Clasificarea emoțiilor pe baza textului

Författare: Mihai Nan

Medel

Din bästa poäng: Ej tillgänglig

Problembeskrivning

📝 Clasificarea emoțiilor pe baza textului

📘 Descrierea problemei

Se dorește construirea unui model de clasificare care să prezică emoția principală asociată unui text.

Fiecare exemplu este caracterizat printr-un text scurt și eticheta (label) reprezintă emoția corespunzătoare (ex: joy, anger, sadness, etc.).

Această problemă aparține categoriei de clasificare multi-clasă.

🔹 Caracteristici (features)

text – conținutul textual al mesajului sau articolului

Eticheta țintă este:

label – emoția asociată textului (string)

📘 Structura fișierelor de intrare

`train.csv`

Conține coloanele:

SampleID
text
label

Exemplu:

SampleID	text	label
1	"I am so happy today!"	joy
2	"I feel really angry about this situation."	anger
3	"Feeling a bit sad after watching that movie."	sadness

`test.csv`

Conține aceleași coloane fără label, dar include SampleID.

Exemplu:

SampleID	text
101	"What a wonderful surprise!"
102	"I can't believe this happened."

📤 Submisia

Fișierul de ieșire (submission.csv) trebuie să conțină exact două coloane:

SampleID
label – eticheta prezisă de model

Exemplu:

SampleID	label
101	joy
102	surprise

⚙️ Evaluarea

Evaluarea modelelor se va face utilizând Macro F1-score:

$Macro F1$

unde:

$C$ = numărul de clase
$Precision_i$
$Recall_i$

Scorul final va fi transformat în intervalul 0–100, astfel încât un F1 mare să conducă la scor mare. Pentru scorul maxim, trebuie ca F1 să fie mai mare sau egal cu 0.9.

📊 Sursă

Datasetul provine de pe Kaggle: Kaggle Emotion Dataset.

Filer

Lämna in lösning

Ladda upp utdatafil och valfritt källkod för utvärdering.

Inlämningsfil

Klicka för att ladda upp eller dra och släpp

CSV, ZIP, etc. (MAX. 25MB)

Källkodsfil (valfritt)

Klicka för att ladda upp eller dra och släpp

Arkiv, notebook eller kodfil

Logga in för att ladda upp en inlämning.