Predicția stării academice a studenților
Author: Mihai Nan
Medium
Your best score: N/A
Problem Description
🏫 Predicția stării academice a studenților
Pentru această problemă trebuie să implementați un model de clasificare capabil să prezică starea academică a unui student (Target) utilizând un set de date disponibil. Setul de date este organizat într-un fișier CSV, iar performanța modelului se va evalua pe baza F1-score.
🔹 Setul de date
Setul de date conține următoarele coloane:
- SampleID: Identificator unic pentru fiecare student
- Marital status: Starea civilă a studentului (Single, Married, Other)
- Application mode: Modul de aplicare (Online, In person, Other)
- Application order: Ordinea aplicării (numeric)
- Course: Cursul la care s-a înscris studentul
- Daytime/evening attendance: Tipul de frecvență (Daytime/Evening)
- Previous qualification: Nivelul educațional anterior (High School, College)
- Nacionality: Naționalitatea studentului
- Mother's qualification: Nivelul de educație al mamei
- Father's qualification: Nivelul de educație al tatălui
- Mother's occupation: Ocupația mamei
- Father's occupation: Ocupația tatălui
- Displaced: Studentul este mutat/străin (Yes/No)
- Educational special needs: Nevoi educaționale speciale (Yes/No)
- Debtor: Student datornic (Yes/No)
- Tuition fees up to date: Taxele sunt achitate (Yes/No)
- Gender: Genul studentului (Male/Female)
- Scholarship holder: Student cu bursă (Yes/No)
- Age at enrollment: Vârsta la înscriere
- International: Student internațional (Yes/No)
- Curricular units 1st sem (credited): Cursuri creditate în primul semestru
- Curricular units 1st sem (enrolled): Cursuri înscrise în primul semestru
- Curricular units 1st sem (evaluations): Evaluări efectuate în primul semestru
- Curricular units 1st sem (approved): Cursuri aprobate în primul semestru
- Curricular units 1st sem (grade): Notele obținute în primul semestru
- Curricular units 1st sem (without evaluations): Cursuri fără evaluări în primul semestru
- Curricular units 2nd sem (credited): Cursuri creditate în al doilea semestru
- Curricular units 2nd sem (enrolled): Cursuri înscrise în al doilea semestru
- Curricular units 2nd sem (evaluations): Evaluări efectuate în al doilea semestru
- Curricular units 2nd sem (approved): Cursuri aprobate în al doilea semestru
- Curricular units 2nd sem (grade): Notele obținute în al doilea semestru
- Curricular units 2nd sem (without evaluations): Cursuri fără evaluări în al doilea semestru
- Unemployment rate: Rata șomajului în regiunea studentului
- Inflation rate: Rata inflației
- GDP: Produsul Intern Brut (GDP)
- Target: Variabila țintă, starea academică a studentului (Dropout, Enrolled, Graduate)
📊 Note despre setul de date
- Câmpul-țintă:
Target - Modelul trebuie antrenat pe
train.csvși evaluat petest.csv
⚙️ Criterii de evaluare
- Performanță: F1-score cât mai mare
📨 Formatul fișierului de submisie
Fișierul de submisie trebuie să fie un CSV cu exact două coloane:
| Coloană | Tip | Descriere |
|---|---|---|
SampleID | integer | Reprezintă identificatorul unic al rândului din setul de test |
Target | String | Predicția clasei pentru student (Dropout, Enrolled, Graduate) |
🔹 Exemple
| SampleID | Target |
|---|---|
| 101 | Dropout |
| 102 | Enrolled |
| 103 | Graduate |
Important: Fiecare rând din CSV reprezintă predicția pentru un singur student din test.
📝 Notă
Scorul se acordă pe baza F1-score obținut de model pe setul de test. Pentru a obține scor maxim, F1 trebuie să fie cel puțin 0.75, iar valori sub 0.5 vor primi 0 puncte, restul fiind scalate proporțional.
🗂️ Resurse utile
- Starter Kit – conține un schelet de la care puteți porni rezolvarea problemei