Evaluarea și predicția performanței educaționale
Autor: Teodor Havriliuc
Descrierea problemei
📖 Predicția scorului de performanță relativă a școlilor
Ai fost angajat de Orașul Austin, Texas pentru a calcula Scorul de Performanță Relativă al instituțiilor de învățământ din oraș. Ai la dispoziție două fișiere care conțin următoarele coloane:
📋 Descrierea coloanelor
| Coloană | Descriere |
|---|---|
| SampleID | Identificator unic pentru fiecare observație |
| County | Județul (county) în care se află campusul/districtul |
| School Type | Clasificarea școlii în funcție de nivel (Elementar, Gimnazial etc.) |
| Alternative Education Accountability | Standarde modificate pentru școlile cu elevi aflați în situații de risc |
| Charter | Școală publică administrată de un consiliu independent, nu de un district (Da/Nu) |
| Number of Students | Numărul total de elevi înscriși |
| % Economically Disadvantaged | Procentul elevilor eligibili pentru masă gratuită sau la preț redus |
| % EB/EL Students | Elevi bilingvi emergenți / elevi care învață limba engleză ca a doua limbă |
| Overall Rating | Scorul final ponderat (70% cel mai bun dintre Domeniul 1 sau 2 + 30% Domeniul 3) |
| Student Achievement Rating | Performanța la testele STAAR, ratele de absolvire și scorurile CCMR |
| School Progress Rating | Progresul elevilor sau performanța relativă față de colegi |
| Academic Growth Rating | Îmbunătățirea individuală a elevilor la testele STAAR |
| Closing the Gaps Rating | Performanța subgrupurilor de elevi comparativ cu țintele stabilite |
| Relative Performance Rating | Performanța școlii comparativ cu școli cu niveluri similare de sărăcie (coloană țintă) |
Notă: Coloana Relative Performance Rating este disponibilă doar în datele de antrenare (
train.csv).
🧩 Subtask-uri
Subtask 1 (5 puncte)
Calculează câte școli elementare există în județul Anderson în datele de test (test.csv).
Rezultatul trebuie să fie un număr întreg.
Subtask 2 (5 puncte)
Care este cel mai frecvent calificativ din coloana Academic Growth Rating în datele de test (test.csv)?
Rezultatul trebuie să fie un șir de caractere: "A", "B", "C", "D" sau "F".
Subtask 3 (90 puncte)
Construiește un model de predicție capabil să estimeze Relative Performance Rating pentru toate instituțiile de învățământ din datele de test.
📊 Evaluare
Evaluarea se face folosind acuratețea (accuracy):
accuracy = număr_predicții_corecte / număr_total_predicții
Scorare pentru Subtask 3:
- accuracy ≥ 0.9 → 90 puncte
- accuracy < 0.75 → 0 puncte
- Valorile intermediare sunt punctate proporțional între 0 și 90
📄 Formatul fișierului de trimitere
Fișierul de trimitere trebuie să fie în format CSV, cu următoarele coloane:
subtaskID– indexul subtask-uluidatapointID– identificator unic din setul de dateanswer– răspunsul sau predicția ta
Exemplu:
subtaskID,datapointID,answer
1,1,0
2,2,F
3,100,C
3,101,A
3,102,B
...
Notă:
Pentru Subtask 1 și Subtask 2, valoareadatapointIDtrebuie să fie 1, respectiv 2.
📊 Sursa datelor
City of Austin – data.austintexas.gov
Emergency Medical Services Department