Autor: Teodor Havriliuc
Ai fost angajat de Orașul Austin, Texas pentru a calcula Scorul de Performanță Relativă al instituțiilor de învățământ din oraș. Ai la dispoziție două fișiere care conțin următoarele coloane:
| Coloană | Descriere |
|---|---|
| SampleID | Identificator unic pentru fiecare observație |
| County | Județul (county) în care se află campusul/districtul |
| School Type | Clasificarea școlii în funcție de nivel (Elementar, Gimnazial etc.) |
| Alternative Education Accountability | Standarde modificate pentru școlile cu elevi aflați în situații de risc |
| Charter | Școală publică administrată de un consiliu independent, nu de un district (Da/Nu) |
| Number of Students | Numărul total de elevi înscriși |
| % Economically Disadvantaged | Procentul elevilor eligibili pentru masă gratuită sau la preț redus |
| % EB/EL Students | Elevi bilingvi emergenți / elevi care învață limba engleză ca a doua limbă |
| Overall Rating | Scorul final ponderat (70% cel mai bun dintre Domeniul 1 sau 2 + 30% Domeniul 3) |
| Student Achievement Rating | Performanța la testele STAAR, ratele de absolvire și scorurile CCMR |
| School Progress Rating | Progresul elevilor sau performanța relativă față de colegi |
| Academic Growth Rating | Îmbunătățirea individuală a elevilor la testele STAAR |
| Closing the Gaps Rating | Performanța subgrupurilor de elevi comparativ cu țintele stabilite |
| Relative Performance Rating | Performanța școlii comparativ cu școli cu niveluri similare de sărăcie (coloană țintă) |
Notă: Coloana Relative Performance Rating este disponibilă doar în datele de antrenare (
train.csv).
Calculează câte școli elementare există în județul Anderson în datele de test (test.csv).
Rezultatul trebuie să fie un număr întreg.
Care este cel mai frecvent calificativ din coloana Academic Growth Rating în datele de test (test.csv)?
Rezultatul trebuie să fie un șir de caractere: "A", "B", "C", "D" sau "F".
Construiește un model de predicție capabil să estimeze Relative Performance Rating pentru toate instituțiile de învățământ din datele de test.
Evaluarea se face folosind acuratețea (accuracy):
accuracy = număr_predicții_corecte / număr_total_predicții
Fișierul de trimitere trebuie să fie în format CSV, cu următoarele coloane:
subtaskID – indexul subtask-uluidatapointID – identificator unic din setul de dateanswer – răspunsul sau predicția tasubtaskID,datapointID,answer
1,1,0
2,2,F
3,100,C
3,101,A
3,102,B
...
Notă:
Pentru Subtask 1 și Subtask 2, valoareadatapointIDtrebuie să fie 1, respectiv 2.
City of Austin – data.austintexas.gov
Emergency Medical Services Department