Autor: Daniel Plăcintă
Un pas extrem de important în evoluția personală a fiecărui elev este admiterea la un liceu prestigios, de elită.
Dezvoltați un model care prezice dacă, pe baza mai multor rezultate, candidatul va fi admis la un liceu de elită (status_admitere = 1) sau respins (status_admitere = 0).
Veți antrena modelul folosind setul de date de antrenament train_data.csv și apoi veți genera predicții folosind setul de date test_data.csv.
Setul de Date pentru Antrenament (train.csv) conține următoarele coloane:
Setul de Date pentru Predicție (test.csv):
id, gen, judet, NT, MEV, MATE, MGIM) ca setul de antrenament, fără coloana status_admitere.Fișierul de submisie output.csv trebuie să conțină exact trei coloane: subtaskID, datapointID, answer.
| subtaskID | datapointID | answer | Descriere |
|---|---|---|---|
| 1 | 101 | 1.25 | dif_NT-MEV: diferența între nota la testul de admitere și nota la evaluarea națională, cu 2 zecimale |
| 2 | 101 | 5 | loc-MEV: poziția în clasament după nota MEV, valoare întreagă |
| 3 | 101 | 1 | status_admitere: predicția modelului, 1 = admis, 0 = respins |
Important: Fiecare rând din CSV reprezintă răspunsul pentru un singur subtask și un singur datapoint. Pentru fiecare
datapointIDtrebuie să existe câte un rând pentru fiecare subtask.
Trimiterea fișierului sample_output.csv generează 5 puncte.