Admiterea la un liceu de elită - Simulare OJIA 3
Author: Daniel Plăcintă
🎓 Admiterea la un liceu de elită
Un pas extrem de important în evoluția personală a fiecărui elev este admiterea la un liceu prestigios, de elită.
Dezvoltați un model care prezice dacă, pe baza mai multor rezultate, candidatul va fi admis la un liceu de elită (status_admitere = 1) sau respins (status_admitere = 0).
Veți antrena modelul folosind setul de date de antrenament train_data.csv și apoi veți genera predicții folosind setul de date test_data.csv.
🗂️ Descrierea setului de date
Setul de Date pentru Antrenament (train.csv) conține următoarele coloane:
- id (număr natural): identificator unic al candidatului
- gen (M/F): genul candidatului
- judet (șir de 2 caractere): județul candidatului
- NT (1.00-10.00): nota la testul de admitere
- MEV (6.00-10.00): media la evaluarea națională
- MATE (5.00-10.00): media gimnazială la matematică
- MGIM (5.00-10.00): media generală gimnazială
- status_admitere (0 sau 1): 1 = admis, 0 = respins
Setul de Date pentru Predicție (test.csv):
- 180 de eșantioane cu aceleași caracteristici (
id, gen, judet, NT, MEV, MATE, MGIM) ca setul de antrenament, fără coloana status_admitere. - Modelul vostru va genera predicții pentru aceste eșantioane.
📊 Rezultatul așteptat
Fișierul de submisie output.csv trebuie să conțină exact trei coloane: subtaskID, datapointID, answer.
| subtaskID | datapointID | answer | Descriere |
|---|---|---|---|
| 1 | 101 | 1.25 | dif_NT-MEV: diferența între nota la testul de admitere și nota la evaluarea națională, cu 2 zecimale |
| 2 | 101 | 5 | loc-MEV: poziția în clasament după nota MEV, valoare întreagă |
| 3 | 101 | 1 | status_admitere: predicția modelului, 1 = admis, 0 = respins |
Important: Fiecare rând din CSV reprezintă răspunsul pentru un singur subtask și un singur datapoint. Pentru fiecare
datapointIDtrebuie să existe câte un rând pentru fiecare subtask.
🏆 Scor
Trimiterea fișierului sample_output.csv generează 5 puncte.
⚙️ Observații
- Eliminați coloanele irelevante pentru predicție.
- Standardizați coloanele numerice.
- Nu există rânduri incomplete.
- Consultați secțiunea Starter Kit pentru detalii orientative despre formatul datelor și submisie.
🗂️ Resurse utile
- Starter Kit complet – conține un schelet de la care puteți porni rezolvarea problemei