Examenul de Rezidențiat
Auteur: Mihai Nan
🩺 Examenul de Rezidențiat 🤖📘
În fiecare an, mii de absolvenți de medicină se pregătesc pentru cel mai dificil moment al carierei lor: Examenul de Rezidențiat. Timp de luni întregi, viitorii medici memorează, repetă și rezolvă sute de întrebări grilă.
Dar anul acesta, Comisia Centrală a decis să introducă o inovație majoră: o platformă automatizată care verifică și evaluează răspunsurile folosind învățare automată.
Din păcate, prototipul sistemului a început să dea erori, iar comisia are nevoie de ajutorul tău pentru a-l repara.
Ți-au fost puse la dispoziție două fișiere:
- train.csv - întrebări oficiale cu răspuns corect
- test.csv - întrebări noi, pentru care trebuie să prezici varianta corectă (din acestea vor fi selectate întrebările pentru examenul de rezidențiat 😅)
Scopul tău este să reconstruiești mecanismul de corectare automată.
📊 Setul de date
Fiecare rând reprezintă o întrebare de tip grilă din examen:
- SampleID – identificator unic al întrebării
- Question – enunțul întrebării
- Option0, Option1, Option2, Option3 – cele patru variante de răspuns
- Answer – doar în train.csv (0–3), indică varianta corectă
📝 Sarcina de lucru (100 puncte)
Construiește un model de învățare automată capabil să prezică, pentru fiecare întrebare din test.csv, care dintre cele patru variante (0–3) este răspunsul corect.
Modelul tău va fi evaluat folosind acuratețea:
- Accuracy ≥ 70% → 100 puncte
- Accuracy ≤ 25% → 0 puncte
- Pentru valorile intermediare se acordă punctaj proporțional.
Orice metodă este permisă: algoritmi clasici de ML, embeddings, modele de limbaj, BERT medical etc.
📄 Formatul fișierului de submisie
Fișierul submission.csv trebuie să conțină un rând pentru fiecare întrebare din test.
Prima linie a fișierului conține următoarele:
DatapointID, PredictedAnswer
unde:
- DatapointID -
SampleIDdin test - PredictedAnswer - un număr între 0 și 3 (varianta corectă prezisă de model)
Exemplu (SampleID = 84f328d3-fca4-422d-8fb2-19d55eb31503):
84f328d3-fca4-422d-8fb2-19d55eb31503, 2