Author: Mihai Nan
În fiecare an, mii de absolvenți de medicină se pregătesc pentru cel mai dificil moment al carierei lor: Examenul de Rezidențiat. Timp de luni întregi, viitorii medici memorează, repetă și rezolvă sute de întrebări grilă.
Dar anul acesta, Comisia Centrală a decis să introducă o inovație majoră: o platformă automatizată care verifică și evaluează răspunsurile folosind învățare automată.
Din păcate, prototipul sistemului a început să dea erori, iar comisia are nevoie de ajutorul tău pentru a-l repara.
Ți-au fost puse la dispoziție două fișiere:
Scopul tău este să reconstruiești mecanismul de corectare automată.
Fiecare rând reprezintă o întrebare de tip grilă din examen:
Construiește un model de învățare automată capabil să prezică, pentru fiecare întrebare din test.csv, care dintre cele patru variante (0–3) este răspunsul corect.
Modelul tău va fi evaluat folosind acuratețea:
Orice metodă este permisă: algoritmi clasici de ML, embeddings, modele de limbaj, BERT medical etc.
Fișierul submission.csv trebuie să conțină un rând pentru fiecare întrebare din test.
Prima linie a fișierului conține următoarele:
DatapointID, PredictedAnswer
unde:
SampleID din test84f328d3-fca4-422d-8fb2-19d55eb31503):84f328d3-fca4-422d-8fb2-19d55eb31503, 2