Predicția scorului filmelor
Auteur: Mihai Nan
Moyen
Votre meilleur score: N/D
Description du problème
🎬 Predicția scorului filmelor 🍿
În lumea streamingului, serviciile de tip Netflix se bazează pe date pentru a înțelege ce filme și seriale vor fi apreciate de utilizatori. Tu ești consultantul unui start-up care vrea să anticipeze scorul unui film pe baza metadatelor sale.
Ai la dispoziție un set de date despre filme și seriale Netflix:
- train.csv - filme și seriale cu scoruri cunoscute
- test.csv - filme și seriale noi, pentru care trebuie să prezici tu scorul
📊 Setul de date
Fiecare rând reprezintă un titlu de film:
- SampleID – identificator unic al filmului
- Title – numele filmului sau serialului
- Type – tipul conținutului (
SHOW) - Description – descriere scurtă a filmului / serialului
- Year – anul lansării
- Score – doar în train.csv, valoare numerică ce reprezintă scorul filmului (ex: rating de la critici)
Scopul tău este să prezici Score pentru fiecare titlu din test.csv.
📝 Task (100 puncte)
Construiește un model de învățare automată capabil să prezică valoarea numerică Score pentru fiecare titlu din test.csv, folosind coloanele disponibile (Title, Type, Description, Year).
🧮 Evaluare
- Metrica principală este MAE (Mean Absolute Error):
- MAE ≤ 0.65 → 100 puncte
- MAE ≥ 2.0 → 0 puncte
- Pentru valori intermediare, punctajul se calculează proporțional.
📄 Formatul fișierului de submisie
Fișierul submission.csv trebuie să conțină un rând pentru fiecare titlu din test:
SampleID, Score
unde:
- SampleID - identificatorul filmului din test
- Score - valoarea numerică prezisă pentru scor