Predicția popularității melodiilor
Author: Mihai Nan
🎧 Predicția popularității melodiilor 🎹
Industria muzicii digitale evoluează rapid, iar platformele de streaming concurează pentru a estima cât de bine va performa o melodie în rândul ascultătorilor. Popularitatea nu este doar un număr, deoarece ea influențează recomandări, playlisturi automatizate și chiar contractele artiștilor.
Pentru a antrena un nou modul de predicție, ai primit un set de date extras din Spotify, conținând caracteristici audio și metadate ale melodiilor.
Scopul tău este să construiești un model care prezice popularitatea unei piese pe baza caracteristicilor numerice și a câtorva informații auxiliare.
📁 Setul de date
Ai la dispoziție două fișiere:
- train.csv — melodii cu toate coloanele incluzând
popularity - test.csv — melodii fără coloana
popularity(acestea trebuie prezise)
Fiecare melodie are un identificator unic și o serie de caracteristici:
track_id— ID unic al pieseiartistsalbum_nametrack_namepopularity(doar în train)duration_msexplicitdanceabilityenergykeyloudnessmodespeechinessacousticnessinstrumentalnesslivenessvalencetempotime_signaturetrack_genre
Scopul principal este să prezici coloana popularity pentru setul de test.
🧠 Task (100 puncte)
Construiește un model de învățare automată care prezice popularitatea fiecărei melodii din test.csv.
Predicțiile tale trebuie salvate într-un fișier submission.csv cu formatul:
track_id,popularity
101,42.7
102,55.1
103,38.0
unde:
track_id— ID-ul melodiei din testpopularity— valoare reală (float), reprezentând popularitatea prezisă
📊 Evaluare
Evaluarea se va face folosind MAE (Mean Absolute Error):
Punctajul final este calculat pe baza scorului MAE obținut folosind următoarele reguli:
- MAE ≤ 5 → 100 puncte
- MAE ≥ 20 → 0 puncte
- Pentru valorile intermediare se acordă punctaj proporțional între 0 și 100.