Auteur: Mihai Nan
Industria muzicii digitale evoluează rapid, iar platformele de streaming concurează pentru a estima cât de bine va performa o melodie în rândul ascultătorilor. Popularitatea nu este doar un număr, deoarece ea influențează recomandări, playlisturi automatizate și chiar contractele artiștilor.
Pentru a antrena un nou modul de predicție, ai primit un set de date extras din Spotify, conținând caracteristici audio și metadate ale melodiilor.
Scopul tău este să construiești un model care prezice popularitatea unei piese pe baza caracteristicilor numerice și a câtorva informații auxiliare.
Ai la dispoziție două fișiere:
popularitypopularity (acestea trebuie prezise)Fiecare melodie are un identificator unic și o serie de caracteristici:
track_id — ID unic al pieseiartistsalbum_nametrack_namepopularity (doar în train)duration_msexplicitdanceabilityenergykeyloudnessmodespeechinessacousticnessinstrumentalnesslivenessvalencetempotime_signaturetrack_genreScopul principal este să prezici coloana popularity pentru setul de test.
Construiește un model de învățare automată care prezice popularitatea fiecărei melodii din test.csv.
Predicțiile tale trebuie salvate într-un fișier submission.csv cu formatul:
track_id,popularity
101,42.7
102,55.1
103,38.0
unde:
track_id — ID-ul melodiei din testpopularity — valoare reală (float), reprezentând popularitatea prezisăEvaluarea se va face folosind MAE (Mean Absolute Error):
Punctajul final este calculat pe baza scorului MAE obținut folosind următoarele reguli: