Autor: Mihai Nan
Aurul a fost considerat de secole un depozit de valoare, protejând averea pe termen lung, mai ales în perioade de inflație, depreciere a monedei sau instabilitate economică. Băncile centrale dețin rezerve semnificative de aur, reflectând importanța sa în sistemul financiar global.
Rolul tău este să dezvolți un sistem automat capabil să prezică prețul de închidere al aurului (gold close) pe baza unui set complex de indicatori financiari, economici și de piață, incluzând indici bursieri, prețuri de mărfuri și rate ale schimbului valutar.
Ai la dispoziție un fișier CSV:
Fiecare rând conține următoarele coloane:
date – data în format YYYY-MM-DDsp500 open, sp500 high, sp500 low, sp500 close, sp500 volume, sp500 high-low – valori pentru indicele S&P500nasdaq open, nasdaq high, nasdaq low, nasdaq close, nasdaq volume, nasdaq high-low – valori pentru indicele Nasdaqus_rates_% – dobânda de referință SUACPI – indicele prețurilor de consumusd_chf, eur_usd – cursuri valutareGDP – produsul intern brutsilver open, silver high, silver low, silver close, silver volume, silver high-low – valori pentru argintoil open, oil high, oil low, oil close, oil volume, oil high-low – valori pentru petrolplatinum open, platinum high, platinum low, platinum close, platinum volume, platinum high-low – valori pentru platinăpalladium open, palladium high, palladium low, palladium close, palladium volume, palladium high-low – valori pentru paladiugold open, gold high, gold low, gold close, gold volume – valori pentru aur (targetul nostru este gold close)💡 Datele pot avea granularități diferite (zilnic, lunar, trimestrial). Unele valori lipsesc (NaN), iar modelul trebuie să gestioneze acest lucru corect.
Construiește un sistem care poate prezice prețul de închidere al aurului (gold close) pentru zilele din test.csv.
Predicțiile trebuie salvate într-un fișier submission.csv cu formatul:
ID,gold close
R00001,1820.35
R00002,1815.92
R00003,1822.10
unde:
ID – identificatorul unic al rândului din test.csvgold close – prețul prezis de sistemul tăuPredicțiile vor fi comparate cu valorile reale din ground_truth.csv și se va calcula Root Mean Squared Error (RMSE):
RMSE = sqrt( sum((y_true - y_pred)^2) / n )
Punctajul final este calculat pe baza RMSE-ului obținut: