Autor: Mihai Nan
În inima Regatului, se află Magazinul Regal al Diamantelor, unde pietre prețioase
de toate formele și mărimile sunt păstrate cu grijă.
Custodele Magazinului vrea să descopere cât de valoroase sunt diamantele sale,
în funcție de caracteristicile lor fizice și estetice, însă pergamentele cu prețuri
s-au pierdut în timp.
Pentru a-l ajuta, consiliul regal a creat o colecție de date:
train.csv – diamantele deja evaluate, cu toate caracteristicile și prețul lortest.csv – diamante noi, cu caracteristicile completate, dar fără prețSarcina ta este să descoperi secretele valorii diamantelor folosind analiza datelor și modele predictive.
Fiecare rând din fișierele train.csv și test.csv reprezintă un diamant descris prin următoarele caracteristici:
Fair, Good, Very Good, Premium, Ideal)D … J), D fiind cea mai bunăClasificați diamantele din test.csv în funcție de greutatea lor (carat):
Light dacă carat < 0.5Medium dacă 0.5 ≤ carat < 1.5Heavy dacă carat ≥ 1.5Calculați proporția dintre depth și table pentru fiecare diamant din test:
proportie = depth / table
Determinați volumul aproximativ al fiecărui diamant, utilizând pentru acest lucru formula:
volum = x * y * z
Construiți o metodă capabilă să estimeze valoarea diamantului (price)
pentru fiecare diamant din test.csv.
Evaluarea finală se va face folosind MAE (Mean Absolute Error):
Punctajul pentru ultima cerință este acordat după următoarele formule:
Pentru subtask 1, răspunsurile sunt evaluate exact.
Pentru subtask-urile 2 și 3, răspunsurile sunt evaluate pentru primele 2 zecimale.
cut, color, clarity) pot fi convertite numericFișierul submission.csv trebuie să conțină câte o linie pentru fiecare rând din test
și fiecare subtask:
subtaskID datapointID answer
SampleID din testSampleID = 1023:subtaskID datapointID answer
1 1023 Medium
2 1023 0.619
3 1023 0.34
4 1023 4578