Autor: Petru Dimitriu
Ai la dispoziție un set de date ale cărui înregistrări conțin pozițiile geografice ale mijloacelor de transport în comun din mai multe orașe din Europa, pe parcursul a aproximativ 3 zile. Înregistrările cuprind următoarele câmpuri:
id = identificatorul unic al vehiculului la care se referă înregistrareatimestamp = momentul (la fusul orar GMT) la care a fost obținută înregistrareavehicle_type = tipul vehicului, sub forma unui număr întreglatitude, longitude = coordonatele GPS ale vehiculului la momentul dat de timestampFișierul dataset.csv: conține setul de date cu câmpurile menționate mai sus
Determină numărul de vehicule distincte și numărul de tipuri de vehicule prezente în setul de date.
Realizează o grupare pe orașe a vehiculelor ale căror informații se regăsesc în setul de date.
Știind că toate vehiculele al căror tip are valoarea 10 se găsesc în același oraș și se retrag în cele 3 depouri disponibile pe timpul nopții, determină coordonatele aproximative ale depourilor.
Pentru subtask-ul 1: 10 puncte pentru determinarea corectă a ambelor valori.
Pentru subtask-ul 2: 30 puncte pentru atribuirea corectă a orașelor. Punctajele parțiale se vor pondera cu metrica Adjusted Rand Index.
Pentru subtask-ul 3: Pentru fiecare depou, se ia în considerarea cea mai puțin precisă coordonată determinată față de valoarea așteptată și se acordă câte 20 de puncte dacă precizia este ≤ 0.003 grade și 0 puncte dacă precizia este ≥ 0.005 grade, între aceste valori punctajul fiind ponderat liniar.
Fișierul de ieșire este în formatul CSV, cu următorul antet:
subtaskID,Value1,Value2
Pentru subtask-ul 1, un singur rând, după cum urmează:
1, <număr vehicule distincte>,<număr tipuri vehicule>
Pentru subtask-ul 2, câte un rând pentru fiecare vehicul distinct, după cum urmează:
2,<id>,<identificator oraș>
Fiecare oraș se va identifica în mod unic cu câte un număr întreg.
Pentru subtask-ul 3, câte un rând pentru fiecare depou detrminat, după cum urmează:
3,<latitudine>,<longitudine>
Coorodnatele vor fi numere reale, cu cel puțin 3 zecimale după virgulă, ordonate de la sud la nord (de la la latitudine mai mică spre latitudine mai mare).