Author: Mihai Nan
Administrația Federală a Aviației dorește să dezvolte un sistem capabil să prezică întârzierea unui zbor (în minute) la sosire, pe baza informațiilor istorice despre companii aeriene, aeroporturi și condiții operaționale.
Pentru acest scop, vi se oferă un set de date agregat la nivel de:
(an, lună, companie aeriană, aeroport).
| Nume | Descriere |
|---|---|
sample_id | ID unic al eșantionului (ex: 0194048) |
year | Anul raportării |
month | Luna raportării |
carrier | Codul companiei aeriene |
carrier_name | Numele complet al companiei aeriene |
airport | Codul aeroportului (IATA) |
airport_name | Numele aeroportului |
arr_flights | Număr total de zboruri care au sosit |
arr_del15 | Număr de sosiri cu întârziere >15 minute |
carrier_ct | Întârzieri atribuite operatorului |
weather_ct | Întârzieri cauzate de condiții meteo |
nas_ct | Întârzieri cauzate de sistemul național (NAS) |
security_ct | Întârzieri de securitate |
late_aircraft_ct | Întârzieri cauzate de aeronave sosite târziu |
arr_cancelled | Zboruri anulate |
arr_diverted | Zboruri deviate |
delay | Variabila țintă — întârzierea totală la sosire (minute, disponibil doar în train.csv) |
Notă: În fișierul
test.csv, coloanadelayeste absentă și trebuie prezisă.
Antrenați un model care prezice delay (în minute) folosind caracteristicile de mai sus.
Rezultatul final va fi transmis sub forma unui fișier submission.csv.
Fișierul trebuie să fie:
sample_id,delay
0194048,132
0194049,0
0194050,215
unde:
sample_id trebuie să coincida cu valorile din test.csvdelay reprezintă un număr întreg, predicția modeluluiEvaluarea se face folosind MAE (Mean Absolute Error):
Succes și zbor lin! ✨