Detectează-l pe Moș Crăciun!
Auteur: Mihai Nan
🎅 Detectează-l pe Moș Crăciun!
În ajunul Crăciunului, atelierul lui Moș Crăciun este mai aglomerat ca niciodată. Elfii pregătesc cadouri, renii își lustruiesc clopoțeii, iar Moșul… apare în mii de fotografii trimise din toată lumea.
Problema este că nu toate aceste imagini chiar îl surprind pe adevăratul Moș Crăciun. Unele sunt costume, altele sunt figurine, reclame sau oameni costumați. Pentru a nu livra cadouri greșite, Moș Crăciun are nevoie de ajutorul vostru!
Sarcina voastră este să construiți un model de clasificare binară a imaginilor care să decidă dacă într-o imagine apare Moș Crăciun sau nu.
🎄 Setul de date
Setul de date reprezintă o arhivă care conține imagini organizate în două directoare împreună cu fișierele CSV train.csv și test.csv.
Există două clase:
- Santa – imaginea îl conține pe Moș Crăciun (
label = 1) - Not Santa – imaginea NU îl conține pe Moș Crăciun (
label = 0)
📁 Structura datasetului
dataset/
├── train/
│ ├── img_000001.jpg
│ ├── img_000002.jpg
│ └── ...
├── test/
│ ├── img_001234.jpg
│ ├── img_001235.jpg
│ └── ...
├── train.csv
└── test.csv
📄 Structura fișierelor CSV
train.csv
Conține imaginile folosite pentru antrenarea modelului.
Coloane:
- image_path – calea relativă către imagine (ex:
train/img_000123.jpg) - label –
1→ Moș Crăciun0→ Nu este Moș Crăciun
test.csv
Conține imaginile pentru care trebuie realizate predicții.
Coloane:
- image_path – calea relativă către imagine
⚠️ Fișierul NU conține coloana
label. Aceasta trebuie prezisă de modelul vostru.
🎯 Scopul problemei
Pentru fiecare imagine din setul de test, modelul vostru trebuie să decidă:
- 1 → imaginea îl conține pe Moș Crăciun
- 0 → imaginea nu îl conține pe Moș Crăciun
Rezultatele vor fi comparate cu etichetele reale păstrate în secret de organizatori.
⚙️ Criterii de evaluare
Performanța soluției va fi evaluată folosind F1-score, o metrică de evaluare ce îmbină precizia și acuratețea, potrivită pentru probleme de clasificare binară.
Formula:
📨 Formatul fișierului de submisie
Trebuie să trimiteți un fișier CSV cu exact două coloane, în următorul format:
| Coloană | Tip | Descriere |
|---|---|---|
| image_path | string | Calea imaginii din test/ |
| label | integer | Predicția (0 sau 1) |
🔹 Exemplu de submisie
image_path,label
test/img_001234.jpg,1
test/img_001235.jpg,0
test/img_001236.jpg,1
📝 Distribuția punctajului
- F1-score ≥ 0.95 → punctaj maxim 🎁
- F1-score < 0.70 → 0 puncte
- Pentru valori intermediare, punctajul se scalează proporțional
❄️ Observații
- Numele fișierelor nu conțin informații despre clasă
- Ordinea imaginilor este aleatorie
- Orice metodă de învățare automată este permisă
- Scopul este să învățați modelul să recunoască tipare vizuale
🎅 Moș Crăciun se bazează pe voi!
Ajutați-l să identifice imaginile corecte și să livreze cadourile la timp!