Clasificarea imaginilor: Artă reală vs. artă generată de AI
Author: Mihai Nan
🖼️ Clasificarea imaginilor: Artă reală vs. artă generată de AI
În această problemă trebuie să implementați un model de clasificare a imaginilor capabil să distingă între imagini de artă reală și imagini generate de inteligență artificială.
Setul de date este organizat într-un director cu imagini și fișiere CSV, iar performanța modelului va fi evaluată folosind F1-score.
🔹 Setul de date
Setul de date conține două tipuri de imagini:
- RealArt – imagini reale (label
0) - AIArt – imagini generate de modele AI (label
1)
Aceste imagini sunt disponibile în directorul images.
Fișierele asociate:
train.csv– pentru antrenaretest.csv– pentru predicții
📁 Structura fișierelor CSV
train.csv
Coloane:
- SampleID – identificator numeric unic
- ImagePath – calea către imagine (ex:
images/img_000123.jpg) - Label –
0pentru artă reală,1pentru artă generată de AI
test.csv
Coloane:
- SampleID
- ImagePath
Fără etichete — acestea trebuie prezise de model.
🎯 Scopul problemei
Modelul trebuie să învețe să clasifice fiecare imagine în una dintre următoarele clase:
- 0 → Artă reală
- 1 → Artă generată de AI
⚙️ Criterii de evaluare
Evaluarea se face folosind F1-score pe predicțiile trimise pentru setul de test.
Formula:
📨 Formatul fișierului de submisie
Fișierul CSV trebuie să conțină exact două coloane:
| Coloană | Tip | Descriere |
|---|---|---|
SampleID | integer | ID-ul imaginii din test |
Label | integer | Predicția (0 sau 1) |
🔹 Exemplu
| SampleID | Label |
|---|---|
| 101 | 0 |
| 102 | 1 |
| 103 | 1 |
📝 Notă
- F1-score ≥ 0.85 → scor maxim
- F1-score < 0.5 → 0 puncte
- Restul valorilor sunt scalate proporțional
🌐 Proveniența datelor
Pentru această problemă se folosește un set de date public disponibil pe Kaggle.