Arhiva cuvintelor desenate
Аутор: Mihai Nan
✍️ Arhiva cuvintelor desenate 🖼️
✨ O provocare de recunoaștere vizuală
Într-o bibliotecă digitală secretă, cunoscută sub numele de
Arhiva cuvintelor desenate, sunt păstrate mii de imagini cu cuvinte scrise de mână, fiecare însoțit de o mică ilustrație care îi sugerează sensul.

Din păcate, un glitch misterios a afectat sistemul de indexare, iar etichetele multor imagini s-au pierdut.
Acum, doar un Maestru al vederii computaționale poate restaura ordinea și sensul acestor imagini.
Fiecare imagine conține:
- un cuvânt scris de mână, cu cerneală neagră pe fundal alb
- o mică ilustrație care reprezintă obiectul sau conceptul acelui cuvânt
Stilul este realist, curat și clar, însă cuvântul trebuie recunoscut exclusiv din imagine.
🗂 Datele primite
Ai la dispoziție următoarele fișiere:
📁 train.csv
Conține exemple etichetate pentru antrenare:
image_path– calea către imaginelabel– cuvântul scris de mână din imagine
Toate imaginile dintrain.csvse află în directoruloutput_dataset/train/.
📁 test.csv
Conține:
image_path– calea către imagine
⚠️ Coloana label lipsește și trebuie prezisă de modelul tău.
Toate imaginile din test.csv se află în directorul output_dataset/test/.
🧠 Cuvintele pe care modelul trebuie să le recunoască
Modelul tău trebuie să recunoască exact unul dintre următoarele 20 de cuvinte posibile:
apple, banana, cat, dog, elephant,
flower, house, moon, sun, tree,
violin, lion, kite, boat, star,
fish, pencil, cake, book, umbrella
Fiecare imagine aparține unei singure clase.
🎯 Sarcina ta
Construiește un model de clasificare a imaginilor care, pentru fiecare imagine din test.csv, prezice corect cuvântul scris de mână.
📤 Formatul fișierului submission.csv
La final, vei genera un fișier submission.csv cu următoarea structură:
image_path,label
output_dataset/test/000001.png,banana
output_dataset/test/000002.png,cat
output_dataset/test/000003.png,tree
📊 Evaluare
Performanța modelului va fi evaluată folosind acuratețea:
accuracy = (număr_predicții_corecte / număr_total_predicții)
🏅 Sistem de punctaj:
- accuracy ≥ 98% → 100 puncte
- accuracy ≤ 20% → 0 puncte
- altfel → scalare liniară între 0 și 100
🏆 Devino maestrul Arhivei cuvintelor desenate!
Fiecare literă contează. Fiecare linie de cerneală ascunde un sens.
Demonstrează că modelul tău poate vedea, înțelege și recunoaște cuvintele din imagini și readu ordinea în Arhiva cuvintelor desenate! ✨📚