Autentificarea picturilor antice
Аутор: IOAI 2025
Aceasta problemă este o adaptare a problemei Antique de la International Olympiad in AI (IOAI) 2025.
Descrierea problemei
Studiezi Inteligența Artificială de ceva vreme. Un vechi prieten al tatălui tău, arheolog și critic de artă faimos, a auzit despre asta și ți-a cerut ajutorul. Trebuie să proiectezi un algoritm care să poată clasifica picturile antice fie ca piese autentice, fie ca replici.
Deoarece autentificarea profesională este costisitoare, echipa de cercetare a obținut etichete de autenticitate doar pentru o mică parte din picturi. Pentru majoritatea mostrelor, autenticitatea rămâne necunoscută. Se știe că caracteristicile digitale ale picturilor prezintă modele structurale puternice. Aveți sarcina de a utiliza toate mostrele disponibile - inclusiv cele cu etichete necunoscute - pentru a antrena un model de clasificare a autenticității picturilor antice.
Set de date
Setul de date este alcătuit dintr-un set de antrenament, un set de validare și un set de testare, fiecare dintre acestea având 500 de eșantioane independente.
Set de antrenament (training_set.csv)
- Prima coloană reprezintă ID-ul picturii (
SampleID). - Următoarele cinci coloane reprezintă caracteristicile digitale ale fiecărei picturi antice (
feature1,feature2,feature3,feature4,feature5,feature6). - A șaptea coloană (
label) conține eticheta:1pentru autentic,-1pentru replică și0pentru necunoscut.
Setul de antrenament este utilizat pentru antrenarea modelelor și poate fi accesat și descărcat direct în timpul competiției.
Set de validare (validation_set.csv)
- Acestea sunt similare cu formatul setului de antrenament, dar nu conțin coloana etichetă.
⚠️ Setul de validare este utilizat pentru calcularea scorului Clasamentului A (public) și nu a fost accesibil direct în timpul competiției.
Set de testare (test_set.csv)
- Acestea sunt similare cu formatul setului de antrenament, dar nu conțin coloana etichetă.
⚠️ Setul de testare este folosit pentru calcularea scorului Clasamentului B (privat) și nu a fost accesibil direct în timpul competiției.
Sarcină
Sarcina ta este să antrenezi un model adecvat, capabil să prezică autenticitatea picturilor din seturile de testare, în ciuda numărului mare de mostre neetichetate.
Trimitere
Trebuie să generați un fișier submission.csv care va avea următorul format:
SampleID, ClasamentType, label
VALIDATION_001, A, 1
TEST_001, B, 1
unde:
SampleIDreprezintă id-ul picturii (furnizat învalidation_set.csvsautest_set.csv).ClasamentTypeva avea valoareaApentru picturile dinvalidation_set.csvși va avea valoreaBpentru picturile dintest_set.csv.labeleste eticheta prezisă de model.
Scor
Metrica de evaluare va fi acuratețea clasificării, definită ca proporția de eșantioane prezise corect din numărul total de eșantioane evaluate.
Punctajul final este calculat pe baza acurateței obținute folosind următoarele reguli:
- accuracy ≥ 0.9 → 100 puncte
- accuracy ≤ 0.5 → 0 puncte
- Pentru valorile intermediare se acordă punctaj proporțional între 0 și 100.