Autor: IOAI 2025
Studiezi Inteligența Artificială de ceva vreme. Un vechi prieten al tatălui tău, arheolog și critic de artă faimos, a auzit despre asta și ți-a cerut ajutorul. Trebuie să proiectezi un algoritm care să poată clasifica picturile antice fie ca piese autentice, fie ca replici.
Deoarece autentificarea profesională este costisitoare, echipa de cercetare a obținut etichete de autenticitate doar pentru o mică parte din picturi. Pentru majoritatea mostrelor, autenticitatea rămâne necunoscută. Se știe că caracteristicile digitale ale picturilor prezintă modele structurale puternice. Aveți sarcina de a utiliza toate mostrele disponibile - inclusiv cele cu etichete necunoscute - pentru a antrena un model de clasificare a autenticității picturilor antice.
Setul de date este alcătuit dintr-un set de antrenament, un set de validare și un set de testare, fiecare dintre acestea având 500 de eșantioane independente.
training_set.csv)SampleID).feature1, feature2, feature3, feature4, feature5, feature6).label) conține eticheta: 1 pentru autentic, -1 pentru replică și 0 pentru necunoscut.Setul de antrenament este utilizat pentru antrenarea modelelor și poate fi accesat și descărcat direct în timpul competiției.
validation_set.csv)⚠️ Setul de validare este utilizat pentru calcularea scorului Clasamentului A (public) și nu a fost accesibil direct în timpul competiției.
test_set.csv)⚠️ Setul de testare este folosit pentru calcularea scorului Clasamentului B (privat) și nu a fost accesibil direct în timpul competiției.
Sarcina ta este să antrenezi un model adecvat, capabil să prezică autenticitatea picturilor din seturile de testare, în ciuda numărului mare de mostre neetichetate.
Trebuie să generați un fișier submission.csv care va avea următorul format:
SampleID, ClasamentType, label
VALIDATION_001, A, 1
TEST_001, B, 1
unde:
SampleID reprezintă id-ul picturii (furnizat în validation_set.csv sau test_set.csv).ClasamentType va avea valoarea A pentru picturile din validation_set.csv și va avea valorea B pentru picturile din test_set.csv.label este eticheta prezisă de model.Metrica de evaluare va fi acuratețea clasificării, definită ca proporția de eșantioane prezise corect din numărul total de eșantioane evaluate.
Punctajul final este calculat pe baza acurateței obținute folosind următoarele reguli: