Autentificarea picturilor antice

Аутор: IOAI 2025

Тешко

Твој најбољи резултат: Н/Д

Опис задатка

Observație
Aceasta problemă este o adaptare a problemei Antique de la International Olympiad in AI (IOAI) 2025.

Descrierea problemei

Studiezi Inteligența Artificială de ceva vreme. Un vechi prieten al tatălui tău, arheolog și critic de artă faimos, a auzit despre asta și ți-a cerut ajutorul. Trebuie să proiectezi un algoritm care să poată clasifica picturile antice fie ca piese autentice, fie ca replici.

Deoarece autentificarea profesională este costisitoare, echipa de cercetare a obținut etichete de autenticitate doar pentru o mică parte din picturi. Pentru majoritatea mostrelor, autenticitatea rămâne necunoscută. Se știe că caracteristicile digitale ale picturilor prezintă modele structurale puternice. Aveți sarcina de a utiliza toate mostrele disponibile - inclusiv cele cu etichete necunoscute - pentru a antrena un model de clasificare a autenticității picturilor antice.

Set de date

Setul de date este alcătuit dintr-un set de antrenament, un set de validare și un set de testare, fiecare dintre acestea având 500 de eșantioane independente.

Set de antrenament (`training_set.csv`)

Prima coloană reprezintă ID-ul picturii (SampleID).
Următoarele cinci coloane reprezintă caracteristicile digitale ale fiecărei picturi antice (feature1, feature2, feature3, feature4, feature5, feature6).
A șaptea coloană (label) conține eticheta: 1 pentru autentic, -1 pentru replică și 0 pentru necunoscut.

Setul de antrenament este utilizat pentru antrenarea modelelor și poate fi accesat și descărcat direct în timpul competiției.

Set de validare (`validation_set.csv`)

Acestea sunt similare cu formatul setului de antrenament, dar nu conțin coloana etichetă.

⚠️ Setul de validare este utilizat pentru calcularea scorului Clasamentului A (public) și nu a fost accesibil direct în timpul competiției.

Set de testare (`test_set.csv`)

Acestea sunt similare cu formatul setului de antrenament, dar nu conțin coloana etichetă.

⚠️ Setul de testare este folosit pentru calcularea scorului Clasamentului B (privat) și nu a fost accesibil direct în timpul competiției.

Sarcină

Sarcina ta este să antrenezi un model adecvat, capabil să prezică autenticitatea picturilor din seturile de testare, în ciuda numărului mare de mostre neetichetate.

Trimitere

Trebuie să generați un fișier submission.csv care va avea următorul format:

1SampleID, ClasamentType, label2VALIDATION_001, A, 13TEST_001, B, 1

unde:

SampleID reprezintă id-ul picturii (furnizat în validation_set.csv sau test_set.csv).
ClasamentType va avea valoarea A pentru picturile din validation_set.csv și va avea valorea B pentru picturile din test_set.csv.
label este eticheta prezisă de model.

Scor

Metrica de evaluare va fi acuratețea clasificării, definită ca proporția de eșantioane prezise corect din numărul total de eșantioane evaluate.

Punctajul final este calculat pe baza acurateței obținute folosind următoarele reguli:

accuracy ≥ 0.9 → 100 puncte
accuracy ≤ 0.5 → 0 puncte
Pentru valorile intermediare se acordă punctaj proporțional între 0 și 100.

Фајлови

Предај решење

Отпремите излазни фајл и опционо изворни код за евалуацију.

Фајл за предају

Кликни за отпремање или превуци и пусти

CSV, ZIP, итд. (МАКС. 100MB)

Фајл изворног кода (опционо)

Кликни за отпремање или превуци и пусти

Архива, notebook или код фајл

Пријавите се да бисте отпремили предају.