Autor: Mihai Nan
Atunci când ne raportăm la tablourile celebre, trebuie să ținem cont și de caracteristici obiective precum dimensiunea pânzei, tipul pensulei cu care a fost pictat, complexitatea vizuală sau densitatea culorilor, pe lângă calitatea artistică a acestora. Estimarea automată a valorii și identificarea stilului pictorului pot ajuta colecționarii și muzeele să analizeze colecții mari de opere.
Pentru rezolvarea acestei probleme veți avea la dispoziție două fișiere:
train.csv – conține toate variabilele, inclusiv target_price, pentru antrenarea modelelortest.csv – conține aceleași variabile, fără coloana target_price, și datele din acest fișier sunt folosite pentru generarea predicțiilor| Column | DType | Descriere |
|---|---|---|
| SampleID | int | Identificator unic al tabloului |
| canvas_size | object | Dimensiunea pânzei (ex. "80x50") |
| is_oil_painting | bool | Indicator dacă tabloul este pictură în ulei |
| brush_type | object | Tipul pensulei utilizate |
| num_colors | int | Numărul de culori utilizate |
| colorfulness | float | Grad de coloristică |
| complexity | float | Complexitate vizuală |
| brightness | float | Luminozitate a tabloului |
| contrast | float | Contrast al tabloului |
| stroke_density | float | Densitate a pensulei |
| has_signature | bool | Dacă tabloul are semnătură |
| is_framed | bool | Dacă tabloul este încadrat |
| uses_gold_leaf | bool | Dacă tabloul folosește foiță de aur |
| is_restored | bool | Dacă tabloul a fost restaurat |
| dominant_warm_colors | bool | Dacă predomină culorile calde |
| dominant_color | object | Culoarea dominantă |
| art_period_hint | object | Sugestie perioadă artistică |
| auction_house | object | Casa de licitații |
| image_quality | object | Calitatea imaginii |
| brightness_log | float | Luminozitate logaritmică |
| complexity_x_stroke | float | Complexitate × densitate pensulă |
| fake_style_score | float | Scor stil fals |
| painter_style_score | float | Scor stil pictor |
| target_price | int | Prețul tabloului (doar în train.csv) |
Pentru această problemă aveți de rezolvat 3 task-uri.
Recent, un algoritm revoluționar a fost descoperit de un grup de cercetători în inteligență artificială și artă. Acesta poate evalua, pe baza caracteristicilor obiective ale tabloului, dacă un tablou este cu siguranță autentic sau nu.
Pentru fiecare tablou, algoritmul calculează un Scor de Autenticitate Artistică (SAA) folosind următoarele reguli:
stroke_density > 0.7, adaugă 2 puncte la SAA.complexity > 0.65, adaugă 2 puncte la SAA.uses_gold_leaf = True, adaugă 1 punct la SAA.has_signature = True, adaugă 1 punct la SAA.num_colors > 65 și colorfulness > 0.7, adaugă 2 puncte la SAA.contrast < 0.4 sau brightness < 0.45 sau brightness > 0.75, scade 1 punct din SAA.După calcularea scorului, tabloul primește eticheta:
Autentic: dacă SAA ≥ 5
Incert: dacă SAA < 5
Answer în fișierul de submisie va fi Autentic sau Incert pentru fiecare tablou din test.csv.
Se știe că tablourile din setul de date au fost realizate de 5 pictori celebri, dar informația despre pictor nu este disponibilă.
Sarcina voastră este să atribuiți fiecărui tablou din test.csv un ID numeric între 0 și 4, astfel încât tablourile realizate de același pictor să primească același ID.
Answer în fișierul de submisie va fi ID-ul numeric (0, 1, 2, 3 sau 4) pentru fiecare tablou din test.csv.Pentru fiecare tablou inclus în train.csv avem specificat un preț (coloana target_price). Pe baza informațiilor disponibile în train.csv, antrenați un model de Inteligență Artificială care să fie capabil să prezică pentru tablourile din test.csv prețul.
Fișierul submission.csv trebuie să conțină:
SampleID - preluat din fișierul test.csv;subtaskID - poate fi: Task1, Task2, Task3;Answer - valoarea calculată sau estimată pentru tabloul indicat prin SampleID la task-ul indicat prin subtaskID.Pentru acest subtask se folosește compararea exactă între răspunsurile trimise (Autentic / Incert) și etichetele corecte.
Evaluarea se face folosind Adjusted Rand Index (ARI).
Evaluarea se face folosind Mean Absolute Error (MAE).
Reguli: