Predicția performanței școlare

作者: Mihai Nan

中等

您的最佳成绩: 不适用

题目描述

📝 Predicția performanței școlare

📘 Descrierea problemei

Se dorește construirea unui model de regresie care să prezică scorul final la examen (Exam_Score) pe baza unor factori academici, sociali și personali ai elevilor.

Modelul primește un set de caracteristici (features) și trebuie să estimeze o valoare numerică continuă.

🔹 Caracteristici (features)

Fiecare instanță conține mai multe variabile, precum:

StudyHours
Attendance
ParentalInvolvement
HealthStatus
... (alte coloane existente în dataset)

Eticheta țintă:

Exam_Score — scorul numeric obținut la examen

📘 Structura fișierelor de intrare

`train.csv`

Conține toate caracteristicile + eticheta țintă.

Coloane obligatorii:

SampleID
diverse features (categorice + numerice)
Exam_Score

Exemplu:

SampleID	StudyHours	Attendance	ParentalInvolvement	...	Exam_Score
1	3.5	High	Medium	...	78
2	1.2	Low	Low	...	55
3	4.0	High	High	...	92

`test.csv`

Are aceeași structură ca train.csv, dar fără coloana Exam_Score, deoarece acesta trebuie prezis.

Exemplu:

SampleID	StudyHours	Attendance	ParentalInvolvement	...
101	3.0	High	Medium	...
102	0.7	Low	Low	...

📤 Submisia

Fișierul submission.csv trebuie să conțină exact două coloane:

SampleID
Exam_Score — predicția modelului

Exemplu:

SampleID	Exam_Score
101	81.2
102	49.7

⚙️ Evaluarea

Evaluarea modelelor se face cu două valori:

Partial RMSE – folosind 50% din date
Complete RMSE – folosind toate datele

Apoi RMSE este convertit într-un scor 0–100 printr-o interpolare liniară:

RMSE mic => scor mare
RMSE mare => scor mic

Modelul ideal (RMSE = 0) obține scorul maxim de 100.

📊 Sursa datelor

Datasetul este generat pe baza setului de date public de pe Kaggle: Student Performance Factors Dataset

文件

提交解答

上传输出文件和可选的源代码进行评测。

提交文件

点击上传或拖放文件

CSV、ZIP 等（最大 25MB）

源代码文件（可选）

点击上传或拖放文件

压缩包、笔记本或代码文件

登录以上传提交。

📘 Structura fișierelor de intrare

train.csv

Conține toate caracteristicile + eticheta țintă.

Coloane obligatorii:

SampleID

diverse features (categorice + numerice)

Exam_Score

Exemplu:

SampleID

StudyHours

Attendance

ParentalInvolvement

...

Exam_Score

3.5

High

Medium

...

1.2

Low

...

4.0

High

...

test.csv

Are aceeași structură ca train.csv, dar fără coloana Exam_Score, deoarece acesta trebuie prezis.

Exemplu:

SampleID

StudyHours

Attendance

ParentalInvolvement

...

101

3.0

High

Medium

...

102

0.7

Low

...

SampleID

Exam_Score

101

81.2

102

49.7