Projet notebook
A faire
- choisir un thème en groupe (medecine, sport, musique, …)
- trouver un dataset au format csv dans kaggle sur le thème choisi
- trouver une colonne à prédire
- indiquer une colonne qui pourrait d’après vos connaissances sur le dataset choisi être un bon prédicteur pour la colonne à prédire
- plotter un catplot de ces 2 colonnes (ou tout autre visu qui pourrait confirmer ou infirmer le choix précédent)
- utiliser le TP intro stats pour trouver le meilleur predicteur (ici une fonction lineaire y = ax + b), selon la methode des moindres carrés
- evaluer la qualité du predicteur en calculant son RMSE (Root Mean Squared Error)
Modalité
Par groupe de 3 personnes. A rendre pour le lundi 08/03.
Groupes
groupe |
nom1 |
nom2 |
nom3 |
groupe1 |
Zhiying |
Roxane |
Matthieu |
groupe2 |
Aleksandra |
Jordan-Marcus |
Jimmy |
groupe3 |
Shehara |
Alain Juste |
Ali |
groupe4 |
Vixra |
Amine |
Michelle |
groupe5 |
Stanislas |
Stan |
|
groupe6 |
Stanislas |
Ahmad Shakib |
Ichrak |
groupe7 |
Hanène |
Pierre-Antoine |
Daria |
groupe8 |
Nedjma |
Olga Nobel |
Djamel |