Nanterre p10 - Dev Data

Logo

semaine s14

semaine s15

semaine courante (s17)

planning des veilles

Projet notebook

A faire

  1. choisir un thème en groupe (medecine, sport, musique, …)
  2. trouver un dataset au format csv dans kaggle sur le thème choisi
  3. trouver une colonne à prédire
  4. indiquer une colonne qui pourrait d’après vos connaissances sur le dataset choisi être un bon prédicteur pour la colonne à prédire
  5. plotter un catplot de ces 2 colonnes (ou tout autre visu qui pourrait confirmer ou infirmer le choix précédent)
  6. utiliser le TP intro stats pour trouver le meilleur predicteur (ici une fonction lineaire y = ax + b), selon la methode des moindres carrés
  7. evaluer la qualité du predicteur en calculant son RMSE (Root Mean Squared Error)

Modalité

Par groupe de 3 personnes. A rendre pour le lundi 08/03.

Groupes

groupe nom1 nom2 nom3
groupe1 Zhiying Roxane Matthieu
groupe2 Aleksandra Jordan-Marcus Jimmy
groupe3 Shehara Alain Juste Ali
groupe4 Vixra Amine Michelle
groupe5 Stanislas Stan  
groupe6 Stanislas Ahmad Shakib Ichrak
groupe7 Hanène Pierre-Antoine Daria
groupe8 Nedjma Olga Nobel Djamel