Séance 8, le 27 mai 2024

Dans le premier exercice, nous avons effectué une régression linéaire. Cependant, nous nous sommes concentrés sur la significativité du coefficient. Une fois de plus, nous avons dû faire face à la loi de Student.

Le célèbre jeu de données de l’iris de Fisher a fait l’objet du deuxième exercice. Ce je de données joue un rôle important dans la science des données et l’apprentissage automatique. Vous pouvez jeter un coup d’œil aux pages de scikitlearn et plotly express.

Séance 7, le 13 mai 2024

Le thème central de cette séance était les intervalles de confiance et le $p$-valeur.

Le premier exercice concerne le test de Wilcoxon-Mann-Whitney. Dans les documents de Chris Wild (anglais), vous trouverez des informations supplémentaires sur ce test. Erik Marsja et stikpet ont produit de courtes vidéos montrant comment réaliser le test de Wilcoxon-Mann-Whitney en python.

Le deuxième exercice portait sur la loi de Poisson et donc sur le cas particulier d’une loi discrète.

Le dernier exercice, que nous n’avons malheureusement pas pu aborder, traite trois modèles. Comme l’a dit George Box, “all models are wrong”.

Séance 6, le 6 mai 2024

Nous avons examiné les tests statistiques. Les deux premiers exercices portaient sur des tests classiques avec des variables à distribution binomiale. Le troisième porte sur la question de l’hétéroscédasticité. Le dernier exercice consiste à établir un tableau de contingence. Cet exercice classique demande s’il existe une corrélation entre les classes individuelles.

Sur la correction, R a été utilisé comme langage de programmation. Dans les TD, j’ai utilisé un Jupyter Notebook ainsi que les bibliothèques Pandas et SciPy. Dans l’exercice 4, une heatmap a été créée en utilisant la bibliothèque Plotly. Mais vous pouvez aussi utiliser Seaborn pour cela.

Séance 5, le 15 avril 2024

Nous avons parlé des estimateurs. En particulière l’estimateur du maximum de vraisemblance et l’estimateur par moment.

Pour l’exercice trois Lé Nguyén Hoang et Heu?reka ont collaboré à la réalisation d’une vidéo sur le biais et la variance des estimateurs et leur relation avec la sous-apprentissage et la sur-apprentissage. Comme le suggère le mot “apprentissage”, il y a ici un lien fort avec l’apprentissage automatique (machine learning).

Séance 4, le 8 avril 2024

Séance 3, le 25 mars 2024

Séance 2, le 18 mars 2024

Séance 1, le 11 mars 2024