Séance 7, le 13 mai 2024

Le thème central de cette séance était les intervalles de confiance et le $p$-valeur.

Le premier exercice concerne le test de Wilcoxon-Mann-Whitney. Dans les documents de Chris Wild (anglais), vous trouverez des informations supplémentaires sur ce test. Erik Marsja et stikpet ont produit de courtes vidéos montrant comment réaliser le test de Wilcoxon-Mann-Whitney en python.

Le deuxième exercice portait sur la loi de Poisson et donc sur le cas particulier d’une loi discrète.

Le dernier exercice, que nous n’avons malheureusement pas pu aborder, traite trois modèles. Comme l’a dit George Box, “all models are wrong”.

Séance 6, le 6 mai 2024

Nous avons examiné les tests statistiques. Les deux premiers exercices portaient sur des tests classiques avec des variables à distribution binomiale. Le troisième porte sur la question de l’hétéroscédasticité. Le dernier exercice consiste à établir un tableau de contingence. Cet exercice classique demande s’il existe une corrélation entre les classes individuelles.

Sur la correction, R a été utilisé comme langage de programmation. Dans les TD, j’ai utilisé un Jupyter Notebook ainsi que les bibliothèques Pandas et SciPy. Dans l’exercice 4, une heatmap a été créée en utilisant la bibliothèque Plotly. Mais vous pouvez aussi utiliser Seaborn pour cela.

Séance 5, le 15 avril 2024

Nous avons parlé des estimateurs. En particulière l’estimateur du maximum de vraisemblance et l’estimateur par moment.

Pour l’exercice trois Lé Nguyén Hoang et Heu?reka ont collaboré à la réalisation d’une vidéo sur le biais et la variance des estimateurs et leur relation avec la sous-apprentissage et la sur-apprentissage. Comme le suggère le mot “apprentissage”, il y a ici un lien fort avec l’apprentissage automatique (machine learning).

Séance 4, le 8 avril 2024

Cette semaine, nous avons examiné les cas extrêmes. Dans le premier exercice, nous avons étudié un nouveau médicament et ses effets secondaires graves. Comme ce taux est défini sur l’intervalle $[0,1]$ et qu’il existe peu de lois appropriées sur cet intervalle, nous avons utilisé la fonction logit pour transformer l’intervalle vers les réels tout entier. À cette fin, nous avons examiné deux prieurs différents fondées sur la loi normale et la loi de student respectivement. Les deux sont concentrés autour de 0,5 et 2 %. Cependant, notre observation a suggéré des effets secondaires de 90 % et nous avons observé deux postérieurs complètement différents. Voir aussi mon outil sur le choix des priors.

Le deuxième exercice est basé sur un test de réaction. En partant de 65 personnes, nous essayons d’interpoler à l’ensemble du monde et nous constatons que notre modèle présente certains défauts.

Séance 3, le 25 mars 2024

Séance 2, le 18 mars 2024

Séance 1, le 11 mars 2024