Check your outliers! An introduction to identifying statistical outliers in R with easystats

Résumé

Au-delà du défi de se tenir au courant des meilleures pratiques actuelles concernant le diagnostic et le traitement des valeurs aberrantes, une difficulté supplémentaire se pose concernant la mise en œuvre mathématique des méthodes recommandées. Nous donnons ici un aperçu des recommandations et des meilleures pratiques actuelles et démontrons comment elles peuvent être facilement et commodément mises en œuvre dans le logiciel de calcul statistique R, en utilisant le package {performance} de l’écosystème easystats. Nous abordons les méthodes de détection des valeurs aberrantes statistiques univariées, multivariées et basées sur un modèle, leur seuil recommandé, la sortie standard et les méthodes de traçage. Nous concluons en passant en revue les différents types théoriques de valeurs aberrantes, la question de savoir s’il faut les exclure ou les winsoriser, et l’importance de la transparence. Une pré-impression de cet article est disponible à l’adresse suivante : https://doi.org/10.31234/osf.io/bu6nt.

Publication
Behavior Research Methods, 56(4), 4162-4172. doi.org/10.3758/s13428-024-02356-w
Rémi Thériault
Rémi Thériault
Étudiant au doctorat (Psychologie sociale)

Mes intérêts de recherche incluent la cognition sociale/implicite, l’altruisme, et les rêves.

Sur le même sujet