Comment le Outlier affecte la moyenne, médiane et mode?

November 23

Comment le Outlier affecte la moyenne, médiane et mode?


Le Dictionnaire de la statistique définit une valeur aberrante comme «une observation qui semble écarter nettement des autres observations de l'échantillon dans lequel il apparaît." Les mesures statistiques qui ne sont pas très affectés par les valeurs aberrantes sont appelés robuste.

Effet de Outlers sur la moyenne

Même une seule valeur aberrante peut avoir un effet énorme sur la moyenne. Considérons les ensembles de données suivants, la première sans valeur aberrante, la seconde avec une valeur aberrante relativement modérée, la troisième avec une valeur aberrante extrême et la dernière avec plusieurs valeurs extrêmes:

Ensemble de données 1: 150, 160, 130, 150, 120

Ensemble de données 2: 150, 160, 130, 150, 120, 180

Ensemble de données 3: 150, 160, 130, 150, 120, 350

Ensemble de données 4: 150, 160, 130, 150, 120, 300, 320, 340, 350.

L'ensemble de données (DS) 1 a une moyenne de 142; DS 2 a une moyenne de 148,3, DS 3 a une moyenne de 176 et DS 4 a une moyenne de 224.

L'effet de Outliers sur le médian

La médiane ou le nombre qui est supérieur à la moitié du nombre et de la moitié inférieure, est beaucoup moins affectée par les valeurs aberrantes que la moyenne. La médiane pour les ensembles de données 1, 2 et 3 est de 150. Même pour le jeu de données 4, elle monte seulement à 160.

L'effet de Outliers sur le mode

À moins de deux ou plusieurs des valeurs aberrantes ont la même valeur exacte, les valeurs aberrantes auront aucun effet sur le mode, qui est la valeur la plus courante. Le mode pour tous les ensembles de données est de 150, parce qu'il ya deux cas de 150 dans chaque ensemble de données, et aucune autre valeur est répétée.