Comment faire pour supprimer Outliers Avec un Z Score

April 6

Lors de l'analyse d'un ensemble de données, on peut souvent avoir des valeurs aberrantes, les points qui ne semblent pas correspondre au modèle de données établies par le reste des points de données. Ils peuvent souvent être vus graphiquement vos résultats, car trouver l'équation "meilleur ajustement" pour un ensemble de points peut rendre les traînards très évident. Ils peuvent être causées par des erreurs de mesure, des phénomènes inconnus ou simplement des erreurs dans la méthode expérimentale. Utilisez la méthode z-score pour éliminer les valeurs aberrantes.

Instructions

1 Calculer la moyenne et la médiane de la déviation absolue de la médiane, ou MAD, de votre ensemble de données. Pour calculer la moyenne, ajouter tous les résultats et diviser cette somme par le nombre de points de données. Pour calculer la médiane de la déviation absolue de la médiane, soustraire la moyenne de chaque point de données, prendre la valeur absolue et trouver la médiane - milieu - valeur de ces résultats.

2 Calculer le z-score pour chaque point de données en soustrayant la moyenne de la population du point de données, et en divisant cette réponse par le MAD. Ceci est modifié z-score de ce point de données.

3 Décidez comment vous voulez déterminer une valeur aberrante. Le test heuristique indique qu'un point de données avec un z-score modifié de 3,5 ou plus devrait déterminer une valeur aberrante. En fonction de votre recherche, vous pouvez éliminer les valeurs aberrantes tout à fait, ou l'incorporer dans vos résultats et de l'expliquer dans votre recherche.