Comment graphiquement Parcelles résiduelles

October 24

Dans les statistiques, les résidus sont ce qui reste après ajustement d'un modèle. Beaucoup de méthodes statistiques (comme la régression multiple) faire des hypothèses sur les résidus. Ces hypothèses peuvent être vérifiées avec des parcelles. En outre, dans tout modèle, les résidus peuvent indiquer des erreurs de saisie de données ou des points autrement problématiques. Traçage est une partie essentielle de l'analyse statistique.

Instructions

1 Tracer les résidus contre les valeurs ajustées du modèle. Dans une parcelle de régression linéaire, cette parcelle doit apparaître comme une tache, sans motif. Ceci est un moyen de vérifier l'hypothèse d'homoscédasticité, ou l'égalité de la variance.

2 Tracer les racines carrées des résidus contre valeurs ajustées du modèle. Ceci est un autre chèque de questions similaires à celles du premier tracé, mais il montre plus clairement la taille du résidu parce que les racines carrées sont tous positifs.

3 Faire une parcelle normale quantile des résidus pour une visualisation de la normalité des données. La régression linéaire suppose que les résidus sont normalement distribués.

4 Tracer la distance de Cook contre les résidus. la distance de Cook est une mesure de l'influence d'un point de données particulier sur une équation de régression. Si un point a une grande influence, la suppression de cela ferait une grande différence dans l'équation de régression. Il est un principe général que de petits changements dans les données d'entrée devraient faire de petits changements dans la sortie. Les points forts d'influence violent cette hypothèse.

Conseils et avertissements

  • Chacune de ces parcelles peuvent être créées dans tout bon programme statistique, tels que SAS, R ou SPSS.