Comment interpréter un test de Chi-Square

October 19

Comment interpréter un test de Chi-Square


Les statisticiens utilisent le test du chi-carré pour analyser la fréquence avec laquelle certaines caractéristiques apparaissent dans un échantillon prélevé sur une population plus large. Ils appliquent le test pour déterminer si les variations entre les résultats des échantillons observés et les résultats qu'ils attendaient de voir sont statistiquement significatifs. La première étape consiste à calculer la valeur du chi-carré, en utilisant l'équation (o - e) ^ 2 / e où o est la fréquence observée d'une caractéristique et e est la fréquence prévue. Vous devez calculer ce pour chaque caractéristique et la somme de toutes les valeurs dans un seul numéro. Ensuite, vous interprétez ce numéro avec une table de probabilité.

Instructions

1 Déterminer les "degrés de liberté" pour votre analyse du chi carré. Les degrés de valeur de la liberté est égal au nombre de caractéristiques différentes que vous analysez, moins un. Donc, si vous étiez intéressé à savoir si une machine remplissait les paquets de haricots de gelée avec les proportions correctes de haricots rouges, jaunes et bleus, vous auriez 3 catégories et 2 degrés de liberté. Peut-être sur 100 fèves que vous attendiez à trouver 50 rouge, 30 jaune et bleu 20 mais votre échantillon contenait en fait 45 rouge, 32 jaune et 23 bleu. Vous voulez savoir si cet écart signifie que la machine ne fonctionne pas, ou est simplement dû au hasard une variation aléatoire dans l'échantillonnage.

2 Trouvez vos degrés de valeur de la liberté sur la colonne de gauche d'une table de probabilité chi-carré. Regardez le long de la ligne correspondante jusqu'à ce que vous trouverez votre valeur de test chi-carré.

3 Suivez la colonne où la valeur de votre chi-carré apparaît vers le haut pour la rangée supérieure. Lorsque votre colonne rencontre la rangée du haut, vous trouverez une valeur de probabilité, sous forme décimale; par exemple, une valeur de 0,30 signifie une probabilité de 30 pour cent. Ceci est la probabilité que les écarts que vous avez vu entre les résultats observés dans l'échantillon et les résultats attendus sont dus au hasard seulement. Dans le cas des numéros de fèves à la gelée, la valeur de chi-carré correspondant est de 1,072, qui a une probabilité d'environ 60 pour cent.

4 Évaluer la probabilité de lecture que vous venez d'obtenir en fonction de vos propres critères pour ce que vous considérez un niveau acceptable du hasard. Un critère commun est de 10 pour cent. Cela signifie que si votre probabilité est de 10 pour cent ou plus, vous supposez que la variation que vous avez vu dans les données de votre échantillon était seulement dû au hasard aléatoire. Dans le cas des données de jelly bean, la probabilité de 60 pour cent est beaucoup plus élevé que 10 pour cent, de sorte que vous conclurait probablement que vous avez vu que la variation aléatoire et la machine fonctionne correctement.

Conseils et avertissements

  • Vous ne devez pas utiliser le test du chi-carré si la valeur attendue pour les observations de toute caractéristique est inférieure à 5.