Comment faire pour utiliser l'analyse du chi carré

January 23

Comment faire pour utiliser l'analyse du chi carré


L'utilisation la plus courante du test statistique chi carré est le test de Pearson. Dans cette analyse, la fréquence d'apparition de diverses variables qualitatives trouvées dans un échantillon sont comparées aux fréquences attendues pour la population échantillonnée. En supposant que les proportions de l'échantillon diffèrent des proportions de population attendus, l'analyse chi carré répond à la question: Quelle est la probabilité, la différence observée est due uniquement à la variation aléatoire attendue lors de la prise d'un échantillon d'une population plus importante?

Instructions

1 Prendre un échantillon représentatif d'une population plus importante que vous souhaitez étudier. A titre d'exemple, supposons que vous souhaitez afin de déterminer si une machine d'emballage jelly bean fonctionne correctement. La machine est censée partie des haricots rouges, jaunes et verts en quantités égales dans chaque sac. Vous, par conséquent, de prendre un échantillon de 30 fèves de la sortie de la machine. Dans ce cas, la couleur est la variable catégorielle.

2 Déterminer le montant réel de chaque variable qui se produit dans votre échantillon. Ceci serait accompli en comptant le nombre de haricots rouges, jaunes et vertes dans l'échantillon. Peut-être vous trouverez huit rouges, sept jaunes et 15 vert.

3 Déterminer la quantité prévue de chaque variable dans votre échantillon. Si la machine est proportionner les couleurs uniformément, vous attendez 10 rouge, 10 jaune et vert 10 dans un échantillon de 30.

4 Calculer la statistique chi carré de test en utilisant la formule suivante pour chaque variable: (O - E) ^ 2 / E, où O est la quantité observée et E est le montant prévu. Faites ce calcul pour chaque variable, puis ajoutez les valeurs pour chaque variable ensemble. La statistique du chi carré pour l'exemple serait (8-10) ^ 2/10 + (7-10) ^ 2/10 + (15-10) ^ 2/10 = 3,8.

5 Déterminer les "degrés de liberté" pour votre test. Les degrés de liberté est le nombre de catégories moins 1. Dans l'exemple, il existe trois catégories (trois couleurs) donc il y a 3 - 1 = 2 degrés de liberté.

6 En utilisant les degrés de liberté et le chi statistique calculée de test carrée, regarder la statistique de test sur une table de chi carré standard. En règle générale, vous aurez l'air dans la colonne de gauche pour vos degrés de valeur de la liberté et de suivre le long de la ligne associée jusqu'à ce que vous trouverez votre valeur de chi carré. Ensuite, vous suivrez cette colonne vers le haut à la ligne supérieure et lire une valeur de probabilité. Ceci est la probabilité que la variation entre les proportions attendues et réelles a eu lieu par hasard et non en raison d'une erreur ou des conditions inhabituelles. Dans le cas de l'exemple, la probabilité est d'environ 15 pour cent.

7 De la valeur de probabilité dérivée, conclure si oui ou non la variation entre l'échantillon et la population était simplement dû au hasard. Normalement, une probabilité supérieure à 10 pour cent est considérée comme une variation insignifiante. Dans le cas des fèves à la gelée, puis, vous conclure la machine fonctionne correctement.

Conseils et avertissements

  • Dans certains cas, vous ne pouvez pas avoir un «attendu» valeur évidente, mais il y a des formules statistiques disponibles pour travailler autour de cette si nécessaire.