Comment calculer la médiane des données groupées

April 24

La médiane est le point central d'un ensemble de données ordonnées. Par exemple, l'ensemble (2,4,7,9,10) a une médiane de 7. données Groupés est agglomérée en catégories, avec le détail exact de chaque point perdu de données. Par conséquent, la médiane exacte ne peut être connue des seules données groupées. Cependant, si vous connaissez le nombre de points de données dans chaque intervalle, vous pouvez dire qui est le "intervalle centre", qui est, que l'on contient le point de données est la médiane. Vous pouvez affiner l'estimation du point médian à l'aide d'une formule, basée sur l'hypothèse que les points de données de l'intervalle moyen sont répartis uniformément.

Instructions

1 Groupe vos points de données en intervalles, si elles ne sont pas déjà. Déterminer quel intervalle doit contenir le point de données médian.

Pour des fins d'instruction, considérez l'ensemble de données (1,2,4,5,6,7,7,7,9). La médiane est ici 6. Vous pourriez le groupe mis en intervalles de largeur 4, par exemple. Sa distribution de fréquence peut alors être, par exemple,
1-4: 3
5-8: 5
9 à 12: 1
Dans les données dissociées, la médiane est clairement dans la catégorie 5-8. Vous pouvez dire que même sans voir l'ensemble de données d'origine.

2 Calculer la différence entre le nombre de points de données à l'intervalle moyen et la moitié du nombre total de points de données.

Pour l'exemple ci-dessus, ce qui équivaut à 9/2-3 = 1,5. Ce estime dans quelle mesure dans l'intervalle milieu de la moyenne devrait se situer.

3 Divisez par le nombre de points dans l'intervalle moyen.

En continuant avec l'exemple, 1,5 / 5 = 0,3. Cela donne une proportion de la distance dans l'intervalle milieu de la médiane est.

4 Multiplier le résultat par la largeur de l'intervalle moyen.

En continuant avec l'exemple, 0,3 x 4 = 1,2. La convertit la proportion dans l'intervalle dans un incrément réel des données.

5 Ajouter le résultat ci-dessus à la valeur entre l'intervalle moyen et l'intervalle ci-dessous.

Depuis la coupure entre l'intervalle moyen et l'intervalle ci-dessous est de 4,5, ce qui vous donne 4,5 + 1,2 = 5,7, que vous pouvez arrondir à 6, la réponse correcte.

Conseils et avertissements

  • En effet, le calcul ci-dessus est identique à l'aide de la formule L + (n / 2 - c) / FXW, où L est le nombre entre l'intervalle moyen et inférieur suivant, n représente le nombre total de points de données, c est la nombre cumulé de points au-dessous de l'intervalle moyen, f est le nombre de points de données dans l'intervalle intermédiaire, et w est la largeur.