Méthodes statistiques descriptives

September 28

Méthodes statistiques descriptives


Statisticiens distinction entre les deux types de statistiques: descriptives et déductives. Dans les statistiques descriptives, les valeurs décrivent un ensemble de nombres résultant de l'essai d'un groupe complet ou «population». Ces descriptions permettent une collecte de données à résumer efficacement en fournissant une indication de l'endroit où le centre de données réside et comment étaler les valeurs.

Tendance centrale

Une importante description d'un ensemble de données est la mesure de la tendance centrale. Ceci est la valeur autour de laquelle les chiffres ont tendance à se rassembler. Il y a trois façons de décrire cela. La moyenne ou la moyenne est la somme de toutes les valeurs divisée par le nombre de valeurs. Le mode est la valeur qui apparaît le plus fréquemment dans l'ensemble de données (note il peut y avoir plus d'un mode). La médiane est la valeur qui a tout comme beaucoup d'autres valeurs qui sont inférieures à une plus grande qu'elle ne l'est.

Variance

Une autre description importante d'un ensemble de nombres est la variance, qui est la propagation des valeurs. Dans un ensemble avec une petite variance des données, les valeurs seront proches l'un de l'autre, alors que l'inverse est vrai pour une grande variance. Les statisticiens utilisent généralement l'écart-type en tant que mesure de la variance. L'écart type est calculé par une formule complexe, mais vous pouvez le considérer comme donnant une indication de la distance moyenne de tous les points de données à partir du point central de données.

percentiles

Statistiques utilise également le concept de percentile. Le percentile "nième" d'un ensemble de nombres est la valeur qui a n pour cent de l'ensemble des données en dessous. Ainsi, par exemple, un étudiant dont le score sur un test est au 90e percentile a marqué plus de 90 pour cent des autres étudiants. Les percentiles les plus couramment utilisés sont à des étapes de 25 pour cent et sont donc appelés quartiles. Les quartiles les plus fréquemment utilisés sont le premier quartile, égal au 25e percentile, et le troisième quartile, égal à 75 pour cent.

Gamme

La portée d'un ensemble de données est également importante. Un statisticien peut parfois calculer la plage en prenant la moyenne plus ou moins trois fois l'écart type, mais cela est vrai que pour les ensembles de données symétriques. La façon la plus commune pour décrire la gamme est tout simplement de donner les valeurs les plus basses et les plus élevées dans l'ensemble de données. Ces valeurs peuvent être utiles dans l'interprétation des autres statistiques puisque, par exemple, la moyenne d'un ensemble de données peut être faussée par une seule valeur très élevée ou très faible.