Facteurs qui influencent l'analyse statistique

June 9

Facteurs qui influencent l'analyse statistique


La plupart des analyses statistiques porte sur l'essai d'un échantillon à trouver des informations sur un plus grand groupe, connu comme une «population». Par exemple, un homme politique pourrait sonder les électeurs à savoir la préférence de vote d'une région, ou un directeur d'usine pourrait tester des échantillons d'un produit afin de garantir une ligne d'assemblage fonctionne. Plusieurs facteurs sont liés au processus d'échantillonnage que vous devez prendre en compte pour faire vos statistiques valides, ainsi que les facteurs relatifs à l'analyse des données.

Échantillonnage aléatoire

Votre analyse statistique sera grandement influencée par le degré auquel vous parvenez à obtenir un échantillon aléatoire de votre population. Par exemple, si vous faites une étude nutritionnelle et vous voulez connaître l'apport calorique moyen des personnes dans votre ville, vous voulez étudier les personnes choisies au hasard, plutôt que, par exemple, 20 de vos amis. Un échantillon aléatoire a la meilleure chance de représenter véritablement le comportement de la population plus importante que vous étudiez.

échantillonnage Taille

L'échantillon que vous étudiez doit être suffisamment grand pour produire des informations significatives sur la population. Une enquête de cinq personnes ne produirait pas beaucoup d'informations utiles sur les habitudes alimentaires d'une ville d'un million de personnes. Il est possible de calculer la taille de l'échantillon nécessaire pour une certaine marge autorisée de l'erreur, mais en général, la taille de l'échantillon doit être aussi grande que possible dans les limites de temps et de budget. Un plus grand échantillon vous donnera un plus haut degré de certitude dans vos conclusions au sujet de la population.

échantillonnage Représentant

L'échantillon que vous prenez pour l'étude doit également être représentatif de la population qui vous intéresse. Ce concept est très proche de l'idée d'un échantillon aléatoire, mais légèrement différente. Si vous deviez aller à une salle de gym et de sonder des gens au hasard pour une étude nutritionnelle, vous auriez encore pas d'un échantillon représentatif de la population d'une ville, puisque tout le monde dans la ville va à la salle de gym. L'échantillon doit autant que possible de représenter la population générale, et devrait donc inclure des personnes de différents âges, professions, sexes et ainsi de suite.

Les niveaux de confiance

Une fois que vous avez fait votre échantillonnage et vos données, vous pouvez effectuer un grand nombre de tests statistiques sur la base des données. Bon nombre de ces essais comprennent ce qu'on appelle un niveau de confiance. Ceci est lié à la chance que vous êtes prêt à prendre que vous faites une erreur dans votre conclusion, et reflète une partie de l'incertitude dans l'extrapolation des données de l'échantillon à une population entière. Le niveau de confiance particulière que vous choisissez peut influer sur la conclusion de votre analyse; une analyse qui prouve une conclusion à un niveau de confiance ne peut manquer de prouver un niveau différent.