Quels sont les inconvénients d'une analyse statistique?

April 17

Quels sont les inconvénients d'une analyse statistique?


Les scientifiques, les sociologues, les sondeurs et bien d'autres utilisent l'analyse statistique pour obtenir les informations dont ils ont besoin. Les statistiques peuvent être un outil puissant et il peut fournir des réponses utiles. Cependant, il existe quelques inconvénients. Lorsque vous effectuez un test statistique, vous êtes généralement tester un échantillon prélevé dans une population, puis en utilisant les données de votre échantillon pour tirer des conclusions sur cette population. Par exemple, un sondage téléphonique pourrait interroger 1000 personnes pour savoir ce que tout le monde dans le pays est de penser à un certain parti politique. Un grand nombre des inconvénients des statistiques découlent de l'utilisation d'échantillons.

Problèmes avec échantillonnage

Un problème majeur avec l'analyse statistique est la difficulté d'obtenir un échantillon qui reflète vraiment la population plus grande que vous étudiez. Un échantillon devrait idéalement être à la fois représentatif et aléatoire. Un échantillon représentatif est celui qui reflète la diversité de la population en général. Un échantillon aléatoire est celui dans lequel chaque élément de la population a une chance égale d'être choisi pour l'échantillon. Si vous ne répondez pas à ces critères, les données d'échantillon ne reflètent pas correctement la population. Un problème typique est un biais de non-réponse, dans laquelle certains types de personnes ne répondent pas à une enquête, produisant ainsi des statistiques non-aléatoires.

déductions

En testant un échantillon plutôt que l'ensemble de la population, vous êtes vous-même un gain de temps et d'argent. Cependant, le prix que vous payez est que les données de l'échantillon que vous obtenez ne sera pas exactement les mêmes que les données démographiques. Cela signifie que vous devez faire des inférences ou des suppositions éclairées, à propos de la population en fonction des caractéristiques de votre échantillon, et donc vos conclusions sera toujours inexacte. Pour cette raison, les analyses statistiques produisent souvent une gamme pour une caractéristique de la population, plutôt que d'une seule valeur numérique.

Hypothèses Normalité

De nombreux calculs et tests statistiques communes font une hypothèse importante sur la population qu'ils étudient. Cette hypothèse est que la population a ce qu'on appelle une distribution «normale». Cela signifie que la caractéristique d'intérêt dans la population est répartie uniformément. Pour de nombreux phénomènes naturels, cela est vrai. Par exemple, les hauteurs des gens ont tendance à être normalement distribués. La plupart des gens sont de taille moyenne, avec un petit pourcentage de personnes étant à la fois à court et grand. Si la population que vous étudiez est pas «normal» que vous savez peut-être pas, et cela peut rendre vos statistiques incorrectes.

Niveaux de probabilité

Une grande partie des statistiques est basée sur les concepts de probabilité. Une observation est presque jamais impossible dans les statistiques, seulement très peu probable. Cela signifie que lorsque vous dessinez conclusions dans une analyse statistique, vous devez tracer la ligne à un certain niveau de probabilité. En règle générale, les statisticiens accepteront un résultat aussi significatif s'il y a seulement un 5 ou 10 pour cent de probabilité que le résultat aurait pu se produire par hasard. Cela signifie que, dans de nombreux tests statistiques, votre conclusion a 5 pour cent ou 10 pour cent de probabilité d'être tout simplement faux.