Méthodes d'analyse des données discrètes

April 29

les données discrètes sont des données qui ne peuvent prendre un nombre limité de valeurs. Ceux-ci peuvent être ordinal ou nominal.

données ordinal a un ordre. Par exemple, si vous demandez aux gens «Combien soutenez-vous le président?" et les réponses possibles sont "none", "un peu", "certains" et "beaucoup", puis les données sont discrètes (seulement quatre réponses possibles), mais a un ordre.

données nominale n'a pas un tel ordre. Par exemple, si vous demandez aux gens au sujet de leur couleur de cheveux et les choix sont "blonde", "brun", "rouge", "blanc", "chauve" et "autres" alors peut-être des réponses ont pas d'ordre.

Méthodes de univariée données discrètes

signifie que les données univariée lorsque vous analysez une seule variable. Si la variable est nominale, vous êtes essentiellement limité à une table de fréquences. Certaines données ordinales peuvent avoir des mesures significatives de la tendance centrale (telles que la médiane) et la propagation (tels que la gamme interquartile). En particulier, si les données sont des versions discrètes de variables continues, celles-ci sont significatives.

Par exemple, le revenu est souvent classé dans un nombre limité de catégories; de nombreuses enquêtes demanderont "Quel est votre revenu?" et une série d'options telles que «Moins de 20 000 $", "$ 20,000 $ 39,999", "40,000 $ $ 59,999» et ainsi de suite. Celles-ci ont un ordre.

Méthodes de bivariées données discrètes

signifie des données bivariées vous avez deux variables. Dans ce cas, vous êtes souvent intéressé à savoir si les deux variables sont indépendantes les unes des autres. Si les deux variables sont nominales, la méthode habituelle est un test de chi-carré. Si un ou les deux variables sont ordinales, alors il existe des alternatives; celui qui est peu utilisé mais très utile est le test de Jonckheere Terpstra. Par exemple, si vous comparez combien les Noirs, les Blancs, les Latinos et les Asiatiques aiment le président, en utilisant l'échelle ci-dessus, alors vous pourriez les comparer en utilisant ce test.

Méthodes de régression pour Discrete données autres que Comtes

Si vous souhaitez lier une variable (la variable dépendante) à un ou plusieurs autres variables (les variables indépendantes) alors il y a une grande famille de modèles de régression qui peuvent être utiles. Le choix de la méthode de régression dépend de la nature de la variable dépendante (la variable que vous essayez d'expliquer). Si la variable dépendante est dichotomique (prend seulement deux valeurs, telles que "Est-ce que le patient vit-il?"), Puis la régression logistique est appropriée. Si la variable dépendante est ordinale (comme la question au sujet du président), vous pouvez alors utiliser la régression logistique ordinale. Si elle est nominale (comme la couleur des cheveux), vous pouvez utiliser multinomial de régression logistique.

Donc, vous pourriez être intéressé à savoir si l'âge affecte la chance de vivre à travers une procédure médicale (régression logistique) d'une personne, l'opinion du président (ordinal logistique) ou de la couleur des cheveux (logistique multinomiale).

Méthodes de régression pour les données de comptage

Si la variable dépendante est un nombre, qui est, si elle ne peut prendre que des valeurs entières non négatives, alors soit une régression de Poisson ou de régression binomiale négative peuvent être la bonne méthode. La régression de Poisson est plus simple, mais fait des hypothèses restrictives. Si, comme cela est souvent le cas, il y a un grand nombre de 0 dans la variable dépendante, alors nul gonflé Poisson ou zéro gonflé régression binomiale négative peut être utilisé.

Par exemple, vous pourriez être intéressé par le nombre de fois qu'une personne avait été arrêté. Ceci est une variable de comptage, car il ne peut être 0, 1, 2 ... Vous pourriez vous demander à propos des variables indépendantes telles que le sexe (masculin / féminin), l'âge, le groupe ethnique et le revenu. Ce serait un bon cas pour l'une des méthodes mentionnées ici. Comme il y a un grand nombre de personnes qui ont jamais été arrêtés, un modèle zéro-gonflé serait probablement nécessaire.