Comment interpréter la régression hiérarchique

September 21

régression hiérarchique est une méthode statistique d'explorer les relations entre, et tester des hypothèses au sujet, une variable dépendante et plusieurs variables indépendantes. La régression linéaire nécessite une variable dépendante numérique. Les variables indépendantes peuvent être numériques ou catégorielles. signifie la régression hiérarchique que les variables indépendantes ne sont pas entrés dans la régression simultanément, mais dans les étapes. Par exemple, une régression hiérarchique pourrait examiner les relations entre la dépression (tel que mesuré par une échelle numérique) et variables, y compris les données démographiques (comme l'âge, le sexe et le groupe ethnique) dans la première étape, et d'autres variables (comme les scores sur les autres tests) dans une deuxième étape.

Instructions

Interpréter la première étape de la régression.

1 Regardez le coefficient de régression non normalisé (qui peut être appelé B sur votre sortie) pour chaque variable indépendante. Pour les variables indépendantes continues, ce qui représente la variation de la variable dépendante pour chaque changement d'unité dans la variable indépendante. Dans l'exemple, si l'âge avait un coefficient de régression de 2.1, cela voudrait dire que la valeur prédite de la dépression augmente de 2,1 unités pour chaque année d'âge.

Pour les variables catégorielles, la sortie doit afficher un coefficient de régression pour chaque niveau de la variable, sauf un; celui qui manque est appelé le niveau de référence. Chaque coefficient représente la différence entre ce niveau et le niveau de référence sur la variable dépendante. Dans l'exemple, si le groupe ethnique de référence est «Blanc» et le coefficient non standardisé pour "Black" est -1.2, cela voudrait dire que la valeur prédite de la dépression pour les Noirs est de 1,2 unités inférieur à celui des Blancs.

2 Regardez les coefficients standardisés (qui peuvent être marqués par la lettre bêta grec). Ceux-ci peuvent être interprétés de manière similaire aux coefficients non normalisés, seulement ils sont maintenant en termes d'unités d'écart-type de la variable indépendante, plutôt que des unités brutes. Cela peut aider à comparer les variables indépendantes les unes aux autres.

3 Regardez les niveaux de signification, ou p-valeurs, pour chaque coefficient (ceux-ci peuvent être étiquetés «Pr>» ou quelque chose de similaire). Ceux-ci vous dire si la variable associée est statistiquement significative. Cela a une signification très particulière qui est souvent déformé. Cela signifie que le coefficient de cette haute ou plus dans un échantillon de cette taille serait peu probable de se produire si le coefficient réel, dans l'ensemble de la population à partir de laquelle c'est tiré, était de 0.

4 Regardez R au carré. Cela montre quelle est la proportion de la variation de la variable dépendante est pris en compte par le modèle.

Interpréter les étapes ultérieures de la régression, le changement et le résultat global

5 Répéter ce qui précède pour chaque étape ultérieure de la régression.

6 Comparez les coefficients standardisés, les coefficients non normalisés, les niveaux de signification et r-squareds dans chaque étape à l'étape précédente. Celles-ci pourraient être dans des sections distinctes de la sortie, ou dans des colonnes séparées d'une table. Cette comparaison vous permet de savoir comment les variables de la deuxième étape (ou plus tard) affectent les relations dans la première étape.

7 Regardez l'ensemble du modèle, y compris toutes les étapes. Regardez les coefficients non normalisés et standardisés et les niveaux pour chaque variable de l'importance et de la R au carré pour l'ensemble du modèle.

Conseils et avertissements

  • Ceci est un sujet très complexe.