Les avantages et inconvénients d'un modèle de régression multiple

August 30

La régression multiple est une technique statistique pour l'examen de la relation entre une variable, appelée la variable dépendante ou le résultat, et plus d'un variables indépendantes. La variable dépendante doit être continue ou presque continue. Les variables indépendantes peuvent être catégoriques ou continues. Par exemple, vous pourriez faire une régression multiple regardant la relation entre le poids (la variable dépendante) et la hauteur, l'âge et le sexe (les variables indépendantes).

Niveau de connaissance

La régression multiple est l'une des techniques statistiques les plus couramment utilisés, et beaucoup de gens sont familiers avec elle, au moins dans les grandes lignes. Ce sera particulièrement vrai pour les gens instruits dans les sciences sociales, comportementales ou physiques; pour ce public, la familiarité est un avantage. D'autre part, si votre public est la population en général, alors beaucoup de gens seront familiers avec la régression multiple; pour ce public, la familiarité est un inconvénient, et vous voudrez peut-être utiliser une statistique plus simple ou compter entièrement sur les graphes.

Hypothèses

La régression multiple fait quatre hypothèses, et ceux-ci doivent être vérifiés. Les hypothèses sont sur les erreurs du modèle; les erreurs sont la différence entre la valeur prédite de la variable dépendante et la valeur réelle de la variable dépendante. La régression multiple suppose que les erreurs du modèle sont normalement distribués; que les erreurs ont une variance constante; que la moyenne des erreurs est égal à zéro; et que les erreurs sont indépendantes.

La flexibilité

La régression multiple est une méthode très flexible. Les variables indépendantes peuvent être numériques ou catégorielles, et les interactions entre les variables peuvent être incorporés; et les termes polynomiaux peuvent également être inclus. Par exemple, en examinant la relation entre le poids et la taille, l'âge et le sexe, vous pouvez inclure la taille au carré et le produit de la taille et le sexe.
Ensuite, la relation entre la taille et le poids serait différent pour les hommes et les femmes, et la différence prédite de poids entre une personne de 5 pieds de haut et une personne de 5 pieds 1 ne sont pas la même que celle entre un 6 pieds de hauteur personne et une personne de 6 pieds 1.

Utilisation de plusieurs variables

La régression multiple utilise plusieurs variables indépendantes, chaque contrôle pour les autres. Par exemple, dans le modèle de poids lié à la taille, l'âge et le sexe, le modèle estime l'effet de commande de hauteur pour le sexe. Le paramètre de hauteur répond à la question «Quelle est la relation entre la taille et le poids, étant donné qu'une personne est un homme ou une femme et d'un certain âge?"