Comment calculer ANCOVA

February 6

Une analyse de covariance (ANCOVA) est une forme plus sophistiquée de l'analyse de la variance. Il représente une variable partagée entre les populations qui peuvent être expliquer la variation. Par exemple, trois groupes peuvent recevoir trois traitements. Les variations entre les survivances de groupe peuvent être entraînés par des différences d'âge; par conséquent, le contrôle de l'effet de l'âge en l'incluant comme une variable pourrait améliorer le pouvoir explicatif du modèle.

Instructions

Explication graphique

1 Déterminer les variables indépendantes et dépendantes, y compris la covariable.
Dans l'exemple ci-dessus, les deux variables dépendantes sont la covariable, l'âge et quel traitement le groupe a reçu. Le covariable doit être continu. Au-delà d'éviter les cellules vides, le bénéfice de cette deviendra clair dans les étapes suivantes.

2 Déterminer la régression linéaire pour chaque groupe. Dans notre exemple, l'âge est une variable indépendante, le temps de survie est une variable indépendante et chaque groupe a sa propre ligne de régression. L'âge a donc été pris en compte.

3 Rejeter l'hypothèse nulle (ce que les traitements sont les mêmes, à savoir que le coefficient de traitement est égal à zéro) si la différence entre les pentes est statistiquement significative.

4 Déterminer si les intersections sont les mêmes si les pentes sont introuvables pour être statistiquement différent.

5 Rejeter l'hypothèse nulle si les intersections sont significativement différentes. Si les trois lignes de régression ont la même pente mais leurs intersections sont significativement différentes, leur nature parallèle signifie qu'ils rencontreront nulle part et les traitements sont différents.

Conseils et avertissements

  • ANCOVA est un mélange de variables discrètes (ie, catégorique) et continus. Dans l'exemple ci-dessus, l'âge est la variable continue et si l'on est dans un groupe ou non est un (binaire) variable discrète. SAS gère ces problèmes de régression facilement contourner la complication ci-dessus.
  • Si polarisation peut être éliminé par une meilleure randomisation des populations, ce serait préférable de compenser ce biais mathématiquement. Dans l'exemple ci-dessus, l'âge doit être réparti de façon aléatoire avant l'expérience, on commence, si possible.
  • Les hypothèses du modèle ANCOVA doivent être remplies par les données dans une mesure significative pour les prédictions du modèle pour être valide. Ces hypothèses, comme dans ANOVA (analyse de variance), sont que la variance des erreurs ne sont pas fonction des variables indépendantes, que les erreurs sont normalement distribuées et que la relation entre les variables indépendantes et dépendantes est linéaire.
  • Deux voies ANOVA est plus approprié si la covariable (temps, dans l'exemple ci-dessus) est catégorique / discrète, évitant ainsi le problème des cellules vides et donc un besoin pour plus de sujets de test.