Comment calculer R Squared en régression

April 21

Comment calculer R Squared en régression


Vous pouvez utiliser R au carré d'évaluer la force de la relation entre deux variables. En règle générale, ces variables se composent d'un organisme indépendant "x" valeur (dollars dépensés en publicité par mois, par exemple) et une valeur dépendant "y" (tels que les ventes mensuelles de produits). La première étape est de mettre les données en paires de correspondance valeurs x et y, les représenter graphiquement et de trouver l'équation de la meilleure ligne droite à travers les points. Avec cette équation, vous pouvez déterminer R au carré en utilisant quelques calculs de base.

Instructions

1 Trouver la moyenne de toutes les valeurs «y» dans l'ensemble des paires de données. Par exemple, considérons l'ensemble des paires de données (1,2), (3,4) et (6,8), qui ont une meilleure équation en ligne droite en forme de y = 1.211x + 0,632. La valeur y moyenne pour cet ensemble est (2 + 4 + 8) / 3 = 4,67. Vous avez déjà trouvé la meilleure équation d'ajustement linéaire pour vos données en utilisant une application de tableur (comme Microsoft Excel) pour créer un diagramme de dispersion des nombres et de générer l'équation pour cette parcelle.

2 Soustraire la valeur y moyenne de chaque valeur individuelle puis y carré la différence. Ajouter tous les carrés des différences. Dans l'exemple, ce serait composé de (2 à 4,67) ^ 2 + (4 à 4,67) ^ 2 + (8 à 4,67) ^ 2 = 18,67. Dans les statistiques, cette valeur est appelée SS (Total).

3 Calculer la valeur de y que votre équation linéaire prédit pour chaque valeur de x dans chaque paire de données. Elles sont connues comme les valeurs "y chapeau". Vous trouverez ces valeurs en remplaçant chaque valeur de x dans l'équation s'en ligne droite pour vos données et résoudre l'équation pour y. Pour les données d'exemple, un chapeau y pour le premier point de données = (1.211) (1) + 0,632 = 1,843. Les deux autres valeurs y chapeau sont 4.265 et 7.898.

4 Calculez la différence entre la valeur réelle y pour chaque point de données et la valeur y chapeau correspondant. Carrés chacune de ces différences, puis les ajouter. Dans l'exemple, cela donnerait (2 à 1,843) ^ 2 + (4 à 4,265) ^ 2 + (8 à 7,898) ^ 2 = 0,105. Cette valeur est connue sous le nom SSE.

5 Effectuer le calcul suivant pour trouver la valeur de R au carré: [SS (Total) - SSE] / SS (Total). Les données d'exemple auraient donc une valeur de R (18,67 à 0,105) au carré /18.67 = 0,9944.

Conseils et avertissements

  • La valeur maximale possible pour R au carré est 1.
  • En règle générale, plus R au carré est de 1, plus la corrélation entre les variables x et y. Cependant, ce ne sont pas toujours vrai. Si x et y sont liés, mais de façon non-linéaire, par exemple, la meilleure ligne droite ajustement donnera un pauvre R au carré.