Comment trouver le coefficient de corrélation pour 'R' dans un nuage de points

March 12

Comment trouver le coefficient de corrélation pour 'R' dans un nuage de points


Quand les scientifiques et les mathématiciens parcelle données x, y sur un graphique, ils ont besoin de comprendre la mesure dans laquelle les valeurs de données sont corrélées les unes aux autres. Autrement dit, si les valeurs de x entre deux x, y augmentation des points de données, font les valeurs de y augmenter par le même facteur? Pour aider à cette détermination, le scientifique sera souvent calculer un coefficient de corrélation, en abrégé R. (Voir les références 1). Le coefficient de corrélation opère sur une échelle de -1,00 à 1,00, où 1,00 et -1,00 représentent une corrélation parfaitement linéaire et une valeur de zéro indique l'absence de corrélation. En termes plus pratiques, le coefficient de corrélation indique la mesure dans laquelle les points de données écartent du "meilleur ajustement" ligne tracée entre les points. (Voir 2 références).

Instructions

1 Calculer la valeur moyenne de x et y en additionnant toutes les valeurs de x et y, et en divisant par le nombre de points de données. À titre d'exemple, considérons un nuage de points avec trois (x, y) des points de données: (0,1), (2,3) et (5,6). Les valeurs x 0, 2 et 5 moyenne (0 + 2 + 5) / 3 = 2,33. La y valeurs 1, 3 et 7 moyenne (1 + 3 + 7) / 3 = 3,67.

2 Calculer l'écart type des points de données x et y, Sx et Sy, en calculant d'abord la valeur absolue de la différence entre chaque point de données et la moyenne, puis la quadrature de ces valeurs, la moyenne des valeurs au carré, et enfin en prenant la racine carrée. (Voir 3 références). Reprenons l'exemple de l'étape 1, les valeurs x de 0, 2 et 5 donnent des écarts de | 0 à 2,33 |, | 2 à 2,33 | et | 5-2,33 |, ou 2,33, 0,33 et 2,67. Élever au carré chacune de ces valeurs donne 5,43, 0,11 et 7,13. Les valeurs au carré en moyenne à 4,22, et en prenant la racine carrée de ce nombre donne 2,05. Par conséquent, l'écart-type pour x ou Sx, est 2.055 et Sy est 2.494.

3 Trouver l'équation de la pente de la régression linéaire ou "meilleur ajustement" ligne tracée à travers les données. Certains programmes graphiques de logiciels vont effectuer la régression linéaire et afficher l'équation sur le graphique sous la forme y = mx + b, où m représente la pente et b représente l'ordonnée à l'origine. Si l'équation de la courbe d'ajustement ne sont pas disponibles, choisissez deux points sur la ligne et les étiqueter x1, y1 et x2, y2. Ensuite, calculer la pente, m, par m = (y2 - y1) / (x2 - x1). Dans le cas des données de l'échantillon de l'étape 1, la pente est 1,2105.

Conseils et avertissements

  • La plupart des programmes graphiques indiquent le carré du coefficient de corrélation, ou R ^ 2, au lieu de R. Pour obtenir cette valeur, il suffit de multiplier R par lui-même.