Comment calculer le coefficient bêta

October 4

Comment calculer le coefficient bêta


Le coefficient bêta dans la régression linéaire simple apparaît dans un ajustement linéaire à un ensemble de points de données (x_i, y_i) comme suit: y_i =? +? * X_i, où l'astérisque indique la multiplication et l'i sert d'un indice dont la valeur distingue un point de données d'un autre. Dans la régression linéaire, les coefficients? et ? résulter d'ajustement d'une droite passant par les points de données (x_i, y_i) de manière à minimiser la distance entre la ligne et les points de données. Mathématiquement, la ligne de meilleur ajustement minimise la somme des distances verticales au carré, comme indiqué dans l'introduction de Freund "Statistiques mathématiques." Calcul est utilisé pour trouver les formules des coefficients? et ? qui minimisent cette distance.

Instructions

1 Somme toutes les y_i de. Donc, s'il y a des n points de données (X_i, y_i), la sommation? Y_i est une sommation de n nombres.

Par exemple, si vos points de données sont (0,1), (1,2) et (3,4) (un déraisonnablement petit ensemble d'observations pour le bien de l'exposition), alors? Y_i = 1 + 2 + 4 = 7 où l'indice i varie de 1 à 3.

2 Somme toutes les X_i de.

Pour l'exemple ci-dessus,? X_i = 0 + 1 + 3 = 4.

3 Additionner le produit appariée des x_i et y_i.

Pour l'exemple ci - dessus,? (X_i

y_i) = 1 0 + 2 + 1 4 3 = 14.

4 Somme x_i ^ 2, où le caret ^ indique exponentiation.

Pour l'exemple ci-dessus,? (X_i ^ 2) = 0 ^ 2 + 1 + 2 ^ 3 ^ 2 = 10.

5 Calculer l'estimation de? en branchant tout dans la formule {(x_i * y_i?) -? (1 / n) x_i y_i} / {(x_i ^ 2?) - [? x_i] (1 / n) ^ 2}, où n est le nombre de points de données.

Pour l'exemple ci-dessus, le résultat? est {14- (1/3) 4 * 7} / {10- (1/3) 4 ^ 2} = 1. Ainsi, la pente de la ligne de meilleur ajustement est 1.

Conseils et avertissements

  • Les deux équations qui minimisent l'erreur et fournissent les formules? et ? sont ?/?? ? (Erreur) ^ 2 = 0 et? / ?? ? (Erreur) ^ 2 = 0, où "erreur" est égal? ? + * X_i - y_i. Rappeler que ? +? * X_i est la ligne de meilleur ajustement évalué à x_i et y_i est le (observé) valeur à x_i empirique.