Courbe Méthodes de montage

November 5

d'ajustement de courbe fait référence à une variété de techniques pour trouver des courbes qui correspondent à un ensemble de points. Les points pourraient être dans un nuage de points en deux dimensions ou dans un espace à trois dimensions ou plus. Un exemple bidimensionnel est les points représentant les hauteurs et les poids des adultes. En plus de dimensions, vous pourriez avoir les revenus, l'âge, des années de l'éducation et les niveaux d'éducation des parents de personnes.

Régression linéaire

La régression linéaire correspond à une ligne à travers les données de manière à minimiser la somme des carrés des erreurs. L'erreur pour chaque point est la distance du point à la ligne. L'erreur quadratique pour chaque point est cette valeur, au carré, et la somme des erreurs au carré est simplement les erreurs au carré pour chaque point additionnées. La régression linéaire ne correspond pas nécessairement une ligne droite aux données; il est linéaire dans les paramètres. Par exemple, si vous modélisez le poids en fonction de la taille au carré, puis la ligne des moindres carrés résultant ne sera pas directement dans un diagramme de dispersion de la hauteur et le poids. Un avantage de la régression linéaire est la simplicité d'interprétation; la régression linéaire exprime une variable en fonction des autres variables d'une manière simple. Un inconvénient est que la régression linéaire fait de nombreuses hypothèses sur les données.

Splines

Splines sont un ensemble de méthodes pour le montage par morceaux courbes polynomiales aux données. D'abord, les données sont divisées en ensembles, sur la base du niveau des variables, puis une courbe polynomiale est apte à chaque ensemble, les courbes résultantes sont combinées. Une des méthodes les plus courantes est splines cubiques, qui correspondent à une courbe cubique à chaque ensemble de données. Il existe de nombreux choix pour déterminer le nombre d'ensembles de données et la nature exacte des courbes. Un avantage de cannelures est qu'ils sont très souples et peuvent s'adapter de nombreux ensembles de données très bien. Un inconvénient est que leur sens de fond est souvent pas très intuitive.

régression locale

régression locale, également connu sous le loess, commence également en divisant les données en séries. Elle diffère de splines en ce qu'il correspond à chaque ensemble de données à l'aide de moindres carrés pondérés plutôt que polynômes et dans la façon dont le nombre d'ensembles de données est déterminée. Il a des avantages et des inconvénients similaires comme splines, mais à un degré encore plus grand.

régression non linéaire

La régression linéaire suppose que la relation que vous êtes raccord est linéaire. Splines et loess font presque aucune hypothèse sur la relation. Parfois, cependant, vous soupçonnez fortement que la relation est non linéaire, mais d'une forme particulière. régression non linéaire trouve la courbe de meilleur ajustement de cette forme particulière, par exemple, la relation peut être périodique. Un exemple de ceci serait la relation entre la température et le jour de l'année. Cela pourrait être modélisée en utilisant une fonction trigonométrique (soit le sinus ou cosinus) et la régression non linéaire trouverait la meilleure courbe de ce type particulier.