Analyse discriminante descriptive

March 23

Si vous avez deux ou plusieurs groupes de sujets et plusieurs variables sur chaque sujet et vous souhaitez déterminer la façon dont les groupes diffèrent sur les variables, vous allez utiliser l'analyse discriminante descriptive. Descriptives montre l'analyse discriminante variables qui sont le mieux à distinguer un groupe de l'autre.

Fonction

analyse discriminante descriptive vous permet de décrire deux ou plusieurs groupes de sujets (par exemple personnes) en fonction des variables que vous avez disponible et de manière à rendre les différences entre les groupes aussi grand que possible. Il utilise des informations sur les moyens et les écarts-types des variables pour créer des combinaisons pondérées de variables qui distinguent les groupes.

Les types

Les deux grands types d'analyse discriminante sont paramétriques et non paramétriques. analyse discriminante Parametric suppose que la distribution de chaque groupe est normale multivariée. analyse discriminante non paramétrique détend cette hypothèse, à un certain coût au pouvoir.

Types d'analyse discriminante Parametric

Le type le plus commun de l'analyse discriminante paramétrique est une analyse discriminante linéaire de Fisher, ce qui crée des combinaisons linéaires des variables. Telle est la valeur de chaque variable est multipliée par une constante, et ces produits sont ajoutés ensemble pour créer un score discriminante. Une alternative est l'analyse discriminante quadratique, ce qui ajoute des termes quadratiques.

Types d'analyse discriminante non paramétrique

Deux types courants d'analyse discriminante non paramétrique sont le noyau et k-plus proche voisin. analyse discriminante noyau évalue la distribution des variables dans chaque groupe avec l'une d'une variété de fonctions complexes appelées estimations de la densité du noyau. Ceux-ci sont nécessaires parce que lorsque la distribution d'une variable est pas normal, la moyenne et la déviation standard ne suffisent pas à décrire la distribution.

K-plus proches voisins méthodes d'abord définir «proximité», puis essayer de trouver des groupes de sujets qui sont le plus près possible les uns aux autres.

Formation et essai des ensembles de données

Toutes les méthodes d'analyse discriminante sont généralement développés sur un ensemble de données de formation et ensuite testés sur un ensemble de données de test séparé. La méthode habituelle consiste à diviser au hasard fixés en deux vos données initiales, et en utilisant un pour la formation et l'autre pour les tests.