Mon Site Gratuit : Horloge Virtuelle pour site internet
Analyse de données

A.1. Méthodes d’analyses de données

a. Méthodes descriptives 

Elles visent à structurer et simplifier des données issues de plusieurs variables sans privilégier l’une d’entre elles en particulier.

Les plus utilisées :

-         L’analyse en composantes principales ACP ;

-         L’analyse factorielle des correspondances (AFC) ;

-         L’analyse des correspondances multiples (ACM) ;

-         La typologie et les méthodes de classification (méthodes de structuration).

b. Méthodes explicatives

Ces méthodes visent à expliquer une variable à l’aide de deux ou plusieurs variables explicatives. Les lus utilisées :

-         Régression multiple ;

-         Analyse discriminante ;

-         La segmentation.

A.2. Objectifs

Selon l’objectif visé selon les données disponibles (variables et leurs types), le choix d’une méthode est illustré par l’organigramme (fig. 2.1) ou le tableau 2.1.

Objectif

Conditions sur le nombre d’individus, de variable de leurs types

Méthodes

Résumer l’information en minimisant la déperdition et repérer les dimensions cachées.

Nombre et type de variables

- Variables numériques et / ou ordinales

ACP

- Deux variables qualitatives 

AFC

- Trois variables qualitatives ou plusieurs

ACM

Constituer des groupes d’individus aussi similaires que possibles

Nombre de groupe d’individus

 

- Le nombre de groupe est fixe

Analyse typologique

- Le nombre de groupes n’est pas fixe 

Classification hiérarchique

Expliquer une variable par rapport à plusieurs autres.

Type de variable à expliquer

- variable à expliquer numérique ou  ordinale

Régression multiple

- variable à expliquer qualitative et variable explicative numérique

Analyse discriminante

- variable à expliquer qualitative et variable explicative qualitative

Segmentation

 

.

Résumer l’information en minimisant la déperdition et repérer les dimensions cachées.

Objectif

Méthodes

 

- Trois variables qualitatives ou pus 

ACP

AFC

ACM

- Deux variables qualitatives 

 

- Variables numériques et / ou ordinales

 

Constituer des groupes d’individus aussi similaires que possibles

Analyse typologique

- Le nombre de groupes n’est pas fixe 

 

- Le nombre de groupe est fixe

 

Classification hiérarchique

Expliquer une variable par rapport à plusieurs autres.

Régression multiple

Analyse discriminante

Segmentation

- variable à expliquer numérique ou  ordinale

 

Nombre et type de variables

Nombre de groupe d’individus

Type de variable à expliquer

- variable à expliquer qualitative et variable explicative numérique

- variable à expliquer qualitative et variable explicative qualitative

<!--[if !vml]--><!--[endif]--> <!--[if !vml]--><!--[endif]-->

Fig. 2.1- Choix des méthodes d’analyse de données.

B. Analyse factorielle

 

B.1. Définition et propriétés

Soit le tableau de données réelles X(n,p), de n-lignes et p-colonnes. Les n-lignes représentent un nuage de points dans Rn (ou les p-colonnes dans Rp).

Une représentation graphique de ces points dans cet espace est impossible si P dépasse 2.

Une représentation extrémale est possible dans R2 en faisant la projection de ces points dans un plan privilégié appelé : plan factoriel. Ce plan est généré par la création d’un nouveau repère définissant un sous-espace de Rp (respectivement de Rn) dont la base est constituée par les deux premiers vecteurs propres u1 et u2 du produit matriciel Xt.X (ou vecteurs propres v1 et v2 du produit X.Xt correspondant aux deux plus grandes valeurs propres l1 et l2.

 

Les vecteurs définissent les axes factoriels et les valeurs propres représentent la valeur de la somme des carrés des projections de ces points sur l’axe factoriel considéré.

Ce procédé permet aussi de faire de la classification, d’étudier les tendances et les liens ou les corrélations qui peuvent exister entre les groupes de données.

 

©2010 hajomar.com
Mon Blog
Mes cours
Forum
Dernière mise à jour : 03 avril 2010.
Mon Site Gratuit : Compteur de visiteurs