ACP – Proc Factor

Proc FACTOR (SAS)

Synthèse des covariations (ACP)

Principe :

  • recherche d’un faible nombre de combinaison linéaire des variables (facteurs) reconstituant au mieux l’information fournie par une matrice de variance/covariance ou de corrélations entre ces variables.    F1= a0 + a1. X1 + a2. X2   et  X1 = b0 + b1.F1 + b2.F2

Nature des variables et de la distance :

  • Quantitatives
  • Distance : euclidienne = (xi-xj)² : valorise les grands écarts absolus

Utilisations :

  • Cas 1 : Approche exploratoire : synthèse de l’information fournie par l’évaluation de plusieurs objets (marques) sur plusieurs variables
  • Cas 2 : Constitution de combinaisons linéaires orthogonales des variables pour éliminer la colinéarité avant une régression

Programme :

acp11

Décisions à prendre :

(0) Quelle approche choisir ? Facteurs communs ou composantes principales

  • Analyse en composantes principales (PCA) : elle cherche à reconstituer TOUTE la variance initiale et est adaptée à une approche exploratoire.
  • Analyse en facteurs communs (principal factor analysis (PFA) ou principal axis factoring (PAF)) ne cherche à reconstituer que la variance commune aux variables (chaque variable est sensée avoir une variance spécifique qui n’a pas d’intérêt). Elle est adaptée lors d’une recherche de variables latentes.

 

(1) Quelles variables retenir dans la constitution de la matrice à analyser ?

  • D’abord toutes celles qui sont pertinentes par rapport à l’objectif de l’analyse

(2) Faut-il standardiser les variables ? Choisir les covariances (COV) ou les corrélations (CORR).

  • Non si les différences de variances ont une signification (analyse des Variances/covariances) : COV
  • Oui si les différences de variance sont dues principalement à des questions d’unités de mesure (analyse des corrélations) CORR

 

(3) Une analyse factorielle est-elle adaptée ? Oui si les variables ont quelque chose en commun (MSA measures of Sample Adequacy).

  • Test 1 KMO (Kaiser-Meyer-Olkin)
  • Test de sphéricité de Bartlett (une matrice de corrélations sphérique ne contient que des 1 sur la diagonale : les corrélations entre deux variables sont toutes nulles)

 

 (4) Combien d‘axes faut-il retenir ? il faut chercher un équilibre entre le pourcentage d’inertie (information contenue dans la matrice initiale) reconstituée et le nombre d’axes retenu (plus il est important, moins la représentation est synthétique et plus elle est difficile à interpréter). Les critères sont :

  • Critère de qualité de la représentation : la configuration doit être la plus simple possible tout en représentant une part importante de l’inertie de la matrice initiale (75% et au minimum 50%).
  • Critère de l’éboulis (scree test) (SCREE): une représentation graphique des valeurs propres montre souvent une cassure (un « coude ») avec un fort changement de pente. On retient alors le nombre de facteurs juste avant le début de l’éboulis.
  • Critère de Kaiser : Une valeur propre au moins égale à 1 pour un facteur. En effet chaque variable contribue à 1 unité d’inertie, un facteur avec une valeur propre <1 représente donc moins qu’une variable. C’est la moins bonne technique de sélection qui conduit à retenir un trop grand nombre d’axes.

 

(5) Eliminer les variables mal représentées dans la configuration envisagée par le nombre d’axes retenus sur la base de la communauté (communality = somme des carrés des loadings d’une variable pour tous les facteurs retenus)

  • processus de « raffinement » du modèle par l’élimination des variables mal représentées : moins de 50% de leur variance est représentée dans l’espace retenu

(6) Interpréter, donner un nom, une signification à chaque facteur. Attention à cette phase cruciale puisque c’est ensuite sur base de ce « nom » que vous allez donner du sens à vos résultats. On interprète les corrélations (loadings) des variables avec les facteurs dans la matrice de « Structure ». A partir des variables

  • Les plus corrélées positivement et négativement : contribution au facteur(loading)  > 0.4 pour une taille d’échantillon de n=140, moins pour des effectifs plus importants.
  • La matrice de « Pattern » donne la contribution spécifique d’une variable (l’effet des autres variables étant éliminé)

 

(7) Obtenir une structure « simple » par le choix d’une rotation éventuelle.

  • Une structure est « simple » si 5 critères sont validés (Thurstone,1947)
    • 1. Chaque variable doit avoir un loading = 0 sur au moins un facteur
    • 2. Chaque facteur doit avoir au moins autant de loadings nuls qu’il y a de facteurs
    • 3. Chaque paire de facteurs doit avoir des variables différenciées (loading important sur un facteur et loading nul sur l’autre)
    • 4. Chaque paire de facteurs doit avoir une large proportion de loading simultanément nuls (s’il y a 4 facteurs et plus)
    • 5. Chaque paire de facteurs ne doit avoir qu’un nombre très réduit de variables complexes (loading sur les deux facteurs).

 

(8) Choisir une rotation éventuelle. Le principe de base est que les facteurs sont orthogonaux (non corrélés) et sont extraits par ordre d’importance décroissante. Une rotation permet de faire « tourner » le système d’axes pour rendre l’interprétation des facteurs plus facile.

  • Rotations obliques (rotation NON orthogonale) : à utiliser si les variables représentent des facteurs non indépendants. Si deux facteurs sont corrélés à plus de 0.32, alors les facteurs partagent au moins 10% de leurs variances et cela justifie de garder la rotation oblique (Tabachnick et Fiddell, 2007) sauf s’il y a de bonnes raison de maintenir la relation orthogonale (avant régression par exemple)
    • Promax
    • Procrustes (rotation pour s’approcher d’un modèle pré-défini)
  • Rotations orthogonales. La qualité de la représentation n’est pas modifiée mais la contribution de chaque facteur est modifiée.
    • Varimax :maximise le carré des loadings des variables sur un facteur
    • Quartimax : minimise le nombre de facteurs pour reconstituer la variance d’une variable. (peu utile)
    • Equamax (mélange de Varimax et Quartimax)

 

(9) Interprétation graphique. La méthode fournit 2 graphiques

  • Le graphique des variables (dont les axes sont borné à +/-1 (les corrélations). Les variables au centre du graphe sont mal représentées. Celles proches du cercle des corrélations le sont bien. La proximité avec un facteur indique que la variable contribue fortement à ce facteur.
  • Le graphique des individus. Son système d’axes est différent de celui des variables, il ne faut donc pas les superposer. Des individus proches dans l’espace des facteurs ont des valeurs proches sur les variables qui forment les facteurs.

Exemple d’application

Publié dans Marketing SAS Tagués avec : ,