les d’équations structurelles à variables...
TRANSCRIPT
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 1
Emmanuel JakobowiczAddinsoftXLSTAT
3 février 2010
Les modLes modèèles dles d’é’équations structurelles quations structurelles àà
variables variables latenteslatentes
Applications et exercicesApplications et exercices
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 2
Le modèle structurel
ξ1
η2
η
3
y36
y35
y33
y32
y34
y31
x11
x12
x13
y21
y22
δ
11
ζ3δ
12
δ
13
ε
21
ε
22
ε
31
ε
32
ε
33
ε
34
ε
35
ε
36ζ2
Eq. du modèle
structurel
Eq. du modèle de
mesure
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 3
Démonstration: La méthode LISREL
Nous utiliserons les logiciels AMOS (aujourd’hui SPSS) et LISREL
Ce sont les 2 principaux logiciels de traitement de la méthode LISREL
Nous utiliserons un modèle très simple (3 Variables Latentes et 9 Variables Manifestes)
AMOS 16.0 est disponible avec SPSS.
LISREL 8.8 est disponible à l’essai 15 jours ou il existe une version étudiants gratuite avec une limite dans le taille du modèle
www.ssicentral.com/lisrel/downloads.html
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 4
Le modèle
V3 V8
V7
V5 V6
V9
V1
V2
V4
L1
L2
L3
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 5
AMOS: Les étapes
Étapes dans l’étude d’un modèle structurel avec Amos Graphics:
1.
Obtenir un jeu de données sans données manquantes avec si possible des données multinormales
2.
Vérifier l’unidimensionnalité
des blocs de variables
3.
Charger les données (Files – Data Files…)
4.
Dessiner le modèle LISREL avec les variables latentes (ellipses), les variables manifestes (rectangles) et les erreurs de mesure (cercles)
5.
Modifier les paramètres d’estimation si nécessaire (View/Set – Analysis Propreties…)
6.
Estimer le modèle en utilisant la commande (Model Fit – Calculate Estimates)
7.
Étudier les coefficients obtenus sur le modèle et les tableaux de sortie dans (View/Set – Table output)
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 6
LISREL: Les étapes
Étapes dans l’étude d’un modèle structurel avec LISREL:
1.
Obtenir un jeu de données avec si possible des données multinormales
2.
Compléter les données manquantes et obtenir la matrice de covariance (*.cov) ou les données en format (*.psf) grâce au logiciel PRELIS intégré
dans LISREL
3.
Vérifier l’unidimensionnalité
des blocs de variables
4.
Paramétriser le modèle LISREL en utilisant le langage SIMPLIS
5.
Donner les paramètres d’estimation si nécessaire
6.
Estimer le modèle en utilisant la commande L
7.
Étudier les coefficients obtenus sur le modèle et les tableaux de sortie (transformation possible en LaTEX)
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 7
LISREL: Exemple de commande
Analyse de la structure de covariance du modèle à 3 variables manifestes
Observed Variables
V1 V2 V3 V4 V5 V6 V7 V8 V9
Raw data from file ‘…\exemple.psf'
Sample Size = 1000
Latent Variables L1 L2 L3
Relationships
V1 V2 V3= L1
V4 V5 V6= L2
V7 V8 V9 = L3
L2 = L1
L3 = L1 L2
Path Diagram
End of Problem
Définition des variables manifestes
Définition du fichier de données
Définition des variables latentes
Relations du modèle de mesure
Relations du modèle interne
Affichage du modèle graphique
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 8
LISREL: Exemple de sortie
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 9
Les données manquantes en LISREL
Délétion par listes, Délétion par paires, Imputation de la moyenne, Imputation multiple par algorithme EM (Expectation Maximization)
Une méthode spécifique: Full Information Maximum Likelihood
Méthode prenant en compte uniquement les données disponibles sans mécanisme de complétion dans le calcul de la matrice de covariance.
Cette méthode maximise la vraisemblance casewise des données observées.
C’est la méthode qui obtient en général les meilleurs résultats en terme de biais des estimations.
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 10
Démonstration: L’approche PLS
Nous utiliserons le logiciel XLSTAT 2010
Nous utiliserons les données de Russett du dernier cours (Instabilité Politique)
XLSTAT est disponible à
l’essai durant 30 jours sur www.xlstat.com
.
Le module PLSPM est le plus abouti du marché
en terme d’application de l’approche PLS.
Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 11
Le modèle
GINI
FARM
RENT
GNPR
LABO
Inégalité
agricole
(ξ1
)
Développement industriel
(ξ2
)
ECKS
DEAT
D‐STB
D‐INS
INST
DICT
Instabilitépolitique
(ξ3
)
ξ1
ξ2
ξ3
++
+
+
‐
+++‐
++
+
‐
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 12
XLSTAT PLSPM: Les étapes
Étapes dans l’étude d’un modèle structurel avec XLSTAT‐PLSPM :
1.
Ouvrir les données dans Excel.
2.
Charger le logiciel.
3.
Créer un nouveau projet PLSPM.
4.
Copier les données dans la feuille D1.
5.
Dessiner le modèle PLS avec les variables latentes (ellipses) dans la feuille PLSPMGraph.
6.
Cliquer sur les variables latentes et sélectionner les variables manifestes à partir des données.
7.
Lancer les calculs.
8.
Étudier les sorties dans la feuille PLSPM générée.
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 13
XLSTAT‐PLSPM : La standardisation des VM
Plusieurs méthodes de standardisation des variables manifestes existent:
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 14
XLSTAT‐PLSPM : Les sorties
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 15
Étude du petit questionnaire distribué
Variables
de groupe
Image
Satisfaction
Engagement
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 16
Étude du petit questionnaire distribué
Image générale
Perception autourde vous
Qualité
de formation
Utilité
de formation
Parrainage
Réinscription
Image du Cnam
Satisfaction des auditeurs
Engagement desauditeurs
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 17
Étude du petit questionnaire distribué
Aucune identification n’est possible avec la méthode LISREL En raison de la faible taille de l’échantillon.
Avec l’approche PLS, l’algorithme converge et on peut ainsi analyser les résultats.
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 18
Étude du petit questionnaire distribué
2009‐2010
N = 17
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 19
Étude du petit questionnaire distribué
2007‐2008
N = 19
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 20
Étude du petit questionnaire distribué
2006‐2007
N = 20
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 21
Étude du petit questionnaire distribué
2005‐2006
N = 24
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 22
Étude du petit questionnaire distribué
Ces résultats montre une forte influence de la satisfaction sur l’engagement des
auditeurs. L’image du CNAM a une influence non significative sur l’engagement.
Ces résultats nous permettent de conseiller au CNAM d’améliorer la qualité
de ces
formations afin d’obtenir plus de nouveaux inscrits.
L’utilisation de méthodes de bootstrap nous permettent d’obtenir des intervalles de
confiance. Ainsi, en 2009‐2010, mise à
part la relation image –
fidélité, les autres
relations sont significatives.
Les R2
pour 2009‐2010 sont plus élevés que les autres années, les résultats sont assez
significatifs. Il y a de fortes différences entre 2009 et les 3 années précédentes.
Comment améliorer ces résultats:
‐
augmenter la taille de l’échantillon,
‐
ajouter des variables manifestes afin d’améliorer le modèle de mesure.
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 23
Quelques problèmes associés aux modèles d’équations structurelles à
variables latentes
Résultats des exercies distribués
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 24
Modélisation graphique ‐
LISREL ‐
1
1 1
2 1
3 2
4 2
2 1
0,7 0,30,4 0,50,7 0,20,5 0,10,6 0,4
xxxx
ξξξξ
ξ ξ
= += += +
= += +
0,3
ξ1
ξ2
x1
x2
x3
x4
δ
1
δ
2
ε
3
ε
4
ζ2
0,5
0,2
0,1 0,4
0,6
0,7
0,4
0,7
0,5
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 25
Modélisation graphique ‐
LISREL ‐
2
ξ1
ξ2
x1
x2
x3
x4
δ1
δ2
ε3
ε4
ζ2
ξ3
ξ4
x5
x6
x7
x8
ε5
ε6
ε7
ε8
ζ4
ζ3 1 1 1 1
2 2 1 2
3 3 2 3
4 4 2 4
5 5 3 5
2 12 1 32 3 2
3 13 1 3
4 14 1 24 2 34 3 4
...
xxxxx
π ξ δπ ξ δπ ξ επ ξ επ ξ ε
ξ β ξ β ξ ζξ β ξ ζξ β ξ β ξ β ξ ζ
= += += +
= += +
= + +
= += + + +
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 26
Modélisation graphique ‐
PLS ‐
1
0,4ξ1
ξ2
0,2 ξ3x5
x6
x1
x2
x3
x4
0,7
0,7
0,5
0,4
0,3
0,6
0,4
1 1
2 1
3 2
4 2
5 3
6 3
2 1
3 1 2
0,7 0,30, 4 0,50,7 0,20,5 0,10, 4 0,20,3 0,30, 2 0, 40,6 0, 4 0,1
xxxxxx
ξξξξξξ
ξ ξξ ξ ξ
= += += +
= += +
= += += + +
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 27
Modélisation graphique ‐
PLS ‐
2
1 1 3 4
2 2 5 6
3 7 8
4 9 10
2 1
4 1 2 3
0,7 0,3 0,6 0,40,4 0,5 0,3 0,10,7 0,2 0,20,5 0,1 0,10,2 0,10,6 0,4 0,2 0,1
x x xx x xx xx x
ξξξξξ ξξ ξ ξ ξ
= + + += + + += + += + += += + + +
ξ1
ξ2
0,2
ξ3x7
x8
x1
x3
x2
x5
0,7
0,3
0,4
0,5
0,2
ξ4x9
x10
0,5
0,1
0,7
0,20,6
0,4
x4 0,6
x60,3
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 28
Quelques problèmes associés aux modèles d’équations structurelles à
variables latentes
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 29
Quelques problèmes associés aux modèles d’équations structurelles à
variables latentes –
Cas1 – Analyse sensorielle
CaractéristiquesBloc 1
CaractéristiquesBloc 2
CaractéristiquesBloc 3
Juges bloc 1
Juges bloc 2
Juges bloc 3
Une solution possible serait la suivante:
avec l’approche PLS et certaines variables formatives et d’autres réflectives
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 30
Quelques problèmes associés aux modèles d’équations structurelles à
variables latentes –
Cas 2 – SatisfactionImage
Perceivedvalue
CustomerExpectation
Perceivedquality
Loyalty
Customersatisfaction
Complaint
.493 (.000)R2=.243
.545 (.000)
.066 (.314)
.037 (.406)
.153 (.006)
.212 (.002)
.540(.000)
.544 (.000)
.200 (.000)
.466(.000)
.540(.000)
.05 (.399)
R2=.297
R2=.335 R2=.672
R2=.432
R2=.292
Les valeurs entre
parenthèses sont
les p‐valeurs (le
poids associé
est
significatif si la p‐
valeur<0,05)
Le principal levier de la fidélité
(loyalty) est la satisfaction des clients. Il faudra donc
appuyer sur cette satisfaction et sur la qualité
perçue qui est le principal levier de la
satisfaction.
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 31
Quelques problèmes associés aux modèles d’équations structurelles à
variables latentes –
Cas 3
Ce modèle est bien défini et chaque coefficient est significatif, ainsi chaque relation peut être étudiée. On se rend compte que l’utilisation de
l’ordinateur a un effet négatif sur l’attitude face à l’ordinateur alors qu’elle a un effet positif sur la confiance. D’autres remarques simples
peuvent être faites en “lisant”
le modèle.
CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 32
•
Orienté
vers la prédiction des variables manifestes et latentes
(basé
sur la variance) •
Modèle externe réflectif et
formatif•
Sans distribution
•
Les observations peuvent être dépendantes
•
Chaque VL est une combinaison linéaire de ces propres VM
•
Consistance au sens large•
Prédiction optimale
•
Évaluation de la qualité
de prévision par jackknife
(Q2)
•
Meilleur modèle de mesure car les VL sont estimées dans
l’espace de leur propres VM
•
Orienté
vers l’estimation des paramètres
(basé
sur la covariance)•
Modèle externe réflectif
•
Hypothèses de distribution•
Les observations doivent être
indépendantes•
Les facteur ne sont pas estimés
•
L’estimation des VL est faite sur l’ensemble des VM
•
Estimations consistantes•
Paramètres optimaux
•
Évaluation du modèle par tests d’hypothèse (N doit être grand)
•
Meilleur modèle structurel car les VL sont estimées sans restriction
d’espace
PLS est lié
à
LISREL de la même façon que l’ACP à l’analyse factorielle
Rappel: PLS vs LISREL