les d’équations structurelles à variables...

32
Cours de Statistique Multivari Cours de Statistique Multivari é é e Approfondie e Approfondie 1 Emmanuel Jakobowicz Addinsoft XLSTAT 3 février 2010 Les mod Les mod è è les d les d ’é ’é quations structurelles quations structurelles à à variables variables latentes latentes Applications et exercices Applications et exercices

Upload: others

Post on 24-Feb-2021

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 1

Emmanuel JakobowiczAddinsoftXLSTAT

3 février 2010

Les modLes modèèles dles d’é’équations structurelles quations structurelles àà

variables variables  latenteslatentes

Applications et exercicesApplications et exercices

Page 2: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 2

Le modèle structurel

ξ1

η2

η

3

y36

y35

y33

y32

y34

y31

x11

x12

x13

y21

y22

δ

11

ζ3δ

12

δ

13

ε

21

ε

22

ε

31

ε

32

ε

33

ε

34

ε

35

ε

36ζ2

Eq. du modèle 

structurel

Eq. du modèle de 

mesure

Page 3: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 3

Démonstration: La méthode LISREL

Nous utiliserons les logiciels AMOS (aujourd’hui SPSS) et LISREL

Ce sont les 2 principaux logiciels de traitement de la méthode LISREL

Nous utiliserons un modèle très simple (3 Variables Latentes et 9 Variables  Manifestes)

AMOS 16.0 est disponible avec SPSS. 

LISREL 8.8 est disponible à l’essai 15 jours ou il existe une version étudiants  gratuite avec une limite dans le taille du modèle 

www.ssicentral.com/lisrel/downloads.html

Page 4: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 4

Le modèle

V3 V8

V7

V5 V6

V9

V1

V2

V4

L1

L2

L3

Page 5: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 5

AMOS: Les étapes

Étapes dans l’étude d’un modèle structurel avec Amos Graphics:

1.

Obtenir un jeu de données sans données manquantes avec si possible des  données multinormales

2.

Vérifier l’unidimensionnalité

des blocs de variables

3.

Charger les données (Files – Data Files…)

4.

Dessiner le modèle LISREL avec les variables latentes (ellipses), les variables  manifestes (rectangles) et les erreurs de mesure (cercles)

5.

Modifier les paramètres d’estimation si nécessaire (View/Set – Analysis  Propreties…)

6.

Estimer le modèle en utilisant la commande (Model Fit – Calculate  Estimates)

7.

Étudier les coefficients obtenus sur le modèle et les tableaux de sortie dans  (View/Set – Table output)

Page 6: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 6

LISREL: Les étapes

Étapes dans l’étude d’un modèle structurel avec LISREL:

1.

Obtenir un jeu de données avec si possible des données multinormales

2.

Compléter les données manquantes et obtenir la matrice de covariance  (*.cov) ou les données en format (*.psf) grâce au logiciel PRELIS intégré

dans  LISREL

3.

Vérifier l’unidimensionnalité

des blocs de variables

4.

Paramétriser le modèle LISREL en utilisant le langage SIMPLIS

5.

Donner les paramètres d’estimation si nécessaire 

6.

Estimer le modèle en utilisant la commande L

7.

Étudier les coefficients obtenus sur le modèle et les tableaux de sortie  (transformation possible en LaTEX)

Page 7: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 7

LISREL: Exemple de commande

Analyse de la structure de covariance du modèle à 3 variables manifestes

Observed Variables

V1 V2 V3 V4 V5 V6 V7 V8 V9

Raw data from file ‘…\exemple.psf'

Sample Size = 1000

Latent Variables L1 L2 L3

Relationships

V1 V2 V3= L1

V4 V5 V6= L2

V7 V8 V9 = L3

L2 = L1

L3 = L1 L2

Path Diagram

End of Problem

Définition des variables manifestes

Définition du fichier de données

Définition des variables latentes

Relations du modèle de mesure

Relations du modèle interne

Affichage du modèle graphique

Page 8: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 8

LISREL: Exemple de sortie

Page 9: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 9

Les données manquantes en LISREL

Délétion par listes, Délétion par paires, Imputation de la moyenne,  Imputation multiple par algorithme EM (Expectation Maximization)

Une méthode spécifique: Full Information Maximum Likelihood

Méthode prenant en compte uniquement les données disponibles sans  mécanisme de complétion dans le calcul de la matrice de covariance.

Cette méthode maximise la vraisemblance casewise des données  observées.

C’est la méthode qui obtient en général les meilleurs résultats en terme  de biais des estimations.

Page 10: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 10

Démonstration: L’approche PLS

Nous utiliserons le logiciel XLSTAT 2010 

Nous utiliserons les données de Russett du dernier cours (Instabilité Politique)

XLSTAT est disponible à

l’essai durant 30 jours sur www.xlstat.com

.

Le module PLSPM est le plus abouti du marché

en terme d’application de  l’approche PLS.

Page 11: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

Cours de Statistique MultivariCours de Statistique Multivariéée Approfondiee Approfondie 11

Le modèle

GINI

FARM

RENT

GNPR

LABO

Inégalité

agricole

(ξ1

)

Développement industriel

(ξ2

)

ECKS

DEAT

D‐STB

D‐INS

INST

DICT

Instabilitépolitique

(ξ3

)

ξ1

ξ2

ξ3

++

+

+

+++‐

++

+

Page 12: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 12

XLSTAT PLSPM: Les étapes

Étapes dans l’étude d’un modèle structurel avec XLSTAT‐PLSPM :

1.

Ouvrir les données dans Excel.

2.

Charger le logiciel.

3.

Créer un nouveau projet PLSPM.

4.

Copier les données dans la feuille D1.

5.

Dessiner le modèle PLS avec les variables latentes (ellipses) dans la feuille  PLSPMGraph.

6.

Cliquer sur les variables latentes et sélectionner les variables manifestes à partir des données.

7.

Lancer les calculs.

8.

Étudier les sorties dans la feuille PLSPM générée.

Page 13: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 13

XLSTAT‐PLSPM : La standardisation des VM

Plusieurs méthodes de standardisation des variables manifestes existent:

Page 14: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 14

XLSTAT‐PLSPM : Les sorties

Page 15: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 15

Étude du petit questionnaire distribué

Variables 

de groupe

Image

Satisfaction

Engagement

Page 16: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 16

Étude du petit questionnaire distribué

Image générale

Perception autourde vous

Qualité

de formation

Utilité

de formation

Parrainage

Réinscription

Image du Cnam

Satisfaction des auditeurs

Engagement desauditeurs

Page 17: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 17

Étude du petit questionnaire distribué

Aucune identification n’est possible avec la méthode LISREL En raison de la faible taille de l’échantillon.

Avec l’approche PLS, l’algorithme converge et on peut ainsi  analyser les résultats.

Page 18: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 18

Étude du petit questionnaire distribué

2009‐2010

N = 17

Page 19: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 19

Étude du petit questionnaire distribué

2007‐2008

N = 19

Page 20: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 20

Étude du petit questionnaire distribué

2006‐2007

N = 20

Page 21: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 21

Étude du petit questionnaire distribué

2005‐2006

N = 24

Page 22: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 22

Étude du petit questionnaire distribué

Ces résultats montre une forte influence de la satisfaction sur l’engagement des 

auditeurs. L’image du CNAM a une influence non significative sur l’engagement.

Ces résultats nous permettent de conseiller au CNAM d’améliorer la qualité

de ces 

formations afin d’obtenir plus de nouveaux inscrits.

L’utilisation de méthodes de bootstrap nous permettent d’obtenir des intervalles de 

confiance. Ainsi, en 2009‐2010, mise à

part la relation image –

fidélité, les autres 

relations sont significatives.

Les R2

pour 2009‐2010 sont plus élevés que les autres années, les résultats sont assez 

significatifs. Il y a de fortes différences entre 2009 et les 3 années précédentes.

Comment améliorer ces résultats:

augmenter la taille de l’échantillon,

ajouter des variables manifestes afin d’améliorer le modèle de mesure.

Page 23: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 23

Quelques problèmes associés aux modèles  d’équations structurelles à

variables latentes

Résultats des exercies distribués

Page 24: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 24

Modélisation graphique ‐

LISREL ‐

1

1 1

2 1

3 2

4 2

2 1

0,7 0,30,4 0,50,7 0,20,5 0,10,6 0,4

xxxx

ξξξξ

ξ ξ

= += += +

= += +

0,3

ξ1

ξ2

x1

x2

x3

x4

δ

1

δ

2

ε

3

ε

4

ζ2

0,5

0,2

0,1 0,4

0,6

0,7

0,4

0,7

0,5

Page 25: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 25

Modélisation graphique ‐

LISREL ‐

2

ξ1

ξ2

x1

x2

x3

x4

δ1

δ2

ε3

ε4

ζ2

ξ3

ξ4

x5

x6

x7

x8

ε5

ε6

ε7

ε8

ζ4

ζ3 1 1 1 1

2 2 1 2

3 3 2 3

4 4 2 4

5 5 3 5

2 12 1 32 3 2

3 13 1 3

4 14 1 24 2 34 3 4

...

xxxxx

π ξ δπ ξ δπ ξ επ ξ επ ξ ε

ξ β ξ β ξ ζξ β ξ ζξ β ξ β ξ β ξ ζ

= += += +

= += +

= + +

= += + + +

Page 26: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 26

Modélisation graphique ‐

PLS ‐

1

0,4ξ1

ξ2

0,2 ξ3x5

x6

x1

x2

x3

x4

0,7

0,7

0,5

0,4

0,3

0,6

0,4

1 1

2 1

3 2

4 2

5 3

6 3

2 1

3 1 2

0,7 0,30, 4 0,50,7 0,20,5 0,10, 4 0,20,3 0,30, 2 0, 40,6 0, 4 0,1

xxxxxx

ξξξξξξ

ξ ξξ ξ ξ

= += += +

= += +

= += += + +

Page 27: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 27

Modélisation graphique ‐

PLS ‐

2

1 1 3 4

2 2 5 6

3 7 8

4 9 10

2 1

4 1 2 3

0,7 0,3 0,6 0,40,4 0,5 0,3 0,10,7 0,2 0,20,5 0,1 0,10,2 0,10,6 0,4 0,2 0,1

x x xx x xx xx x

ξξξξξ ξξ ξ ξ ξ

= + + += + + += + += + += += + + +

ξ1

ξ2

0,2

ξ3x7

x8

x1

x3

x2

x5

0,7

0,3

0,4

0,5

0,2

ξ4x9

x10

0,5

0,1

0,7

0,20,6

0,4

x4 0,6

x60,3

Page 28: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 28

Quelques problèmes associés aux modèles  d’équations structurelles à

variables latentes

Page 29: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 29

Quelques problèmes associés aux modèles  d’équations structurelles à

variables latentes –

Cas1 – Analyse sensorielle

CaractéristiquesBloc 1

CaractéristiquesBloc 2

CaractéristiquesBloc 3

Juges bloc 1

Juges bloc 2

Juges bloc 3

Une solution possible serait la suivante:

avec l’approche PLS et certaines variables formatives et d’autres réflectives

Page 30: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 30

Quelques problèmes associés aux modèles  d’équations structurelles à

variables latentes –

Cas 2 – SatisfactionImage

Perceivedvalue

CustomerExpectation

Perceivedquality

Loyalty

Customersatisfaction

Complaint

.493 (.000)R2=.243

.545 (.000)

.066 (.314)

.037 (.406)

.153 (.006)

.212 (.002)

.540(.000)

.544 (.000)

.200 (.000)

.466(.000)

.540(.000)

.05 (.399)

R2=.297

R2=.335 R2=.672

R2=.432

R2=.292

Les valeurs entre 

parenthèses sont 

les p‐valeurs (le 

poids associé

est 

significatif si la    p‐

valeur<0,05)

Le principal levier de la fidélité

(loyalty) est la satisfaction des clients. Il faudra donc 

appuyer sur cette satisfaction et sur la qualité

perçue qui est le principal levier de la 

satisfaction.

Page 31: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 31

Quelques problèmes associés aux modèles  d’équations structurelles à

variables latentes –

Cas 3

Ce modèle est bien défini et chaque coefficient est significatif, ainsi  chaque relation peut être étudiée. On se rend compte que l’utilisation de 

l’ordinateur a un effet négatif sur l’attitude face à l’ordinateur alors  qu’elle a un effet positif sur la confiance. D’autres remarques simples 

peuvent être faites en “lisant”

le modèle.

Page 32: Les d’équations structurelles à variables latentescedric.cnam.fr/~saporta/modeles_structurels_2.pdf · 2010. 2. 8. · AMOS 16.0 est disponible avec SPSS. ... Analyse de la structure

CoursCours de de StatistiqueStatistique MultivariMultivariééee ApprofondieApprofondie 32

Orienté

vers la prédiction des  variables manifestes et latentes 

(basé

sur la variance) •

Modèle externe réflectif et 

formatif•

Sans distribution

Les observations peuvent être  dépendantes

Chaque VL est une combinaison  linéaire de ces propres VM

Consistance au sens large•

Prédiction optimale

Évaluation de la qualité

de  prévision par jackknife

(Q2)

Meilleur modèle de mesure car  les VL sont estimées dans 

l’espace de leur propres VM

Orienté

vers l’estimation des  paramètres 

(basé

sur la covariance)•

Modèle externe réflectif

Hypothèses de distribution•

Les observations doivent être 

indépendantes•

Les facteur ne sont pas estimés

L’estimation des VL est faite sur  l’ensemble des VM

Estimations consistantes•

Paramètres optimaux

Évaluation du modèle par tests  d’hypothèse (N doit être grand)

Meilleur modèle structurel car les VL  sont estimées sans restriction 

d’espace

PLS est lié

à

LISREL de la même façon que l’ACP à l’analyse factorielle

Rappel: PLS vs LISREL