université paul verlaine - metz ecole doctorale piemes les modèles déquations structurales :...
Post on 03-Apr-2015
112 Views
Preview:
TRANSCRIPT
Université Paul Verlaine - MetzEcole Doctorale PIEMES
Les modèles d’équations structurales : théorie et applications avec LISREL
Jean-Luc KopUniversité Nancy 2
jean-luc.kop@univ-nancy2.fr
PLAN
I.Présentation générale
II.La régression multiple avec LISREL
III.Les pistes causales avec LISREL
IV.La logique des MES
V.Le modèle de mesure (analyse factorielle)
VI.Le modèle complet
Les modèles d’équations structurales (MES) permettent de modéliser les relations existant entre un ensemble de variables à partir d’une représentation théorique
permettent d’introduire des variables latentes et donc de tenir compte des erreurs de mesure
intègrent la régression, les pistes causales et les analyses factorielles
ORIGINES
• Jöreskog (1973)• Keesing (1972)• Wiley (1973)
Modèle JKW
Premier logiciel : LISREL (Jöreskog & Sörbom)
Autres logiciels : AMOS, SePath, Mplus, EQS, MX
LISREL = Linear Structural RELationships
MODE OPERATOIRE de LISREL
La régression multiple avec LISREL
Exemple• VD = salaire (annuel, brut, en k$)• VI = expérience (en mois) niveau d’études (en années)
La régression multiple avec LISREL
salact exp nivetud -------- -------- -------- salact 1.00 exp -0.10 1.00 nivetud 0.66 -0.26 1.00
salact exp nivetud -------- -------- -------- salact 291.58 exp -181.15 10828.48 nivetud 32.54 -77.00 8.32
Matrice de corrélations
Matrice de covariances
RAPPEL
NYX
YYXX ii ,cov
)var()var(
),cov(
YX
YXr XY
La régression multiple avec LISRELProgramme SIMPLIS
regression avec deux VIobserved variables salact exp nivetudmeans : 34.42 96.47 13.49covariance matrix291.58-181.15 10828.4832.54 -77.00 8.32sample size 474relationshipsconst exp nivetud -> salactend of problem
La régression multiple avec LISREL
Résultats
salact = - 20.97 + 0.012*exp + 4.02*nivetud (3.10) (0.0058) (0.21) -6.77 2.03 19.06
Errorvar.= 162.89, R² = 0.44
Résultats standardisés (options SC)
Regression Matrix Y on X (Standardized)
exp nivetud -------- -------- salact 0.07 0.68
Les pistes causales
Analyse en pistes causales (path analysis)
S. Wright (1920-30) Simon, Blalock, Boudon
Plusieurs variables explicatives et plusieurs variables expliquées
Les pistes causales
spécification du réseau de relations entre variables
Exemple
Âge
Autonomie
Revenu
travail
Satisfactiondans le
b21
b42
b32
b41
b31b43
e1
e2
e4
e3
Les pistes causales âge = variable exogène (plusieurs sont possibles)
variable endogène = variable au moins influencée par une autre
Âge
Autonomie
Revenu
travail
Satisfactiondans le
b21
b42
b32
b41
b31b43
e1
e2
e4
e3
satisfaction = variable endogène ultime
modèles récursifs = une seule piste entre deux variables (effets réciproques modèles non récursifs)
ei = variables résiduelles
modèle saturé = toutes les pistes possibles
Les équationsautonomie = b21 × âge + e2
revenu = b31 × âge + b32 × autonomie + e3
satisfaction = b41 × âge + b42 × autonomie + b43 × revenu + e4
Calcul des paramètresrevenu = b31 × âge + b32 × autonomie + e3
On multiplie par l’âgerevenu × âge = b31 × (âge)² +
b32 × (autonomie × âge) + e3 × âge Espérances mathématiquesE(revenu x âge) = rrevenu, âge
E(âge²) = 1E(autonomie x âge) = rautonomie, âge
E(e3 × âge) = 0
rrevenu, âge = b31 + b32 × rautonomie, âge
Calcul des paramètres
revenu = b31 × âge + b32 × autonomie + e3
On multiplie par l’autonomie…….
rautonomie, revenu = b31 × rautonomie, âge + b32
Système de deux équations à deux inconnuesrrevenu, âge = b31 + b32 × rautonomie, âge
rautonomie, revenu = b31 × rautonomie, âge + b32
Les pistes causales avec LISRELProgramme SIMPLIS
Pistes causales de la satisfaction au travailobserved variables age autonom revenu satiscorrelation matrix10.28 10.63 0.38 10.38 0.74 0.64 1sample size 472relationshipsage autonom revenu -> satisage –> autonomage autonom -> revenupath diagramend of problem
Âge
Autonomie
Revenu
travail
Satisfactiondans le
b21
b42
b32
b41
b31b43
e1
e2
e4
e3
Âge
Autonomie
Revenu
travail
Satisfactiondans le
b21
b42
b32
b41
b31b43
e1
e2
e4
e3
Les pistes causales avec LISRELRésultats (équations)
autonom = 0.28*age, Errorvar.= 0.92 , R² = 0.078 (0.044) (0.060) 6.32 15.33 revenu = 0.22*autonom + 0.57*age, Errorvar.= 0.56 , R² = 0.44 (0.036) (0.036) (0.036) 6.15 15.83 15.33 satis = 0.58*autonom + 0.47*revenu - 0.078*age, Errorvar.= 0.30 , R² = 0.70 (0.027) (0.034) (0.032) (0.019) 21.42 13.85 -2.39 15.33
Les pistes causales avec LISRELRésultats (graphique)
Âge
Autonomie
Revenu
travail
Satisfactiondans le
.28.58
.22
-.08
.57 .47
1.0
0.92
0.30
0.56
Les pistes causales avec LISREL
Âge
Autonomie
Revenu
travail
Satisfactiondans le
.28.58
.22
-.08
.57 .47
1.0
0.92
0.30
0.56
eautonomie = 0.92 ; l’âge n’explique que 8% (0.28² * 100) de l’autonomie effet direct de l’âge sur la satisfaction : -0.08
effet indirect de l’âge sur la satisfaction : par l’intermédiaire de l’autonomie (0.28 * 0.58 = 0.16) ; par l’intermédiaire du revenu (0.57 * 0.47 = 0.27) ; par l’intermédiaire de l’autonomie et du revenu (0.28 * 0.22 * 0.47 = 0.03)
Les pistes causales avec LISREL
Âge
Autonomie
Revenu
travail
Satisfactiondans le
.28.58
.22
-.08
.57 .47
1.0
0.92
0.30
0.56
effet indirect de l’âge sur la satisfaction : 0.16 + 0.27 + 0.03 = 0.46
effet total de l’âge sur la satisfaction = effet direct (-0.08) + effet indirect (0.46) = 0.38
(N.B. râge, satisfaction = 0.38)
Les pistes causales avec LISREL
Effets directs et indirects
syntaxe LISREL : options EFTotal and Indirect Effects Total Effects of X on Y age -------- autonom 0.28 (0.04) 6.32 revenu 0.63 (0.04) 17.59 satis 0.38 (0.04) 8.91
Indirect Effects of X on Y
age -------- autonom - - revenu 0.06 (0.01) 4.41 satis 0.46 (0.04) 11.42
Total Effects of Y on Y
autonom revenu satis -------- -------- -------- autonom - - - - - - revenu 0.22 - - - - (0.04) 6.15 satis 0.69 0.47 - - (0.03) (0.03) 22.08 13.85
Largest Eigenvalue of B*B' (Stability Index) is 0.590
Indirect Effects of Y on Y
autonom revenu satis -------- -------- -------- autonom - - - - - - revenu - - - - - - satis 0.10 - - - - (0.02) 5.62
Autre exemple
1708 étudiants évaluent :
qualité formelle de l’enseignement (qual)
feedback donné par l’enseignant (feedback)
intégration de l’enseignement (integ)
charge de travail (charge)
stimulation int. / apprentissage (stimul)
évaluation globale de l’enseignement (global)
Stringer, M., & Irwing, P. (1998). Students’ evaluations of teaching effectiveness: a structural modelling approach. British Journal of Educational Psychology, 68, 409-426
192.73.31.37.65.
172.30.28.56.
147.56.70.
128.37.
133.
1
globale
stimul
integ
feedback
charge
qual
globalestimulintegfeedbackchargequal
Autre exemple
Matrice de corrélations
qual
charge
integ
feedback
stimul globale
Efficacité del’enseignant
Réponsepsychologique
RésultatCaractéristiques del’enseignement
Le modèle théorique des auteurs
qual
charge
integ
feedback
stimul globale
.37
.52
-.33
.18
-.34
.84 .81
-.05
.18
.20
.86
.36
.89
.46 .13
Résultats
La logique des MES
✔ tester des hypothèses qui découlent d’une théorie concernant les relations de dépendances et/ou d'interdépendances entre des variables observées et/ou des variables latentes ;
✔ à partir des relations (exprimées en termes de variances-covariances) entre des variables manifestes ;
✔ par l'intermédiaire de la manipulation de paramètres.
La logique des MES
()
Observé Théorique
THEORIE
paramètres
=
()
Observé Théorique
THEORIE
paramètres
= Trois types de paramètres
Paramètres fixés
Paramètres contraints
Paramètres libres
Les différents types de variables
VariablesVariables LatentesLatentes ManifestManifesteses
ExogènesExogènes ξξ XX ModèleModèle
StructuralStructural
(théories (théories nomologiqunomologiques)es)
EndogènesEndogènes ηη YY
Modèle de mesureModèle de mesure
(Théories (Théories définitoires)définitoires)
Les 8 matrices du modèle de base
XXyX
XYyY
1
Exemple : la matrice Γ
Qual
Charge libre
Feedback libre
Integ libre
Stimul fixé à 0
Globale libre
qual
charge
integ
feedback
stimul globale
Efficacité del’enseignant
Réponsepsychologique
RésultatCaractéristiques del’enseignement
XXyX
XYyY
L’estimation des paramètres libres
)())(()( 1 qpLntrLnFML
Moindres carrés non pondérés (ULS)
2)(2
1 trFULS
Maximum de vraisemblance
Moindres carrés généralisés (GLS)
21 )(2
1 ItrFGLS
Nombre de degrés de liberté du modèle
p = nombre de variables exogènes manifestesq = nombre de variables endogènes manifestest = nombre de paramètres estimés (libres)
tqpqp
df
2
)1()(
En résumé
∑ ∑(Θ)
???? Adéquation ?????
Matrice théoriqueMatrice observée
Théorie
Paramètres 2)(
2
1 trFULS
XXyX
XYyY
Le modèle de mesure (analyse factorielle)
ExempleLance, C.E., Mallard, A.G., & Michalos, A.C. (1995). Tests of the causal directions of global-life facet satisfaction relationships. Social Indicators Research, 34, 69-92.
Mesure de la satisfaction de 400 personnes relativement à différents domaines : santé, revenu, relations familiales, travail, amis, logement, conjoint, loisirs, religion, transports, éducation
1.19.16.22.12.20.21.13.18.18.18éducation
1.16.10.13.27.07.22.12.30.16transports
1.23.15.15.28.09.26.19.14religion
1.16.25.37.11.21.25.30loisirs
1.27.18.15.28.20.15conjoint
1.27.16.20.21.15logement
1.14.31.14.21amis
1.17.38.15travail
1.27.20famille
1.27revenu
1santé
éducationtransportsreligionloisirsconjointlogementamistravailfamillerevenusanté
Matrice de corrélations entre les variables
Différents modèles théoriques possibles
revenu famille travail amis logement conjoint loisirs religion transports éducation
satisfactiongénérale
santé
1 2 3 4 5 6 7 8 9 10 11
Différents modèles théoriques possibles
revenu
2
famille
3
travail
4
amis
5
logement
6
conjoint
7
loisirs
8
religion
9
transports
10
éducation
11 1
santé
satisfactionimmatérielle
satisfactionmatérielle
Différents modèles théoriques possibles
revenu
2
famille
3
travail
4
amis
5
logement
6
conjoint
7
loisirs
8
religion
9
transports
10
éducation
11 1
santé
satisfactionimmatérielle
satisfactionmatérielle
Différents modèles théoriques possibles
revenu
2
famille
3
travail
4
amis
5
logement
6
conjoint
7
loisirs
8
religion
9
transports
10
éducation
11 1
santé
sphèreprivée travailfamille
Différents modèles théoriques possibles
revenu
2
famille
3
travail
4
amis
5
logement
6
conjoint
7
loisirs
8
religion
9
transports
10
éducation
11 1
santé
sphèreprivée
travailfamille
satisfactiongénérale
Comment tester le modèle à deux facteurs indépendants ?
revenu
2
famille
3
travail
4
amis
5
logement
6
conjoint
7
loisirs
8
religion
9
transports
10
éducation
11 1
santé
satisfactionimmatérielle
satisfactionmatérielle
Modèle de mesure
x = λxξ + δ
xi = λi1ξ1 + λi2ξ2 + …. + λinξn + δi
revenu
2
famille
3
travail
4
amis
5
logement
6
conjoint
7
loisirs
8
religion
9
transports
10
éducation
11 1
santé
satisfactionimmatérielle
satisfactionmatérielle
Modèle de mesure (développement matriciel)
11
10
9
8
7
6
5
4
3
2
1
2
1
1_11
2_10
91
81
71
62
51
42
31
22
11
0
0
0
0
0
0
0
0
0
0
0
éducation
transports
religion
loisirs
conjoint
logement
amis
travail
famille
revenu
santé
X = Λx ξ + δ
revenu
2
famille
3
travail
4
amis
5
logement
6
conjoint
7
loisirs
8
religion
9
transports
10
éducation
11 1
santé
satisfactionimmatérielle
satisfactionmatérielle
Test du modèle à deux facteurs indépendants
0
0
0
0
0
0
0
0
0
0
0
1_11
2_10
91
81
71
62
51
42
31
22
11
21
éducation
transports
religion
loisirs
conjoint
logement
amis
travail
famille
revenu
santé
Matrice factorielle (Λ)
Test du modèle à deux facteurs indépendants
22212
111
21
0
Matrice de corrélations entre les facteurs Φ
Test du modèle à deux facteurs indépendants
11_1110_119_118_117_116_115_114_113_112_111_1111
10_109_108_107_106_105_104_103_102_101_1010
9998979695949392919
88878685848382818
777675747372717
6665646362616
55545352515
444342414
3332313
22212
111
1110987654321
0000000000
000000000
00000000
0000000
000000
00000
0000
000
00
0
Matrice de covariances entre les parties résiduelles (Θδ)
Les 3 matrices du modèle de mesure
)(
XXyX
XYyY
Programme Simplislance et al 1995 : 2 facteurs independantsObserved Variables sante revenu famille travail amis logement conjoint loisirs religion transp educlatent variables mat immatCorrelation Matrix……..Sample Size = 400relationshipsimmat -> sante famille amis conjoint loisirs religion educ mat -> revenu travail logement transp set the covariance between mat and immat to zeropath diagramlisrel output rs miEnd of Problem
Goodness of Fit Statistics
Degrees of Freedom = 44 Minimum Fit Function Chi-Square = 171.17 (P = 0.00) Normal Theory Weighted Least Squares Chi-Square = 154.81 (P = 0.00)
ADEQUATION du MODELE
Un modèle défendable
revenufamille travailamis logement conjointloisirs religion transportséducationsanté
sphèreprivée travailfamille
.81
.58 .58 .43 .39 .55 .48 .45.74 .51 .41
.81 .62
.53
.44
.66 .66 .81 .85 .70 .77 .79 .45 .74 .83
.15
Le modèle complet : un exemple fictif
x1
x2
x7
x5
x4
x3
x6
1
2
3
1
2
y4
y3
y2
y1
1
2
11
42
52
63
73
21
32
31
31
32
21
11
12
21
23
21
11
42
32
21
12
1
21
1
2
3
4
5
6
7
2
3
4
x
x
x
x
x
x
y
x
x
y
y
y
Les trois équations du modèle complet
xx
Modèle de mesure pour les variables exogènes (X)
Modèle de mesure pour les variables endogènes (Y)
yy
Modèle structural
Modèle de mesure sur xModèle de mesure sur x
x
x
x
x
x
xx
x
x
x
x
x
x
x
x
x
x
7
6
5
4
3
2
1
3
2
1
73
63
52
42
3231
21
11
7
6
5
4
3
2
1
00
00
00
00
0
00
00
Modèle de mesure sur xModèle de mesure sur x
333231
2221
11
77
66
55
44
33
22
11
000000
00000
0000
000
00
0
Matrice de covariances des
erreurs des variables x
Modèle de mesure sur yModèle de mesure sur y
y
y
y
y
y
y
y
y
y
y
4
3
2
1
2
1
42
32
21
11
4
3
2
1
0
0
0
0
44
33
22
11
000
00
0
Modèle structuralModèle structural
2
1
3
2
1
2321
1211
2
1
21
12
2
1
0
0
0
0
2221
11
Le modèle complet
)(
XXyX
XYyY
Le modèle complet : les 8 matrices
yx
Programme SimplisModele complet sur donnees fictivesObserved Variables Y1 Y2 Y3 Y4 X1 X2 X3 X4 X5 X6 X7Covariance Matrix from file fictif.covLatent Variables ETA1 ETA2 KSI1 KSI2 KSI3Sample Size 100RelationshipsKSI1 -> X1 X2 X3KSI2 -> X3 X4 X5KSI3 -> X6 X7ETA1 -> Y1 Y2ETA2 -> Y3 Y4KSI1 -> ETA1 ETA2KSI2 -> ETA1KSI3 -> ETA2ETA1 -> ETA2ETA2 -> ETA1Let the Error Covariance between ETA1 and ETA2 freeLisrel output RS SS SCPath DiagramEnd of Problem
Exemple fictif : matrice de covariances
68.269.116.014.092.091.069.031.292.115.126.1
42.110.007.066.069.047.071.142.196.005.1
74.119.109.207.184.043.036.054.050.0
38.195.104.179.054.044.046.047.0
80.328.274.159.049.002.101.1
96.127.134.032.059.056.0
36.147.036.037.033.0
32.637.520.355.3
86.488.220.3
63.272.2
20.3
7
6
5
4
3
2
1
4
3
2
1
76543214321
X
X
X
X
X
X
X
Y
Y
Y
Y
XXXXXXXYYYY
On dispose des 9 variables suivantes, observées dans un échantillon de 200 enfants :- niveau d'aspiration scolaire (ASPSCO)- niveau d'aspiration professionnelle (ASPPRO)- réussite scolaire dans les matières verbales (RSVERB)- réussite scolaire en mathématiques (RSMATH)- revenu de la famille (REVENU)- niveau d'éducation du père (EDPERE)- niveau d'éducation de la mère (EDMERE)- aptitude verbale (APTVERB)- aptitude numérique (APTNUM)On veut montrer (modèle théorique) que la réussite de l’enfant dépend du background familial, des aptitudes et du niveau d'aspiration ; ce dernier dépendant lui-même du background familial et desaptitudes
EXEMPLE sur données réelles
Matrice de variances-covariancesaspsco 1.024asppro .792 1.077Rsverb 1.027 .919 1.844rsmath .756 .697 1.244 1.286revenu .567 .537 .876 .632 .852educpere.445 .424 .677 .526 .518 .670educmere.434 .389 .635 .498 .475 .545 .716aptverb .580 .564 .893 .716 .546 .422 .373 .851aptnum .491 .499 .888 .646 .508 .389 .339 .629 .871
aspsco asppro rsverb rsmath revenu edpere edmere aptverb aptnum
EXEMPLE sur données réelles
Le modèle de mesure
aptitude -> aptverb aptnum
aspire -> aspsco asppro
reussite -> rsverb rsmath
famille -> revenu educpere educmere
EXEMPLE sur données réelles
Le modèle structural
famille -> aspire reussite
aptitude -> aspire reussite
aspire -> reussite
EXEMPLE sur données réelles
EXEMPLE sur données réellesLe modèle théorique initial
Boomsma, A. (2000). Reporting analyses of covariance structures. Structural Equation Modeling, 7(3), 461-482.Jackson, D.L., Gillaspy, J.A. & Purc-Stephenson R. (2009). Reporting practices in confirmatory factor analysis: an overview and some recommendations. Psychological Methods, 14, 6-23.McDonald, R. P., & Ringo Ho, Moon-Ho (2002). Principles and practice in reporting structural equation analyses. Psychological Methods, 7(1), 64-82.Raykov, T., Tomer, A., & Nesselroade, J. R. (1991). Reporting structural equation modeling results in Psychology and Aging: Some proposed guidelines. Psychology and Aging, 6(4), 499-503.Tabachnick, B.G. & Fidell, (2007). Using multivariate statistics (5th ed.). Boston : Pearson International Edition.
http://davidakenny.net/kenny.htm
Comment présenter les résultats de MES ?
http://davidakenny.net/kenny.htm
Baron, R. M., & Kenny, D. A. (1986). The moderator-mediator variable distinction in social psychological research: Conceptual, strategic and statistical considerations. Journal of Personality and Social Psychology, 51, 1173-1182. Edwards, J. R., & Lambert L. S. (2007). Methods for integrating moderation and mediation: A general analytical framework using moderated path analysis. Psychological Methods, 12, 1-22. MacKinnon, D. P., Fairchild, A. J., & Fritz, M. S. (2007). Mediation analysis. Annual Review of Psychology, 58, 593-614.Muller, D., Judd, C. M., & Yzerbyt, V. Y. (2005). When moderation is mediated and mediation is moderated. Journal of Personality and Social Psychology, 89, 852-863.
Médiation et modération
top related