université paul verlaine - metz ecole doctorale piemes les modèles déquations structurales :...

Post on 03-Apr-2015

112 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Université Paul Verlaine - MetzEcole Doctorale PIEMES

Les modèles d’équations structurales : théorie et applications avec LISREL

Jean-Luc KopUniversité Nancy 2

jean-luc.kop@univ-nancy2.fr

PLAN

I.Présentation générale

II.La régression multiple avec LISREL

III.Les pistes causales avec LISREL

IV.La logique des MES

V.Le modèle de mesure (analyse factorielle)

VI.Le modèle complet

Les modèles d’équations structurales (MES) permettent de modéliser les relations existant entre un ensemble de variables à partir d’une représentation théorique

permettent d’introduire des variables latentes et donc de tenir compte des erreurs de mesure

intègrent la régression, les pistes causales et les analyses factorielles

ORIGINES

• Jöreskog (1973)• Keesing (1972)• Wiley (1973)

Modèle JKW

Premier logiciel : LISREL (Jöreskog & Sörbom)

Autres logiciels : AMOS, SePath, Mplus, EQS, MX

LISREL = Linear Structural RELationships

MODE OPERATOIRE de LISREL

La régression multiple avec LISREL

Exemple• VD = salaire (annuel, brut, en k$)• VI = expérience (en mois) niveau d’études (en années)

La régression multiple avec LISREL

salact exp nivetud -------- -------- -------- salact 1.00 exp -0.10 1.00 nivetud 0.66 -0.26 1.00

salact exp nivetud -------- -------- -------- salact 291.58 exp -181.15 10828.48 nivetud 32.54 -77.00 8.32

Matrice de corrélations

Matrice de covariances

RAPPEL

NYX

YYXX ii ,cov

)var()var(

),cov(

YX

YXr XY

La régression multiple avec LISRELProgramme SIMPLIS

regression avec deux VIobserved variables salact exp nivetudmeans : 34.42 96.47 13.49covariance matrix291.58-181.15 10828.4832.54 -77.00 8.32sample size 474relationshipsconst exp nivetud -> salactend of problem

La régression multiple avec LISREL

Résultats

salact = - 20.97 + 0.012*exp + 4.02*nivetud (3.10) (0.0058) (0.21) -6.77 2.03 19.06

Errorvar.= 162.89, R² = 0.44

Résultats standardisés (options SC)

Regression Matrix Y on X (Standardized)

exp nivetud -------- -------- salact 0.07 0.68

Les pistes causales

Analyse en pistes causales (path analysis)

S. Wright (1920-30) Simon, Blalock, Boudon

Plusieurs variables explicatives et plusieurs variables expliquées

Les pistes causales

spécification du réseau de relations entre variables

Exemple

Âge

Autonomie

Revenu

travail

Satisfactiondans le

b21

b42

b32

b41

b31b43

e1

e2

e4

e3

Les pistes causales âge = variable exogène (plusieurs sont possibles)

variable endogène = variable au moins influencée par une autre

Âge

Autonomie

Revenu

travail

Satisfactiondans le

b21

b42

b32

b41

b31b43

e1

e2

e4

e3

satisfaction = variable endogène ultime

modèles récursifs = une seule piste entre deux variables (effets réciproques modèles non récursifs)

ei = variables résiduelles

modèle saturé = toutes les pistes possibles

Les équationsautonomie = b21 × âge + e2

revenu = b31 × âge + b32 × autonomie + e3

satisfaction = b41 × âge + b42 × autonomie + b43 × revenu + e4

Calcul des paramètresrevenu = b31 × âge + b32 × autonomie + e3

On multiplie par l’âgerevenu × âge = b31 × (âge)² +

b32 × (autonomie × âge) + e3 × âge Espérances mathématiquesE(revenu x âge) = rrevenu, âge

E(âge²) = 1E(autonomie x âge) = rautonomie, âge

E(e3 × âge) = 0

rrevenu, âge = b31 + b32 × rautonomie, âge

Calcul des paramètres

revenu = b31 × âge + b32 × autonomie + e3

On multiplie par l’autonomie…….

rautonomie, revenu = b31 × rautonomie, âge + b32

Système de deux équations à deux inconnuesrrevenu, âge = b31 + b32 × rautonomie, âge

rautonomie, revenu = b31 × rautonomie, âge + b32

Les pistes causales avec LISRELProgramme SIMPLIS

Pistes causales de la satisfaction au travailobserved variables age autonom revenu satiscorrelation matrix10.28 10.63 0.38 10.38 0.74 0.64 1sample size 472relationshipsage autonom revenu -> satisage –> autonomage autonom -> revenupath diagramend of problem

Âge

Autonomie

Revenu

travail

Satisfactiondans le

b21

b42

b32

b41

b31b43

e1

e2

e4

e3

Âge

Autonomie

Revenu

travail

Satisfactiondans le

b21

b42

b32

b41

b31b43

e1

e2

e4

e3

Les pistes causales avec LISRELRésultats (équations)

autonom = 0.28*age, Errorvar.= 0.92 , R² = 0.078 (0.044) (0.060) 6.32 15.33 revenu = 0.22*autonom + 0.57*age, Errorvar.= 0.56 , R² = 0.44 (0.036) (0.036) (0.036) 6.15 15.83 15.33 satis = 0.58*autonom + 0.47*revenu - 0.078*age, Errorvar.= 0.30 , R² = 0.70 (0.027) (0.034) (0.032) (0.019) 21.42 13.85 -2.39 15.33

Les pistes causales avec LISRELRésultats (graphique)

Âge

Autonomie

Revenu

travail

Satisfactiondans le

.28.58

.22

-.08

.57 .47

1.0

0.92

0.30

0.56

Les pistes causales avec LISREL

Âge

Autonomie

Revenu

travail

Satisfactiondans le

.28.58

.22

-.08

.57 .47

1.0

0.92

0.30

0.56

eautonomie = 0.92 ; l’âge n’explique que 8% (0.28² * 100) de l’autonomie effet direct de l’âge sur la satisfaction : -0.08

effet indirect de l’âge sur la satisfaction : par l’intermédiaire de l’autonomie (0.28 * 0.58 = 0.16) ; par l’intermédiaire du revenu (0.57 * 0.47 = 0.27) ; par l’intermédiaire de l’autonomie et du revenu (0.28 * 0.22 * 0.47 = 0.03)

Les pistes causales avec LISREL

Âge

Autonomie

Revenu

travail

Satisfactiondans le

.28.58

.22

-.08

.57 .47

1.0

0.92

0.30

0.56

effet indirect de l’âge sur la satisfaction : 0.16 + 0.27 + 0.03 = 0.46

effet total de l’âge sur la satisfaction = effet direct (-0.08) + effet indirect (0.46) = 0.38

(N.B. râge, satisfaction = 0.38)

Les pistes causales avec LISREL

Effets directs et indirects

syntaxe LISREL : options EFTotal and Indirect Effects Total Effects of X on Y age -------- autonom 0.28 (0.04) 6.32 revenu 0.63 (0.04) 17.59 satis 0.38 (0.04) 8.91

Indirect Effects of X on Y

age -------- autonom - - revenu 0.06 (0.01) 4.41 satis 0.46 (0.04) 11.42

Total Effects of Y on Y

autonom revenu satis -------- -------- -------- autonom - - - - - - revenu 0.22 - - - - (0.04) 6.15 satis 0.69 0.47 - - (0.03) (0.03) 22.08 13.85

Largest Eigenvalue of B*B' (Stability Index) is 0.590

Indirect Effects of Y on Y

autonom revenu satis -------- -------- -------- autonom - - - - - - revenu - - - - - - satis 0.10 - - - - (0.02) 5.62

Autre exemple

1708 étudiants évaluent :

qualité formelle de l’enseignement (qual)

feedback donné par l’enseignant (feedback)

intégration de l’enseignement (integ)

charge de travail (charge)

stimulation int. / apprentissage (stimul)

évaluation globale de l’enseignement (global)

Stringer, M., & Irwing, P. (1998). Students’ evaluations of teaching effectiveness: a structural modelling approach. British Journal of Educational Psychology, 68, 409-426

192.73.31.37.65.

172.30.28.56.

147.56.70.

128.37.

133.

1

globale

stimul

integ

feedback

charge

qual

globalestimulintegfeedbackchargequal

Autre exemple

Matrice de corrélations

qual

charge

integ

feedback

stimul globale

Efficacité del’enseignant

Réponsepsychologique

RésultatCaractéristiques del’enseignement

Le modèle théorique des auteurs

qual

charge

integ

feedback

stimul globale

.37

.52

-.33

.18

-.34

.84 .81

-.05

.18

.20

.86

.36

.89

.46 .13

Résultats

La logique des MES

✔ tester des hypothèses qui découlent d’une théorie concernant les relations de dépendances et/ou d'interdépendances entre des variables observées et/ou des variables latentes ;

✔ à partir des relations (exprimées en termes de variances-covariances) entre des variables manifestes ;

✔ par l'intermédiaire de la manipulation de paramètres.

La logique des MES

()

Observé Théorique

THEORIE

paramètres

=

()

Observé Théorique

THEORIE

paramètres

= Trois types de paramètres

Paramètres fixés

Paramètres contraints

Paramètres libres

Les différents types de variables

VariablesVariables LatentesLatentes ManifestManifesteses

ExogènesExogènes ξξ XX ModèleModèle

StructuralStructural

(théories (théories nomologiqunomologiques)es)

EndogènesEndogènes ηη YY

Modèle de mesureModèle de mesure

(Théories (Théories définitoires)définitoires)

Les 8 matrices du modèle de base

XXyX

XYyY

1

Exemple : la matrice Γ

Qual

Charge libre

Feedback libre

Integ libre

Stimul fixé à 0

Globale libre

qual

charge

integ

feedback

stimul globale

Efficacité del’enseignant

Réponsepsychologique

RésultatCaractéristiques del’enseignement

XXyX

XYyY

L’estimation des paramètres libres

)())(()( 1 qpLntrLnFML

Moindres carrés non pondérés (ULS)

2)(2

1 trFULS

Maximum de vraisemblance

Moindres carrés généralisés (GLS)

21 )(2

1 ItrFGLS

Nombre de degrés de liberté du modèle

p = nombre de variables exogènes manifestesq = nombre de variables endogènes manifestest = nombre de paramètres estimés (libres)

tqpqp

df

2

)1()(

En résumé

∑ ∑(Θ)

???? Adéquation ?????

Matrice théoriqueMatrice observée

Théorie

Paramètres 2)(

2

1 trFULS

XXyX

XYyY

Le modèle de mesure (analyse factorielle)

ExempleLance, C.E., Mallard, A.G., & Michalos, A.C. (1995). Tests of the causal directions of global-life facet satisfaction relationships. Social Indicators Research, 34, 69-92.

Mesure de la satisfaction de 400 personnes relativement à différents domaines : santé, revenu, relations familiales, travail, amis, logement, conjoint, loisirs, religion, transports, éducation

1.19.16.22.12.20.21.13.18.18.18éducation

1.16.10.13.27.07.22.12.30.16transports

1.23.15.15.28.09.26.19.14religion

1.16.25.37.11.21.25.30loisirs

1.27.18.15.28.20.15conjoint

1.27.16.20.21.15logement

1.14.31.14.21amis

1.17.38.15travail

1.27.20famille

1.27revenu

1santé

éducationtransportsreligionloisirsconjointlogementamistravailfamillerevenusanté

Matrice de corrélations entre les variables

Différents modèles théoriques possibles

revenu famille travail amis logement conjoint loisirs religion transports éducation

satisfactiongénérale

santé

1 2 3 4 5 6 7 8 9 10 11

Différents modèles théoriques possibles

revenu

2

famille

3

travail

4

amis

5

logement

6

conjoint

7

loisirs

8

religion

9

transports

10

éducation

11 1

santé

satisfactionimmatérielle

satisfactionmatérielle

Différents modèles théoriques possibles

revenu

2

famille

3

travail

4

amis

5

logement

6

conjoint

7

loisirs

8

religion

9

transports

10

éducation

11 1

santé

satisfactionimmatérielle

satisfactionmatérielle

Différents modèles théoriques possibles

revenu

2

famille

3

travail

4

amis

5

logement

6

conjoint

7

loisirs

8

religion

9

transports

10

éducation

11 1

santé

sphèreprivée travailfamille

Différents modèles théoriques possibles

revenu

2

famille

3

travail

4

amis

5

logement

6

conjoint

7

loisirs

8

religion

9

transports

10

éducation

11 1

santé

sphèreprivée

travailfamille

satisfactiongénérale

Comment tester le modèle à deux facteurs indépendants ?

revenu

2

famille

3

travail

4

amis

5

logement

6

conjoint

7

loisirs

8

religion

9

transports

10

éducation

11 1

santé

satisfactionimmatérielle

satisfactionmatérielle

Modèle de mesure

x = λxξ + δ

xi = λi1ξ1 + λi2ξ2 + …. + λinξn + δi

revenu

2

famille

3

travail

4

amis

5

logement

6

conjoint

7

loisirs

8

religion

9

transports

10

éducation

11 1

santé

satisfactionimmatérielle

satisfactionmatérielle

Modèle de mesure (développement matriciel)

11

10

9

8

7

6

5

4

3

2

1

2

1

1_11

2_10

91

81

71

62

51

42

31

22

11

0

0

0

0

0

0

0

0

0

0

0

éducation

transports

religion

loisirs

conjoint

logement

amis

travail

famille

revenu

santé

X = Λx ξ + δ

revenu

2

famille

3

travail

4

amis

5

logement

6

conjoint

7

loisirs

8

religion

9

transports

10

éducation

11 1

santé

satisfactionimmatérielle

satisfactionmatérielle

Test du modèle à deux facteurs indépendants

0

0

0

0

0

0

0

0

0

0

0

1_11

2_10

91

81

71

62

51

42

31

22

11

21

éducation

transports

religion

loisirs

conjoint

logement

amis

travail

famille

revenu

santé

Matrice factorielle (Λ)

Test du modèle à deux facteurs indépendants

22212

111

21

0

Matrice de corrélations entre les facteurs Φ

Test du modèle à deux facteurs indépendants

11_1110_119_118_117_116_115_114_113_112_111_1111

10_109_108_107_106_105_104_103_102_101_1010

9998979695949392919

88878685848382818

777675747372717

6665646362616

55545352515

444342414

3332313

22212

111

1110987654321

0000000000

000000000

00000000

0000000

000000

00000

0000

000

00

0

Matrice de covariances entre les parties résiduelles (Θδ)

Les 3 matrices du modèle de mesure

)(

XXyX

XYyY

Programme Simplislance et al 1995 : 2 facteurs independantsObserved Variables sante revenu famille travail amis logement conjoint loisirs religion transp educlatent variables mat immatCorrelation Matrix……..Sample Size = 400relationshipsimmat -> sante famille amis conjoint loisirs religion educ mat -> revenu travail logement transp set the covariance between mat and immat to zeropath diagramlisrel output rs miEnd of Problem

Goodness of Fit Statistics

Degrees of Freedom = 44 Minimum Fit Function Chi-Square = 171.17 (P = 0.00) Normal Theory Weighted Least Squares Chi-Square = 154.81 (P = 0.00)

ADEQUATION du MODELE

Un modèle défendable

revenufamille travailamis logement conjointloisirs religion transportséducationsanté

sphèreprivée travailfamille

.81

.58 .58 .43 .39 .55 .48 .45.74 .51 .41

.81 .62

.53

.44

.66 .66 .81 .85 .70 .77 .79 .45 .74 .83

.15

Le modèle complet : un exemple fictif

x1

x2

x7

x5

x4

x3

x6

1

2

3

1

2

y4

y3

y2

y1

1

2

11

42

52

63

73

21

32

31

31

32

21

11

12

21

23

21

11

42

32

21

12

1

21

1

2

3

4

5

6

7

2

3

4

x

x

x

x

x

x

y

x

x

y

y

y

Les trois équations du modèle complet

xx

Modèle de mesure pour les variables exogènes (X)

Modèle de mesure pour les variables endogènes (Y)

yy

Modèle structural

Modèle de mesure sur xModèle de mesure sur x

x

x

x

x

x

xx

x

x

x

x

x

x

x

x

x

x

7

6

5

4

3

2

1

3

2

1

73

63

52

42

3231

21

11

7

6

5

4

3

2

1

00

00

00

00

0

00

00

Modèle de mesure sur xModèle de mesure sur x

333231

2221

11

77

66

55

44

33

22

11

000000

00000

0000

000

00

0

Matrice de covariances des

erreurs des variables x

Modèle de mesure sur yModèle de mesure sur y

y

y

y

y

y

y

y

y

y

y

4

3

2

1

2

1

42

32

21

11

4

3

2

1

0

0

0

0

44

33

22

11

000

00

0

Modèle structuralModèle structural

2

1

3

2

1

2321

1211

2

1

21

12

2

1

0

0

0

0

2221

11

Le modèle complet

)(

XXyX

XYyY

Le modèle complet : les 8 matrices

yx

Programme SimplisModele complet sur donnees fictivesObserved Variables Y1 Y2 Y3 Y4 X1 X2 X3 X4 X5 X6 X7Covariance Matrix from file fictif.covLatent Variables ETA1 ETA2 KSI1 KSI2 KSI3Sample Size 100RelationshipsKSI1 -> X1 X2 X3KSI2 -> X3 X4 X5KSI3 -> X6 X7ETA1 -> Y1 Y2ETA2 -> Y3 Y4KSI1 -> ETA1 ETA2KSI2 -> ETA1KSI3 -> ETA2ETA1 -> ETA2ETA2 -> ETA1Let the Error Covariance between ETA1 and ETA2 freeLisrel output RS SS SCPath DiagramEnd of Problem

Exemple fictif : matrice de covariances

68.269.116.014.092.091.069.031.292.115.126.1

42.110.007.066.069.047.071.142.196.005.1

74.119.109.207.184.043.036.054.050.0

38.195.104.179.054.044.046.047.0

80.328.274.159.049.002.101.1

96.127.134.032.059.056.0

36.147.036.037.033.0

32.637.520.355.3

86.488.220.3

63.272.2

20.3

7

6

5

4

3

2

1

4

3

2

1

76543214321

X

X

X

X

X

X

X

Y

Y

Y

Y

XXXXXXXYYYY

On dispose des 9 variables suivantes, observées dans un échantillon de 200 enfants :- niveau d'aspiration scolaire (ASPSCO)- niveau d'aspiration professionnelle (ASPPRO)- réussite scolaire dans les matières verbales (RSVERB)- réussite scolaire en mathématiques (RSMATH)- revenu de la famille (REVENU)- niveau d'éducation du père (EDPERE)- niveau d'éducation de la mère (EDMERE)- aptitude verbale (APTVERB)- aptitude numérique (APTNUM)On veut montrer (modèle théorique) que la réussite de l’enfant dépend du background familial, des aptitudes et du niveau d'aspiration ; ce dernier dépendant lui-même du background familial et desaptitudes

EXEMPLE sur données réelles

Matrice de variances-covariancesaspsco 1.024asppro .792 1.077Rsverb 1.027 .919 1.844rsmath .756 .697 1.244 1.286revenu .567 .537 .876 .632 .852educpere.445 .424 .677 .526 .518 .670educmere.434 .389 .635 .498 .475 .545 .716aptverb .580 .564 .893 .716 .546 .422 .373 .851aptnum .491 .499 .888 .646 .508 .389 .339 .629 .871

aspsco asppro rsverb rsmath revenu edpere edmere aptverb aptnum

EXEMPLE sur données réelles

Le modèle de mesure

aptitude -> aptverb aptnum

aspire -> aspsco asppro

reussite -> rsverb rsmath

famille -> revenu educpere educmere

EXEMPLE sur données réelles

Le modèle structural

famille -> aspire reussite

aptitude -> aspire reussite

aspire -> reussite

EXEMPLE sur données réelles

EXEMPLE sur données réellesLe modèle théorique initial

Boomsma, A. (2000). Reporting analyses of covariance structures. Structural Equation Modeling, 7(3), 461-482.Jackson, D.L., Gillaspy, J.A. & Purc-Stephenson R. (2009). Reporting practices in confirmatory factor analysis: an overview and some recommendations. Psychological Methods, 14, 6-23.McDonald, R. P., & Ringo Ho, Moon-Ho (2002). Principles and practice in reporting structural equation analyses. Psychological Methods, 7(1), 64-82.Raykov, T., Tomer, A., & Nesselroade, J. R. (1991). Reporting structural equation modeling results in Psychology and Aging: Some proposed guidelines. Psychology and Aging, 6(4), 499-503.Tabachnick, B.G. & Fidell, (2007). Using multivariate statistics (5th ed.). Boston : Pearson International Edition.

http://davidakenny.net/kenny.htm

Comment présenter les résultats de MES ?

http://davidakenny.net/kenny.htm

Baron, R. M., & Kenny, D. A. (1986). The moderator-mediator variable distinction in social psychological research: Conceptual, strategic and statistical considerations. Journal of Personality and Social Psychology, 51, 1173-1182. Edwards, J. R., & Lambert L. S. (2007). Methods for integrating moderation and mediation: A general analytical framework using moderated path analysis. Psychological Methods, 12, 1-22. MacKinnon, D. P., Fairchild, A. J., & Fritz, M. S.  (2007). Mediation analysis. Annual Review of Psychology, 58, 593-614.Muller, D., Judd, C. M., & Yzerbyt, V. Y. (2005). When moderation is mediated and mediation is moderated. Journal of Personality and Social Psychology, 89, 852-863.

Médiation et modération

top related