ex6 heteroscedasticitate

8
1 Heteroscedasticitatea erorilor aleatoare Erorile sunt heteroscedastice dacă au dispersii diferite: n i E E Var i i i i ,..., 2 , 1 , )) ( ( ) ( 2 2 = = = σ ε ε ε . Exprimăm proprietatea de heteroscedasticitate a erorilor aleatoare prin 2 2 ) ( i i E σ ε = . Exemplu: Cheltuieli pentru Cercetare&Dezvoltare şi Vânzările în Industria SUA. Datele se găsesc în fişierul Seminar 7 Chelt CD_Vanzari.xls. Mai întâi ne propunem să determinăm legătura dintre CD (Cheltuielile pentru Cercetare şi Dezvoltare) şi Vânzări. Considerăm un model liniar: i Vanzari CD ε β β + + = 1 0 . A priori, ne aşteptăm la o relaŃie pozitivă între cele 2 variabile. Formăm grupul CD, Vânzări. Efectuăm regresia EQ01: CD Vanzari C CD = 192,9931 + 0,0319 Vanzari 4783 , 0 2 = R se = (0,0416) (0.0083) t = (990,98) (3,8300) ReŃinem reziduurile din această regresie. În zona de lucru din Eviews (zona albă) definim: „series reziduuri=resid” Vizualizăm grupul reziduuri, resid. Reprezentăm grafic CD în funcŃie de vânzări. Formăm grupul Vânzări, CD. Selectăm View, Graph, Scatter, Scatter with regression. Din grafic se vede că chelt.CD cresc atunci când vânzările cresc. De remarcat este faptul că variabilitatea chelt.CD în jurul dreptei de regresie pare să crească atunci când vânzările cresc. Aceasta inseamnă că este prezentă proprietatea de heteroscedasticitate.

Upload: andreea-cristina

Post on 23-Apr-2017

284 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Ex6 Heteroscedasticitate

1

Heteroscedasticitatea erorilor aleatoare Erorile sunt heteroscedastice dacă au dispersii diferite:

niEEVar iiii ,...,2,1,))(()( 22 ==−= σεεε .

Exprimăm proprietatea de heteroscedasticitate a erorilor aleatoare prin 22 )( iiE σε = .

Exemplu: Cheltuieli pentru Cercetare&Dezvoltare şi Vânzările în Industria SUA. Datele se găsesc în fişierul Seminar 7 Chelt CD_Vanzari.xls. Mai întâi ne propunem să determinăm legătura dintre CD (Cheltuielile pentru Cercetare şi Dezvoltare) şi Vânzări. Considerăm un model liniar: iVanzariCD εββ ++= 10 . A priori, ne aşteptăm la o relaŃie pozitivă între cele 2 variabile. Formăm grupul CD, Vânzări. Efectuăm regresia EQ01: CD Vanzari C

CD = 192,9931 + 0,0319 Vanzari 4783,02=R

se = (0,0416) (0.0083) t = (990,98) (3,8300)

ReŃinem reziduurile din această regresie. În zona de lucru din Eviews (zona albă) definim: „series reziduuri=resid” Vizualizăm grupul reziduuri, resid. Reprezentăm grafic CD în funcŃie de vânzări. Formăm grupul Vânzări, CD. Selectăm View, Graph, Scatter, Scatter with regression. Din grafic se vede că chelt.CD cresc atunci când vânzările cresc. De remarcat este faptul că variabilitatea chelt.CD în jurul dreptei de regresie pare să crească atunci când vânzările cresc. Aceasta inseamnă că este prezentă proprietatea de heteroscedasticitate.

Page 2: Ex6 Heteroscedasticitate

2

Reprezentăm grafic reziduurile faŃă de vânzări. Se observă că valoarea absolută a reziduurilor creşte pe măsură ce vânzările cresc, ceea ce sugerează că ipoteza de homoscedasticitete nu este îndeplinită. Obs: Este evident că reziduurile ie nu sunt identice cu variabilele de perturbaŃie iε , ci reprezintă nişte aproximaŃii. Din variabilitatea observată pentru ie nu putem spune în mod categoric faptul că varianŃa lui iε este, de asemenea, variabilă. Totuşi, în practică, când nu putem observa iε , vom trage concluzii despre modelul lui iε pe baza modelului observat pentru ie .

Testul Park Ipotezele testului sunt:

Page 3: Ex6 Heteroscedasticitate

3

H0: există homoscedasticitate sau, nu există heteroscedasticitate H1: există heteroscedasticitate sau, nu există homoscedasticitate

ii Vanzarie ηββ ++= )ln(ln 102

“series eipatrat=reziduuri*reziduuri” Make EQ02: log(eipatrat) log(vanzari) C

ScrieŃi ecuaŃia de regresie estimată..... ∧

2ln ie = 5,6877 + 0,7014*ln(Vanzari) 07789,02=R

se = (6,6351) (0.6033) t = (0,8572) (1,1626)

Coeficientul pantă estimat nu este semnificativ statistic (t Stat = 1,16 şi p=0,26). Nu putem respinge H0 care constă în ??... Nici nu vom accepta imediat că nu există heteroscedasticitate. Există probleme cu testul Park şi anume: eroarea aleatoare iη poate fi heteroscedastică. Sunt necesare mai multe teste pentru a putea afirma că modelul nostru iniŃial nu este afectat de heteroscedasticitate. Testul Glejser După obŃinerea reziduurilor din modelul original, Glejser a sugerat regresarea valorii absolute a lui ei în raport cu variabila X (Vanzari), care este privită ca fiind asociată strâns cu varianŃa heteroscedastică 2

iσ .

iii Xe ηββ ++= 10|| H0: 01 =β (există homoscedasticitate sau, nu există heteroscedasticitate) H0: 01 ≠β (există heteroscedasticitate sau, nu există homoscedasticitate) “series eimodul=abs(reziduuri)” Make EQ03: eimodul vanzari c

Page 4: Ex6 Heteroscedasticitate

4

|| ie = 578,571 + 0, 0119* Vanzari 2149,02=R

t =(0,8524) (2,0930)

iii Xe ηββ ++= 10||

Make EQ04: eimodul sqr(vanzari) c

|| ie = -507,0202 + 0, 0119* Vanzari 2599,02=R

t =(-0,50315) (2,37038)

Page 5: Ex6 Heteroscedasticitate

5

i

i

iX

e ηββ ++=1

|| 10

Make EQ05: eimodul 1/vanzari c

|| ie = 2273,702 -19924566*Vanzari

1 1405,02

=R

t =(3,76005) (-1,6174) Modelele din eq03 şi eq04 sugerează să respingem H0, deoarece coeficientul pantă este semnificativ statistic. Modelul din eq05 sugerează să nu respingem H0, deoarece coeficientul pantă nu este semnificativ statistic. Testul White Testul solicită ca, după determinarea reziduurilor din regresia originală, să se calculeze o

regresie auxiliară a pătratelor reziduurilor în raport cu o constantă, variabilele explicative

ale modelului original, pătratele lor şi produsele încrucişate.

iiii XXe ηααα +++= 2210

2 Din regresia auxiliară se reŃine coeficientul de determinaŃie multiplă. White a arătat că, în selecŃii de volum mare, sub ipoteza H0 (adică dacă ε este homoscedastic) statistica 2

anRW = urmează asimptotic o distribuŃie 2χ cu gradele de

libertate date de numărul de regresori din ecuaŃia auxiliară (la noi 2). Dacă valoarea calculată depăşeşte valoarea critică, atunci ar trebui să respingem 0H .

0: 210 ==ααH (nu există heteroscedasticitate, ci există homoscedasticitate) 2,1,0)(:1 =≠∃ iH iα (există heteroscedasticitate)

Se estimează parametrii modelului original şi reziduurile. Se aplică testul White pe seria reziduurilor.

Page 6: Ex6 Heteroscedasticitate

6

Corectarea heteroscedasticităŃii

Cazul: VarianŃele perturbaŃiilor sunt necunoscute: 2iσ = necunoscut

a) VarianŃa erorilor variază direct cu o variabilă explicativă, fiind proporŃională cu pătratul ei: 222

ii xσσ = .

i

i

ii

i

xxx

y εββ ++= 10

1

Page 7: Ex6 Heteroscedasticitate

7

Modelul este semnificativ? b) VarianŃa erorilor este proporŃională cu o variabilă explicativă: ii x22 σσ =

Transformăm modelul împărŃind prin ix :

i

i

i

i

ii

i

xx

x

xx

y εββ ++= 10

1, ⇒

i

ii

ii

i

xx

xx

y εββ ++= 10

1

Rezultă că a fost eliminată heteroscedasticitatea erorilor aleatoare, deci putem estima modelul transformat prin MCMMP. Make EQ07: CD/sqr(vanzari) 1/sqr(vanzari) sqr(vanzari)

Comparăm eq07 cu eq01. Variabilele dependente sunt diferite. Dacă în eq07 înmulŃim prin

ix , eq07 va fi transformată în ii xy *0368,068,246ˆ +−= .

În eq07 coeficientul lui X este mai semnificativ. Se pare că presupunerea ii x22 σσ = este potrivită pentru exemplul CD-Vanzari.

Respecificarea modelului

În loc să facem presupuneri despre 2iσ , alegem o altă formă funcŃională

Transformarea logaritmică este folosită în mod frecvent pentru a elimina heteroscedasticitatea, deoarece reduce dispersia variabilelor iniŃiale. Se estimează prin MCMMP modelul iii xy εββ ++= lnln 10 în locul modelului iii xy εββ ++= 10 . Un avantaj al modelului log-liniar sau dublu logaritmic, este că panta măsoară elasticitatea lui Y în raport cu X, adică modificarea procentuală în Y, pentru o modificare procentuală în X. Problema heteroscedasticităŃii poate fi rezolvată, uneori, dacă se folosesc ecuaŃii de regresie în formă logaritmică.

Page 8: Ex6 Heteroscedasticitate

8