regresion mc

4
Ejercicio de Regresión Lineal Simple. Sea X el volumen de lluvia (m3) y Y el volumen de escurrimiento (m3) en determinado lugar. (Devore, 6a. Edición. Pág. 517, problema 16) Var Indep. Var. Dep. o regresiva Bandas de confianza Bandas de predicción No. Observ. X Y XY yiestimada ei LIC LSC LIP LSP 1 5 4 25 16 20 3.00656096582 0.9934390341844 -1.790261 7.80338293 -9.2890475 15.3021695 2 12 10 144 100 120 8.79537299706 1.2046270029405 4.42350582 13.1672402 -3.3407594 20.9315054 3 14 13 196 169 182 10.4493192917 2.5506807082994 6.19349156 14.705147 -1.645496 22.5441346 4 17 15 289 225 255 12.9302387337 2.0697612663377 8.84321888 17.0172586 0.89378499 24.9666925 5 23 15 529 225 345 17.8920776176 -2.892077617586 14.1207035 21.6634517 5.95910857 29.8250467 6 30 25 900 625 750 23.6808896488 1.3191103511704 20.2318382 27.129941 11.8458382 35.5159411 7 40 27 1600 729 1080 31.950621122 -4.950621122035 28.8474511 35.0537911 20.211705 43.6895372 8 47 46 2209 2116 2162 37.7394331533 8.2605668467208 34.7756243 40.703242 26.0365852 49.4422811 9 55 38 3025 1444 2090 44.3552183318 -6.355218331844 41.4286154 47.2818213 32.6617376 56.0486991 10 67 46 4489 2116 3082 54.2788960997 -8.27889609969 51.1595169 57.3982753 42.5356847 66.0221075 11 72 53 5184 2809 3816 58.4137618363 -5.413761836293 55.1357477 61.691776 46.6274196 70.2001041 12 81 70 6561 4900 5670 65.8565201622 4.1434798378217 62.2018529 69.5111874 53.9599206 77.7531197 13 96 82 9216 6724 7872 78.261117372 3.7388826280133 73.7945743 82.7276605 66.0905589 90.4316759 14 112 99 12544 9801 11088 91.4926877291 7.5073122708843 86.008974 96.9764014 78.9131963 104.072179 15 127 100 16129 10000 12700 103.897284939 -3.897284938924 97.3815516 110.413018 90.8348476 116.959722 n= 15 Sumas 798 643 63040 41999 51232 -3.19744E-14 Promedio 53.2 42.8666666666667 Desv.Est. insesgada 38.346540168 32.1111166035037 Varianza insesgada 1470.4571429 1031.12380952381 Sumas de cuadrados Sxx Syy Sxy 20586.4 14435.7333333333 63040 41999 17024.4 Coef. de correlación, r= 0.9875570321 Intervalo de confianza para el promedio de y dado 0.9752688917 <- 97.53% de la variación de Y está explicada por el modelo de regresión Si xo se fija en: 50 Bo=Y-B1*X -1.128304771 <- Ordenada al origen La estimación puntual para la respuesta media de y B1=Sxy/Sxx 0.8269731473 <- Pendiente 40.22035 SSE=Syy-B1*Sxy 357.01168409 <- Suma de cuadrados de los errores El error estándar estimado de la respuesta media e MSE=SSE/(n-2) 27.462437238 <- Cuadrados medios de los errores 1.35812 37.28631 a 43.15439 0.05 0.025 La región de rechazo es: 2.16036865646 El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad. Intervalo de predicción para y dado x Si xo se fija en: 50 La predicción para la respuesta yo es: = 22.6418585332 40.22035 El error estándar estimado de la predicción: Por lo tanto: Se rechaza Ho 5.413587 Un intervalo de predicción para yo es: 28.52501 a 51.9157 El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad. = 22.6418585332 Por lo tanto: Se rechaza Ho X 2 Y 2 Suma(Y 2 ) Suma(X 2 ) Coef. de determinación, R2= El intervalo de confianza de (1-a)100% es: Si b1=0, ó r=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y Si a = a/2= | t0 |>ta/2 Prueba de Hipótesis sobre b1: Prueba de Hipótesis sobre r el coeficiente de correlación poblacional 0 20 40 60 80 100 120 140 -20 0 20 40 60 80 100 120 140 f(x) = 0.826973147320561 x − 1.12830477078719 R² = 0.975268891725452 Diagrama de dispersión Y Linear (Y) LIC LSC LIP LSP X Y 0 20 40 60 80 100 120 140 -10 -8 -6 -4 -2 0 2 4 6 8 10 f(x) = − 3.78286071577872E-16 x + 1.79931908006625E-14 R² = 1.11022302462516E-16 Gráfica de residuos ei X ei 0 : 0 : 1 1 1 0 β H β H xx E S MS T 1 1 ˆ b b 0 : 0 : 1 0 r r H H 2 1 2 r n r T

Upload: rafael-edgar-leon-segura

Post on 31-Jan-2016

217 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Regresion MC

Ejercicio de Regresión Lineal Simple.Sea X el volumen de lluvia (m3) y Y el volumen de escurrimiento (m3) en determinado lugar. (Devore, 6a. Edición. Pág. 517, problema 16)

Var Indep. Var. Dep. o regresiva Bandas de confianza Bandas de predicción

No. Observ. X Y XY yiestimada ei LIC LSC LIP LSP1 5 4 25 16 20 3.00656096582 0.9934390341844 -1.79026099 7.80338293 -9.28904753 15.30216952 12 10 144 100 120 8.79537299706 1.2046270029405 4.42350582 13.1672402 -3.34075942 20.93150543 14 13 196 169 182 10.4493192917 2.5506807082993 6.19349156 14.705147 -1.64549601 22.54413464 17 15 289 225 255 12.9302387337 2.0697612663377 8.84321888 17.0172586 0.89378499 24.96669255 23 15 529 225 345 17.8920776176 -2.8920776175857 14.1207035 21.6634517 5.95910857 29.82504676 30 25 900 625 750 23.6808896488 1.3191103511704 20.2318382 27.129941 11.8458382 35.51594117 40 27 1600 729 1080 31.950621122 -4.9506211220353 28.8474511 35.0537911 20.211705 43.68953728 47 46 2209 2116 2162 37.7394331533 8.2605668467208 34.7756243 40.703242 26.0365852 49.44228119 55 38 3025 1444 2090 44.3552183318 -6.3552183318437 41.4286154 47.2818213 32.6617376 56.0486991

10 67 46 4489 2116 3082 54.2788960997 -8.2788960996904 51.1595169 57.3982753 42.5356847 66.022107511 72 53 5184 2809 3816 58.4137618363 -5.4137618362932 55.1357477 61.691776 46.6274196 70.200104112 81 70 6561 4900 5670 65.8565201622 4.1434798378217 62.2018529 69.5111874 53.9599206 77.753119713 96 82 9216 6724 7872 78.261117372 3.7388826280133 73.7945743 82.7276605 66.0905589 90.431675914 112 99 12544 9801 11088 91.4926877291 7.5073122708843 86.008974 96.9764014 78.9131963 104.07217915 127 100 16129 10000 12700 103.897284939 -3.8972849389241 97.3815516 110.413018 90.8348476 116.959722

n= 15Sumas 798 643 63040 41999 51232 -3.197442E-14Promedio 53.2 42.8666666666667Desv.Est. insesgada 38.346540168 32.1111166035037Varianza insesgada 1470.4571429 1031.12380952381

Sumas de cuadrados Sxx Syy Sxy20586.4 14435.7333333333 63040 41999 17024.4

Coef. de correlación, r= 0.9875570321 Intervalo de confianza para el promedio de y dado x:Coef. de determinación, R2= 0.9752688917 <- 97.53% de la variación de Y está explicada por el modelo de regresión Si xo se fija en: 50Bo=Y-B1*X -1.128304771 <- Ordenada al origen La estimación puntual para la respuesta media de yo es: B1=Sxy/Sxx 0.8269731473 <- Pendiente 40.220353SSE=Syy-B1*Sxy 357.01168409 <- Suma de cuadrados de los errores El error estándar estimado de la respuesta media es:MSE=SSE/(n-2) 27.462437238 <- Cuadrados medios de los errores 1.3581198

37.286313 a 43.154392

0.05 0.025

La región de rechazo es: 2.16036865646

El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad. Intervalo de predicción para y dado xSi xo se fija en: 50La predicción para la respuesta yo es:

= 22.6418585332 40.220353El error estándar estimado de la predicción:

Por lo tanto: Se rechaza Ho 5.4135872Un intervalo de predicción para yo es:

28.525008 a 51.915697

El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

= 22.6418585332

Por lo tanto: Se rechaza Ho

X2 Y2

Suma(Y2) Suma(X2)

El intervalo de confianza de (1-a)100% es:

Si b1=0, ó r=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y

Si a = a/2=

| t0 |>ta/2

Prueba de Hipótesis sobre b1:

Prueba de Hipótesis sobre r el coeficiente de correlación poblacional

0 20 40 60 80 100 120 140

-20

0

20

40

60

80

100

120

140

f(x) = 0.826973147320561 x − 1.12830477078719R² = 0.975268891725452

Diagrama de dispersión

Y

Linear (Y)

LIC

LSC

LIP

LSP

X

Y

0 20 40 60 80 100 120 140

-10

-8

-6

-4

-2

0

2

4

6

8

10

f(x) = − 3.78286071577872E-16 x + 1.79931908006625E-14R² = 1.11022302462516E-16

Gráfica de residuos

ei

Linear (ei)

X

ei

0 :

0 :

11

10

βH

βH

xx

E

SMS

T 11ˆ bb

0 :

0 :

1

0

rr

H

H21

2

r

nrT

Page 2: Regresion MC

Var Indep. Var. Dep. o regresiva Bandas de confianza Bandas de predicción

No. Observ. X Y XY yiestimada ei LIC LSC LIP LSP1 1 2.8 1 7.84 2.8 2.21904761905 0.58095238095238 1.2321869 3.20590834 0.53585232 3.902242922 2 4.8 4 23.04 9.6 5.40476190476 -0.6047619047619 4.66386912 6.14565469 3.85293251 6.95659133 3 8.2 9 67.24 24.6 8.59047619048 -0.3904761904762 8.01044504 9.17050734 7.10869062 10.07226184 4 12 16 144 48 11.7761904762 0.22380952380952 11.1961593 12.3562216 10.2944049 13.2579765 5 15.2 25 231.04 76 14.9619047619 0.23809523809524 14.221012 15.7027975 13.4100754 16.51373426 6 18.1 36 327.61 108.6 18.1476190476 -0.0476190476191 17.1607583 19.1344798 16.4644237 19.8308144

n= 6

Sumas 21 61.1 91 800.77 269.6 -1.332268E-15Promedio 3.5 10.1833333333333

Desv.Est. insesgada 1.8708286934 5.97609125320779Varianza insesgada 3.5 35.7136666666667

Sumas de cuadrados Sxx Syy Sxy17.5 178.568333333333 55.75

Coef. De Correlación, r= 0.9972949612Intervalo de confianza para la respuesta media esperada dado x

0.9945972397 <- 99.46% de la variación de Y está explicada por el modelo de regresión Si xo se fija en: 3.5 horas10.18333

Bo=Y-B1*X -0.966666667 <- Ordenada al origenB1=Sxy/Sxx 3.1857142857 <- Pendiente

Un intervalo de confianza para la calificación esperada es:SSE=Syy-B1*Sxy 0.9647619048 <- Suma de cuadrados de los errores 9.626669 a 10.74

MSE=SSE/(n-2) 0.2411904762 <- Cuadrados medios de los errores Error estándar estimado de la respuesta media: 0.200495

Intervalo de predicción para y dado xSi xo se fija en: 3.5 horas

0.05 0.025 La predicción para la respuesta yo es: 10.18333

La región de rechazo es: 2.7764451052Un intervalo de predicción para yo es:

El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad. 8.710537 a 11.65613

Error estándar estimado de la predicción: 0.530461= 27.1359962085

Por lo tanto: Se rechaza Ho

El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

= 27.1359962085

Por lo tanto: Se rechaza Ho

X2 Y2

Coef. De Determinación, R2=

La respuesta media esperada sería de:

Si b1=0, ó r=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y Y

Si a = a/2=

| t0 |>ta/2

Prueba de Hipótesis sobre b1:

Prueba de Hipótesis sobre r el coeficiente de correlación poblacional

0 1 2 3 4 5 6 70

5

10

15

20

25

f(x) = 3.18571428571429 x − 0.966666666666667R² = 0.994597239685488

Diagrama de dispersión

YLinear (Y)LICLSCLIPLSP

X

Y

0 :

0 :

11

10

βH

βH

xx

E

SMS

T 11ˆ bb

0 :

0 :

1

0

rr

H

H21

2

r

nrT

Page 3: Regresion MC

FORMULARIO PARA EL AJUSTE DE LA RECTA DE REGRESIÓNPOR EL MÉTODO DE MÍNIMOS CUADRADOS

Ahora, el modelo de regresión lineal simple ajustado (o recta estimada) es:

donde:

Suma de cuadrados de X

Suma de productos cruzados de X y Y

Suma de cuadrados de Y

Verdadera recta de regresión:

Modelo lineal simple:

Los i se suponen errores aleatorios con distribución normal, media cero y varianza 2; 0 y 1 son constantes desconocidas (parámetros del modelo de regresión)

Coeficiente de correlación: Coeficiente de determinación:

Suma de cuadrados de los errores:

Cuadrado medios de los errores (o varianza residual):

También:

Bandas de confianza para la recta de regresión:

Bandas de predicción:

Estimación de la respuesta media de yo dado un xo:

El residuo o error en la estimación se define como:

iii xy bb 10

XY 10 bb

xy 10ˆˆˆ bb ˆˆ

10 xy bb

n

x

xxxS

n

iin

i

n

iixx i

2

1

1

2

1

2

n

xy

yxyxxS

n

ii

n

iin

iii

n

iiixy

11

11

)(

n

y

yyyS

n

iin

i

n

iiyy i

2

1

1

2

1

2

yyxx

xy

SS

Sr 22 rR

),0(~ 2 Ni

n

iii

n

iiE yyeSS

1

2

1

2 ˆ

22

ˆ1

2

nSS

n

yyMS E

n

iii

E xyyyE SSSS 1b̂

xx

oEn S

xx

nMSty

2

2,2/0

)(1ˆ a

xx

oEn S

xxn

MSty2

2,2/0

)(11ˆ a

01000ˆˆˆˆˆ

0xxYEyY bb

xx

xy

S

Sβ 1ˆ

iii yye ˆ

Page 4: Regresion MC

No. hrs. estudio Calificación del examen Bandas de confianza Bandas de predicción

No. Observ. X Y XY yiestimada ei LIC LSC LIP LSP1 1 71 1 5041 71 71.45 -0.45 67.1647411 75.7352589 63.1768167 79.72318332 2 71 4 5041 142 72.8375 -1.8375 69.0983479 76.5766521 64.8335399 80.84146013 4 74 16 5476 296 75.6125 -1.6125 72.6169957 78.6080043 67.9277642 83.29723584 4 80 16 6400 320 75.6125 4.3875 72.6169957 78.6080043 67.9277642 83.29723585 7 80 49 6400 560 79.775 0.22499999999999 76.4808953 83.0691047 71.9690251 87.58097496 12 86 144 7396 1032 86.7125 -0.7125 80.4657154 92.9592846 77.2729854 96.1520146

n= 6

Sumas 30 462 230 35754 2421 -1.421085E-14Promedio 5 77

Desv.Est. insesgada 4 6Varianza insesgada 16 36

Desv. Est. sesgada 3.6514837167 5.47722557505166Varianza sesgada 13.333333333 30

Sumas de cuadrados Sxx Syy Sxy80 180 111

Coef. De Correlación, r= 0.925Intervalo de confianza para la respuesta media esperada dado x

0.855625 <- 85.56% de la variación de Y está explicada por el modelo de regresión Si los alumnos estudian en promedio: 5 horas77

Bo=Y-B1*X 70.0625 <- Ordenada al origenB1=Sxy/Sxx 1.3875 <- Pendiente

Un intervalo de confianza para la calificación esperada es:SSE=Syy-B1*Sxy 25.9875 <- Suma de cuadrados de los errores 74.11088 a 79.88912

MSE=SSE/(n-2) 6.496875 <- Cuadrados medios de los errores

Intervalo de predicción para y dado x5 horas

0.05 0.025 La predicción para su calificación es de: 77

La región de rechazo es: 2.7764451052Un intervalo de predicción para la calificación es:

El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad. 69.3561 a 84.6439

= 4.8688425427

Por lo tanto: Se rechaza Ho

El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

= 4.8688425427

Por lo tanto: Se rechaza Ho

X2 Y2

Coef. De Determinación, R2=

La calificación esperada en promedio sería de:

Si b1=0, ó r=0, entonces la variación de X no explica la variación de Y o no hay regresión lineal entre X y YSi un alumno estudia

Si a = a/2=

| t0 |>ta/2

Prueba de Hipótesis sobre b1:

Prueba de Hipótesis sobre r el coeficiente de correlación poblacional

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1550

55

60

65

70

75

80

85

90

95

100

f(x) = 1.3875 x + 70.0625R² = 0.855625

YLinear (Y)LICLSCLIPLSP

0 :

0 :

11

10

βH

βH

xx

E

SMS

T 11ˆ bb

0 :

0 :

1

0

rr

H

H21

2

r

nrT