regresi%25c3%25b3n%2blineal%2bsimple
DESCRIPTION
regresionTRANSCRIPT
-
Facultad de Economa y Negocios FEN-1
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-1
Anlisis de Regresin Lineal Simple
Vctor Hugo Gonzlez J. PhD (c)
Mtodos Estadsticos III
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-2
Objetivos de Aprendizaje
Objetivos: Como usar el anlisis de regresin para predecir el
valor de una variable dependiente basado en una variable independiente.
El significado de los coeficientes de regresin b0 y b1 Como evaluar las asunciones del anlisis de regresin
y conocer que hacer si las asunciones son violadas. Realizar inferencias acerca de la pendiente y el
coeficiente de correlacin. Estimar los valores medios y predecir valores
individuales.
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-3
Correlacin vs. Regresin
Un diagrama de dispersin puede ser usado para mostrar las relaciones entre las dos variables.
El anlisis de Correlacin es usado para medir la fuerza de asociacin (relacin lineal) entre las dos variables. La correlacin es pertinente solamente con la fuerza
de la relacin. El efecto causal no se da con la correlacin. Diagramas de dispersin y Correlacin fueron vistos
en Mtodos estadsticos I.
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-4
Introduccin al Anlisis de Regresin
El anlisis de relacin es usado para: Predecir el valor de una variable dependiente basado
en el valor de por lo menos una variable independiente.
Explicar el impacto de cambios en una variable independiente sobre la variable dependiente.
Variable Dependiente: La variable que deseamos predecir o explicar
Variable Independiente: La variable usada para predecir o explicar la variable dependiente.
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-5
Modelo de Regresin Lineal Simple
Solamente una variable independiente, X
Relacion entre X y Y es descrita por una funcin lineal.
Cambios en Y son asumidos a ser relacionados a cambios en X.
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-6
Tipos de Relaciones
Y
X
Y
X
Y
Y
X
X
Relaciones lineales Relaciones curvilineas
-
Facultad de Economa y Negocios FEN-2
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-7
Tipos de Relaciones
Y
X
Y
X
Y
Y
X
X
Fuertes relacin Baja Relacin
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-8
Tipos de Relaciones
Y
X
Y
X
Ninguna Relacin
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-9
ii10i XY Componente Lineal
Modelo de Regresin Lineal Simple
Interseccin Poblacional Y
Coeficiente de Pendiente Poblacional
Trmino de error aleatorio
Variable Dependiente
Variable independiente
Componente del Error Aleatorio
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-10
Error aleatorio para este valor de Xi
Y
X
Valor observado de Y para Xi
Valor de prediccin de Y
para Xi
ii10i XY
Xi
Pendiente = 1
Intercepcin = 0
i
Modelo de Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-11
i10i XbbY
La ecuacin de regresin lineal simple provee un estimado de la lnea poblacional de regresin
Ecuacin de regresin lineal simple (Lnea de Prediccin)
Valor estimado de la interseccin
Valor estimado de la pendiente
Estimado (o predecido) valor Y para la observacin i
Valor de X para la observacin i
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-12
The Least Squares Method
b0 y b1 son obtenidos al encontrar los valores que minimizan la suma de las diferencias de los cuadrados entre Y and :
2i10i
2ii ))Xb(b(Ymin)Y(Ymin
Y
-
Facultad de Economa y Negocios FEN-3
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-13
Encontrando la Ecuacin de los mnimos cuadrados
Los coeficientes b0 y b1 , y otros resultados de regresin, sern encontrados con Excel.
Formulas son mostradas a continuacin
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-14
b0 es el valor estimado promedio de Y cuando el valor de X es cero
b1 es el cambio estimado en el valor promedio de Y como un resultado de una-unidad en incremento en X
Interpretacin de la pendiente y la intercepcin
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-15
Ejemplo de Regresin Lineal Simple
Un agente de bienes races desea examinar la relacin entre el precio de venta de una casa y su tamao (medido en pies cuadrados)
Una muestra aleatoria de 10 casas es seleccionada Variable dependiente(Y) = Precios de casas en
$1000s Variable independiente(X) = Pies cuadrados
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-16
DatosPrecio Casa $1000s
(Y)Pies Cuadrados
(X)245 1400312 1600279 1700308 1875199 1100219 1550405 2350324 2450319 1425255 1700
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-17
0
50
100
150
200
250
300
350
400
450
0 500 1000 1500 2000 2500 3000
Hou
se P
rice
($10
00s)
Square Feet
Diagrama de Dispersin
House price model: Scatter Plot
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-18
Usando funciones de Excel
1. Choose Data 2. Choose Data Analysis
3. Choose Regression
-
Facultad de Economa y Negocios FEN-4
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-19
Usando Funcin de Anlisis de Datos en Excel
Entre Ys y Xs y opciones deseadas
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-20
Usando PHStatAdd-Ins: PHStat: Regression: Simple Linear Regression
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-21
Excel Output
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVAdf SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
La Ecuacin de regresin es:
cuadrados) (Pies 0.10977 98.24833 casa la de Precio
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-22
050
100150200250300350400450
0 500 1000 1500 2000 2500 3000
Square Feet
Hous
e Pr
ice
($10
00s)
Representacin Grfica
Modelo Precio Casa: Diagrama Dispersin y la lnea de prediccin
cuadrados) (Pies 0.10977 98.24833 Casa la de Precio
Pendiente= 0.10977
Interseccin= 98.248
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-23
Interpretacin de bo
b0 es el valor estimado promedio de Y cuando el valor de X es cero (si X = 0 esta en el rango de valores observados de X)
Porque una casa no puede tener un valor de pies cuadrados de 0, b0 no tiene aplicacin prctica
cuadrados) (Pies 0.10977 98.24833 Casa Precio
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-24
Interpretando b1
b1 estima el cambio en el valor promedio de Y como el resultado del incremento de una unidad en X Aqu, b1 = 0.10977 nos dice que el valor medio de
una casa se incrementa por 0.10977($1000) = $109.77, en promedio, por cada pie cuadrado de superficie.
cuadrados) (pies 0.10977 98.24833 casa precio
-
Facultad de Economa y Negocios FEN-5
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-25
317.850)0.1098(200 98.25cuadrado) (pie 0.1098 98.25 Casa Precio
Predecir el precio de una casa con 2000 pies cuadrados:
El precio para una casa con 2000 pies cuadrados es de 317.85($1,000s) = $317,850
Realizando predicciones
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-26
050
100150200250300350400450
0 500 1000 1500 2000 2500 3000
Square Feet
Hous
e Pr
ice
($10
00s)
Realizando predicciones Cuando usamos un modelo de regresin para prediccin,
solamente se predice sobre un rango relevante.
Rango revelante para interpolacin
No tratar de extrapolar ms all del rango
observado de Xs
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-27
Medidas de variacin
La variacion total est en 2 partes:
SSE SSR SST Suma total
de cuadrados
Suma de cuadrados de
regresin
Suma de cuadrados del
error
2i )YY(SST 2ii )YY(SSE 2i )YY(SSRdonde:
= valor medio de la variable dependiente
Yi = valor observado de la variable dependiente= valor predecido de Y para un dado valor de XiiY
Y
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-28
SST = Suma de cuadrados totales (Variacin Total)
Medidas de variacin de los valores de Yi alrrededor de la media Y
SSR = Suma de cuadr. Regresion (Variacin explicada)
Variacin atribuble a la relacin entre X y Y
SSE = Suma de cuadrado del error (Variacin no explicada)
Variacin en Y atribubles a otros factores diferentes a X
Medidas de variacin
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-29
Xi
Y
X
Yi
SST = (Yi - Y)2SSE = (Yi - Yi )2
SSR = (Yi - Y)2
__
_Y
Y
Y_Y
Medidas de variacin
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-30
El coeficiente de determinacin es la porcin de la variacin total en la variable dependiente que es explicada por la variacin en la variable independiente.
El coeficiente de variacin es tambin llamado r-squared y es denotado como r2
Coeficiente de determinacin, r2
1r0 2 note: totalescuadr. de suma
regresin cuadr. de suma2 SSTSSRr
-
Facultad de Economa y Negocios FEN-6
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-31
r2 = 1
Valores de r2 aproximados
Y
X
Y
X
r2 = 1
r2 = 1
Perfect linear relationship between X and Y:
100% of the variation in Y is explained by variation in X
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-32
Valores de r2 aproximados
Y
X
Y
X
0 < r2 < 1
Dbil relacin lineal entre X y Y:
Algunos pero no todas las variaciones en Y es explicada con las variaciones en X
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-33
Valores de r2 aproximados
r2 = 0
No hay relaciones lineales entre X y Y:
El valor de Y no depende de X. (Ninguna de la variacin en Y es explicada por la variacin en X)
Y
Xr2 = 0
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-34
Ejemplo de un modelo de regresin lineal simple: Coeficiente de determinacin, r2 en Excel
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVAdf SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
58.08% de la variacin en precios casa es explicada por
la variacin en pies cuadrados
0.5808232600.500018934.9348
SSTSSRr 2
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-35
Error estandar de la estimacin
La desviacin estndard de la variacin de las observaciones alrrededor de la lnea de regresin es estimado por:
2
)(
21
2
n
YY
nSSES
n
iii
YX
Donde:SSE = Suma de cuadr. Del error
n = tamao muestral
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-36
Error estndar del estimado en Excel
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVAdf SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
41.33032SYX
-
Facultad de Economa y Negocios FEN-7
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-37
Comparando errores estndar
YY
X XYXS small YXS large
SYX es una medida de la variacin de los valores observados de Y desde una lnea de regresin
La magnitud de SYX debe siempre ser tomada con respecto al tamao de los valores de Y values en los datos muestrales.
i.e., SYX = $41.33K es moderadamente pequeo relativo al precio de las casas en el rango de $200K - $400K
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-38
Asunciones de regresinL.I.N.E
Linealidad La relacin entre X y Y es lineal
Independencia de los errores Valores de los errores son estadisticamente independientes
Normalidad del Error Los valores de los errores son normalmente distribudos para
cualquier X Equal o Igual Varianza (tambin llamado homocedasticidad)
La distribucin de probabilidad de los errores tiene varianza constante.
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-39
Anlisis Residual
El residual para la observacin i, ei, es la diferencia entre el valor observado y el predecido.
Se chequean las asunciones de la regresin examinando los residuos. Linealidad Evaluar independencia Evaluar normalidad Examinar varianza constante en todos los niveles de X
(homocedasticidad)
Anlisis grfico de los residuos Graficar residuos vs. X
iii YYe
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-40
Anlisis para linealidad en los residuos
Not Linear Linearx
resi
dual
s
x
Y
x
Y
x
resi
dual
s
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-41
Anlisis de residuos para independencia
Not IndependentIndependent
X
Xresi
dual
s
resi
dual
s
X
resi
dual
s
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-42
Normalidad
Examinar el Stem-and-Leaf Display de los residuos
Examinar el Boxplot of the Residuals Examinar el Histogram of the Residuals Construir un grfico de la probabilidad Normal
de los Residuos
-
Facultad de Economa y Negocios FEN-8
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-43
Anlisis de normalidad de los residuos
Percent
Residual
Cuandose usa un normal probability plot, los errores normales se grafican en una lnea recta
-3 -2 -1 0 1 2 3
0
100
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-44
Anlisis de residuos para igual varianza
Non-constant variance Constant variancex x
Y
x x
Y
resi
dual
s
resi
dual
s
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-45
House Price Model Residual Plot
-60
-40
-20
0
20
40
60
80
0 1000 2000 3000
Square Feet
Res
idua
ls
Excel Output de los residuos
RESIDUAL OUTPUT
Predicted House Price Residuals
1 251.92316 -6.923162
2 273.87671 38.12329
3 284.85348 -5.853484
4 304.06284 3.937162
5 218.99284 -19.99284
6 268.38832 -49.38832
7 356.20251 48.79749
8 367.17929 -43.17929
9 254.6674 64.33264
10 284.85348 -29.85348No parece violar ninguna asuncin de
regresinCopyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-46
Usado cuando los datos son tomados sombre un tiempo para detectar si la autocorrelacin est presente
Autocorrelacin existe si los residuos en un perodo de tiempo estn relacionados a los residuos en otro perodo de tiempo
Medida de Autocorrelacin:Durbin-Watson Statistic
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-47
Autocorrelacin
Autocorrelacin es la correlacin de los errores (residualess) sobre el tiempo
Viola la asuncin de regresin que los residuos son aleatorios e independientes
Time (t) Residual Plot
-15-10
-505
1015
0 2 4 6 8
Time (t)
Res
idua
ls
Aqu, Los residuos tienen tendencia cclica, no aleatoria. Tendencia cclica son signos de autocorrelacin positiva
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-48
The Durbin-Watson Statistic
n1i
2i
n
2i
21ii
e
)ee(D
El rango est entre 0 D 4 D debera estr cerca a 2 si H0 es verdad
D menor que 2 puede dar seal positiva de autocorrelacin , D mayor que 2 puede ser seal de autocorrelacin negativa
Durbin-Watson statistic es usado para probar autocorrelacin
H0: residuos no son correlacionadosH1: autocorrelacin positiva est presente
-
Facultad de Economa y Negocios FEN-9
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-49
Prueba para Autocorrelacin Positiva
Calcular Durbin-Watson statistic = D (Durbin-Watson Statistic usando Excel o Minitab)
Regla de Decisin: reject H0 if D < dL
H0: No existe autocorrelacin positiva
H1: autocorrelacin positiva est presente
0 dU 2dL
Rechazar H0 No rechazar H0
Encontrar los valores dL and dU desde la tabla Durbin-Watson(para muestras de tamao n y nmero de variables independientes k)
No concluyente
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-50
Supongase que tenemos la siguiente serie de tiempo:
Existe Autocorrelacin?
y = 30.65 + 4.7038x R2 = 0.8976
0
20
40
60
80
100
120
140
160
0 5 10 15 20 25 30
Tim e
Sale
s
Probar Autocorrelacin Positiva
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-51
Ejemplo con n = 25:
Durbin-Watson CalculationsSum of Squared Difference of Residuals 3296.18Sum of Squared Residuals 3279.98Durbin-Watson Statistic 1.00494
y = 30.65 + 4.7038x R2 = 0.8976
0
20
40
60
80
100
120
140
160
0 5 10 15 20 25 30
Tim e
Sale
s
Probando Autocorrelacin Positiva
Excel/PHStat output:
1.004943279.983296.18
e
)e(eD n
1i
2i
n
2i
21ii
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-52
Aqu, n = 25 y hay k = 1 una variable independiente
Usando la tabla Durbin-Watson, dL = 1.29 y dU = 1.45
D = 1.00494 < dL = 1.29, entonces rechazar H0 y concluir que existe autocorrelacin positiva.
Prueba para autocorrelacin Positiva
Decision: rechazar H0D = 1.00494 < dL
0 dU=1.45 2dL=1.29Rechazar H0
No rechazar H0No concluyente
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-53
Inferencias acerca de la pendiente
El error estandar del coeficiente de la pendiente de la regresin (b1) es estimado por:
2iYXYX
b)X(X
SSSXSS
1
donde:= Estimacin del error estndar de la pendiente
= Error estndar de la estimacin
1bS
2nSSESYX
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-54
Inferencias sobre la pendiente: t test
t test para una pendiente poblacional Hay una relacin lineal entre X y Y?
Hiptesis nula y alternativas son: H0: 1 = 0 (No existe relacin lineal) H1: 1 0 (existe relacin lineal)
Test statistic
1b
11STAT S
bt
2nd.f.
donde:
b1 = coeficiente de la pendiente de la regresin
1 = Pendiente de la hiptesis
Sb1 = error estndar de la pendiente
-
Facultad de Economa y Negocios FEN-10
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-55
Inferencias sobre la pendiente: t test - Ejemplo
House Price in $1000s
(y)
Square Feet (x)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
(sq.ft.) 0.1098 98.25 price house Ecuacin de regresin estimada:
La pendiente de este modelo es 0.1098
Hay una relacin entre los pies cuadrados de la casa y su precio de venta o precio de casa?
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-56
Inferencias sobre la pendiente: t test - Ejemplo
H0: 1 = 0H1: 1 0From Excel output:
Coefficients Standard Error t Stat P-valueIntercept 98.24833 58.03348 1.69296 0.12892Square Feet 0.10977 0.03297 3.32938 0.01039
1bSb1
329383032970
0109770S
bt
1b
11STAT ..
.
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-57
Inferencias sobre la pendiente: t test - Ejemplo
Test Statistic: tSTAT = 3.329
Hay suficiente evidencia que los pies cuadrados afectan el precio de venta de la casa.
Decision: Rechazar H0
Reject H0Reject H0
/2=.025
-t/2Do not reject H0
0 t/2
/2=.025
-2.3060 2.3060 3.329
d.f. = 10- 2 = 8
H0: 1 = 0H1: 1 0
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-58
Inferencias sobre la pendiente: t test - Ejemplo
H0: 1 = 0H1: 1 0
From Excel output: Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892Square Feet 0.10977 0.03297 3.32938 0.01039
p-value
Hay suficiente evidencia que los pies cuadrados afectan el precio de venta de la casa.
Decision: Rechazar H0, si el p-value <
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-59
F Test para significancia
F Test :
donde:
MSEMSRFSTAT
1knSSEMSE
kSSRMSR
donde FSTAT sigue una distribucin F con k numerador y (n k - 1)denominador grados de libertad
(k = el nmero de variables independientes en el modelo de regresin)
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-60
F-Test para significancia:Output de Excel
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVAdf SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
11.08481708.195718934.9348
MSEMSRFSTAT
With 1 and 8 degrees of freedom
p-value for the F-Test
-
Facultad de Economa y Negocios FEN-11
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-61
H0: 1 = 0H1: 1 0 = .05df1= 1 df2 = 8
Test Statistic:
Decision:
Conclusion:
Rechazar H0 at = 0.05
Hay suficiente evidencia que el tamao de la casa afecta el precio de venta.
0
= .05
F.05 = 5.32Rechazar H0No
rechazar H0
11.08FSTAT MSEMSR
Critical Value:
F = 5.32
F Test para significancia
F
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-62
Intervalo de confianza para la pendiente
Estimacin del intervalo de confianza de la pendiente:
Excel para los precios casas:
Al 95% de confianza, el intervalo de confianza para la pendiente es de (0.0337, 0.1858)
1b2/1Sb t
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
d.f. = n - 2
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-63
Siendo las unidades del precio de casa en $1000s, Tenemos 95% confianza que el impacto promedio sobre el precio de venta est entre $33.74 y $185.80 por pie cuadrado de superficie
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Este 95% intervalo de confianza no incluye 0.
Conclusion: Hay una relacin significativa entre el precio de la casa y los pies cuadrados al .05 nivel de significancia
Estimacin del intervalo de confianza para la pendiente
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-64
t Test para el coeficiente de correlacin
Hipotesis H0: = 0 (no correlation between X and Y)H1: 0 (correlation exists)
Test statistic
(con n 2 grados de libertad)
2nr1
-rt2STAT
0 b if
0 b if
12
12
rr
rr
donde
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-65
t Test para el coeficiente de correlacin
Hay evidencia de una relacin lineal entre los pies cuadrados y precios casa al .05 nivel de significancia?
H0: = 0 (No correlacion)H1: 0 (correlacion existe) =.05 , df = 10 - 2 = 8
3.329
210.7621
0.762
2nr1
rt22STAT
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-66
t Test para el coeficiente de correlacin
Conclusion:Hay evidencia de una asociacin lineal al 5% nivel de significancia
Decision:Rechazar H0
Reject H0Reject H0
/2=.025
-t/2Do not reject H0
0 t/2
/2=.025
-2.3060 2.30603.329
d.f. = 10-2 = 8
3.329
210.7621
0.762
2nr1
rt22STAT
-
Facultad de Economa y Negocios FEN-12
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-67
Estimando los valores medios y prediciendo los valores individuales
Y
XXi
Y = b0+b1Xi
Intervalo de confianza para la mediade Y, dado Xi
Intervalo de prediccin para un valor individual Y,dado Xi
Meta: Formar intervalos alrrededor de Y para expresar incertidumbre acerca del valor Y para un dado Xi
Y
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-68
Intervalo de confianza para el promedio Y, dado X
Estimar el intervalo de confianza para elValor medio de Y dado un particular Xi
Tamao del intervalo vara de acuerdo a la distancia desde la media, X
ihtY YX2/
XX|Y
S
: para confianza de intervaloi
2i
2i
2i
i )X(X)X(X
n1
SSX)X(X
n1h
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-69
Intervalo de prediccin para un valor Y, dado X
Estimar el intervalo de confianza paraValor individual de Y dado un particular Xi
Este trmino extra aade al ancho de intervalo para reflejar la incertidumbre adicional para un caso para un caso individual
ihtY
1S
:Y para confianza de Intervalo
YX2/
XX i
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-70
Estimacin de los valores medios: Ejemplo
Encontrar el intervalo del 95% para el precio medio de casas de 2,000 pies cuadrados
Precio predecidoYi = 317.85 ($1,000s)
Estimar el intervalo de confianza para Y|X=X
37.12317.85)X(X
)X(Xn1StY
2i
2i
YX0.025
Los puntos finales del intervalo de confianza son 280.66 y 354.90, o desde $280,660 a $354,900
i
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-71
Ejemplo de estimacin de los valores individuales
Encontrar el intervalo de prediccin al 95% para una casa individual con 2,000 pies cuadrados
Precio pronosticado Yi = 317.85 ($1,000s)
Estimar intervalos de prediccin para YX=X
102.28317.85)X(X
)X(Xn11StY
2i
2i
YX0.025
El intervalo es desde 215.50 a 420.07, o desde $215,500 a $420,070
i
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-72
Encontrar con Excel estos intervalos
Para Excel, usar
PHStat | regression | simple linear regression
Chequear:confidence and prediction interval for X=box y entrar el valor X y el nivel de confianza deseado.
-
Facultad de Economa y Negocios FEN-13
Vctor Hugo Gonzlez Jaramillo, PhD ( c ) Regresin Lineal Simple
Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall 13-73
Input values
Encontrar el intervalo de confianza y Prediccin en Excel
Confidence Interval Estimate for Y|X=Xi
Prediction Interval Estimate for YX=Xi
Y