clase 10 espacialidad y sus retos - the university of ...danrod/espacialidad y sus retos.pdf ·...

33
1 Espacialidad y sus retos Daniel A. Rodríguez, Ph.D. University of North Carolina, Chapel Hill [email protected] www.planning.unc.edu/index.php?option=com_content&view=article&id=51&Itemid=16 Resumen de temas • Introducción a la autocorrelación espacial • Diagnóstico – Visual (variograma, rezagos residuales) – Estadístico (I de Moran, C de Geary, Multiplicadores de Lagrange) • Opciones para incorporar autocorrelación espacial – Modelo de error espacial – Modelo de rezago espacial

Upload: hathien

Post on 21-Aug-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

1

Espacialidad y sus retos

Daniel A. Rodríguez, Ph.D.University of North Carolina, Chapel Hill

[email protected] www.planning.unc.edu/index.php?option=com_content&view=article&id=51&Itemid=16

Resumen de temas

• Introducción a la autocorrelación espacial• Diagnóstico

– Visual (variograma, rezagos residuales)– Estadístico (I de Moran, C de Geary,

Multiplicadores de Lagrange)

• Opciones para incorporar autocorrelación espacial– Modelo de error espacial– Modelo de rezago espacial

2

Relaciones espaciales

• Primera ley de la geografía de Tobler– Observaciones que están más cercanas (en

el espacio) son más parecidos entre si, que observaciones que están más alejadas

Fuente: Wilson 2008

Autocorrelación espacial

• Definición formal– Observaciones exhiben autocorrelación

espacial si sabiendo el valor de un parámetro de interés en un sitio permite la predicción del mismo parámetro en otro sitio

– Necesitamos información sobre la localización de nuestras observaciones

• Geografía importa!

3

Por qué ocurre?

1. Dependencia espacial– Correlación espacial

• Lo que explica una observación (la causa) en algún sitio, también explica observaciones en sitios contiguos

– Estatus socio-económico, cobertura policial y seguridad

Por qué ocurre?

– Causalidad espacial• Algo un algún sitio causa o explica observaciones

contiguas– Falta de mantenimiento y seguridad

– Solución: estimar modelos que tengan esto en cuenta

4

Por qué ocurre?

2. Interacción espacial– Cambio de régimen en el espacio (promedio

y dispersión varían)• Movimiento de información, personas o bienes

explican el fenómeno– Apertura de líneas de transporte masivo y seguridad

– Mercado inmobiliario cambia por barrio

– Solución: Utilizar variables tipo dummy para estabilizar el proceso

Ejemplos

• Seguridad

• Precios del suelo

• Calidad de la vivienda

• Concentración de la pobreza

• Demanda por vivienda específica– De interés social, de lujo, o nueva

• Calidad ambiental y polución– Muestras de aire y agua

5

Cuál es la consecuencia de la dependencia espacial de datos ?

• Supuestos de regresión lineal sobre error• Está distribuido normalmente y es

homoskedástico Se supone que está distribuido normalmente por

el teorema del limite central (porque la variable dependiente “Y” viene de una muestra aleatoria, y el error no está relacionado con ninguna variable independiente) Puede generar sesgo en los parámetros (debido a la

falta de independencia) y errores estándares pequeños (heteroskedasticidad)

• Reduce tamaño efectivo de la muestra

Ejemplos teóricos

Fuente: Layne, tomado de Wilson 2008

6

Opciones prácticas

• Controlar por el efecto que genera la autocorrelación espacial– Econometría espacial

• Evitarlo– Diseño muestral

Resumen de temas

• Introducción a la autocorrelación espacial• Diagnóstico

– Visual (variograma, rezagos residuales)– Estadístico (I de Moran, C de Geary,

Multiplicadores de Lagrange)

• Opciones para incorporar autocorrelación espacial– Modelo de error espacial– Modelo de rezago espacial

7

Cómo se diagnostica?

• Visualmente, inspeccionando residuales– Variograma

– Gráficas de residuos contra los propios datos pero desplazados (o rezagados) en el espacio

• Tests estadísticos de los residuales– I de Moran

– Tests de multiplicadores de Lagrange (LM) robustos

Variograma • Se calcula para los residuales de una

regresión lineal (Y-Yhat)– También se puede calcular para la variable

dependiente (Y) y variables independientes (X) si se quiere como método descriptivo

• Para un rango del rezago h, el variograma se define como la diferencia media cuadrada de los valores que tienen una separación dentro de ese rango

8

Rezagos espaciales• Un rezago espacial es una variable que

promedia los valores de observaciones vecinas– Valor de cada vecina es multiplicado por un

peso y el producto sumado

– El rango h en el variograma define cuales observaciones vecinas se tienen en cuenta

Matriz de proximidad

• Es una función que define como están distanciados espacialmente los datos– Clave para la estimación de rezagos

espaciales• Suponga que tiene 6 observaciones, y sabe sus

localizaciones en el espacio (lat y long)

• La manera mas sencilla de mostrar distancias es con una tabla de 6 x 6 (también llamada matriz)

6

35

214

9

Matriz de proximidad

• Resume 30 pares de puntos (6 x 5)

• Distancia entre una observación y ella misma es 0

• Es una tabla o matriz simétrica

• Se usa para construir los rezagos

ID 1 2 3 4 5 6

1 0 11.72 12.38 11.26 9.37 12.23

2 11.72 0.00 1.33 6.99 13.24 1.12

3 12.38 1.33 0 6.18 12.93 0.22

4 11.26 6.99 6.18 0 7.53 6.27

5 9.37 13.24 12.93 7.53 0 12.94

6 12.23 1.12 0.22 6.27 12.94 0

Matriz de proximidad

• Definamos rezagos h (arbitrarios), y contemos cuantos pares hay para cada h

ID 1 2 3 4 5 6

1 0 11.72 12.38 11.26 9.37 12.23

2 11.72 0.00 1.33 6.99 13.24 1.12

3 12.38 1.33 0 6.18 12.93 0.22

4 11.26 6.99 6.18 0 7.53 6.27

5 9.37 13.24 12.93 7.53 0 12.94

6 12.23 1.12 0.22 6.27 12.94 0

h # de pares 

0‐5 6

5‐10 10

10‐15 14

10

Variograma • Para un rango de rezago h, el variograma

se define como la diferencia media cuadrada de los valores que están separados en ese rango– Usualmente para valores estandarizados

(normal estándar)

h # de pares Promedio de diferencias

0‐5 6 2

5‐10 10 8

10‐15 14 9

Variograma • Se grafica h (eje X) contra el promedio de

diferencias (eje Y)

00.20.40.60.8

11.21.41.61.8

0 1 2 3 4 5 6 7 8

Val

or

Gam

a

Distancia (km)

Variograma empirical del residuales

RANGO

Umbral o “sill”

11

Variograma –otro ejemplo

Fuente: SAS

Gráficas de residuales

• Recorderis: Gráficas de residuos vs. Xs para detectar heteroskedasticidad

• Sugerencia es similar aquí utilizar residuales para diagnosticar problema

• Residuales vs. residuales rezagados– Es decir graficar el valor de cada residual i

vs. un valor promedio de residuales vecinos

12

Ejemplo: grafica de residuales

Matriz de contigüidad

• Matriz de contigüidad– Definamos con un 1 los rezagos si los vecinos están

a una distancia h de 3km o menos, o sino 0

ID 1 2 3 4 5 6

1 0 11.72 12.38 11.26 9.37 12.23

2 11.72 0.00 1.33 6.99 13.24 1.12

3 12.38 1.33 0 6.18 12.93 0.22

4 11.26 6.99 6.18 0 7.53 6.27

5 9.37 13.24 12.93 7.53 0 12.94

6 12.23 1.12 0.22 6.27 12.94 0

13

Matriz de contigüidad

• Definamos con un 1 los rezagos si los vecinos están a una distancia h de 7km o menos, o sino 0

ID 1 2 3 4 5 6

1 0 11.72 12.38 11.26 9.37 12.23

2 11.72 0.00 1.33 6.99 13.24 1.12

3 12.38 1.33 0 6.18 12.93 0.22

4 11.26 6.99 6.18 0 7.53 6.27

5 9.37 13.24 12.93 7.53 0 12.94

6 12.23 1.12 0.22 6.27 12.94 0

Matriz de contigüidad

• Hay otras maneras de definir contigüidad– 1/Distancia

ID 1 2 3 4 5 6

1 0 11.72 12.38 11.26 9.37 12.23

2 11.72 0.00 1.33 6.99 13.24 1.12

3 12.38 1.33 0 6.18 12.93 0.22

4 11.26 6.99 6.18 0 7.53 6.27

5 9.37 13.24 12.93 7.53 0 12.94

6 12.23 1.12 0.22 6.27 12.94 0

14

Matriz de contigüidad

• Hay otras maneras de definir contigüidad– 1/Distancia2

ID 1 2 3 4 5 6

1 0 11.72 12.38 11.26 9.37 12.23

2 11.72 0.00 1.33 6.99 13.24 1.12

3 12.38 1.33 0 6.18 12.93 0.22

4 11.26 6.99 6.18 0 7.53 6.27

5 9.37 13.24 12.93 7.53 0 12.94

6 12.23 1.12 0.22 6.27 12.94 0

Matriz de contigüidad

• Hay otras maneras de definir contigüidad– K-vecinos mas cercanos

ID 1 2 3 4 5 6

1 0 11.72 12.38 11.26 9.37 12.23

2 11.72 0.00 1.33 6.99 13.24 1.12

3 12.38 1.33 0 6.18 12.93 0.22

4 11.26 6.99 6.18 0 7.53 6.27

5 9.37 13.24 12.93 7.53 0 12.94

6 12.23 1.12 0.22 6.27 12.94 0

15

Grafica de residuales

• Objetivo: crear rezago de residuales, con la matriz de contigüidad estandarizada y los residuales– Multiplicar cada residual i por la fila i de la matriz de

contigüidad estandarizada

Matriz de contiguidad, banda de 7km

Normal estandar de los residuales

Matriz de contiguidad estandarizada, banda de 7km

Grafica de residuales

• Para observación 1: 1.2187*0 + -0.355*0 + 1.0236*0 + 0.3859*0 + -0.239*0 + -.9585*0 = 0

Normal estandar de los residuales

Matriz de contiguidad estandarizada, banda de 7km

16

Grafica de residuales

• Observación 2: 1.2187*0 + -0.355*0 + 1.0236*0.33 + 0.3859*0.33 + -0.239*0 + -.9585*0.33 = 0.789

Normal estandar de los residuales

Matriz de contiguidad estandarizada, banda de 7km

Grafica de residuales

• Observación 3: 1.2187*0 + -0.355*0.33 + 1.0236*0 + 0.3859*0.33 + -0.239*0 + -.9585*0.33 = 0.33

Normal estandar de los residuales

Matriz de contiguidad estandarizada, banda de 7km

17

Grafica de residuales

Ejemplo: grafica de residuales

18

Ejemplo: grafica de residuales

Repetir mismo ejercicio pero con un rezago de banda de 5km

Matriz de contiguidad estandarizada, banda de 5km

19

Resumen de temas

• Introducción a la autocorrelación espacial• Diagnóstico

– Visual (variograma, rezagos residuales)– Estadístico (I de Moran, C de Geary,

Multiplicadores de Lagrange)

• Opciones para incorporar autocorrelación espacial– Modelo de error espacial– Modelo de rezago espacial

Tests estadísticos para diagnosticar autocorrelación

espacial• I de Moran para los residuales

– Valores entre 1 y -1

– 1 significa autocorrelación positiva• Valores cercanos similares

– -1 significa autocorrelación negativa• Valores lejanos similares

– 0 significa que no hay autocorrelación

20

Tests estadísticos para diagnosticar autocorrelación

espacial• I de Moran para los residuales

– Tests global de autocorrelación

– Calculado con software (stata, SAS, GeoDa, Matlab)

– Significancia estadística determinada en relación a una distribución aleatoria hipotética

• Qué tan desviada está nuestra muestra en comparación a una que no tiene autocorrelación espacial?

Fotheringham, A. S., C. Brunsdon, and M. Charlton. 2000. Quantitative Geography: Perspectives on Spatial Data Analysis. London, UK: Sage.

Tests estadísticos para diagnosticar autocorrelación

espacial• C de Geary para los residuales

– Valores entre 0 y 2

– 1 significa que no hay autocorrelación espacial

– Mayor que 1 indica autocorrelación positiva

– Menor que 1 indica autocorrelación negativa

Geary, R. 1954. The contiguity ratio and statistical mapping. The Incorporated Statistician 5: 115–145.

21

Tests estadísticos para diagnosticar autocorrelación

espacial• Tests de multiplicadores de Lagrange

– Robustos y no robustos

– Sugiero utilización de los tests robustos• En Stata, GeoDA, R

• Determinan qué tipo de ecuación espacial se debe utilizar

Anselin, L., A. K. Bera, R. Florax, and M. J. Yoon. 1996. Simple diagnostic tests for spatial dependence. Regional Science and Urban Economics 26: 77–104

Resumen de temas

• Introducción a la autocorrelación espacial• Diagnóstico

– Visual (variograma, rezagos residuales)– Estadístico (I de Moran, C de Geary,

Multiplicadores de Lagrange)

• Opciones para incorporar autocorrelación espacial– Modelo de error espacial– Modelo de rezago espacial

22

Pasos a seguirEstimar modelo

mínimos cuadrados

Diagnosticar multicolinealidad, heteroskedasticidad y dependencia espacial

Si es necesario, usar econometria espacial

Pasos para diagnosticar y remediar autocorrelación

espacial

Fuente: GeoDA Workbook

23

Ejemplo• Información de ciudad de Columbus,

Ohio– Seguridad f(ingresos y valor de propiedad)

• Seguridad (hurtos vehiculares y robos a viviendas por 1000 residentes)

Diagnóstico de residuales

• Pedazo de matriz de contigüidad, estandarizada

24

Ejemplo• Descripción espacial de variables

Ejemplo

• Diagnóstico de autocorrelación

25

Si hay autocorrelación, qué hacer?

• Dos posibilidades– Modelo de error espacial

– Modelo de rezago espacial

Modelo de error espacial

• W es una matriz espacial de pesos (o de contigüidad, estandarizada)

• Error f(error vecinos)

• Implica que el error estándar estimado es mas bajo de lo que realmente es– Sesgo a mostrar significancia, cuando no la

hay

26

Modelo de rezago espacial

• W es una matriz espacial de pesos (o de contigüidad, estandarizada)

• Implicaciones– Posible sesgo en coeficientes estimados (en

cualquier dirección –no se sabe a priori)

– El error estándar estimado puede ser mas bajo de lo que realmente es (sesgo a mostrar significancia, cuando no la hay)

De nuevo el ejemplo de la seguridad en Columbus

• Diagnóstico de autocorrelación

27

Ejemplo

Ejemplo -comparación

28

Ejemplo --Bogotá

• Examinar efecto de expansiones del BRT en propiedades que ya tenían acceso al BRT• Efecto de red, o indirecto

• Economía urbana sugiere que las mejoras en accesibilidad se capitalizan en el valor del suelo

Efectos de red

29

Bogotá Troncal, Fase 1 (12/99)

Transmilenio: Avenida Caracas

Fuente: TransMilenio S.A.

Bogotá Troncal, Fase 2 –Av. Americas (02/03)

Transmilenio: Avenida de Las Americas

Fuente: TransMilenio S.A.

30

• Incluir propiedades residenciales a 1 km del troncal

• 2,976 propiedades residenciales en venta entre 2000 & 2006

• Variable dependiente, precio al que se ofrece

Datos

Variables independientes de interés

Con servicio de troncal a 1km?

Seis variables dummy:

= 1 si predio tenía troncal antes de 2003 y fue anunciado en el año 200X

= 0 si no

Atributos Estructurales

Atributos deVecindarios

Año de venta (variables dummy, 01-06)

Controles

31

• Incluir propiedades residenciales a 1 km del troncal

• 2,976 propiedades residenciales en venta entre 2000 & 2006

• Variable dependiente, precio al que se ofrece

Datos

Resultados

OJO: Hacer doble click en tabla para mirarla en WORD

32

Inauguración extensionAnuncio extension

Inauguración extensionAnuncio extension

33

Libros recomendados

• Anselin, L. 1988. Spatial Econometrics: Methods and Models. Dordrecht: Kluwer Academic.

• Bivand, R.S., E.J. Pebesma, and V. Gómez-Rubio. 2008. Applied spatial data analysis with R. New York, NY: Springer.