clase 10 espacialidad y sus retos - the university of ...danrod/espacialidad y sus retos.pdf ·...
TRANSCRIPT
1
Espacialidad y sus retos
Daniel A. Rodríguez, Ph.D.University of North Carolina, Chapel Hill
[email protected] www.planning.unc.edu/index.php?option=com_content&view=article&id=51&Itemid=16
Resumen de temas
• Introducción a la autocorrelación espacial• Diagnóstico
– Visual (variograma, rezagos residuales)– Estadístico (I de Moran, C de Geary,
Multiplicadores de Lagrange)
• Opciones para incorporar autocorrelación espacial– Modelo de error espacial– Modelo de rezago espacial
2
Relaciones espaciales
• Primera ley de la geografía de Tobler– Observaciones que están más cercanas (en
el espacio) son más parecidos entre si, que observaciones que están más alejadas
Fuente: Wilson 2008
Autocorrelación espacial
• Definición formal– Observaciones exhiben autocorrelación
espacial si sabiendo el valor de un parámetro de interés en un sitio permite la predicción del mismo parámetro en otro sitio
– Necesitamos información sobre la localización de nuestras observaciones
• Geografía importa!
3
Por qué ocurre?
1. Dependencia espacial– Correlación espacial
• Lo que explica una observación (la causa) en algún sitio, también explica observaciones en sitios contiguos
– Estatus socio-económico, cobertura policial y seguridad
Por qué ocurre?
– Causalidad espacial• Algo un algún sitio causa o explica observaciones
contiguas– Falta de mantenimiento y seguridad
– Solución: estimar modelos que tengan esto en cuenta
4
Por qué ocurre?
2. Interacción espacial– Cambio de régimen en el espacio (promedio
y dispersión varían)• Movimiento de información, personas o bienes
explican el fenómeno– Apertura de líneas de transporte masivo y seguridad
– Mercado inmobiliario cambia por barrio
– Solución: Utilizar variables tipo dummy para estabilizar el proceso
Ejemplos
• Seguridad
• Precios del suelo
• Calidad de la vivienda
• Concentración de la pobreza
• Demanda por vivienda específica– De interés social, de lujo, o nueva
• Calidad ambiental y polución– Muestras de aire y agua
5
Cuál es la consecuencia de la dependencia espacial de datos ?
• Supuestos de regresión lineal sobre error• Está distribuido normalmente y es
homoskedástico Se supone que está distribuido normalmente por
el teorema del limite central (porque la variable dependiente “Y” viene de una muestra aleatoria, y el error no está relacionado con ninguna variable independiente) Puede generar sesgo en los parámetros (debido a la
falta de independencia) y errores estándares pequeños (heteroskedasticidad)
• Reduce tamaño efectivo de la muestra
Ejemplos teóricos
Fuente: Layne, tomado de Wilson 2008
6
Opciones prácticas
• Controlar por el efecto que genera la autocorrelación espacial– Econometría espacial
• Evitarlo– Diseño muestral
Resumen de temas
• Introducción a la autocorrelación espacial• Diagnóstico
– Visual (variograma, rezagos residuales)– Estadístico (I de Moran, C de Geary,
Multiplicadores de Lagrange)
• Opciones para incorporar autocorrelación espacial– Modelo de error espacial– Modelo de rezago espacial
7
Cómo se diagnostica?
• Visualmente, inspeccionando residuales– Variograma
– Gráficas de residuos contra los propios datos pero desplazados (o rezagados) en el espacio
• Tests estadísticos de los residuales– I de Moran
– Tests de multiplicadores de Lagrange (LM) robustos
Variograma • Se calcula para los residuales de una
regresión lineal (Y-Yhat)– También se puede calcular para la variable
dependiente (Y) y variables independientes (X) si se quiere como método descriptivo
• Para un rango del rezago h, el variograma se define como la diferencia media cuadrada de los valores que tienen una separación dentro de ese rango
8
Rezagos espaciales• Un rezago espacial es una variable que
promedia los valores de observaciones vecinas– Valor de cada vecina es multiplicado por un
peso y el producto sumado
– El rango h en el variograma define cuales observaciones vecinas se tienen en cuenta
Matriz de proximidad
• Es una función que define como están distanciados espacialmente los datos– Clave para la estimación de rezagos
espaciales• Suponga que tiene 6 observaciones, y sabe sus
localizaciones en el espacio (lat y long)
• La manera mas sencilla de mostrar distancias es con una tabla de 6 x 6 (también llamada matriz)
6
35
214
9
Matriz de proximidad
• Resume 30 pares de puntos (6 x 5)
• Distancia entre una observación y ella misma es 0
• Es una tabla o matriz simétrica
• Se usa para construir los rezagos
ID 1 2 3 4 5 6
1 0 11.72 12.38 11.26 9.37 12.23
2 11.72 0.00 1.33 6.99 13.24 1.12
3 12.38 1.33 0 6.18 12.93 0.22
4 11.26 6.99 6.18 0 7.53 6.27
5 9.37 13.24 12.93 7.53 0 12.94
6 12.23 1.12 0.22 6.27 12.94 0
Matriz de proximidad
• Definamos rezagos h (arbitrarios), y contemos cuantos pares hay para cada h
ID 1 2 3 4 5 6
1 0 11.72 12.38 11.26 9.37 12.23
2 11.72 0.00 1.33 6.99 13.24 1.12
3 12.38 1.33 0 6.18 12.93 0.22
4 11.26 6.99 6.18 0 7.53 6.27
5 9.37 13.24 12.93 7.53 0 12.94
6 12.23 1.12 0.22 6.27 12.94 0
h # de pares
0‐5 6
5‐10 10
10‐15 14
10
Variograma • Para un rango de rezago h, el variograma
se define como la diferencia media cuadrada de los valores que están separados en ese rango– Usualmente para valores estandarizados
(normal estándar)
h # de pares Promedio de diferencias
0‐5 6 2
5‐10 10 8
10‐15 14 9
Variograma • Se grafica h (eje X) contra el promedio de
diferencias (eje Y)
00.20.40.60.8
11.21.41.61.8
0 1 2 3 4 5 6 7 8
Val
or
Gam
a
Distancia (km)
Variograma empirical del residuales
RANGO
Umbral o “sill”
11
Variograma –otro ejemplo
Fuente: SAS
Gráficas de residuales
• Recorderis: Gráficas de residuos vs. Xs para detectar heteroskedasticidad
• Sugerencia es similar aquí utilizar residuales para diagnosticar problema
• Residuales vs. residuales rezagados– Es decir graficar el valor de cada residual i
vs. un valor promedio de residuales vecinos
12
Ejemplo: grafica de residuales
Matriz de contigüidad
• Matriz de contigüidad– Definamos con un 1 los rezagos si los vecinos están
a una distancia h de 3km o menos, o sino 0
ID 1 2 3 4 5 6
1 0 11.72 12.38 11.26 9.37 12.23
2 11.72 0.00 1.33 6.99 13.24 1.12
3 12.38 1.33 0 6.18 12.93 0.22
4 11.26 6.99 6.18 0 7.53 6.27
5 9.37 13.24 12.93 7.53 0 12.94
6 12.23 1.12 0.22 6.27 12.94 0
13
Matriz de contigüidad
• Definamos con un 1 los rezagos si los vecinos están a una distancia h de 7km o menos, o sino 0
ID 1 2 3 4 5 6
1 0 11.72 12.38 11.26 9.37 12.23
2 11.72 0.00 1.33 6.99 13.24 1.12
3 12.38 1.33 0 6.18 12.93 0.22
4 11.26 6.99 6.18 0 7.53 6.27
5 9.37 13.24 12.93 7.53 0 12.94
6 12.23 1.12 0.22 6.27 12.94 0
Matriz de contigüidad
• Hay otras maneras de definir contigüidad– 1/Distancia
ID 1 2 3 4 5 6
1 0 11.72 12.38 11.26 9.37 12.23
2 11.72 0.00 1.33 6.99 13.24 1.12
3 12.38 1.33 0 6.18 12.93 0.22
4 11.26 6.99 6.18 0 7.53 6.27
5 9.37 13.24 12.93 7.53 0 12.94
6 12.23 1.12 0.22 6.27 12.94 0
14
Matriz de contigüidad
• Hay otras maneras de definir contigüidad– 1/Distancia2
ID 1 2 3 4 5 6
1 0 11.72 12.38 11.26 9.37 12.23
2 11.72 0.00 1.33 6.99 13.24 1.12
3 12.38 1.33 0 6.18 12.93 0.22
4 11.26 6.99 6.18 0 7.53 6.27
5 9.37 13.24 12.93 7.53 0 12.94
6 12.23 1.12 0.22 6.27 12.94 0
Matriz de contigüidad
• Hay otras maneras de definir contigüidad– K-vecinos mas cercanos
ID 1 2 3 4 5 6
1 0 11.72 12.38 11.26 9.37 12.23
2 11.72 0.00 1.33 6.99 13.24 1.12
3 12.38 1.33 0 6.18 12.93 0.22
4 11.26 6.99 6.18 0 7.53 6.27
5 9.37 13.24 12.93 7.53 0 12.94
6 12.23 1.12 0.22 6.27 12.94 0
15
Grafica de residuales
• Objetivo: crear rezago de residuales, con la matriz de contigüidad estandarizada y los residuales– Multiplicar cada residual i por la fila i de la matriz de
contigüidad estandarizada
Matriz de contiguidad, banda de 7km
Normal estandar de los residuales
Matriz de contiguidad estandarizada, banda de 7km
Grafica de residuales
• Para observación 1: 1.2187*0 + -0.355*0 + 1.0236*0 + 0.3859*0 + -0.239*0 + -.9585*0 = 0
Normal estandar de los residuales
Matriz de contiguidad estandarizada, banda de 7km
16
Grafica de residuales
• Observación 2: 1.2187*0 + -0.355*0 + 1.0236*0.33 + 0.3859*0.33 + -0.239*0 + -.9585*0.33 = 0.789
Normal estandar de los residuales
Matriz de contiguidad estandarizada, banda de 7km
Grafica de residuales
• Observación 3: 1.2187*0 + -0.355*0.33 + 1.0236*0 + 0.3859*0.33 + -0.239*0 + -.9585*0.33 = 0.33
Normal estandar de los residuales
Matriz de contiguidad estandarizada, banda de 7km
18
Ejemplo: grafica de residuales
Repetir mismo ejercicio pero con un rezago de banda de 5km
Matriz de contiguidad estandarizada, banda de 5km
19
Resumen de temas
• Introducción a la autocorrelación espacial• Diagnóstico
– Visual (variograma, rezagos residuales)– Estadístico (I de Moran, C de Geary,
Multiplicadores de Lagrange)
• Opciones para incorporar autocorrelación espacial– Modelo de error espacial– Modelo de rezago espacial
Tests estadísticos para diagnosticar autocorrelación
espacial• I de Moran para los residuales
– Valores entre 1 y -1
– 1 significa autocorrelación positiva• Valores cercanos similares
– -1 significa autocorrelación negativa• Valores lejanos similares
– 0 significa que no hay autocorrelación
20
Tests estadísticos para diagnosticar autocorrelación
espacial• I de Moran para los residuales
– Tests global de autocorrelación
– Calculado con software (stata, SAS, GeoDa, Matlab)
– Significancia estadística determinada en relación a una distribución aleatoria hipotética
• Qué tan desviada está nuestra muestra en comparación a una que no tiene autocorrelación espacial?
Fotheringham, A. S., C. Brunsdon, and M. Charlton. 2000. Quantitative Geography: Perspectives on Spatial Data Analysis. London, UK: Sage.
Tests estadísticos para diagnosticar autocorrelación
espacial• C de Geary para los residuales
– Valores entre 0 y 2
– 1 significa que no hay autocorrelación espacial
– Mayor que 1 indica autocorrelación positiva
– Menor que 1 indica autocorrelación negativa
Geary, R. 1954. The contiguity ratio and statistical mapping. The Incorporated Statistician 5: 115–145.
21
Tests estadísticos para diagnosticar autocorrelación
espacial• Tests de multiplicadores de Lagrange
– Robustos y no robustos
– Sugiero utilización de los tests robustos• En Stata, GeoDA, R
• Determinan qué tipo de ecuación espacial se debe utilizar
Anselin, L., A. K. Bera, R. Florax, and M. J. Yoon. 1996. Simple diagnostic tests for spatial dependence. Regional Science and Urban Economics 26: 77–104
Resumen de temas
• Introducción a la autocorrelación espacial• Diagnóstico
– Visual (variograma, rezagos residuales)– Estadístico (I de Moran, C de Geary,
Multiplicadores de Lagrange)
• Opciones para incorporar autocorrelación espacial– Modelo de error espacial– Modelo de rezago espacial
22
Pasos a seguirEstimar modelo
mínimos cuadrados
Diagnosticar multicolinealidad, heteroskedasticidad y dependencia espacial
Si es necesario, usar econometria espacial
Pasos para diagnosticar y remediar autocorrelación
espacial
Fuente: GeoDA Workbook
23
Ejemplo• Información de ciudad de Columbus,
Ohio– Seguridad f(ingresos y valor de propiedad)
• Seguridad (hurtos vehiculares y robos a viviendas por 1000 residentes)
Diagnóstico de residuales
• Pedazo de matriz de contigüidad, estandarizada
25
Si hay autocorrelación, qué hacer?
• Dos posibilidades– Modelo de error espacial
– Modelo de rezago espacial
Modelo de error espacial
• W es una matriz espacial de pesos (o de contigüidad, estandarizada)
• Error f(error vecinos)
• Implica que el error estándar estimado es mas bajo de lo que realmente es– Sesgo a mostrar significancia, cuando no la
hay
26
Modelo de rezago espacial
• W es una matriz espacial de pesos (o de contigüidad, estandarizada)
• Implicaciones– Posible sesgo en coeficientes estimados (en
cualquier dirección –no se sabe a priori)
– El error estándar estimado puede ser mas bajo de lo que realmente es (sesgo a mostrar significancia, cuando no la hay)
De nuevo el ejemplo de la seguridad en Columbus
• Diagnóstico de autocorrelación
28
Ejemplo --Bogotá
• Examinar efecto de expansiones del BRT en propiedades que ya tenían acceso al BRT• Efecto de red, o indirecto
• Economía urbana sugiere que las mejoras en accesibilidad se capitalizan en el valor del suelo
Efectos de red
29
Bogotá Troncal, Fase 1 (12/99)
Transmilenio: Avenida Caracas
Fuente: TransMilenio S.A.
Bogotá Troncal, Fase 2 –Av. Americas (02/03)
Transmilenio: Avenida de Las Americas
Fuente: TransMilenio S.A.
30
• Incluir propiedades residenciales a 1 km del troncal
• 2,976 propiedades residenciales en venta entre 2000 & 2006
• Variable dependiente, precio al que se ofrece
Datos
Variables independientes de interés
Con servicio de troncal a 1km?
Seis variables dummy:
= 1 si predio tenía troncal antes de 2003 y fue anunciado en el año 200X
= 0 si no
Atributos Estructurales
Atributos deVecindarios
Año de venta (variables dummy, 01-06)
Controles
31
• Incluir propiedades residenciales a 1 km del troncal
• 2,976 propiedades residenciales en venta entre 2000 & 2006
• Variable dependiente, precio al que se ofrece
Datos
Resultados
OJO: Hacer doble click en tabla para mirarla en WORD