estimación de un modelo econométrico de respuesta lineal para el indice de necesidades básicas...
DESCRIPTION
El índice de necesidades básicas insatisfechas permite caracterizar y cuantificar la pobreza estableciendo ésta como una función de las carencias en necesidades específicas de una población. En tal sentido, el presente artículo pretende estimar un modelo econométrico con respuesta de tipo lineal obtenido a partir del método de mínimos cuadrados ordinarios que permita explicar el comportamiento que siguen las necesidades básicas insatisfechas en el departamento de Cundinamarca para el año 2005. Se identificaron los factores determinantes del NBI y finalmente se obtuvo una ecuación lineal significativa que representa en muy buena aproximación los valores estimados en la realidad para dicho índice. Los resultados obtenidos muestran que el modelo presenta problemas de especificación asociado a la falta de variables relevantes, no obstante, sus coeficientes son consistentes, insesgados y eficientes.TRANSCRIPT
1 Artículo de Investigación
ESTIMACIÓN DE UN MODELO ECONOMÉTRICO DE RESPUESTA
LINEAL PARA EL INDICE DE NECESIDADES BÁSICAS
INSATISFECHAS. CASO DE ESTUDIO: DEPARTAMENTO DE
CUNDINAMARCA
Estimation of an Econometric Model of Linear Response for the Index of
Unsatisfied Basic Needs. Case Study: Department of Cundinamarca
German Giovanny Vargas Velasquez1
Ingeniero Catastral y Geodesta
1 Universidad Distrital Francisco José de Caldas. [email protected] †
RESUMEN
El índice de necesidades básicas insatisfechas permite caracterizar y cuantificar la pobreza
estableciendo ésta como una función de las carencias en necesidades específicas de una población.
En tal sentido, el presente artículo pretende estimar un modelo econométrico con respuesta de tipo
lineal obtenido a partir del método de mínimos cuadrados ordinarios que permita explicar el
comportamiento que siguen las necesidades básicas insatisfechas en el departamento de
Cundinamarca para el año 2005. Se identificaron los factores determinantes del NBI y finalmente se
obtuvo una ecuación lineal significativa que representa en muy buena aproximación los valores
estimados en la realidad para dicho índice. Los resultados obtenidos muestran que el modelo
presenta problemas de especificación asociado a la falta de variables relevantes, no obstante, sus
coeficientes son consistentes, insesgados y eficientes.
Palabras clave: pobreza, NBI, modelo econométrico, regresión lineal, mínimos cuadrados
ordinarios, Cundinamarca.
ABSTRACT
The index of unsatisfied basic allows to characterize and quantify poverty, establishing it as a
function of lacks in specific needs of a population. In that sense, this paper aims to estimate an
econometric model with linear response obtained from ordinary least squares method that allows to
explain the behavior present in the unsatisfied basic needs in the department of Cundinamarca for
2005. We identified NBI determining factors and finally a significant linear equation representing in
very good approximation, the estimate values obtained for that index. The results show that the
model has good specification and their coefficients are consistent, unbiased and efficient.
Keywords: Poverty, NBI, econometric model, linear regression, OLS, Cundinamarca.
1. INTRODUCCIÓN
La caracterización de la pobreza es una
necesidad apremiante en política social y
económica. En términos generales, la pobreza
se refiere a la incapacidad de las personas de
vivir una vida tolerable (PNUD, 2010), es
decir, y tal como lo sintetiza la CEPAL
(2001), corresponde a la situación de aquellos
hogares que no logran reunir, en forma
relativamente estable, los recursos necesarios
para satisfacer las necesidades básicas de sus
miembros, necesidades que de ser satisfechas,
por supuesto, se traduce en una mejor calidad
de vida.
Universidad Distrital Francisco José de Caladas. Junio 2015
2 Artículo de Investigación
Si bien es cierto, la pobreza es un fenómeno
inherente a la existencia del hombre, a sus
formas de apropiación de recursos, a las
relaciones de poder que establece y
evidentemente a las desigualdades que este
proceso genera; definir los elementos que
cuantifiquen dicha calidad de vida no es un
tema fácil, dada la natural dificultad de medir
algunos de sus elementos constituyentes, esto
es, al tratarse de un tema de tipo
socioeconómico intervienen variables
cuantitativas y cualitativas en el análisis.
Dicho lo anterior, en la actualidad, se han
utilizado algunas metodologías para medir la
pobreza, mediciones que pueden estar
fundamentadas en una serie de definiciones
propuestas por Paul Spicker (1999):
necesidad1, estándar de vida e insuficiencia
de recursos2, entre otros.
En consecuencia, existen dos mecanismos
para determinar la pobreza en los hogares.
“Una primera posibilidad es evaluar
directamente si los hogares han logrado
satisfacer sus necesidades básicas,
encuestándolos sobre los bienes y servicios
que disponen. La segunda alternativa
consiste en medir los recursos del hogar,
usualmente sus ingresos o sus gastos, y
estimar si estos son suficientes para que el
hogar pueda gozar de un nivel de vida
aceptable, de acuerdo con los estándares
sociales prevalecientes” (Feres & Mancero,
2001b). De acuerdo con Amartya Sen (1984),
la medición de la pobreza se puede dividir en
dos grandes etapas. En la primera,
denominada de “identificación” se define
cuales hogares son pobres y cuales no a partir
de algún criterio previamente elegido. La
segunda etapa, denominada “agregación”,
implica calcular índices de pobreza que
permitan sintetizar en un solo indicador la
1 la interpretación de necesidad se refiere a la carencia de
bienes y servicios materiales requeridos para vivir en óptimas
condiciones, no obstante la pobreza también puede ser
interpretada como insuficiencia de recursos, es decir, la carencia de riqueza para adquirir lo que una persona necesita. 2 Para estas opciones, los indicadores de bienestar más
aceptados han sido la satisfacción de ciertas necesidades, el consumo de bienes o el ingreso disponible. (CEPAL, 2001)
magnitud y profundidad de las privaciones de
una población (Sen, 1985). De modo que, el
método de agregación más conocido y
utilizado para dichas estimaciones es el de las
Necesidades Básicas Insatisfechas (NBI)3,
basado esencialmente en una concepción de
la pobreza como necesidad. (Feres &
Mancero, 2001b). “Bajo este método, se elige
una serie de indicadores censales que
permiten constatar si los hogares satisfacen o
no algunas de las necesidades. Algunos de
los factores tenidos en cuenta son: vivienda
inadecuada, servicios inadecuados, alta
dependencia económica, inasistencia escolar,
hacinamiento crítico y finalmente la
capacidad económica o ingresos por
persona” (Feres & Mancero, 2001a).
En ese orden de ideas, caracterizar la pobreza
recurriendo al índice de necesidades básicas
insatisfechas (NBI) sugiere la idea que, ante
la posibilidad de obtener datos de muestras
censales, es absolutamente necesario definir
un procedimiento que permita cuantificar las
relaciones que existen entre una serie de
variables que pueden explicar el fenómeno
objeto de estudio y conocer su estructura
económica. De modo tal que cabe señalar la
importancia de involucrar modelos
econométricos en este tipo de análisis,
modelos que se sustentan en la cuantificación
de dichas relaciones y sirve para conocer
cómo inciden en la variable NBI las
variaciones de las variables consideradas
como explicativas para éste. Por otro lado,
estimando la expresión matemática que las
relaciona, es posible predecir los valores que
tomará a futuro la variable objeto de estudio.
El área de estudio corresponde al
departamento de Cundinamarca, ubicado en
el centro geográfico de la República de
Colombia que ocupa una superficie de 24.210
kilómetros cuadrados, con una población
incluyendo la capital del país (Bogotá D.C.)
de 10.558.824. Cundinamarca está dividida
en 15 provincias creadas para facilitar la
3 Es un índice diseñado para aprovechar la información
obtenida a partir de los censos demográficos, por permitir su fácil inclusión e interpretación de los resultados.
Vargas et al. – Estimación de un Modelo Econométrico de Respuesta Lineal para el Índice de Necesidades Básicas Insatisfechas. Caso de estudio: Departamento de Cundinamarca.
3 Artículo de Investigación
administración del departamento, compuestas
a su vez de 116 municipios. Limita por el
norte con el departamento de Boyacá, por el
sur con los departamentos de Meta, Huila y
Tolima y por el occidente con el río
Magdalena, por el oriente limita con el
departamento de Casanare4. El estudio de
NBI permitió utilizar variables de tipo social
y económico con el propósito de identificar
las condiciones de vida de los habitantes de
los municipios que conforman el
departamento para el año 2005, a través de un
modelo de regresión lineal.
1.1. Estado del Arte
Los estudios realizados en la actualidad sobre
las necesidades básicas insatisfechas en
Colombia, se han llevado a cabo por medio
de la información obtenida en el censo
demográfico realizado en el año 2005 por el
departamento nacional de estadística DANE,
esto ha permitido estimar modelos que
determinan las condiciones y calidad de vida
de la población con base a la información per
cápita pública municipal. A pesar de que los
modelos de estimación con los datos del
censo general del año 2005 han sido
satisfactorios para determinar las necesidades
básicas insatisfechas, el DANE no ha puesto
en marcha otro censo general con el que se
pueda comparar la información existente con
la actual. Por tal motivo, el modelo que se
empleará a continuación busca estimar otros
factores condicionantes que permitan
determinar las NBI de la población que no
necesariamente son las mismas empleadas
por el censo de población del periodo 2005.
Cabe mencionar, que el 29 de Junio de 2011,
el DANE llevó a cabo la actualización de la
base de datos que definen las NBI para los
departamentos que conforman la región
Andina, sin embargo, en la presente
actualización, se anexan municipios que
fueron creados posterior al censo del año
4 Datos recuperados de la página web de la Gobernación de
Cundinamarca.
http://www.cundinamarca.gov.co/wps/portal/Home/Cundinamarca.gc
2005 los cuales generan cambio en la
distribución departamental.
La regresión del modelo para variables
aleatorias que presentaron Ferrari y
Cribarineto asumen que el intervalo de 0 a 1
estas son continuas. En ese modelo los
parámetros de regresión son interpretables en
términos de la variable explicada. Ellos en su
informe propusieron que la ventaja de utilizar
una distribución tipo beta presenta la
flexibilidad que permite que al realizar la
dispersión variable del modelo de regresión,
estos tomen diferentes valores dependiendo
de la combinación de valor de los parámetros,
en lo cual incluye la forma derecha e
izquierda sesgada o la palma de densidad
uniforme.
2. MARCO REFERENCIAL
2.1. Índice de Necesidades Básicas
Insatisfechas (NBI)
“Este método ha sido utilizado por la CEPAL
para realizar sus mediciones de pobreza,
para ello establece que ésta es una función
directa de las carencias en necesidades
específicas” (Adame, Lara, & Miguel, 2005).
El objetivo del método NBI es proveer un
método directo de identificación de los
pobres. Desde sus inicios, el método NBI ha
sido utilizado con distintos propósitos, no
necesariamente compatibles entre sí. Por un
lado es posible plantearlo como un
instrumento para caracterizar la pobreza5 de
manera complementaria a los métodos
indirectos de medición. Por otra parte, el
método puede ser considerado como un
sustituto del método de líneas de pobreza,
caso en el que se justifica la utilización de
indicadores, altamente correlacionados con el
ingreso aunque no fueren representativos del
mismo (Feres & Mancero, 2001b).
“La medición de la pobreza a través de este
método requiere, primeramente, de la
elección de características de los hogares
5 Aportando información sobre el desarrollo de las capacidades
humanas no reflejadas en el ingreso.
Universidad Distrital Francisco José de Caladas. Junio 2015
4 Artículo de Investigación
que además de representar alguna dimensión
importante de la privación, también se
encuentren lo suficientemente asociadas con
las situaciones de pobreza como para
representar a las demás carencias que
configuran tales situaciones.”(INDEC, 1984)
“Si bien es la situación propia de un país la
que determina qué tan apropiado es un
indicador, existen ciertas carencias que se
han constituido en el común denominador de
las aplicaciones de este método, ellas son:
hacinamiento, vivienda inadecuada,
abastecimiento inadecuado de agua, carencia
de servicios sanitarios e inasistencia a
escolar y un indicador de la capacidad
económica” (Feres & Mancero, 2001b). Así,
con el objetivo de captar la disponibilidad y
el acceso a los servicios básicos a partir de
estas cinco condiciones mediante las cuales
se clasifica la población como pobre por NBI
de modo que si un hogar presenta al menos
una de las condiciones definidas se considera
como pobre o en miseria si presenta al menos
dos de esas condiciones.
De acuerdo con la CEPAL, el proceso de
selección está constituido, de manera general,
por cuatro pasos:
a) Determinar el grupo de necesidades
básicas mínimas susceptibles de
estudiarse con la información del
censo.
b) Elegir indicadores censales que
representen dichas necesidades.
c) Definir el nivel crítico de satisfacción
para cada necesidad.
d) Asegurar que los indicadores
seleccionados correspondan a
situaciones de pobreza.
No obstante, el método NBI también presenta
algunas deficiencias importantes. En primer
lugar, el nivel de pobreza es sensible al
número de necesidades insatisfechas que se
requiere para ser considerado pobre, y esta
elección generalmente es arbitraria. En
segundo lugar, el número de personas pobres
siempre aumenta ante la adición de nuevos
indicadores; en una situación extrema, el uso
de un número suficientemente grande de
indicadores podría originar que casi toda la
población sea clasificada como pobre. Un
tercer problema, en tanto, consiste en la
elección de ponderadores para cada
indicador, al momento de agregar las distintas
necesidades entre sí (Feres & Mancero,
2001b).
Con base en lo anterior, el índice ha sido
objeto de críticas, la principal se relaciona
con la arbitrariedad en la selección de las
cinco necesidades básicas expuestas
anteriormente, que abre la posibilidad a que
puedan ser reemplazadas por otras con base
en distintos juicios de valor. Además este
índice solo identifica a los hogares por el
número de insatisfacciones, lo cual impide
una valoración de la magnitud de la pobreza.
No permite medir ni el incremento necesario
en el ingreso para superar la pobreza (la
brecha de ingresos), ni las diferencias entre
los niveles de pobreza de los individuos (la
distribución de los ingresos). Esto se debe, a
que no existe una forma única y establecida
de relacionar el número de necesidades
básicas insatisfechas con la condición de
pobreza, lo que implica que la clasificación
final en pobres y no pobres es arbitraria y es
tomada por el investigador (Delgado &
Salcedo, 2010).
2.2. Modelo Econométrico
La econometría es la herramienta que por
medio de las matemáticas y la estadística,
busca definir y cuantificar las relaciones entre
las diferentes variables que se incluyen en un
modelo econométrico y los datos observados
en la vida real. Así las cosas, la econometría
puede definirse como “el análisis cuantitativo
de fenómenos económicos reales, basados en
el desarrollo simultáneo de la teoría y la
observación, relacionados mediante métodos
apropiados de inferencia”. (Guajarati, 2003).
La econometría es importante al reunir una
serie de herramientas que permiten
comprobar la validez de un modelo
Vargas et al. – Estimación de un Modelo Econométrico de Respuesta Lineal para el Índice de Necesidades Básicas Insatisfechas. Caso de estudio: Departamento de Cundinamarca.
5 Artículo de Investigación
económico. En tal sentido, un modelo
económico es una representación matemática
simplificada de la realidad, es decir, pese a
que es una abstracción de la realidad solo
involucra aquellos detalles más relevantes
para el análisis. Dicho lo anterior, cuando se
desea especificar un modelo econométrico se
acude a la definición de una expresión
matemática que involucre una serie de
variables exógenas o independientes que
explique una variable endógena o
dependiente, de modo que sea obtenida a
través de un análisis estadístico de regresión
lineal.
“La idea fundamental del análisis de
regresión es la dependencia estadística de
una variable dependiente respecto de otra o
más variables explicativas, en tal sentido, el
objetivo del análisis de regresión es estimar o
predecir la media o valor promedio de la
variable dependiente con base en los valores
conocidos o fijos de las explicativas”.
(Guajarati, 2003).
Para estimar la función de regresión se tienen
fundamentalmente dos métodos: el método de
mínimos cuadrados ordinarios (MCO) y el
método de máxima verosimilitud. El primero,
al que se hará hincapié en este artículo, ofrece
en términos matemáticos mayor sencillez en
su manipulación e interpretación, además de
sus propiedades estadísticas.
Mediante la técnica MCO se obtienen una
serie de parámetros que permiten cuantificar
las relaciones existentes entre las variables
explicativas y la variable endógena, así como
el término de perturbación estocástica que
representa los errores de especificación; es un
método frecuentemente utilizado para
encontrar los parámetros que acompañan a las
variables en la regresión. El método
básicamente plantea utilizar, como estimación
de duchos parámetros aquella combinación de
betas que minimice los errores que el modelo
cometerá(Guajarati, 2003).
No obstante para que los estimadores de
mínimos cuadrados ordinarios arrojen los
mejores parámetros (en términos de
linealidad, insesgamiento y varianza mínima),
existe un teorema (Gauss-Markov) que
establece que si son cumplidos los supuestos
del modelo clásico de regresión lineal, el
econometrista obtiene los estimadores MELI
(mejores estimadores lineales, insesgados y
eficientes). Dichos supuestos corresponden a:
a) El modelo está bien especificado, es
decir no le faltan variables relevantes
y posee una forma funcional
adecuada.
b) Los parámetros son constantes en el
tiempo, es decir no hay cambio
estructural.
c) No existe multicolinealidad entre las
variables explicativas del modelo.
d) El modelo es lineal en los parámetros.
e) El modelo no posee endogeneidad.
f) No existe correlación entre las
variables explicativas y los errores.
g) No hay autocorrelación en los
errores.
h) No existe heterocedasticidad entre los
errores.
i) Existe normalidad en los errores.
j) El valor esperado de los errores es
igual a cero.
Así, un modelo econométrico con respuesta
lineal viene dado de la forma:
En donde el parámetro β1 que corresponde al
término constante debe ser interpretado como
el valor que toma la variable endógena
cuando el resto de variables explicativas x
valen cero. El resto de parámetros βs que
acompañan a las variables explicativas miden
la relación entre éstas y la variable endógena
a través de su signo y su cuantía,
representando la razón de cambio de una
respecto de la otra. Por otro lado la variable
aleatoria μ representa los errores del modelo.
3. METODOLOGÍA Y DATOS
Universidad Distrital Francisco José de Caladas. Junio 2015
6 Artículo de Investigación
La metodología utilizada en este artículo se
sustenta en la metodología tradicional o
clásica de la econometría, sujeta a los
lineamientos que se presentan en el siguiente
esquema:
Diagrama 1. Flujo de procesos desarrollados
en este artículo. Fuente: elaborado por los
autores.
Con base en lo anterior, la metodología de
este estudio se divide en 4 etapas: una fase de
especificación, una de estimación, una de
verificación y finalmente una fase de
predicción, por supuesto, a estos niveles
subyacen una serie de subprocesos que serán
explicados brevemente y que permitirán dar
cumplimiento al objetivo de este artículo en
cuestión: obtenejer estimadores lineales,
insesgados y eficientes en términos de su
varianza para el indice de necesidades bàsicas
insatisfechas de Cundinamarca para el 2005.
1. Habiendo definido el fenómeno
económico a estudiar, su espacialidad
y temproralidad, en la fase de
especificación se realizó el anàlisis de
la información obtenida en la base de
datos, llevada a cabo por medio de la
clasificación de las variables
independientes o explicativas y la
dependiente, de esta manera fue
posible establecer los tipos de datos
de cada variable, su naturaleza
matemática, la escala de medida y los
niveles, indicados en la Tabla 1. A
partir de estas definiciones se efectuó
un análisis descrptivo de la variable
endógena.
2. La base de datos formada para la
estimación del modelo NBI del
departamento de Cundinamarca fue
establecida por una muestra de 116
datos6 que proporcionan información
a nivel municipal, las cuales
presentan las condiciones de vida por
kilómetro cuadrado de la población.
La varible dependiente o regresada
corresponde al NBI, mientras que el
conjunto de variables subyacente a
ésta forman el grupo de las
indipendientes con las que se
explicará el comportamiento de este
índice. Esta base de datos se
construyó a partir de consultas a
portales web institucionales (DANE,
IGAC) de tal manera que la
información que se utilizara fuera
consistente con la realidad.
3. Una vez obtenidos los datos, éstos
fueron organizados y estructurados
en un documento Excel7. Acto
seguido, los datos fueron importados
al software econométrico Stata para
su posterior análisis.
6 Correspondientes a los 116 municipios que conforman el
departamento. 7 Muchos de los datos consultados al tener componente
geográfica venían en formato shapefile por lo que mediante la
utilización de la herramienta ArcGIS se pudo extraer la
información alfanumérica contenida en cada polígono del municipio.
Vargas et al. – Estimación de un Modelo Econométrico de Respuesta Lineal para el Índice de Necesidades Básicas Insatisfechas. Caso de estudio: Departamento de Cundinamarca.
7 Artículo de Investigación
Tabla 1. Descripción de los datos. Fuente:
Elaborado por los autores.
4. En la fase estimación se realizó el
cálculo de los parámetros del modelo
mediante un analisis estadístico de
regresión lineal a partir de la técnica
de mínimos cuadrados ordinarios
(MCO). Obtenidos los valores de los
coeficientes para cada variable
explicativa, se procedió a seleccionar
aquellas variables cuyos betas fueran
significativos con una probabilidad
del 10% mediante la utilización de la
regresión Stepwise.8
5. Posteriormente, se aplicó la prueba
MWD9 para seleccionar la mejor
forma funcional (lineal o logarítmica)
del modelo.
6. En la fase de verificación, constituida
por la interpretación de estadisticos
8 La prueba Stepwise es un procedimiento que permite
encontrar una ecuación significativa a partir de un conjunto de
variables. Son seleccionadas aquellas variables cuyos
coeficientes posean un p valor inferior a la significancia establecida por el usuario. 9 En la prueba MWD se definen dos hipótesis: una hipótesis
para el modelo lineal y otra para el logarítmico y comparando mediante su significancia se opta por elegir uno de los dos.
de prueba, y la verificación de los
supuestos del modelo clásico, se
buscó cotrastar las hipotesis nula y
alternativa de tal manera que
permitiera verificar aplicando una
serie de pruebas: la normalidad de los
errores (test de Shapiro-Wilk), el no
cambio estructural en los parámetros
(test de Chow), la no
heterocedasticidad de los errores (test
de White), la no multicolinealidad de
las variables (factor de inflación de
varianca FIV), la no autocorrelación
de los errores (test de Durbin Watson
y test de Breusch Godfrey) y la buena
especificación del modelo (Test de
Ramsey).
7. Finalmente, habiendo verificado los
supuestos del modelo y obenido los
estimadores MELI (lineales
insesgaods y con varianza mínima)
para el modelo teórico, se acude a la
fase de predicción para el calculo del
valor de la predicción individual y la
estimación por intervalo para la
variable dependiente NBI.
3.1. Estadistica Descriptiva
3.1.1. Variable Exógena
Variable SiglaTipo de
Variable
Naturaleza
matemática
Escala de
Medida
Niveles/Rango de
valoresDescripción
Necesidades Básicas
InsatisfechasNBI Cuantitativa Continua Razón Reales [0-1]
Indicador que determina el porcentaje de carenciasde una ppoblación
determinantes de la calidad de vida y sus niveles de pobreza.
Tasa de Afiliación
Regimen Contributivo
TCONTVO Cuantitativa Continua Razón Reales [0-1]Indicador que determina el porcentaje de personas afiliadas al sistema de salud, las
cuales se encuentran vinculadas laboralmente.
Tasa de Afiliación
Regimen SubsidiadoTSUBSID Cuantitativa Continua Razón Reales [0-1]
Indicador que determina el porcentaje de personas sin capacidad de pago afiliadas
al sistema de salud por parte del estado.
Ingreso Público Per CápitaIPP Cuantitativa Continua Intervalo IPP: [120.78-2722.16] Total de recursos anuales en la entidad territorial sobre la población total de ella.
Cobertura en Educación COBEDU Cuantitativa Continua Razón Reales [0-1]Número de estudiantes por nivel sobre la población según el rango de edad
correspondiente X100.
Densidad de Población DP Cuantitativa Continua Intervalo DP: [0.437-4.136] Número de habitantes sobre el área municipal por kilómetro cuadrado.
Deficit Vivienda Total DEFCVT Cuantitativa Continua Razón Reales [0-1]Número de hogares que presentan carencias habitacionales sobre el total de
hogares del municipio X100.
Magnitud de la Inversión
MunicipalMIM Cuantitativa Continua Razón Reales [0-1]
Porcentaje del total de recursos anuales destinados al municipio por kilómetro
cuadrado.
Generación de Recursos
Propios (Esfuerzo Fiscal)GRP Cuantitativa Continua Razón Reales [0-1] Recursos destinados a financiar el activo fijo presentado por el municipio.
Desempeño Integral
MunicipalDIM Cuantitativa Continua Razón Reales [0-1]
Indice con escala de 0 a 100 del desempeño de los municipios en un año
determinado, integrando la evaluación de los factores de eficacia, eficiencia,
cumplimiento de requisitos legales, gestión y entorno.
Área Agrícola Sembrada
TotalASST Cuantitativa Continua Intervalo ASST: [1.46-86224.12] Número de hectareas sembradas por municipio
Capacidad de Ahorro CAPAHO Cualitativa
1 [Muy Baja], 2
[Baja], 3 [Media],
4[Alta]
Relación entre el ahorro corriente y el ingreso corriente X100 por kilómetro
cuadrado.
Descripción de Variables
Universidad Distrital Francisco José de Caladas. Junio 2015
8 Artículo de Investigación
Tabla 2. Estadísticas Variable Explicada
Fuente: Datos propios.
Figura 1. Histograma de la variable NBI. Fuente: Datos propios.
De la tabla anterior, el valor esperado o valor
promedio del NBI para el departamento de
Cundinamarca corresponde al 30.22, el valor
de la desviación estándar que muestra el
grado de dspersión de los datos de la muestra
con respecto a su valor prmedio corresponde
a 12.26. El rango de valores posibles abarca
desde el valor mínimo 7.11 hasta el máximo
valor de 68.49, sugiriendo que valores bajos
del NBI corresponden a aquellos municpios
que no presentan carencia en sus necesidades
bàsicas. Nótese en la Figura 1 que el
histograma tiende a ser asimétrico a la
derecha con una fuerte concentración de
valores en el intervalo [20-30].
3.1.2. Variable Exógenas
Tabla 2. Matriz de Correlación de Variables
Exógenas
Fuente: datos propios.
Figura 2. Diagrama de dispersión variables
exógenas. Fuente: Datos propios.
La matriz anterior explica cómo se
encuentran relacionadas cada una de las
variables entre sí, al interior del modelo. Las
variables cuyos valores están cercanos a cero,
por ejemplo, el coeficiente de correlación
entre defcvt respecto de ipp es de 0.0732
indicando que la correlación es muy baja,
esto es, ambas variables son linealmente
independientes (una no influye en la otra). No
obstante, el signo que acompaña el
coeficiente es positivo sugiriendo que la
proyección de la regresión lineal va a tender a
crecer conjuntamente una variable respecto
de la otra (variables directamente
proporcional). Por otra parte, las variables
con más alta correlación corresponden a icv
respecto del nbi con un coeficiente de
correlación de -0.8846, si bien la dependencia
es bastante alta el signo que la acompaña
señala que dicha relación es inversamente
proporcional.
Figura 3. Diagrama de Cajas para las
variables del modelo. Fuente: Datos propios.
Vargas et al. – Estimación de un Modelo Econométrico de Respuesta Lineal para el Índice de Necesidades Básicas Insatisfechas. Caso de estudio: Departamento de Cundinamarca.
9 Artículo de Investigación
Como se puede visualizar en la Figura 3, se
representan la distribución de cada una de las
variables en términos de su mediana,
percentiles, valores extremos y su dispersión.
Además permite comparar entre sì cada una
de las variables explicativas.
Finalmente, para este análisis descriptivo se
hace uso de la prueba de normalidad de
Shapiro Wilk10
para conocer si el
comportamiento del conjunto de variables
independientes es de tipo normal. Dado que
los p valores que acompañan a cada una de
las variables son inferiores a una significancia
del 5%, no hay suficiente evidencia
estadística para aceptar la hipótesis nula, por
tanto se rechaza la misma y se concluye que
los datos no siguen una distribución normal.
4. RESULTADOS
El modelo inicial presentado, que involucra
todas las variables consideradas en la
metodología es el siguiente:
Las dummys corresponden a la capacidad de
ahorro baja, media y alta indicadas en la
descripción de variables.
10
Esta prueba permitió contrastar la normalidad de los datos
de la muestra, planteándose como hipótesis nula que la muestra proviene de una población normalmente distribuida.
Tabla 3. Modelo Inicial del NBI.
Fuente: Datos propios.
No obstante, como puede observarse en la
salida anterior, no todos los coeficientes son
estadísticamente significativos, pues los p
valores no son inferiores al 10%. De modo
que al aplicar la regresión paso a paso
Stepwise con una probabilidad del 10% se
obtuvieron 5 variables significativas: dp con
un p valor de 0.107, defcvt con un p valor de
0.008, ipp con un p valor de 0.078, icv con un
p valor de 0.000, y aast con un p valor de
0.067.
La forma funcional más adecuada del
modelo, habiendo realizado la prueba
MWD11
, arrojó que debía ser de tipo lineal
dada la significancia de la variable Z2, pues
al calcular dicha variable, que resulta de la
resta de el modelo lineal y el antilog del
modelo logarítmico, y estimando nuevamente
el modelo incluyéndola como explicativa, el
coeficiente que la acompaña posee un p valor
inferior a la significancia del 5%, por lo que
no es rechazada la hipótesis nula. En tal
sentido se presenta el modelo definitivo para
el NBI:
Tabla 4. Modelo Definitivo para el NBI
11
En la prueba MWD se establece como hipótesis nula que el
modelo sea de tipo lineal y como hipótesis alterna que sea de tipo logarítmico.
Universidad Distrital Francisco José de Caladas. Junio 2015
10 Artículo de Investigación
Pese a que la naturaleza de los datos extán
expresados como indicadores, los coeficientes
que acompañan a cada una de las variables
explicativas representan el cambio marginal,
es decir, que si una de las variables aumenta
en una unidad y las demás toman valores de
cero, el NBI en promedio cambia en el valor
de beta unidades de dicha variable para los
municipios considerados en la muestra. De
otro modo, el término constante indica el
valor autónomo del NBI cuando todas las
variables adoptan valores de cero, o dicho de
otro modo corresponde al intercepto de la
recta de regresión.
Analizando el R2 y R2 ajustado, se tiene que
es de 0.81, por lo que la bondad del ajuste,
que intenta resumir qué tanto las variables
exógenas explican el comportamiento del
NBI, es del 81%.
Para σ^2, que respresenta la varianza mínima
de los errores del modelo, obtenida de la
relación entre la sumatoria residual de
cuadrados y los grados de libertad del
modelo, equivale a 28.566, y el intervalo de
confianza estimado para la varianza
corresponde a Pr[43.876≤ σ^2≤25.135] =
95%, por lo que si se construye 100 intervalos
como este, en 95 de los casos, esos intervalos
contendrán el verdadero de la varianza
poblacional.
Con respecto a la significancia individual y
global del modelo, dada una significancia del
10%, los valores críticos de t corresponden a
[-1.6449, 1.6449], en consecuencia, los
estadísticos de prueba t calculados para los
Beta, sin considerar el coeficiente que
acompaña a la variable dp que posee un valor
de t de 1.6, se encuentran fuera de dicho
intervalo (que corresponde al rango de
valores de aceptación de la hipótesis nula),
por ende, se concluye que los hallazgos para
estos coeficientes son significativos.
Considerando la significancia global, dado
que el p valor que acompaña el estadístico F
es significativo (p valor de 0.000) no hay
evidencia estadística para aceptar la hipótesis
nula12
, de este modo, en conjunto los
estimadores de las pendientes (betas) del
modelo son significativos.
Para la verificación de los supuestos del
modelo clásico de regresión lineal (MCRL)
se realizaron pruebas estadisticas que
contrastan hipótesis a partir de los test
descritos en la metodología. Así por ejemplo,
no se encontró problemas de cambio
estructural13
ya que el p valor obtenido en el
Test de Chow es de 0.7661, valor superior a
la significancia del 5% por lo que es aceptada
la hipótesis nula14
y se afirma que no hay
cambio estructural.
Verificando la multicolinealidad15
del
modelo, el factor de inflación de varianza
VIF16
para las variables icv y defcvt se ubica
en el intervalo [2-10] de multicolienalidad
moderada, no obstante, las variables dp, aast
e ipp poseen valores de VIF inferiores a 2
indicando baja multicolinealidad.
Para la comprobación de heterocedasticidad 17
, una vez aplicado el test de White, se
obtuvo un p valor de 0.0829 superior a la
significancia del 5% señalando que no debe
ser rechazada la hipótesis nula18
, de este,
modo, se garantiza que el modelo no presenta
heterocedasticidad.
En cuanto a la revisión de la autocorrelación19
de los errores del modelo, se hizo uso de dos
12
Se establece como hipótesis nula que el
modelo no es significativo. 13
Corresponde al incumplimiento del supuesto del modelo
clásico que establece que los coeficientes no son constantes en el tiempo. 14
En el test de Chow se establece como hipótesis nula que no
haya cambio estructural en el modelo. 15
El supuesto establece que no debe haber correlación entre
las variables explicativas. 16
Si el valor del VIF para cada variable supera el valor 10, se
dice que hay multicolinealidad alta en las variables. 17
El supuesto establece que el modelo debe ser
homocedástico, es decir, la varianza de los errores es
constante. 18
En el test de White, la hipótesis nula se asocia a que el
modelo no presenta heterocedasticidad. 19
El supuesto establece que el pasado de los errores no explica
el presente de los mismos.
Vargas et al. – Estimación de un Modelo Econométrico de Respuesta Lineal para el Índice de Necesidades Básicas Insatisfechas. Caso de estudio: Departamento de Cundinamarca.
11 Artículo de Investigación
pruebas: el test de autocorrelación de orden
uno o Durbin Watson y el test de
autocorrelación de orden superior o Breusch
Godfrey. Así, con el test de Durbin Watson se
obtuvo un valor DW = 2.085964, y dados un
dl=1.60 y un du=1.78 se confirma que el
modelo cae en la zona de no autocorrelación.
Para el test de Godfrey20
el p valor
corresponde a 0.6148, por ende, es aceptada
la hipótesis nula, y de acuerdo a lo anterior,
los errores del modelo están libre de
autocorrelación superior.
Aplicando el test de Shapiro-Wilk para
determinar si los errores del modelo se
distrubuyen con normalidad21
, se obtuvo un p
valor de 0.67833, valor que como se ha visto
con anterioridad supera la significancia del
5% por tal razón, no se rechaza la hipótesis
nula, es decir, los errores del modelo se
comportan como una disribución normal, tal
y como se observa en la figura a
continuación:
Figura 4. Distribución normal de los errores
del modelo. Fuente: Datos propios.
Finalmente para corroborar si el modelo
propuesto posee buena especificación se optó
por emplear el test de Ramsey22
, realizada la
pruebase encuentra que hay problemas de
especificación del modelo pues su p valor es
20
El test de Godfrey así como los demás test de verificación
plantea en la hipótesis nula que el modelo no presenta autocorrelación superior. 21
El supuesto establece que existe normalidad en los errores. 22
El test de Ramsey establece como hipótesis nula que al
modelo no le hacen falta variables relevantes.
de 0.000, muy pequeño en comparación con
la significancia del 5%, por tal razón se
rechaza la hipotesis nula y se concluye que a
dicho modelo le hacen falta variables
explicativas relevantes para su correcta
especificación.
Abordando la predicción como la fase final
de la construcción de un modelo
econométrico, se obtuvieron los siguientes
resultados:
Tabla 5. Predicción Individual y por
Intervalo
Fuente: Datos propios.
De la tabla anterior, se tiene que la predicción
individual de posibles valores para el NBI en
el departamento de Cundinamarca
corresponde a 30.22 y el intervalo de posibles
valores para dicho índice equivale a Pr
[19.708 ≤ Yo ≤ 40.7504] = 95%
Todos los valores presentados en estos
resultados pueden ser consultados en los
anexos de este documento.
5. CONCLUSIONES
1. El modelo econométrico obtenido,
pese a presentar problemas de buena
especificación, es un modelo cuyas
variables son estadisticamente
significativas (ingreso público per
cápita IPP, densidad de población
DP, deficit de vivienda total del
Universidad Distrital Francisco José de Caladas. Junio 2015
12 Artículo de Investigación
municipio DEFCVT, el área agrícola
sembrada AAST, y el índice de
calidad de vida ICV), y explican en
un 81% el indice de necesidades
básicas insatisfechas NBI para cada
entidad territorial del departamento.
Estos resultados son consistentes, ya
que en la revisión teórica se
consideran otra serie de variables que
son determinantes en la
cuantificación de las necesidades
básicas insatisfechas de un hogar
como es: el acceso al agua potable,
servicios sanitarios básicos o el
hacinamiento, variables que por
supuesto al no poseer suficientes
datosque que describieran su
comportamiento no fueron
consideradas en la estimación del
modelo presentada en este
documento.
2. Se determinó a través de las
diferentes pruebas que el modelo
econométrico propuesto cumple con
los nueve de los diez supuestos del
modelo clásico de regresión lineal,
excluyendo por supuesto la buena
especificación; de este modo, se
garantiza que los estimadores
propuestos en el modelo cumplen con
las propiedades de linealidad,
insesgamiento y varianza mínima al
no presentar problemas de cambio
estructural, multicolinealidad alta,
autocorrelación y heterocedasticidad,
y al considerar que los errores del
mismo se distribuyen normalmente.
En conclusión, las pruebas de
significancia indiviual no están
subvaloradas ni sobrevaloradas y los
intervalos de confianza estimados son
confiables.
3. Al aplicar la regresión Stepwise
(regresión paso a paso) permitió
obtener un modelo con sólo las
variables estadisticamente
significativas, que podrían tener
efectivamente una relación en
términos matemáticos y estadísticos
con el NBI, en tal sentido, se
obtuvieron cinco variables
significativas de las cuales solo dos
son incluidas en los análisis del
índice de necesidades básicas
insatisfechas por el DANE.
4. Se debe entender la importancia que
establece la determinación del NBI
en función de focalizar mejor los
recursos de una entidad territorial, de
este modo, permite definir de una
mejor manera las estrategias a
considerar en politica social y
económica que garantice la calidad
de vida de sus habitantes, calidad que
se interpreta de manera directa en la
satisfacción de sus necesidades
básicas. Así las cosas, vale la pena
dedicar esfuerzos para estimar un
modelo que represente lo mejor
posible dicha realidad
socioeconómica.
6. REFERENCIAS
Adame, C. J. C., Lara, A. A. G., & Miguel, R.
A. (2005). Introducción a los
indicadores económicos y sociales de
México. Unam. Recuperado a partir
de
http://books.google.es/books?hl=es&l
r=&id=AmDbuTdEw7gC&oi=fnd&p
g=PA11&dq=introduccion+a+los+in
dicadores+economicos+y+sociales+d
e+m%C3%A9xico&ots=kPfi5DHU1
0&sig=oAe-
4Kb4snrcArCAsRLAbbVgDBg
Delgado, P., & Salcedo, T. (2010). Aspectos
conceptuales sobre los indicadores de
calidad de vida. La Sociología en sus
escenarios, (17). Recuperado a partir
de
http://aprendeenlinea.udea.edu.co/rev
istas/index.php/ceo/article/viewArticl
e/6803
Desarrollo, P. de las N. U. para el. (2010).
Informe Nacional sobre Desarrollo
Humano 2010: Desarrollo humano
Vargas et al. – Estimación de un Modelo Econométrico de Respuesta Lineal para el Índice de Necesidades Básicas Insatisfechas. Caso de estudio: Departamento de Cundinamarca.
13 Artículo de Investigación
en Argentina: trayectos y nuevos
desafíos. PNUD Buenos Aires.
Feres, J. C., & Mancero, X. (2001a). El
método de las necesidades básicas
insatisfechas (NBI) y sus
aplicaciones en América Latina.
Cepal. Recuperado a partir de
http://repositorio.cepal.org/handle/11
362/4784
Feres, J. C., & Mancero, X. (2001b).
Enfoques para la medición de la
pobreza: breve revisión de la
literatura. CEPAL. Recuperado a
partir de
http://repositorio.cepal.org/handle/11
362/4740
Guajarati, D. N. (2003). Econometría.
Recuperado a partir de
http://www.cib.espol.edu.ec/catalogo/
53918/detallesCatalogo.aspx
INDEC. (1984). La pobreza en Argentina.
Instituto Nacional de Estadísticay
Censos.
Sen, A. (1985). A sociological approach to
the measurement of poverty: a reply
to Professor Peter Townsend. Oxford
Economic Papers, 669–676.
Spicker, P. (1999). Definitions of poverty:
eleven clusters of meaning. The
international glossary on poverty.
London: Zed Books, 150–62.
Universidad Distrital Francisco José de Caladas. Junio 2015
14 Artículo de Investigación
ANEXOS 1: ESTIMACIÓN DE REGRESIONES
REGRESIÓN INICIAL
PRUEBA STEPWISE
PRUEBA MWD
REGRESIÓN LINEAL CON ZI
Vargas et al. – Estimación de un Modelo Econométrico de Respuesta Lineal para el Índice de Necesidades Básicas Insatisfechas. Caso de estudio: Departamento de Cundinamarca.
15 Artículo de Investigación
REGRESIÓN LOGARÍTMICA CON Z2
ANEXOS 2: VERIFICACIÓN DEL MODELO ECONOMÉTRICO
PRUEBA DE MULTICOLINEALIDAD
PRUEBA DE HETEROSCEDASTICIDAD
PRUEBA DE AUTOCORRELACIÓN
Universidad Distrital Francisco José de Caladas. Junio 2015
16 Artículo de Investigación
AUTOCORRELACIÓN CON 4 REZAGOS
PRUEBA DE CAMBIO ESTRUCTURAL
PRUEBA DE NORMALIDAD EN LOS ERRORES
PRUEBA DE BUENA ESPECIFICACIÓN