estimación de un modelo econométrico de respuesta lineal para el indice de necesidades básicas...

1 Artículo de Investigación

ESTIMACIÓN DE UN MODELO ECONOMÉTRICO DE RESPUESTA

LINEAL PARA EL INDICE DE NECESIDADES BÁSICAS

INSATISFECHAS. CASO DE ESTUDIO: DEPARTAMENTO DE

CUNDINAMARCA

Estimation of an Econometric Model of Linear Response for the Index of

Unsatisfied Basic Needs. Case Study: Department of Cundinamarca

German Giovanny Vargas Velasquez1

Ingeniero Catastral y Geodesta

1 Universidad Distrital Francisco José de Caldas. [email protected] †

RESUMEN

El índice de necesidades básicas insatisfechas permite caracterizar y cuantificar la pobreza

estableciendo ésta como una función de las carencias en necesidades específicas de una población.

En tal sentido, el presente artículo pretende estimar un modelo econométrico con respuesta de tipo

lineal obtenido a partir del método de mínimos cuadrados ordinarios que permita explicar el

comportamiento que siguen las necesidades básicas insatisfechas en el departamento de

Cundinamarca para el año 2005. Se identificaron los factores determinantes del NBI y finalmente se

obtuvo una ecuación lineal significativa que representa en muy buena aproximación los valores

estimados en la realidad para dicho índice. Los resultados obtenidos muestran que el modelo

presenta problemas de especificación asociado a la falta de variables relevantes, no obstante, sus

coeficientes son consistentes, insesgados y eficientes.

Palabras clave: pobreza, NBI, modelo econométrico, regresión lineal, mínimos cuadrados

ordinarios, Cundinamarca.

ABSTRACT

The index of unsatisfied basic allows to characterize and quantify poverty, establishing it as a

function of lacks in specific needs of a population. In that sense, this paper aims to estimate an

econometric model with linear response obtained from ordinary least squares method that allows to

explain the behavior present in the unsatisfied basic needs in the department of Cundinamarca for

2005. We identified NBI determining factors and finally a significant linear equation representing in

very good approximation, the estimate values obtained for that index. The results show that the

model has good specification and their coefficients are consistent, unbiased and efficient.

Keywords: Poverty, NBI, econometric model, linear regression, OLS, Cundinamarca.

1. INTRODUCCIÓN

La caracterización de la pobreza es una

necesidad apremiante en política social y

económica. En términos generales, la pobreza

se refiere a la incapacidad de las personas de

vivir una vida tolerable (PNUD, 2010), es

decir, y tal como lo sintetiza la CEPAL

(2001), corresponde a la situación de aquellos

hogares que no logran reunir, en forma

relativamente estable, los recursos necesarios

para satisfacer las necesidades básicas de sus

miembros, necesidades que de ser satisfechas,

por supuesto, se traduce en una mejor calidad

de vida.

Universidad Distrital Francisco José de Caladas. Junio 2015


Si bien es cierto, la pobreza es un fenómeno

inherente a la existencia del hombre, a sus

formas de apropiación de recursos, a las

relaciones de poder que establece y

evidentemente a las desigualdades que este

proceso genera; definir los elementos que

cuantifiquen dicha calidad de vida no es un

tema fácil, dada la natural dificultad de medir

algunos de sus elementos constituyentes, esto

es, al tratarse de un tema de tipo

socioeconómico intervienen variables

cuantitativas y cualitativas en el análisis.

Dicho lo anterior, en la actualidad, se han

utilizado algunas metodologías para medir la

pobreza, mediciones que pueden estar

fundamentadas en una serie de definiciones

propuestas por Paul Spicker (1999):

necesidad1, estándar de vida e insuficiencia

de recursos2, entre otros.

En consecuencia, existen dos mecanismos

para determinar la pobreza en los hogares.

“Una primera posibilidad es evaluar

directamente si los hogares han logrado

satisfacer sus necesidades básicas,

encuestándolos sobre los bienes y servicios

que disponen. La segunda alternativa

consiste en medir los recursos del hogar,

usualmente sus ingresos o sus gastos, y

estimar si estos son suficientes para que el

hogar pueda gozar de un nivel de vida

aceptable, de acuerdo con los estándares

sociales prevalecientes” (Feres & Mancero,

2001b). De acuerdo con Amartya Sen (1984),

la medición de la pobreza se puede dividir en

dos grandes etapas. En la primera,

denominada de “identificación” se define

cuales hogares son pobres y cuales no a partir

de algún criterio previamente elegido. La

segunda etapa, denominada “agregación”,

implica calcular índices de pobreza que

permitan sintetizar en un solo indicador la

1 la interpretación de necesidad se refiere a la carencia de

bienes y servicios materiales requeridos para vivir en óptimas

condiciones, no obstante la pobreza también puede ser

interpretada como insuficiencia de recursos, es decir, la carencia de riqueza para adquirir lo que una persona necesita. 2 Para estas opciones, los indicadores de bienestar más

aceptados han sido la satisfacción de ciertas necesidades, el consumo de bienes o el ingreso disponible. (CEPAL, 2001)

magnitud y profundidad de las privaciones de

una población (Sen, 1985). De modo que, el

método de agregación más conocido y

utilizado para dichas estimaciones es el de las

Necesidades Básicas Insatisfechas (NBI)3,

basado esencialmente en una concepción de

la pobreza como necesidad. (Feres &

Mancero, 2001b). “Bajo este método, se elige

una serie de indicadores censales que

permiten constatar si los hogares satisfacen o

no algunas de las necesidades. Algunos de

los factores tenidos en cuenta son: vivienda

inadecuada, servicios inadecuados, alta

dependencia económica, inasistencia escolar,

hacinamiento crítico y finalmente la

capacidad económica o ingresos por

persona” (Feres & Mancero, 2001a).

En ese orden de ideas, caracterizar la pobreza

recurriendo al índice de necesidades básicas

insatisfechas (NBI) sugiere la idea que, ante

la posibilidad de obtener datos de muestras

censales, es absolutamente necesario definir

un procedimiento que permita cuantificar las

relaciones que existen entre una serie de

variables que pueden explicar el fenómeno

objeto de estudio y conocer su estructura

económica. De modo tal que cabe señalar la

importancia de involucrar modelos

econométricos en este tipo de análisis,

modelos que se sustentan en la cuantificación

de dichas relaciones y sirve para conocer

cómo inciden en la variable NBI las

variaciones de las variables consideradas

como explicativas para éste. Por otro lado,

estimando la expresión matemática que las

relaciona, es posible predecir los valores que

tomará a futuro la variable objeto de estudio.

El área de estudio corresponde al

departamento de Cundinamarca, ubicado en

el centro geográfico de la República de

Colombia que ocupa una superficie de 24.210

kilómetros cuadrados, con una población

incluyendo la capital del país (Bogotá D.C.)

de 10.558.824. Cundinamarca está dividida

en 15 provincias creadas para facilitar la

3 Es un índice diseñado para aprovechar la información

obtenida a partir de los censos demográficos, por permitir su fácil inclusión e interpretación de los resultados.

Vargas et al. – Estimación de un Modelo Econométrico de Respuesta Lineal para el Índice de Necesidades Básicas Insatisfechas. Caso de estudio: Departamento de Cundinamarca.


administración del departamento, compuestas

a su vez de 116 municipios. Limita por el

norte con el departamento de Boyacá, por el

sur con los departamentos de Meta, Huila y

Tolima y por el occidente con el río

Magdalena, por el oriente limita con el

departamento de Casanare4. El estudio de

NBI permitió utilizar variables de tipo social

y económico con el propósito de identificar

las condiciones de vida de los habitantes de

los municipios que conforman el

departamento para el año 2005, a través de un

modelo de regresión lineal.

1.1. Estado del Arte

Los estudios realizados en la actualidad sobre

las necesidades básicas insatisfechas en

Colombia, se han llevado a cabo por medio

de la información obtenida en el censo

demográfico realizado en el año 2005 por el

departamento nacional de estadística DANE,

esto ha permitido estimar modelos que

determinan las condiciones y calidad de vida

de la población con base a la información per

cápita pública municipal. A pesar de que los

modelos de estimación con los datos del

censo general del año 2005 han sido

satisfactorios para determinar las necesidades

básicas insatisfechas, el DANE no ha puesto

en marcha otro censo general con el que se

pueda comparar la información existente con

la actual. Por tal motivo, el modelo que se

empleará a continuación busca estimar otros

factores condicionantes que permitan

determinar las NBI de la población que no

necesariamente son las mismas empleadas

por el censo de población del periodo 2005.

Cabe mencionar, que el 29 de Junio de 2011,

el DANE llevó a cabo la actualización de la

base de datos que definen las NBI para los

departamentos que conforman la región

Andina, sin embargo, en la presente

actualización, se anexan municipios que

fueron creados posterior al censo del año

4 Datos recuperados de la página web de la Gobernación de

Cundinamarca.

http://www.cundinamarca.gov.co/wps/portal/Home/Cundinamarca.gc

2005 los cuales generan cambio en la

distribución departamental.

La regresión del modelo para variables

aleatorias que presentaron Ferrari y

Cribarineto asumen que el intervalo de 0 a 1

estas son continuas. En ese modelo los

parámetros de regresión son interpretables en

términos de la variable explicada. Ellos en su

informe propusieron que la ventaja de utilizar

una distribución tipo beta presenta la

flexibilidad que permite que al realizar la

dispersión variable del modelo de regresión,

estos tomen diferentes valores dependiendo

de la combinación de valor de los parámetros,

en lo cual incluye la forma derecha e

izquierda sesgada o la palma de densidad

uniforme.

2. MARCO REFERENCIAL

2.1. Índice de Necesidades Básicas

Insatisfechas (NBI)

“Este método ha sido utilizado por la CEPAL

para realizar sus mediciones de pobreza,

para ello establece que ésta es una función

directa de las carencias en necesidades

específicas” (Adame, Lara, & Miguel, 2005).

El objetivo del método NBI es proveer un

método directo de identificación de los

pobres. Desde sus inicios, el método NBI ha

sido utilizado con distintos propósitos, no

necesariamente compatibles entre sí. Por un

lado es posible plantearlo como un

instrumento para caracterizar la pobreza5 de

manera complementaria a los métodos

indirectos de medición. Por otra parte, el

método puede ser considerado como un

sustituto del método de líneas de pobreza,

caso en el que se justifica la utilización de

indicadores, altamente correlacionados con el

ingreso aunque no fueren representativos del

mismo (Feres & Mancero, 2001b).

“La medición de la pobreza a través de este

método requiere, primeramente, de la

elección de características de los hogares

5 Aportando información sobre el desarrollo de las capacidades

humanas no reflejadas en el ingreso.



que además de representar alguna dimensión

importante de la privación, también se

encuentren lo suficientemente asociadas con

las situaciones de pobreza como para

representar a las demás carencias que

configuran tales situaciones.”(INDEC, 1984)

“Si bien es la situación propia de un país la

que determina qué tan apropiado es un

indicador, existen ciertas carencias que se

han constituido en el común denominador de

las aplicaciones de este método, ellas son:

hacinamiento, vivienda inadecuada,

abastecimiento inadecuado de agua, carencia

de servicios sanitarios e inasistencia a

escolar y un indicador de la capacidad

económica” (Feres & Mancero, 2001b). Así,

con el objetivo de captar la disponibilidad y

el acceso a los servicios básicos a partir de

estas cinco condiciones mediante las cuales

se clasifica la población como pobre por NBI

de modo que si un hogar presenta al menos

una de las condiciones definidas se considera

como pobre o en miseria si presenta al menos

dos de esas condiciones.

De acuerdo con la CEPAL, el proceso de

selección está constituido, de manera general,

por cuatro pasos:

a) Determinar el grupo de necesidades

básicas mínimas susceptibles de

estudiarse con la información del

censo.

b) Elegir indicadores censales que

representen dichas necesidades.

c) Definir el nivel crítico de satisfacción

para cada necesidad.

d) Asegurar que los indicadores

seleccionados correspondan a

situaciones de pobreza.

No obstante, el método NBI también presenta

algunas deficiencias importantes. En primer

lugar, el nivel de pobreza es sensible al

número de necesidades insatisfechas que se

requiere para ser considerado pobre, y esta

elección generalmente es arbitraria. En

segundo lugar, el número de personas pobres

siempre aumenta ante la adición de nuevos

indicadores; en una situación extrema, el uso

de un número suficientemente grande de

indicadores podría originar que casi toda la

población sea clasificada como pobre. Un

tercer problema, en tanto, consiste en la

elección de ponderadores para cada

indicador, al momento de agregar las distintas

necesidades entre sí (Feres & Mancero,

2001b).

Con base en lo anterior, el índice ha sido

objeto de críticas, la principal se relaciona

con la arbitrariedad en la selección de las

cinco necesidades básicas expuestas

anteriormente, que abre la posibilidad a que

puedan ser reemplazadas por otras con base

en distintos juicios de valor. Además este

índice solo identifica a los hogares por el

número de insatisfacciones, lo cual impide

una valoración de la magnitud de la pobreza.

No permite medir ni el incremento necesario

en el ingreso para superar la pobreza (la

brecha de ingresos), ni las diferencias entre

los niveles de pobreza de los individuos (la

distribución de los ingresos). Esto se debe, a

que no existe una forma única y establecida

de relacionar el número de necesidades

básicas insatisfechas con la condición de

pobreza, lo que implica que la clasificación

final en pobres y no pobres es arbitraria y es

tomada por el investigador (Delgado &

Salcedo, 2010).

2.2. Modelo Econométrico

La econometría es la herramienta que por

medio de las matemáticas y la estadística,

busca definir y cuantificar las relaciones entre

las diferentes variables que se incluyen en un

modelo econométrico y los datos observados

en la vida real. Así las cosas, la econometría

puede definirse como “el análisis cuantitativo

de fenómenos económicos reales, basados en

el desarrollo simultáneo de la teoría y la

observación, relacionados mediante métodos

apropiados de inferencia”. (Guajarati, 2003).

La econometría es importante al reunir una

serie de herramientas que permiten

comprobar la validez de un modelo



económico. En tal sentido, un modelo

económico es una representación matemática

simplificada de la realidad, es decir, pese a

que es una abstracción de la realidad solo

involucra aquellos detalles más relevantes

para el análisis. Dicho lo anterior, cuando se

desea especificar un modelo econométrico se

acude a la definición de una expresión

matemática que involucre una serie de

variables exógenas o independientes que

explique una variable endógena o

dependiente, de modo que sea obtenida a

través de un análisis estadístico de regresión

lineal.

“La idea fundamental del análisis de

regresión es la dependencia estadística de

una variable dependiente respecto de otra o

más variables explicativas, en tal sentido, el

objetivo del análisis de regresión es estimar o

predecir la media o valor promedio de la

variable dependiente con base en los valores

conocidos o fijos de las explicativas”.

(Guajarati, 2003).

Para estimar la función de regresión se tienen

fundamentalmente dos métodos: el método de

mínimos cuadrados ordinarios (MCO) y el

método de máxima verosimilitud. El primero,

al que se hará hincapié en este artículo, ofrece

en términos matemáticos mayor sencillez en

su manipulación e interpretación, además de

sus propiedades estadísticas.

Mediante la técnica MCO se obtienen una

serie de parámetros que permiten cuantificar

las relaciones existentes entre las variables

explicativas y la variable endógena, así como

el término de perturbación estocástica que

representa los errores de especificación; es un

método frecuentemente utilizado para

encontrar los parámetros que acompañan a las

variables en la regresión. El método

básicamente plantea utilizar, como estimación

de duchos parámetros aquella combinación de

betas que minimice los errores que el modelo

cometerá(Guajarati, 2003).

No obstante para que los estimadores de

mínimos cuadrados ordinarios arrojen los

mejores parámetros (en términos de

linealidad, insesgamiento y varianza mínima),

existe un teorema (Gauss-Markov) que

establece que si son cumplidos los supuestos

del modelo clásico de regresión lineal, el

econometrista obtiene los estimadores MELI

(mejores estimadores lineales, insesgados y

eficientes). Dichos supuestos corresponden a:

a) El modelo está bien especificado, es

decir no le faltan variables relevantes

y posee una forma funcional

adecuada.

b) Los parámetros son constantes en el

tiempo, es decir no hay cambio

estructural.

c) No existe multicolinealidad entre las

variables explicativas del modelo.

d) El modelo es lineal en los parámetros.

e) El modelo no posee endogeneidad.

f) No existe correlación entre las

variables explicativas y los errores.

g) No hay autocorrelación en los

errores.

h) No existe heterocedasticidad entre los

errores.

i) Existe normalidad en los errores.

j) El valor esperado de los errores es

igual a cero.

Así, un modelo econométrico con respuesta

lineal viene dado de la forma:

En donde el parámetro β1 que corresponde al

término constante debe ser interpretado como

el valor que toma la variable endógena

cuando el resto de variables explicativas x

valen cero. El resto de parámetros βs que

acompañan a las variables explicativas miden

la relación entre éstas y la variable endógena

a través de su signo y su cuantía,

representando la razón de cambio de una

respecto de la otra. Por otro lado la variable

aleatoria μ representa los errores del modelo.

3. METODOLOGÍA Y DATOS



La metodología utilizada en este artículo se

sustenta en la metodología tradicional o

clásica de la econometría, sujeta a los

lineamientos que se presentan en el siguiente

esquema:

Diagrama 1. Flujo de procesos desarrollados

en este artículo. Fuente: elaborado por los

autores.

Con base en lo anterior, la metodología de

este estudio se divide en 4 etapas: una fase de

especificación, una de estimación, una de

verificación y finalmente una fase de

predicción, por supuesto, a estos niveles

subyacen una serie de subprocesos que serán

explicados brevemente y que permitirán dar

cumplimiento al objetivo de este artículo en

cuestión: obtenejer estimadores lineales,

insesgados y eficientes en términos de su

varianza para el indice de necesidades bàsicas

insatisfechas de Cundinamarca para el 2005.

1. Habiendo definido el fenómeno

económico a estudiar, su espacialidad

y temproralidad, en la fase de

especificación se realizó el anàlisis de

la información obtenida en la base de

datos, llevada a cabo por medio de la

clasificación de las variables

independientes o explicativas y la

dependiente, de esta manera fue

posible establecer los tipos de datos

de cada variable, su naturaleza

matemática, la escala de medida y los

niveles, indicados en la Tabla 1. A

partir de estas definiciones se efectuó

un análisis descrptivo de la variable

endógena.

2. La base de datos formada para la

estimación del modelo NBI del

departamento de Cundinamarca fue

establecida por una muestra de 116

datos6 que proporcionan información

a nivel municipal, las cuales

presentan las condiciones de vida por

kilómetro cuadrado de la población.

La varible dependiente o regresada

corresponde al NBI, mientras que el

conjunto de variables subyacente a

ésta forman el grupo de las

indipendientes con las que se

explicará el comportamiento de este

índice. Esta base de datos se

construyó a partir de consultas a

portales web institucionales (DANE,

IGAC) de tal manera que la

información que se utilizara fuera

consistente con la realidad.

3. Una vez obtenidos los datos, éstos

fueron organizados y estructurados

en un documento Excel7. Acto

seguido, los datos fueron importados

al software econométrico Stata para

su posterior análisis.

6 Correspondientes a los 116 municipios que conforman el

departamento. 7 Muchos de los datos consultados al tener componente

geográfica venían en formato shapefile por lo que mediante la

utilización de la herramienta ArcGIS se pudo extraer la

información alfanumérica contenida en cada polígono del municipio.



Tabla 1. Descripción de los datos. Fuente:

Elaborado por los autores.

4. En la fase estimación se realizó el

cálculo de los parámetros del modelo

mediante un analisis estadístico de

regresión lineal a partir de la técnica

de mínimos cuadrados ordinarios

(MCO). Obtenidos los valores de los

coeficientes para cada variable

explicativa, se procedió a seleccionar

aquellas variables cuyos betas fueran

significativos con una probabilidad

del 10% mediante la utilización de la

regresión Stepwise.8

5. Posteriormente, se aplicó la prueba

MWD9 para seleccionar la mejor

forma funcional (lineal o logarítmica)

del modelo.

6. En la fase de verificación, constituida

por la interpretación de estadisticos

8 La prueba Stepwise es un procedimiento que permite

encontrar una ecuación significativa a partir de un conjunto de

variables. Son seleccionadas aquellas variables cuyos

coeficientes posean un p valor inferior a la significancia establecida por el usuario. 9 En la prueba MWD se definen dos hipótesis: una hipótesis

para el modelo lineal y otra para el logarítmico y comparando mediante su significancia se opta por elegir uno de los dos.

de prueba, y la verificación de los

supuestos del modelo clásico, se

buscó cotrastar las hipotesis nula y

alternativa de tal manera que

permitiera verificar aplicando una

serie de pruebas: la normalidad de los

errores (test de Shapiro-Wilk), el no

cambio estructural en los parámetros

(test de Chow), la no

heterocedasticidad de los errores (test

de White), la no multicolinealidad de

las variables (factor de inflación de

varianca FIV), la no autocorrelación

de los errores (test de Durbin Watson

y test de Breusch Godfrey) y la buena

especificación del modelo (Test de

Ramsey).

7. Finalmente, habiendo verificado los

supuestos del modelo y obenido los

estimadores MELI (lineales

insesgaods y con varianza mínima)

para el modelo teórico, se acude a la

fase de predicción para el calculo del

valor de la predicción individual y la

estimación por intervalo para la

variable dependiente NBI.

3.1. Estadistica Descriptiva

3.1.1. Variable Exógena

Variable SiglaTipo de

Variable

Naturaleza

matemática

Escala de

Medida

Niveles/Rango de

valoresDescripción

Necesidades Básicas

InsatisfechasNBI Cuantitativa Continua Razón Reales [0-1]

Indicador que determina el porcentaje de carenciasde una ppoblación

determinantes de la calidad de vida y sus niveles de pobreza.

Tasa de Afiliación

Regimen Contributivo

TCONTVO Cuantitativa Continua Razón Reales [0-1]Indicador que determina el porcentaje de personas afiliadas al sistema de salud, las

cuales se encuentran vinculadas laboralmente.

Tasa de Afiliación

Regimen SubsidiadoTSUBSID Cuantitativa Continua Razón Reales [0-1]

Indicador que determina el porcentaje de personas sin capacidad de pago afiliadas

al sistema de salud por parte del estado.

Ingreso Público Per CápitaIPP Cuantitativa Continua Intervalo IPP: [120.78-2722.16] Total de recursos anuales en la entidad territorial sobre la población total de ella.

Cobertura en Educación COBEDU Cuantitativa Continua Razón Reales [0-1]Número de estudiantes por nivel sobre la población según el rango de edad

correspondiente X100.

Densidad de Población DP Cuantitativa Continua Intervalo DP: [0.437-4.136] Número de habitantes sobre el área municipal por kilómetro cuadrado.

Deficit Vivienda Total DEFCVT Cuantitativa Continua Razón Reales [0-1]Número de hogares que presentan carencias habitacionales sobre el total de

hogares del municipio X100.

Magnitud de la Inversión

MunicipalMIM Cuantitativa Continua Razón Reales [0-1]

Porcentaje del total de recursos anuales destinados al municipio por kilómetro

cuadrado.

Generación de Recursos

Propios (Esfuerzo Fiscal)GRP Cuantitativa Continua Razón Reales [0-1] Recursos destinados a financiar el activo fijo presentado por el municipio.

Desempeño Integral

MunicipalDIM Cuantitativa Continua Razón Reales [0-1]

Indice con escala de 0 a 100 del desempeño de los municipios en un año

determinado, integrando la evaluación de los factores de eficacia, eficiencia,

cumplimiento de requisitos legales, gestión y entorno.

Área Agrícola Sembrada

TotalASST Cuantitativa Continua Intervalo ASST: [1.46-86224.12] Número de hectareas sembradas por municipio

Capacidad de Ahorro CAPAHO Cualitativa

1 [Muy Baja], 2

[Baja], 3 [Media],

4[Alta]

Relación entre el ahorro corriente y el ingreso corriente X100 por kilómetro

cuadrado.

Descripción de Variables



Tabla 2. Estadísticas Variable Explicada

Fuente: Datos propios.

Figura 1. Histograma de la variable NBI. Fuente: Datos propios.

De la tabla anterior, el valor esperado o valor

promedio del NBI para el departamento de

Cundinamarca corresponde al 30.22, el valor

de la desviación estándar que muestra el

grado de dspersión de los datos de la muestra

con respecto a su valor prmedio corresponde

a 12.26. El rango de valores posibles abarca

desde el valor mínimo 7.11 hasta el máximo

valor de 68.49, sugiriendo que valores bajos

del NBI corresponden a aquellos municpios

que no presentan carencia en sus necesidades

bàsicas. Nótese en la Figura 1 que el

histograma tiende a ser asimétrico a la

derecha con una fuerte concentración de

valores en el intervalo [20-30].

3.1.2. Variable Exógenas

Tabla 2. Matriz de Correlación de Variables

Exógenas

Fuente: datos propios.

Figura 2. Diagrama de dispersión variables

exógenas. Fuente: Datos propios.

La matriz anterior explica cómo se

encuentran relacionadas cada una de las

variables entre sí, al interior del modelo. Las

variables cuyos valores están cercanos a cero,

por ejemplo, el coeficiente de correlación

entre defcvt respecto de ipp es de 0.0732

indicando que la correlación es muy baja,

esto es, ambas variables son linealmente

independientes (una no influye en la otra). No

obstante, el signo que acompaña el

coeficiente es positivo sugiriendo que la

proyección de la regresión lineal va a tender a

crecer conjuntamente una variable respecto

de la otra (variables directamente

proporcional). Por otra parte, las variables

con más alta correlación corresponden a icv

respecto del nbi con un coeficiente de

correlación de -0.8846, si bien la dependencia

es bastante alta el signo que la acompaña

señala que dicha relación es inversamente

proporcional.

Figura 3. Diagrama de Cajas para las

variables del modelo. Fuente: Datos propios.



Como se puede visualizar en la Figura 3, se

representan la distribución de cada una de las

variables en términos de su mediana,

percentiles, valores extremos y su dispersión.

Además permite comparar entre sì cada una

de las variables explicativas.

Finalmente, para este análisis descriptivo se

hace uso de la prueba de normalidad de

Shapiro Wilk10

para conocer si el

comportamiento del conjunto de variables

independientes es de tipo normal. Dado que

los p valores que acompañan a cada una de

las variables son inferiores a una significancia

del 5%, no hay suficiente evidencia

estadística para aceptar la hipótesis nula, por

tanto se rechaza la misma y se concluye que

los datos no siguen una distribución normal.

4. RESULTADOS

El modelo inicial presentado, que involucra

todas las variables consideradas en la

metodología es el siguiente:

Las dummys corresponden a la capacidad de

ahorro baja, media y alta indicadas en la

descripción de variables.

10

Esta prueba permitió contrastar la normalidad de los datos

de la muestra, planteándose como hipótesis nula que la muestra proviene de una población normalmente distribuida.

Tabla 3. Modelo Inicial del NBI.


No obstante, como puede observarse en la

salida anterior, no todos los coeficientes son

estadísticamente significativos, pues los p

valores no son inferiores al 10%. De modo

que al aplicar la regresión paso a paso

Stepwise con una probabilidad del 10% se

obtuvieron 5 variables significativas: dp con

un p valor de 0.107, defcvt con un p valor de

0.008, ipp con un p valor de 0.078, icv con un

p valor de 0.000, y aast con un p valor de

0.067.

La forma funcional más adecuada del

modelo, habiendo realizado la prueba

MWD11

, arrojó que debía ser de tipo lineal

dada la significancia de la variable Z2, pues

al calcular dicha variable, que resulta de la

resta de el modelo lineal y el antilog del

modelo logarítmico, y estimando nuevamente

el modelo incluyéndola como explicativa, el

coeficiente que la acompaña posee un p valor

inferior a la significancia del 5%, por lo que

no es rechazada la hipótesis nula. En tal

sentido se presenta el modelo definitivo para

el NBI:

Tabla 4. Modelo Definitivo para el NBI

11

En la prueba MWD se establece como hipótesis nula que el

modelo sea de tipo lineal y como hipótesis alterna que sea de tipo logarítmico.



Pese a que la naturaleza de los datos extán

expresados como indicadores, los coeficientes

que acompañan a cada una de las variables

explicativas representan el cambio marginal,

es decir, que si una de las variables aumenta

en una unidad y las demás toman valores de

cero, el NBI en promedio cambia en el valor

de beta unidades de dicha variable para los

municipios considerados en la muestra. De

otro modo, el término constante indica el

valor autónomo del NBI cuando todas las

variables adoptan valores de cero, o dicho de

otro modo corresponde al intercepto de la

recta de regresión.

Analizando el R2 y R2 ajustado, se tiene que

es de 0.81, por lo que la bondad del ajuste,

que intenta resumir qué tanto las variables

exógenas explican el comportamiento del

NBI, es del 81%.

Para σ^2, que respresenta la varianza mínima

de los errores del modelo, obtenida de la

relación entre la sumatoria residual de

cuadrados y los grados de libertad del

modelo, equivale a 28.566, y el intervalo de

confianza estimado para la varianza

corresponde a Pr[43.876≤ σ^2≤25.135] =

95%, por lo que si se construye 100 intervalos

como este, en 95 de los casos, esos intervalos

contendrán el verdadero de la varianza

poblacional.

Con respecto a la significancia individual y

global del modelo, dada una significancia del

10%, los valores críticos de t corresponden a

[-1.6449, 1.6449], en consecuencia, los

estadísticos de prueba t calculados para los

Beta, sin considerar el coeficiente que

acompaña a la variable dp que posee un valor

de t de 1.6, se encuentran fuera de dicho

intervalo (que corresponde al rango de

valores de aceptación de la hipótesis nula),

por ende, se concluye que los hallazgos para

estos coeficientes son significativos.

Considerando la significancia global, dado

que el p valor que acompaña el estadístico F

es significativo (p valor de 0.000) no hay

evidencia estadística para aceptar la hipótesis

nula12

, de este modo, en conjunto los

estimadores de las pendientes (betas) del

modelo son significativos.

Para la verificación de los supuestos del

modelo clásico de regresión lineal (MCRL)

se realizaron pruebas estadisticas que

contrastan hipótesis a partir de los test

descritos en la metodología. Así por ejemplo,

no se encontró problemas de cambio

estructural13

ya que el p valor obtenido en el

Test de Chow es de 0.7661, valor superior a

la significancia del 5% por lo que es aceptada

la hipótesis nula14

y se afirma que no hay

cambio estructural.

Verificando la multicolinealidad15

del

modelo, el factor de inflación de varianza

VIF16

para las variables icv y defcvt se ubica

en el intervalo [2-10] de multicolienalidad

moderada, no obstante, las variables dp, aast

e ipp poseen valores de VIF inferiores a 2

indicando baja multicolinealidad.

Para la comprobación de heterocedasticidad 17

, una vez aplicado el test de White, se

obtuvo un p valor de 0.0829 superior a la

significancia del 5% señalando que no debe

ser rechazada la hipótesis nula18

, de este,

modo, se garantiza que el modelo no presenta

heterocedasticidad.

En cuanto a la revisión de la autocorrelación19

de los errores del modelo, se hizo uso de dos

12

Se establece como hipótesis nula que el

modelo no es significativo. 13

Corresponde al incumplimiento del supuesto del modelo

clásico que establece que los coeficientes no son constantes en el tiempo. 14

En el test de Chow se establece como hipótesis nula que no

haya cambio estructural en el modelo. 15

El supuesto establece que no debe haber correlación entre

las variables explicativas. 16

Si el valor del VIF para cada variable supera el valor 10, se

dice que hay multicolinealidad alta en las variables. 17

El supuesto establece que el modelo debe ser

homocedástico, es decir, la varianza de los errores es

constante. 18

En el test de White, la hipótesis nula se asocia a que el

modelo no presenta heterocedasticidad. 19

El supuesto establece que el pasado de los errores no explica

el presente de los mismos.



pruebas: el test de autocorrelación de orden

uno o Durbin Watson y el test de

autocorrelación de orden superior o Breusch

Godfrey. Así, con el test de Durbin Watson se

obtuvo un valor DW = 2.085964, y dados un

dl=1.60 y un du=1.78 se confirma que el

modelo cae en la zona de no autocorrelación.

Para el test de Godfrey20

el p valor

corresponde a 0.6148, por ende, es aceptada

la hipótesis nula, y de acuerdo a lo anterior,

los errores del modelo están libre de

autocorrelación superior.

Aplicando el test de Shapiro-Wilk para

determinar si los errores del modelo se

distrubuyen con normalidad21

, se obtuvo un p

valor de 0.67833, valor que como se ha visto

con anterioridad supera la significancia del

5% por tal razón, no se rechaza la hipótesis

nula, es decir, los errores del modelo se

comportan como una disribución normal, tal

y como se observa en la figura a

continuación:

Figura 4. Distribución normal de los errores

del modelo. Fuente: Datos propios.

Finalmente para corroborar si el modelo

propuesto posee buena especificación se optó

por emplear el test de Ramsey22

, realizada la

pruebase encuentra que hay problemas de

especificación del modelo pues su p valor es

20

El test de Godfrey así como los demás test de verificación

plantea en la hipótesis nula que el modelo no presenta autocorrelación superior. 21

El supuesto establece que existe normalidad en los errores. 22

El test de Ramsey establece como hipótesis nula que al

modelo no le hacen falta variables relevantes.

de 0.000, muy pequeño en comparación con

la significancia del 5%, por tal razón se

rechaza la hipotesis nula y se concluye que a

dicho modelo le hacen falta variables

explicativas relevantes para su correcta

especificación.

Abordando la predicción como la fase final

de la construcción de un modelo

econométrico, se obtuvieron los siguientes

resultados:

Tabla 5. Predicción Individual y por

Intervalo


De la tabla anterior, se tiene que la predicción

individual de posibles valores para el NBI en

el departamento de Cundinamarca

corresponde a 30.22 y el intervalo de posibles

valores para dicho índice equivale a Pr

[19.708 ≤ Yo ≤ 40.7504] = 95%

Todos los valores presentados en estos

resultados pueden ser consultados en los

anexos de este documento.

5. CONCLUSIONES

1. El modelo econométrico obtenido,

pese a presentar problemas de buena

especificación, es un modelo cuyas

variables son estadisticamente

significativas (ingreso público per

cápita IPP, densidad de población

DP, deficit de vivienda total del



municipio DEFCVT, el área agrícola

sembrada AAST, y el índice de

calidad de vida ICV), y explican en

un 81% el indice de necesidades

básicas insatisfechas NBI para cada

entidad territorial del departamento.

Estos resultados son consistentes, ya

que en la revisión teórica se

consideran otra serie de variables que

son determinantes en la

cuantificación de las necesidades

básicas insatisfechas de un hogar

como es: el acceso al agua potable,

servicios sanitarios básicos o el

hacinamiento, variables que por

supuesto al no poseer suficientes

datosque que describieran su

comportamiento no fueron

consideradas en la estimación del

modelo presentada en este

documento.

2. Se determinó a través de las

diferentes pruebas que el modelo

econométrico propuesto cumple con

los nueve de los diez supuestos del

modelo clásico de regresión lineal,

excluyendo por supuesto la buena

especificación; de este modo, se

garantiza que los estimadores

propuestos en el modelo cumplen con

las propiedades de linealidad,

insesgamiento y varianza mínima al

no presentar problemas de cambio

estructural, multicolinealidad alta,

autocorrelación y heterocedasticidad,

y al considerar que los errores del

mismo se distribuyen normalmente.

En conclusión, las pruebas de

significancia indiviual no están

subvaloradas ni sobrevaloradas y los

intervalos de confianza estimados son

confiables.

3. Al aplicar la regresión Stepwise

(regresión paso a paso) permitió

obtener un modelo con sólo las

variables estadisticamente

significativas, que podrían tener

efectivamente una relación en

términos matemáticos y estadísticos

con el NBI, en tal sentido, se

obtuvieron cinco variables

significativas de las cuales solo dos

son incluidas en los análisis del

índice de necesidades básicas

insatisfechas por el DANE.

4. Se debe entender la importancia que

establece la determinación del NBI

en función de focalizar mejor los

recursos de una entidad territorial, de

este modo, permite definir de una

mejor manera las estrategias a

considerar en politica social y

económica que garantice la calidad

de vida de sus habitantes, calidad que

se interpreta de manera directa en la

satisfacción de sus necesidades

básicas. Así las cosas, vale la pena

dedicar esfuerzos para estimar un

modelo que represente lo mejor

posible dicha realidad

socioeconómica.

6. REFERENCIAS

Adame, C. J. C., Lara, A. A. G., & Miguel, R.

A. (2005). Introducción a los

indicadores económicos y sociales de

México. Unam. Recuperado a partir

de

http://books.google.es/books?hl=es&l

r=&id=AmDbuTdEw7gC&oi=fnd&p

g=PA11&dq=introduccion+a+los+in

dicadores+economicos+y+sociales+d

e+m%C3%A9xico&ots=kPfi5DHU1

0&sig=oAe-

4Kb4snrcArCAsRLAbbVgDBg

Delgado, P., & Salcedo, T. (2010). Aspectos

conceptuales sobre los indicadores de

calidad de vida. La Sociología en sus

escenarios, (17). Recuperado a partir

de

http://aprendeenlinea.udea.edu.co/rev

istas/index.php/ceo/article/viewArticl

e/6803

Desarrollo, P. de las N. U. para el. (2010).

Informe Nacional sobre Desarrollo

Humano 2010: Desarrollo humano



en Argentina: trayectos y nuevos

desafíos. PNUD Buenos Aires.

Feres, J. C., & Mancero, X. (2001a). El

método de las necesidades básicas

insatisfechas (NBI) y sus

aplicaciones en América Latina.

Cepal. Recuperado a partir de

http://repositorio.cepal.org/handle/11

362/4784

Feres, J. C., & Mancero, X. (2001b).

Enfoques para la medición de la

pobreza: breve revisión de la

literatura. CEPAL. Recuperado a

partir de

http://repositorio.cepal.org/handle/11

362/4740

Guajarati, D. N. (2003). Econometría.

Recuperado a partir de

http://www.cib.espol.edu.ec/catalogo/

53918/detallesCatalogo.aspx

INDEC. (1984). La pobreza en Argentina.

Instituto Nacional de Estadísticay

Censos.

Sen, A. (1985). A sociological approach to

the measurement of poverty: a reply

to Professor Peter Townsend. Oxford

Economic Papers, 669–676.

Spicker, P. (1999). Definitions of poverty:

eleven clusters of meaning. The

international glossary on poverty.

London: Zed Books, 150–62.



ANEXOS 1: ESTIMACIÓN DE REGRESIONES

REGRESIÓN INICIAL

PRUEBA STEPWISE

PRUEBA MWD

REGRESIÓN LINEAL CON ZI



REGRESIÓN LOGARÍTMICA CON Z2

ANEXOS 2: VERIFICACIÓN DEL MODELO ECONOMÉTRICO

PRUEBA DE MULTICOLINEALIDAD

PRUEBA DE HETEROSCEDASTICIDAD

PRUEBA DE AUTOCORRELACIÓN



AUTOCORRELACIÓN CON 4 REZAGOS

PRUEBA DE CAMBIO ESTRUCTURAL

PRUEBA DE NORMALIDAD EN LOS ERRORES

PRUEBA DE BUENA ESPECIFICACIÓN

estimación de un modelo econométrico de respuesta lineal para el indice de necesidades básicas...

Documents

necesidades especficas

in that sense

obtained for that index

an econometric model

regresin lineal

linear regression

good specification and

method that allows