estimacion del modelo de variable dependiente binaria

42
“UNIVERSIDAD NACIONAL DE PIURA” FACULTAD DE ECONOMÍA” “ESTIMACION DEL MODELO DE VARIABLE DEPENDIENTE BINARIA EMPLEO PARA LIMA METROPOLITANA: trimestre febrero-marzo-abril 2010” PROFESOR: CURSO: ALUMNA: CUSCO-PERÚ 1

Upload: cielo-hm

Post on 13-Apr-2015

21 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Estimacion Del Modelo de Variable Dependiente Binaria

“UNIVERSIDAD NACIONAL DE PIURA”

“FACULTAD DE ECONOMÍA”

“ESTIMACION DEL MODELO DE VARIABLE DEPENDIENTE BINARIA EMPLEO PARA LIMA METROPOLITANA: trimestre febrero-marzo-abril 2010”

PROFESOR:

CURSO:

ALUMNA:

CUSCO-PERÚ

12 DE septiembre DE 2011.

1

Page 2: Estimacion Del Modelo de Variable Dependiente Binaria

TITULO:

UN MODELO ECONOMETRICO PARA EL EMPLEO EN EL DEPARTAMENTO DE LIMA METROPOLITANA

PERIODO 2010

2

Page 3: Estimacion Del Modelo de Variable Dependiente Binaria

INTRODUCCIÓN

Principalmente las políticas económicas están basadas tanto en

aspectos teóricos como en la evidencia empírica relacionada con el área en la

cual se está actuando. La teoría económica aporta las relaciones entre las

variables y los principios básicos que explican tanto su comportamiento, como

el posible tipo de función matemática que las entrelaza. Por su parte, la

evidencia empírica muestra la relación que existe en el mundo real entre las

variables estudiadas con respecto a un fenómeno económico determinado.

La econometría es aquella ciencia que se encarga de darnos los

métodos necesarios para comunicar ambos mundos, el teórico y el real,

mediante bases teóricas y procedimientos que facilitan la formulación y

estimación de modelos económicos para de esta manera explicar el

comportamiento de la variable en estudio durante un período en referencia,

asimismo nos permite hacer inferencia y pronostico de la misma con base en

las variables independientes seleccionadas en el modelo.

Todo este proceso contemplado en la econometría, nos permite la utilización

del modelo siendo el sustento teórico-práctico para formular políticas

relacionadas con el fenómeno en estudio.  

El fin de este trabajo es formular un modelo econométrico que muestre

una importancia que tiene el empleo en el Perú (Departamento de Lima) y logre

explicar su comportamiento satisfactoriamente. La formulación del modelo está

basada en la Teoría Económica, conjuntamente con la evidencia empírica

obtenida a través de la Encuesta Nacional de Hogares ENAHO 2010.

3

Page 4: Estimacion Del Modelo de Variable Dependiente Binaria

MARCO TEORICO

CAPITULO 1: MARCO TEÓRICO

1.1. MARCO REFERENCIAL

POBREZA:

Siguiendo el modelo propuesto por RAVALLION (1998), donde un hogar cuyas

preferencias se pueden representar por la siguiente función de utilidad u = u (q,

x), la de gasto del consumidor es e = e (p, x, u), que se interpreta como el costo

mínimo de un nivel de utilidad u para un hogar con características x cuando se

enfrenta a un vector de precios p, y q representa las canastas de bienes que

consume el hogar; e = e (p, x, u) cuando se evalúa en el nivel de utilidad real,

se corresponde al gasto total real en consumo y = p*q, para un hogar que

aumenta su utilidad. Si tomamos a uz como nivel de utilidad de referencia

necesario para escapar de la pobreza, la línea de ésta sería igual a: z = e (p, x,

uz).

La línea de pobreza es el costo del nivel mínimo de utilidad para escapar de la

pobreza a los precios corrientes y dadas las características personales del

hogar. Esta ecuación relaciona cómo ir de la pobreza en términos de utilidad a

la pobreza en términos de dinero, pero no cómo definir el nivel de utilidad de la

pobreza.

Podemos decir que un individuo no se encontrara en situación de pobreza si

posee un nivel de ingresos suficiente para cubrir una canasta de bienes básica;

esto se logra teniendo ingresos fijos provenientes de un empleo. De esta forma

diremos que una persona que trabaja tiene altas posibilidades de no ser pobre.

DESEMPLEO:

Desempleo, paro forzoso o desocupación de los asalariados que pueden y

quieren trabajar pero no encuentran un puesto de trabajo. En las sociedades en

4

Page 5: Estimacion Del Modelo de Variable Dependiente Binaria

las que la mayoría de la población vive de trabajar para los demás, el

no poder encontrar un trabajo es un grave problema. Debido a los costes

humanos derivados de la privación y del sentimiento de rechazo y de

fracaso personal, la cuantía del desempleo se utiliza habitualmente como una

medida del bienestar de los trabajadores. La proporción de trabajadores

desempleados también muestra si se están aprovechando adecuadamente los

recursos humanos del país y sirve como índice de la actividad económica.

Políticas de Empleo

La intervención del Estado para fomentar el empleo topa con grandes

dificultades. Las políticas expansivas pueden producir desagradables efectos

secundarios, provocando inestabilidad monetaria y otros desequilibrios. Si lo

que se busca es una oferta de empleo bien remunerado, sostenida a largo

plazo, habrá que actuar de forma muy cuidadosa para que no sea peor el

remedio que la enfermedad.

El aumento de la demanda de trabajadores puede conseguirse con medidas

fiscales que reduzcan los costes salariales para las empresas, bien reduciendo

las contribuciones obligatorias a la Seguridad Social (que tendrían que ser

substituidas por otros ingresos del Estado), bien subvencionando la

contratación de trabajadores que por alguna circunstancia sean menos

eficientes, minusválidos, jóvenes en su primer empleo, etc. La flexibilización de

los empleos, autorizando contratos temporales y facilitando los despidos,

supone de hecho abaratar los costes laborales de las empresas aunque

acosta de la precarización del empleo.

Finalmente siguen siendo muchos los partidarios de las tradicionales medidas

keynesianas de aumentar la demanda agregada mediante el aumento del

gasto público, bien mediante contratación directa por el Estado-patrón, bien

mediante la realización de obras o inversiones públicas. A pesar de las

argumentaciones de Friedman, los programas y gobiernos socialdemócratas

siguen siendo partidarios de políticas activas de creación de empleo

especialmente en países con tasas altas de paro.

5

Page 6: Estimacion Del Modelo de Variable Dependiente Binaria

1.2. EVIDENCIA EMPÍRICA:

GALDO, JARAMILLO Y MONTALVA (2009) evalúan el impacto de

PROJOVEN a lo largo de la distribución de los ingresos laborales; se concluye

que el diseño de PROJOVEN no constituye solamente un mecanismo efectivo

para mejorar la productividad de jóvenes económicamente desfavorecidos, sino

que también mejora la equidad entre los grupos de diversos niveles de

pobreza. Además descubrió que los impactos en ingresos como en el empleo

son mayores para mujeres que para hombres, es decir PROJOVEN ayuda a

reducir las brechas de género en el mercado laboral. Además la intervención

en capacitación que realiza PROJOVEN parece adecuada para producir

cambios en las ganancias pero no parece funcionar del mismo modo para el

empleo.

ISGUT (2002) realiza un estudio para determinar la relación entre el empleo no

agrícola y los ingresos de los individuos en Honduras, este trabajo concluye

que los años de escolaridad están positivamente asociados a la participación

en el empleo no agrícola asalariado, y negativamente asociados a la

participación en el empleo agrícola asalariado. Esta actividad es más común

entre los trabajadores más jóvenes, mientras que es menos probable que los

jefes de familia o sus esposas sean asalariados agrícolas. Los promedios de

escolaridad de los adultos en el hogar del trabajador, están positivamente

asociados a las ganancias del trabajador, esto indica que a mayor escolaridad

de las familias, mayor es su capacidad de obtener información sobre buenas

oportunidades de trabajo.

6

Page 7: Estimacion Del Modelo de Variable Dependiente Binaria

CONSTRUCCIÓN DE UN MODELO DE VARIABLE DEPENDIENTE BINARIA:

SECTOR: EMPLEO

Encuesta Permanente del Empleo (EPE): La EPE es una encuesta realizada por el INEI, la cual permite muestra indicadores de empleo e ingreso en el Área Metropolitana de Lima y Callao, para el seguimiento y análisis del mercado laboral, permite desarrollar indicadores anticipatorios de la evolución del empleo, sirve como fuente de información para futuras investigaciones tanto para entidades públicas como privadas.

Este tipo de encuesta tiene carácter móvil, pues sus resultados son publicados trimestralmente, para el caso de esta investigación se tomo el I trimestre del año 2010, y solo se cogió los datos del mes de marzo.

Año: 2010. - Marzo

Departamento: Lima Metropolitana

1. ESPECIFICACIÓN DEL MODELO

1.1 Ecuación Funcional

Ocu= f (sexo, edad, nivestu, negocio, hrastrab, pago, buscotra, trabantes, ingreso)

1.1.1 Definición de variables del modelo:

a) Variable dependiente cualitativa dicotómica

Ocu (Ocu200)= Se encuentra ocupado o empleado en algo actualmente

1= Se encuentra ocupado o empleado

0= No se encuentra ocupado o empleado

b) Variables explicativas del modelo:

1. Sexo:

1=Hombre0=Mujer

7

Page 8: Estimacion Del Modelo de Variable Dependiente Binaria

2. Edad: ¿Qué edad tiene en años cumplidos?

3. Nivestu: Nivel de Estudios

1=Superior (técnica o universitaria)0=No superior

4. Negocio: ¿Tiene algún negocio propio?

1=Si 0=No

5. Hrastrab: Total de horas que trabaja

6. Pago: ¿En su ocupación principal a usted le pagan?

1=Si0=No

7. Buscotra: ¿Ha hecho algo para conseguir trabajo?

1=Si0=No

8. Trabantes: Ha trabajado antes

1=Si0=NO

9. Ingreso: Ingreso total mensual

1.2 FUNCIÓN ECONOMETRICA

Occupation= 0 + 1 sexo i + 2 edadi + 3nivestu i + 4 negocio i + 5 hrastrab i + 6

pagoi + 7 buscotra i + 8 trabantes i + 9 ingreso+ Ut i

Loa signos esperados de los parámetros son:

0: Parámetro Autónomo

8

Page 9: Estimacion Del Modelo de Variable Dependiente Binaria

1 ><0: El grado de sensibilidad de la variable dependiente respecto sexo se espera

que sea positivo.

2 <0: El grado de sensibilidad de la variable dependiente respecto a la edad se espera

que sea positivo o negativo.

3 >0: El grado de sensibilidad de la variable dependiente respecto al nivestu se espera

que sea positivo.

4 >0: El grado de sensibilidad de la variable dependiente respecto al negocio se espera que sea positivo.

5 >0: El grado de sensibilidad de la variable dependiente respecto a hrastrab se

espera sea de signo positivo.

6 >0: El grado de sensibilidad de la variable dependiente respecto al pago se espera

que sea de signo negativo.

7 >0: El grado de sensibilidad de la variable dependiente respecto a bucotra se espera

que sea de signo positivo.

8 >0: El grado de sensibilidad de la variable dependiente respecto a trabantes se espera

que sea de signo positivo.

9 >0: El grado de sensibilidad de la variable dependiente respecto al ingresos se espera

que sea de signo positivo.

9

Page 10: Estimacion Del Modelo de Variable Dependiente Binaria

ELABORACIÓN DEL MODELO LOGIT

Ocupacion= 0 + 1 sexo i + 2 edadi + 3nivestu i + 4 negocio i + 5 hrastrab i + 6

pagoi + 7 buscotra i + 8 trabantes i + 9 ingreso+ Ut i

1. REGRESIONES BIVARIANTES:

Rango: 1 3910 Yi=f(xi)Simple: 1 3600

ML1: LS OCUPACION C SEXO

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:08Sample (adjusted): 2 3909Included observations: 2977 after adjustmentsConvergence achieved after 3 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 0.575616 0.056124 10.25613 0.0000SEXO 0.001486 0.076587 0.019398 0.9845

Mean dependent var 0.640242     S.D. dependent var 0.480010S.E. of regression 0.480091     Akaike info criterion 1.307901Sum squared resid 685.6989     Schwarz criterion 1.311931Log likelihood -1944.811     Hannan-Quinn criter. 1.309351Restr. log likelihood -1944.811     Avg. log likelihood -0.653279LR statistic (1 df) 0.000376     McFadden R-squared 9.67E-08Probability(LR stat) 0.984524

Obs with Dep=0 1071      Total obs 2977Obs with Dep=1 1906

ML2: LS OCUPACION C EDAD

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:08Sample (adjusted): 2 3909Included observations: 2977 after adjustments

10

Page 11: Estimacion Del Modelo de Variable Dependiente Binaria

Convergence achieved after 4 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 1.106341 0.075385 14.67581 0.0000EDAD -0.015691 0.001874 -8.372240 0.0000

Mean dependent var 0.640242     S.D. dependent var 0.480010S.E. of regression 0.474567     Akaike info criterion 1.283938Sum squared resid 670.0119     Schwarz criterion 1.287968Log likelihood -1909.141     Hannan-Quinn criter. 1.285388Restr. log likelihood -1944.811     Avg. log likelihood -0.641297LR statistic (1 df) 71.34006     McFadden R-squared 0.018341Probability(LR stat) 0.000000

Obs with Dep=0 1071      Total obs 2977Obs with Dep=1 1906

ML3: LS OCUPACION C NIVESTU

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:09Sample (adjusted): 2 3909Included observations: 2766 after adjustmentsConvergence achieved after 3 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 0.614336 0.049843 12.32535 0.0000NIVESTU 0.255711 0.078236 -3.268437 0.0011

Mean dependent var 0.626175     S.D. dependent var 0.483905S.E. of regression 0.482934     Akaike info criterion 1.319314Sum squared resid 644.6343     Schwarz criterion 1.323598Log likelihood -1822.611     Hannan-Quinn criter. 1.320861Restr. log likelihood -1828.216     Avg. log likelihood -0.658934LR statistic (1 df) 11.20960     McFadden R-squared 0.003066Probability(LR stat) 0.000814

Obs with Dep=0 1034      Total obs 2766Obs with Dep=1 1732

11

Page 12: Estimacion Del Modelo de Variable Dependiente Binaria

ML4: LS OCUPACION C NEGOCIO

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:09Sample (adjusted): 7 3904Included observations: 947 after adjustmentsConvergence achieved after 3 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 0.535303 0.068388 7.827392 0.0000NEGOCIO -0.000133 4.07E-05 -3.275808 0.0011

Mean dependent var 0.620908     S.D. dependent var 0.485417S.E. of regression 0.482521     Akaike info criterion 1.318967Sum squared resid 220.0206     Schwarz criterion 1.329217Log likelihood -622.5309     Hannan-Quinn criter. 1.322873Restr. log likelihood -628.4461     Avg. log likelihood -0.657372LR statistic (1 df) 11.83029     McFadden R-squared 0.009412Probability(LR stat) 0.000583

Obs with Dep=0 359      Total obs 947Obs with Dep=1 588

ML5: LS OCUPACION C HRASTRAB

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:10Sample (adjusted): 3 3909Included observations: 1617 after adjustmentsConvergence achieved after 3 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 0.581442 0.130894 4.442074 0.0000HRASTRAB -0.002151 0.002492 -0.863440 0.3879

Mean dependent var 0.617192     S.D. dependent var 0.486222S.E. of regression 0.486259     Akaike info criterion 1.332856Sum squared resid 381.8639     Schwarz criterion 1.339521Log likelihood -1075.614     Hannan-Quinn criter. 1.335329

12

Page 13: Estimacion Del Modelo de Variable Dependiente Binaria

Restr. log likelihood -1075.987     Avg. log likelihood -0.665191LR statistic (1 df) 0.746291     McFadden R-squared 0.000347Probability(LR stat) 0.387653

Obs with Dep=0 619      Total obs 1617Obs with Dep=1 998

ML6: LS OCUPACION C PAGO

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:11Sample (adjusted): 5 3909Included observations: 1288 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 0.067992 0.167337 0.406319 0.6845PAGO 0.344809 0.176486 1.953751 0.0507

Mean dependent var 0.593168     S.D. dependent var 0.491434S.E. of regression 0.490835     Akaike info criterion 1.351052Sum squared resid 309.8217     Schwarz criterion 1.359066Log likelihood -868.0776     Hannan-Quinn criter. 1.354060Restr. log likelihood -870.2821     Avg. log likelihood -0.673973LR statistic (1 df) 4.409086     McFadden R-squared 0.002533Probability(LR stat) 0.035748

Obs with Dep=0 524      Total obs 1288Obs with Dep=1 764

ML7: LS OCUPACION C BUSCOTRA

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:11Sample (adjusted): 3 3909Included observations: 1617 after adjustmentsConvergence achieved after 3 iterations

13

Page 14: Estimacion Del Modelo de Variable Dependiente Binaria

Covariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 0.492581 0.055082 8.942746 0.0000BUSCOTRA -0.110106 0.148827 -0.739821 0.4594

Mean dependent var 0.617192     S.D. dependent var 0.486222S.E. of regression 0.486290     Akaike info criterion 1.332981Sum squared resid 381.9126     Schwarz criterion 1.339645Log likelihood -1075.715     Hannan-Quinn criter. 1.335454Restr. log likelihood -1075.987     Avg. log likelihood -0.665254LR statistic (1 df) 0.544434     McFadden R-squared 0.000253Probability(LR stat) 0.460601

Obs with Dep=0 619      Total obs 1617Obs with Dep=1 998

ML8: LS OCUPACION C TRABANTES

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 09:03Sample (adjusted): 21 3904Included observations: 499 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 3.218876 0.509902 6.312735 0.0000TRABANTES 0.952944 0.655162 1.454517 0.1458

Mean dependent var 0.979960     S.D. dependent var 0.140278S.E. of regression 0.140099     Akaike info criterion 0.200527Sum squared resid 9.755015     Schwarz criterion 0.217411Log likelihood -48.03141     Hannan-Quinn criter. 0.207153Restr. log likelihood -48.99933     Avg. log likelihood -0.096255LR statistic (1 df) 1.935841     McFadden R-squared 0.019754Probability(LR stat) 0.164121

Obs with Dep=0 10      Total obs 499Obs with Dep=1 489

14

Page 15: Estimacion Del Modelo de Variable Dependiente Binaria

ML9: LS OCUPACION C INGRESO

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:12Sample (adjusted): 3 3909Included observations: 1600 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 0.505625 0.067787 7.459047 0.0000INGRESO -2.49E-05 3.73E-05 -0.666377 0.5052

Mean dependent var 0.616875     S.D. dependent var 0.486300S.E. of regression 0.486391     Akaike info criterion 1.333371Sum squared resid 378.0490     Schwarz criterion 1.340093Log likelihood -1064.697     Hannan-Quinn criter. 1.335867Restr. log likelihood -1064.917     Avg. log likelihood -0.665435LR statistic (1 df) 0.441042     McFadden R-squared 0.000207Probability(LR stat) 0.506620

Obs with Dep=0 613      Total obs 1600Obs with Dep=1 987

15

Page 16: Estimacion Del Modelo de Variable Dependiente Binaria

2. SELECCIÓN DE VARIABLES:

En el cuadro se muestra las variables que ya han sido seleccionadas en base a los critrios

estadísticos. Por lo tanto el modelo queda especificado de la siguiente forma:

Ocuàcion= 0 + 1 edad i + 2 nivestui + 3 pagoi + U

3. ANALISIS DE MULTICOLINEALIDAD: (< 0.5). En este punto se construye la

matriz de correlación, con la cual concluimos que no se eliminan ninguna variable ya

que ninguna genera multicolinealidad..

MATRIZ DE CORRELACON

EDAD NIVESTU PAGO

EDAD  1.000000  0.078643  0.003948

NIVESTU  0.078643  1.000000  0.054468

PAGO  0.003948  0.054468  1.000000

Por lo tanto en esta segunda etapa nuestro modelo seria

16

VARIABLE SIGNO Significanci

a

R2 Mc FADENN

0.2<R2<0.6Selec.

Esperado Estimad

o

Sexo + + 0.9845 No sig 9.67E-08 malo NO

Edad - - 0.0000 Altasig 0.018341 malo SI

Nivestu + + 0.0011 Alta sig 0.003066 malo SI

Negocio + - 0.0011 Alta sig 0.009412 malo NO

Hrastrab + - 0.38 No sig 0.000347 malo NO

Pago + + 0.0507 sig 0.002533 malo SI

Buscotra + + 0.4594 No sig 0.000253malo NO

Trabantes + - 0.1458 No sig 0.019754 malo NO

Ingreso + - 0.5052 No sig 0.000207 malo No

Page 17: Estimacion Del Modelo de Variable Dependiente Binaria

Ocu= f(edadi , nivestu I, pago )

LUEGO REGRECIONAMOS EL MODELO LOGIT CON LAS VARIABLES SELECCIONADAS

2. ESTIMACION DEL MODELO MULTIVARIANTE

Ocuàcion= 0 + 1 edad i + 2 nivestui + 3 pagoi + U

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:13Sample (adjusted): 5 3600Included observations: 1151 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 0.567133 0.233417 2.429695 0.0151EDAD -0.016414 0.004066 -4.037424 0.0001

NIVESTU -0.348614 0.122672 -2.841827 0.0045PAGO 0.550889 0.205233 2.684218 0.0073

Mean dependent var 0.582103     S.D. dependent var 0.493428S.E. of regression 0.487354     Akaike info criterion 1.338228Sum squared resid 272.4290     Schwarz criterion 1.355773Log likelihood -766.1505     Hannan-Quinn criter. 1.344851Restr. log likelihood -782.2245     Avg. log likelihood -0.665639LR statistic (3 df) 32.14806     McFadden R-squared 0.020549Probability(LR stat) 4.87E-07

Obs with Dep=0 481      Total obs 1151Obs with Dep=1 670

17

Page 18: Estimacion Del Modelo de Variable Dependiente Binaria

3. EVALUACION DEL MODELO

1º signos

Signo esperado Signo estimado

EDAD- -

NIVESTU+ -

PAGO+ +

2º Significancia Individual

variables probabilidad Significancia

Edad

Nivestu

Pago

0.0001

0.0045

0.0073

Alta sig

Alta sig.

Alta sig.

3º Significancia Conjunta

H0: Bj = 0 (Los parámetros no son significativos, y en consecuencia el modelo en su conjunto no es significativo.).H1: Bj ≠ 0 (Los parámetros son significativos, y en consecuencia el modelo en su conjunto es significativo).

El estadístico de prueba es: LR Chi- Cuadrado.

LR =-2(ln l¿

(r )−lnl¿

(ur )) v/s X (0.95 ,3 )2 = 7.81

Entonces:

lr=-2*(-782.224532220058-(-766.15050142041))= 32.14806

18

Page 19: Estimacion Del Modelo de Variable Dependiente Binaria

2)3,95.0(X 7.81

LR > X (0.95 ,3 )

2

Se rechaza H0, por lo tanto el modelo en su conjunto es estadísticamente significativo. Por lo tanto, podemos concluir que las variables exógenas explican conjuntamente los valores de la variable dependiente cualitativa.

4º Coeficiente de Bondad de Ajuste:

R2Mc−Fadden=1−lnLURlnLR

r2mcf=1-(-766.15050142041/-782.224532220058)= 0.020549

El modelo es bueno ya que el McFadden R-squared esta entre 0.2<0.206712<0.6

RCorrelacion

2 =0. 1643

El R2 de correlación no es aceptable dado que no se encuentra comprendido entre 0.2 y 0.6.

RConteo2 =nº pred .correctas

nº total .observ .=668

1151=0 .5804

Por lo tanto se puede afirmar que nuestro modelo predice correctamente el 58.04% de las observaciones

Percent Gain (probabilidad=0.5): esta tabla nos permite observar que el modelo estimado esta ganando en 21.51% en capacidad predictiva con respecto al modelo de probabilidad constante.

19

Page 20: Estimacion Del Modelo de Variable Dependiente Binaria

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 17:13Sample (adjusted): 5 3600Included observations: 1151 after adjustmentsPrediction Evaluation (success cutoff C = 0.5)

           Estimated Equation            Constant ProbabilityDep=0 Dep=1 Total Dep=0 Dep=1 Total

P(Dep=1)<=C 93 95 188 0 0 0P(Dep=1)>C 388 575 963 481 670 1151

Total 481 670 1151 481 670 1151Correct 93 575 668 0 670 670

% Correct 19.33 85.82 58.04 0.00 100.00 58.21% Incorrect 80.67 14.18 41.96 100.00 0.00 41.79Total Gain* 19.33 -14.18 -0.17

Percent Gain** 19.33 NA -0.42

           Estimated Equation            Constant ProbabilityDep=0 Dep=1 Total Dep=0 Dep=1 Total

E(# of Dep=0) 208.64 272.36 481.00 201.01 279.99 481.00E(# of Dep=1) 272.36 397.64 670.00 279.99 390.01 670.00

Total 481.00 670.00 1151.00 481.00 670.00 1151.00Correct 208.64 397.64 606.28 201.01 390.01 591.02

% Correct 43.38 59.35 52.67 41.79 58.21 51.35% Incorrect 56.62 40.65 47.33 58.21 41.79 48.65Total Gain* 1.59 1.14 1.33

Percent Gain** 2.72 2.72 2.72

Normalidad de los residuos

- H0= Los residuos se distribuyen con una normal.

20

Page 21: Estimacion Del Modelo de Variable Dependiente Binaria

Se compara el Jarque-Bera contra el chi-cuadrado

JB= 171.9668 VS X (0.95 ,2)

2 = 5.99

Como el JB es mayor al Chi-cuadrado, se rechaza la hipótesis nula, concluyendo que los

residuos no se distribuyen con una normal.

6. COMPARACION DEL MODELO LOGIT Y PROBIT

MODELO PROBIT

Ocuàcion= 0 + 1 edad i + 2 nivestui + 3 pagoi + U

Dependent Variable: OCUPACIONMethod: ML - Binary Probit (Quadratic hill climbing)Date: 10/09/11 Time: 10:59Sample (adjusted): 5 3600Included observations: 1151 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 0.353611 0.145569 2.429168 0.0151EDAD -0.010226 0.002515 -4.066159 0.0000

NIVESTU -0.217698 0.076096 -2.860822 0.0042PAGO 0.343216 0.128059 2.680134 0.0074

Mean dependent var 0.582103     S.D. dependent var 0.493428S.E. of regression 0.487331     Akaike info criterion 1.338124Sum squared resid 272.4028     Schwarz criterion 1.355668Log likelihood -766.0902     Hannan-Quinn criter. 1.344746

21

Page 22: Estimacion Del Modelo de Variable Dependiente Binaria

Restr. log likelihood -782.2245     Avg. log likelihood -0.665587LR statistic (3 df) 32.26871     McFadden R-squared 0.020626Probability(LR stat) 4.59E-07

Obs with Dep=0 481      Total obs 1151Obs with Dep=1 670

Para comparar construimos la siguiente tabla:

MODELO LOGIT PROBIT

R2MC FADDEN

0.206712 MAYOR0.02062

AKAIKE1.338228 1.338124 MENOR

SCHWARZ 1.3557731.355668 MENOR

HANNAN QUINN

1.344851 1.344746 MENOR

Por el criterio del R2 el modelo Logit es el mejor modelo pues este es mayor que el R2 del modelo Probi, según el criterio del AKAIKE, SCHWARZ y el HANNAN QUINN el mejor modelo es el Probit pues estos estimadores son menores en este modelo. Pero tales estimadores son casi iguales y la diferencia es solo de centésimas, asi que elegiremos al modelo Logia como mejor modelo.

Por lo tanto el mejor modelo es el modelo Logia.

7. EFECTOS MARGINALES

Para el modelo Logit

∂Pi∂X ij

=EMgX=β j Pi(1−Pi)

Donde: - Pi: La variable endógena proyectada- Bi: El parámetro asociado a la variable exógena.

22

Page 23: Estimacion Del Modelo de Variable Dependiente Binaria

Efectos Promedios

a) Efecto marginal de Edad= -0.003878

b) Efecto marginal de Nivestu= -0.082370

c) Efecto marginal de Pago= 0.130163

MODELO DE PROBABILIDAD LINEAL

23

Page 24: Estimacion Del Modelo de Variable Dependiente Binaria

a) Primero estimamos por MCO y predecimos para hallar la varianza.

En el comando escribimos: Genr vau= y(1-y)

genr vau=ocupacionf2*(1-ocuf2)

b) Luego estimamos el modelo de probabilidad lineal

Dependent Variable: OCUPACIONMethod: Least SquaresDate: 10/09/11 Time: 11:22Sample (adjusted): 3606 3909Included observations: 105 after adjustmentsWeighting series: 1/SQR(VAR)

Variable Coefficient Std. Error t-Statistic Prob.

C 0.855748 0.173825 4.923036 0.0000EDAD -0.006678 0.003249 -2.055533 0.0424

NIVESTU -0.036780 0.092502 -0.397613 0.6918PAGO 0.040684 0.160000 0.254273 0.7998

Weighted Statistics

R-squared 0.085630     Mean dependent var 0.662935Adjusted R-squared 0.058471     S.D. dependent var 0.484779S.E. of regression 0.470393     Akaike info criterion 1.366855Sum squared resid 22.34825     Schwarz criterion 1.467959Log likelihood -67.75990     F-statistic 1.504437Durbin-Watson stat 1.265254     Prob(F-statistic) 0.217973

Unweighted Statistics

R-squared 0.035667     Mean dependent var 0.657143Adjusted R-squared 0.007024     S.D. dependent var 0.476941S.E. of regression 0.475263     Sum squared resid 22.81336Durbin-Watson stat 1.299452

8. PREDICCION DEL MODELO PROBIT

24

Page 25: Estimacion Del Modelo de Variable Dependiente Binaria

Para este ítem se evaluara la capacidad predictiva del modelo en base a los 316 últimos datos, luego se procederá a calcular el R2 de Conteo.

Rango: 1 – 3910Sample: 3601 3910

Utilizando el modelo Logit, para las 310 últimas observaciones, predecimos la variable ocupacion→ ocupaciónf1

Aplicando el siguiente criterio Ocupacionf1>0.5 →1 Ocupacionf1Ocupacionf1<=0.5 →0

PREDICCION

25

Page 26: Estimacion Del Modelo de Variable Dependiente Binaria

obs OCUPACION OCUPACIONF13601 NA NA3602 NA 1.0000003603 NA NA3604 NA NA3605 1.000000 NA3606 1.000000 1.0000003607 1.000000 1.0000003608 NA 1.0000003609 1.000000 NA3610 1.000000 NA3611 1.000000 1.0000003612 0.000000 NA3613 1.000000 NA3614 1.000000 1.0000003615 0.000000 1.0000003616 NA NA3617 NA NA3618 1.000000 NA3619 0.000000 NA3620 1.000000 NA3621 1.000000 1.0000003622 NA 1.0000003623 NA NA3624 1.000000 NA3625 0.000000 NA3626 NA NA3627 NA NA3628 NA NA3629 1.000000 NA3630 1.000000 1.0000003631 NA NA3632 1.000000 NA3633 1.000000 1.0000003634 0.000000 1.0000003635 NA NA3636 NA NA3637 NA NA3638 1.000000 NA3639 0.000000 0.0000003640 0.000000 NA3641 NA 1.0000003642 NA 1.0000003643 NA NA3644 0.000000 NA3645 1.000000 NA3646 0.000000 1.0000003647 1.000000 NA3648 1.000000 1.000000

26

Page 27: Estimacion Del Modelo de Variable Dependiente Binaria

3649 NA 1.0000003650 1.000000 NA3651 NA NA3652 1.000000 NA3653 NA 1.0000003654 NA NA3655 1.000000 NA3656 1.000000 NA3657 NA NA3658 NA 1.0000003659 1.000000 NA3660 0.000000 1.0000003661 1.000000 NA3662 1.000000 1.0000003663 1.000000 NA3664 1.000000 NA3665 1.000000 1.0000003666 NA NA3667 1.000000 NA3668 0.000000 1.0000003669 NA NA3670 NA 1.0000003671 NA NA3672 1.000000 NA3673 0.000000 1.0000003674 1.000000 NA3675 0.000000 1.0000003676 1.000000 NA3677 NA 1.0000003678 NA NA3679 1.000000 NA3680 1.000000 1.0000003681 NA 1.0000003682 NA NA3683 NA NA3684 1.000000 1.0000003685 1.000000 NA3686 0.000000 1.0000003687 1.000000 NA3688 1.000000 1.0000003689 1.000000 1.0000003690 1.000000 NA3691 NA 1.0000003692 NA NA3693 1.000000 NA3694 1.000000 1.0000003695 1.000000 1.0000003696 1.000000 1.0000003697 1.000000 1.0000003698 1.000000 1.0000003699 NA NA

27

Page 28: Estimacion Del Modelo de Variable Dependiente Binaria

3700 0.000000 NA3701 1.000000 NA3702 0.000000 1.0000003703 NA NA3704 NA NA3705 1.000000 NA3706 1.000000 1.0000003707 1.000000 1.0000003708 NA 1.0000003709 1.000000 NA3710 1.000000 1.0000003711 NA 0.0000003712 NA NA3713 1.000000 NA3714 1.000000 1.0000003715 1.000000 1.0000003716 NA 1.0000003717 NA NA3718 1.000000 NA3719 0.000000 0.0000003720 0.000000 NA3721 1.000000 NA3722 NA NA3723 0.000000 NA3724 0.000000 NA3725 1.000000 NA3726 0.000000 0.0000003727 0.000000 NA3728 0.000000 NA3729 0.000000 NA3730 0.000000 NA3731 1.000000 NA3732 1.000000 0.0000003733 0.000000 1.0000003734 0.000000 NA3735 NA NA3736 NA NA3737 NA NA3738 1.000000 NA3739 1.000000 1.0000003740 0.000000 1.0000003741 NA NA3742 NA NA3743 1.000000 NA3744 1.000000 1.0000003745 1.000000 1.0000003746 1.000000 1.0000003747 0.000000 1.0000003748 0.000000 NA3749 0.000000 NA3750 1.000000 NA

28

Page 29: Estimacion Del Modelo de Variable Dependiente Binaria

3751 1.000000 1.0000003752 1.000000 1.0000003753 1.000000 0.0000003754 1.000000 1.0000003755 NA NA3756 0.000000 NA3757 1.000000 NA3758 1.000000 1.0000003759 0.000000 1.0000003760 1.000000 0.0000003761 NA NA3762 NA NA3763 1.000000 NA3764 0.000000 1.0000003765 0.000000 NA3766 1.000000 NA3767 NA NA3768 NA NA3769 0.000000 NA3770 0.000000 NA3771 1.000000 NA3772 1.000000 1.0000003773 0.000000 1.0000003774 0.000000 NA3775 1.000000 NA3776 0.000000 1.0000003777 0.000000 NA3778 NA NA3779 1.000000 NA3780 1.000000 1.0000003781 0.000000 1.0000003782 1.000000 NA3783 0.000000 1.0000003784 NA NA3785 0.000000 NA3786 0.000000 NA3787 1.000000 NA3788 0.000000 NA3789 NA NA3790 NA NA3791 0.000000 NA3792 1.000000 NA3793 1.000000 1.0000003794 1.000000 1.0000003795 NA NA3796 1.000000 NA3797 1.000000 1.0000003798 1.000000 1.0000003799 NA 1.0000003800 1.000000 NA3801 0.000000 1.000000

29

Page 30: Estimacion Del Modelo de Variable Dependiente Binaria

3802 0.000000 NA3803 0.000000 NA3804 0.000000 NA3805 1.000000 NA3806 1.000000 1.0000003807 0.000000 NA3808 1.000000 NA3809 1.000000 0.0000003810 1.000000 1.0000003811 0.000000 NA3812 1.000000 NA3813 NA NA3814 NA 1.0000003815 1.000000 NA3816 1.000000 NA3817 1.000000 1.0000003818 0.000000 1.0000003819 0.000000 0.0000003820 1.000000 NA3821 NA 0.0000003822 1.000000 1.0000003823 1.000000 NA3824 NA 1.0000003825 1.000000 NA3826 0.000000 NA3827 1.000000 0.0000003828 NA NA3829 NA 1.0000003830 1.000000 NA3831 1.000000 1.0000003832 1.000000 1.0000003833 1.000000 1.0000003834 1.000000 1.0000003835 1.000000 1.0000003836 1.000000 1.0000003837 1.000000 0.0000003838 1.000000 NA3839 0.000000 1.0000003840 NA NA3841 0.000000 1.0000003842 0.000000 1.0000003843 0.000000 1.0000003844 0.000000 1.0000003845 0.000000 0.0000003846 1.000000 1.0000003847 NA 1.0000003848 NA 1.0000003849 0.000000 NA3850 1.000000 1.0000003851 1.000000 NA3852 1.000000 1.000000

30

Page 31: Estimacion Del Modelo de Variable Dependiente Binaria

3853 1.000000 1.0000003854 NA NA3855 1.000000 NA3856 0.000000 1.0000003857 NA NA3858 1.000000 NA3859 1.000000 1.0000003860 NA NA3861 NA 1.0000003862 0.000000 NA3863 1.000000 1.0000003864 1.000000 NA3865 1.000000 1.0000003866 NA NA3867 1.000000 NA3868 1.000000 NA3869 1.000000 1.0000003870 NA NA3871 1.000000 1.0000003872 0.000000 NA3873 1.000000 NA3874 0.000000 1.0000003875 NA NA3876 1.000000 NA3877 1.000000 1.0000003878 1.000000 0.0000003879 1.000000 1.0000003880 NA NA3881 NA NA3882 0.000000 NA3883 1.000000 NA3884 1.000000 NA3885 NA 0.0000003886 NA 1.0000003887 NA NA3888 NA NA3889 1.000000 1.0000003890 0.000000 1.0000003891 NA NA3892 1.000000 NA3893 0.000000 1.0000003894 1.000000 NA3895 1.000000 NA3896 NA 1.0000003897 1.000000 NA3898 0.000000 1.0000003899 NA NA3900 NA 1.0000003901 NA NA3902 1.000000 NA3903 0.000000 1.000000

31

Page 32: Estimacion Del Modelo de Variable Dependiente Binaria

3904 1.000000 NA3905 NA 1.0000003906 NA NA3907 NA NA3908 1.000000 1.0000003909 1.000000 1.0000003910 NA NA

Luego se procede a generar la variable dife:

GENR D1=OCUPACION-OCUPACIONF1

Descriptive Statistics for DIFECategorized by values of DIFEDate: 10/09/11 Time: 11:17Sample (adjusted): 3606 3909Included observations: 105 after adjustments

DIFE  Mean  Std. Dev.  Obs.-1 -1.000000 0.000000 310 0.000000 0.000000 671 1.000000 0.000000 7

All -0.228571 0.559140 105

RConteo2 =nº pred .correctas

nº total .observ .=67

105=0 .6380

El modelo predice bien a los individuos que no se encuentran ocupados por ahora en

algún empleo o trabajo.

Con un R2 de Conteo de 0.638 podemos concluir que el modelo predice bien el 63,8%

de las observaciones.

32

Page 33: Estimacion Del Modelo de Variable Dependiente Binaria

CONCLUSION

El mejor modelo resultante fue el modelo Logit, dado que cuenta con mejores estimadores y con un mejor R2 a comparación del modelo Probit, sin embargo los resultados varían por solo centésimas, por ello se puede considerar indiferente a la hora de elegir entre uno u otro. La predicción también no están acertada pues solo predice bien el 63% de las observaciones, esto debido a la falta de valores en varias observaciones.

33

Page 34: Estimacion Del Modelo de Variable Dependiente Binaria

BIBLIOGRAFÍA

1.- ARRANZ J.; GARCÍA, C. (2009) “Pobreza en España”. Universidad de

España.

2.- JARAMILLO, M. y MONTALVA, V. (2009) “Pobreza e impactos

heterogéneos de las políticas activas de empleo juvenil: el caso de PROJOVEN

en el Perú”. Documento de Trabajo N° 54; Grupo de Análisis para el Desarrollo

GRADE. Lima.

3.- LANJOUW P. (1996) “Empleo no agrícola y pobreza en El Salvador Rural”.

Banco Mundial. El Salvador.

4.- Cuadros estadísticos: De Lima Metropolitana y la Provincia Constitucional del Callao.Página Web (MICRODATOS INEI)

34