estimacion del modelo de variable dependiente binaria

“UNIVERSIDAD NACIONAL DE PIURA”

“FACULTAD DE ECONOMÍA”

“ESTIMACION DEL MODELO DE VARIABLE DEPENDIENTE BINARIA EMPLEO PARA LIMA METROPOLITANA: trimestre febrero-marzo-abril 2010”

PROFESOR:

CURSO:

ALUMNA:

CUSCO-PERÚ

12 DE septiembre DE 2011.

1

TITULO:

UN MODELO ECONOMETRICO PARA EL EMPLEO EN EL DEPARTAMENTO DE LIMA METROPOLITANA

PERIODO 2010

2

INTRODUCCIÓN

Principalmente las políticas económicas están basadas tanto en

aspectos teóricos como en la evidencia empírica relacionada con el área en la

cual se está actuando. La teoría económica aporta las relaciones entre las

variables y los principios básicos que explican tanto su comportamiento, como

el posible tipo de función matemática que las entrelaza. Por su parte, la

evidencia empírica muestra la relación que existe en el mundo real entre las

variables estudiadas con respecto a un fenómeno económico determinado.

La econometría es aquella ciencia que se encarga de darnos los

métodos necesarios para comunicar ambos mundos, el teórico y el real,

mediante bases teóricas y procedimientos que facilitan la formulación y

estimación de modelos económicos para de esta manera explicar el

comportamiento de la variable en estudio durante un período en referencia,

asimismo nos permite hacer inferencia y pronostico de la misma con base en

las variables independientes seleccionadas en el modelo.

Todo este proceso contemplado en la econometría, nos permite la utilización

del modelo siendo el sustento teórico-práctico para formular políticas

relacionadas con el fenómeno en estudio.

El fin de este trabajo es formular un modelo econométrico que muestre

una importancia que tiene el empleo en el Perú (Departamento de Lima) y logre

explicar su comportamiento satisfactoriamente. La formulación del modelo está

basada en la Teoría Económica, conjuntamente con la evidencia empírica

obtenida a través de la Encuesta Nacional de Hogares ENAHO 2010.

3

MARCO TEORICO

CAPITULO 1: MARCO TEÓRICO

1.1. MARCO REFERENCIAL

POBREZA:

Siguiendo el modelo propuesto por RAVALLION (1998), donde un hogar cuyas

preferencias se pueden representar por la siguiente función de utilidad u = u (q,

x), la de gasto del consumidor es e = e (p, x, u), que se interpreta como el costo

mínimo de un nivel de utilidad u para un hogar con características x cuando se

enfrenta a un vector de precios p, y q representa las canastas de bienes que

consume el hogar; e = e (p, x, u) cuando se evalúa en el nivel de utilidad real,

se corresponde al gasto total real en consumo y = p*q, para un hogar que

aumenta su utilidad. Si tomamos a uz como nivel de utilidad de referencia

necesario para escapar de la pobreza, la línea de ésta sería igual a: z = e (p, x,

uz).

La línea de pobreza es el costo del nivel mínimo de utilidad para escapar de la

pobreza a los precios corrientes y dadas las características personales del

hogar. Esta ecuación relaciona cómo ir de la pobreza en términos de utilidad a

la pobreza en términos de dinero, pero no cómo definir el nivel de utilidad de la

pobreza.

Podemos decir que un individuo no se encontrara en situación de pobreza si

posee un nivel de ingresos suficiente para cubrir una canasta de bienes básica;

esto se logra teniendo ingresos fijos provenientes de un empleo. De esta forma

diremos que una persona que trabaja tiene altas posibilidades de no ser pobre.

DESEMPLEO:

Desempleo, paro forzoso o desocupación de los asalariados que pueden y

quieren trabajar pero no encuentran un puesto de trabajo. En las sociedades en

4

las que la mayoría de la población vive de trabajar para los demás, el

no poder encontrar un trabajo es un grave problema. Debido a los costes

humanos derivados de la privación y del sentimiento de rechazo y de

fracaso personal, la cuantía del desempleo se utiliza habitualmente como una

medida del bienestar de los trabajadores. La proporción de trabajadores

desempleados también muestra si se están aprovechando adecuadamente los

recursos humanos del país y sirve como índice de la actividad económica.

Políticas de Empleo

La intervención del Estado para fomentar el empleo topa con grandes

dificultades. Las políticas expansivas pueden producir desagradables efectos

secundarios, provocando inestabilidad monetaria y otros desequilibrios. Si lo

que se busca es una oferta de empleo bien remunerado, sostenida a largo

plazo, habrá que actuar de forma muy cuidadosa para que no sea peor el

remedio que la enfermedad.

El aumento de la demanda de trabajadores puede conseguirse con medidas

fiscales que reduzcan los costes salariales para las empresas, bien reduciendo

las contribuciones obligatorias a la Seguridad Social (que tendrían que ser

substituidas por otros ingresos del Estado), bien subvencionando la

contratación de trabajadores que por alguna circunstancia sean menos

eficientes, minusválidos, jóvenes en su primer empleo, etc. La flexibilización de

los empleos, autorizando contratos temporales y facilitando los despidos,

supone de hecho abaratar los costes laborales de las empresas aunque

acosta de la precarización del empleo.

Finalmente siguen siendo muchos los partidarios de las tradicionales medidas

keynesianas de aumentar la demanda agregada mediante el aumento del

gasto público, bien mediante contratación directa por el Estado-patrón, bien

mediante la realización de obras o inversiones públicas. A pesar de las

argumentaciones de Friedman, los programas y gobiernos socialdemócratas

siguen siendo partidarios de políticas activas de creación de empleo

especialmente en países con tasas altas de paro.

5

1.2. EVIDENCIA EMPÍRICA:

GALDO, JARAMILLO Y MONTALVA (2009) evalúan el impacto de

PROJOVEN a lo largo de la distribución de los ingresos laborales; se concluye

que el diseño de PROJOVEN no constituye solamente un mecanismo efectivo

para mejorar la productividad de jóvenes económicamente desfavorecidos, sino

que también mejora la equidad entre los grupos de diversos niveles de

pobreza. Además descubrió que los impactos en ingresos como en el empleo

son mayores para mujeres que para hombres, es decir PROJOVEN ayuda a

reducir las brechas de género en el mercado laboral. Además la intervención

en capacitación que realiza PROJOVEN parece adecuada para producir

cambios en las ganancias pero no parece funcionar del mismo modo para el

empleo.

ISGUT (2002) realiza un estudio para determinar la relación entre el empleo no

agrícola y los ingresos de los individuos en Honduras, este trabajo concluye

que los años de escolaridad están positivamente asociados a la participación

en el empleo no agrícola asalariado, y negativamente asociados a la

participación en el empleo agrícola asalariado. Esta actividad es más común

entre los trabajadores más jóvenes, mientras que es menos probable que los

jefes de familia o sus esposas sean asalariados agrícolas. Los promedios de

escolaridad de los adultos en el hogar del trabajador, están positivamente

asociados a las ganancias del trabajador, esto indica que a mayor escolaridad

de las familias, mayor es su capacidad de obtener información sobre buenas

oportunidades de trabajo.

6

CONSTRUCCIÓN DE UN MODELO DE VARIABLE DEPENDIENTE BINARIA:

SECTOR: EMPLEO

Encuesta Permanente del Empleo (EPE): La EPE es una encuesta realizada por el INEI, la cual permite muestra indicadores de empleo e ingreso en el Área Metropolitana de Lima y Callao, para el seguimiento y análisis del mercado laboral, permite desarrollar indicadores anticipatorios de la evolución del empleo, sirve como fuente de información para futuras investigaciones tanto para entidades públicas como privadas.

Este tipo de encuesta tiene carácter móvil, pues sus resultados son publicados trimestralmente, para el caso de esta investigación se tomo el I trimestre del año 2010, y solo se cogió los datos del mes de marzo.

Año: 2010. - Marzo

Departamento: Lima Metropolitana

1. ESPECIFICACIÓN DEL MODELO

1.1 Ecuación Funcional

Ocu= f (sexo, edad, nivestu, negocio, hrastrab, pago, buscotra, trabantes, ingreso)

1.1.1 Definición de variables del modelo:

a) Variable dependiente cualitativa dicotómica

Ocu (Ocu200)= Se encuentra ocupado o empleado en algo actualmente

1= Se encuentra ocupado o empleado

0= No se encuentra ocupado o empleado

b) Variables explicativas del modelo:

1. Sexo:

1=Hombre0=Mujer

7

2. Edad: ¿Qué edad tiene en años cumplidos?

3. Nivestu: Nivel de Estudios

1=Superior (técnica o universitaria)0=No superior

4. Negocio: ¿Tiene algún negocio propio?

1=Si 0=No

5. Hrastrab: Total de horas que trabaja

6. Pago: ¿En su ocupación principal a usted le pagan?

1=Si0=No

7. Buscotra: ¿Ha hecho algo para conseguir trabajo?

1=Si0=No

8. Trabantes: Ha trabajado antes

1=Si0=NO

9. Ingreso: Ingreso total mensual

1.2 FUNCIÓN ECONOMETRICA

Occupation= 0 + 1 sexo i + 2 edadi + 3nivestu i + 4 negocio i + 5 hrastrab i + 6

pagoi + 7 buscotra i + 8 trabantes i + 9 ingreso+ Ut i

Loa signos esperados de los parámetros son:

0: Parámetro Autónomo

8

1 ><0: El grado de sensibilidad de la variable dependiente respecto sexo se espera

que sea positivo.

2 <0: El grado de sensibilidad de la variable dependiente respecto a la edad se espera

que sea positivo o negativo.

3 >0: El grado de sensibilidad de la variable dependiente respecto al nivestu se espera

que sea positivo.

4 >0: El grado de sensibilidad de la variable dependiente respecto al negocio se espera que sea positivo.

5 >0: El grado de sensibilidad de la variable dependiente respecto a hrastrab se

espera sea de signo positivo.

6 >0: El grado de sensibilidad de la variable dependiente respecto al pago se espera

que sea de signo negativo.

7 >0: El grado de sensibilidad de la variable dependiente respecto a bucotra se espera

que sea de signo positivo.

8 >0: El grado de sensibilidad de la variable dependiente respecto a trabantes se espera


9 >0: El grado de sensibilidad de la variable dependiente respecto al ingresos se espera


9

ELABORACIÓN DEL MODELO LOGIT

Ocupacion= 0 + 1 sexo i + 2 edadi + 3nivestu i + 4 negocio i + 5 hrastrab i + 6

pagoi + 7 buscotra i + 8 trabantes i + 9 ingreso+ Ut i

1. REGRESIONES BIVARIANTES:

Rango: 1 3910 Yi=f(xi)Simple: 1 3600

ML1: LS OCUPACION C SEXO

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:08Sample (adjusted): 2 3909Included observations: 2977 after adjustmentsConvergence achieved after 3 iterationsCovariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C 0.575616 0.056124 10.25613 0.0000SEXO 0.001486 0.076587 0.019398 0.9845

Mean dependent var 0.640242 S.D. dependent var 0.480010S.E. of regression 0.480091 Akaike info criterion 1.307901Sum squared resid 685.6989 Schwarz criterion 1.311931Log likelihood -1944.811 Hannan-Quinn criter. 1.309351Restr. log likelihood -1944.811 Avg. log likelihood -0.653279LR statistic (1 df) 0.000376 McFadden R-squared 9.67E-08Probability(LR stat) 0.984524

Obs with Dep=0 1071 Total obs 2977Obs with Dep=1 1906

ML2: LS OCUPACION C EDAD

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:08Sample (adjusted): 2 3909Included observations: 2977 after adjustments

10

Convergence achieved after 4 iterationsCovariance matrix computed using second derivatives


C 1.106341 0.075385 14.67581 0.0000EDAD -0.015691 0.001874 -8.372240 0.0000

Mean dependent var 0.640242 S.D. dependent var 0.480010S.E. of regression 0.474567 Akaike info criterion 1.283938Sum squared resid 670.0119 Schwarz criterion 1.287968Log likelihood -1909.141 Hannan-Quinn criter. 1.285388Restr. log likelihood -1944.811 Avg. log likelihood -0.641297LR statistic (1 df) 71.34006 McFadden R-squared 0.018341Probability(LR stat) 0.000000


ML3: LS OCUPACION C NIVESTU



C 0.614336 0.049843 12.32535 0.0000NIVESTU 0.255711 0.078236 -3.268437 0.0011



11

ML4: LS OCUPACION C NEGOCIO



C 0.535303 0.068388 7.827392 0.0000NEGOCIO -0.000133 4.07E-05 -3.275808 0.0011



ML5: LS OCUPACION C HRASTRAB



C 0.581442 0.130894 4.442074 0.0000HRASTRAB -0.002151 0.002492 -0.863440 0.3879

Mean dependent var 0.617192 S.D. dependent var 0.486222S.E. of regression 0.486259 Akaike info criterion 1.332856Sum squared resid 381.8639 Schwarz criterion 1.339521Log likelihood -1075.614 Hannan-Quinn criter. 1.335329

12

Restr. log likelihood -1075.987 Avg. log likelihood -0.665191LR statistic (1 df) 0.746291 McFadden R-squared 0.000347Probability(LR stat) 0.387653


ML6: LS OCUPACION C PAGO



C 0.067992 0.167337 0.406319 0.6845PAGO 0.344809 0.176486 1.953751 0.0507



ML7: LS OCUPACION C BUSCOTRA

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:11Sample (adjusted): 3 3909Included observations: 1617 after adjustmentsConvergence achieved after 3 iterations

13

Covariance matrix computed using second derivatives


C 0.492581 0.055082 8.942746 0.0000BUSCOTRA -0.110106 0.148827 -0.739821 0.4594



ML8: LS OCUPACION C TRABANTES



C 3.218876 0.509902 6.312735 0.0000TRABANTES 0.952944 0.655162 1.454517 0.1458



14

ML9: LS OCUPACION C INGRESO



C 0.505625 0.067787 7.459047 0.0000INGRESO -2.49E-05 3.73E-05 -0.666377 0.5052



15

2. SELECCIÓN DE VARIABLES:

En el cuadro se muestra las variables que ya han sido seleccionadas en base a los critrios

estadísticos. Por lo tanto el modelo queda especificado de la siguiente forma:

Ocuàcion= 0 + 1 edad i + 2 nivestui + 3 pagoi + U

3. ANALISIS DE MULTICOLINEALIDAD: (< 0.5). En este punto se construye la

matriz de correlación, con la cual concluimos que no se eliminan ninguna variable ya

que ninguna genera multicolinealidad..

MATRIZ DE CORRELACON

EDAD NIVESTU PAGO

EDAD 1.000000 0.078643 0.003948

NIVESTU 0.078643 1.000000 0.054468

PAGO 0.003948 0.054468 1.000000

Por lo tanto en esta segunda etapa nuestro modelo seria

16

VARIABLE SIGNO Significanci

a

R2 Mc FADENN

0.2<R2<0.6Selec.

Esperado Estimad

o

Sexo + + 0.9845 No sig 9.67E-08 malo NO

Edad - - 0.0000 Altasig 0.018341 malo SI

Nivestu + + 0.0011 Alta sig 0.003066 malo SI

Negocio + - 0.0011 Alta sig 0.009412 malo NO

Hrastrab + - 0.38 No sig 0.000347 malo NO

Pago + + 0.0507 sig 0.002533 malo SI

Buscotra + + 0.4594 No sig 0.000253malo NO

Trabantes + - 0.1458 No sig 0.019754 malo NO

Ingreso + - 0.5052 No sig 0.000207 malo No

Ocu= f(edadi , nivestu I, pago )

LUEGO REGRECIONAMOS EL MODELO LOGIT CON LAS VARIABLES SELECCIONADAS

2. ESTIMACION DEL MODELO MULTIVARIANTE




C 0.567133 0.233417 2.429695 0.0151EDAD -0.016414 0.004066 -4.037424 0.0001

NIVESTU -0.348614 0.122672 -2.841827 0.0045PAGO 0.550889 0.205233 2.684218 0.0073

Mean dependent var 0.582103 S.D. dependent var 0.493428S.E. of regression 0.487354 Akaike info criterion 1.338228Sum squared resid 272.4290 Schwarz criterion 1.355773Log likelihood -766.1505 Hannan-Quinn criter. 1.344851Restr. log likelihood -782.2245 Avg. log likelihood -0.665639LR statistic (3 df) 32.14806 McFadden R-squared 0.020549Probability(LR stat) 4.87E-07


17

3. EVALUACION DEL MODELO

1º signos

Signo esperado Signo estimado

EDAD- -

NIVESTU+ -

PAGO+ +

2º Significancia Individual

variables probabilidad Significancia

Edad

Nivestu

Pago

0.0001

0.0045

0.0073

Alta sig

Alta sig.

Alta sig.

3º Significancia Conjunta

H0: Bj = 0 (Los parámetros no son significativos, y en consecuencia el modelo en su conjunto no es significativo.).H1: Bj ≠ 0 (Los parámetros son significativos, y en consecuencia el modelo en su conjunto es significativo).

El estadístico de prueba es: LR Chi- Cuadrado.

LR =-2(ln l¿

(r )−lnl¿

(ur )) v/s X (0.95 ,3 )2 = 7.81

Entonces:

lr=-2*(-782.224532220058-(-766.15050142041))= 32.14806

18

2)3,95.0(X 7.81

LR > X (0.95 ,3 )

2

Se rechaza H0, por lo tanto el modelo en su conjunto es estadísticamente significativo. Por lo tanto, podemos concluir que las variables exógenas explican conjuntamente los valores de la variable dependiente cualitativa.

4º Coeficiente de Bondad de Ajuste:

R2Mc−Fadden=1−lnLURlnLR

r2mcf=1-(-766.15050142041/-782.224532220058)= 0.020549

El modelo es bueno ya que el McFadden R-squared esta entre 0.2<0.206712<0.6

RCorrelacion

2 =0. 1643

El R2 de correlación no es aceptable dado que no se encuentra comprendido entre 0.2 y 0.6.

RConteo2 =nº pred .correctas

nº total .observ .=668

1151=0 .5804

Por lo tanto se puede afirmar que nuestro modelo predice correctamente el 58.04% de las observaciones

Percent Gain (probabilidad=0.5): esta tabla nos permite observar que el modelo estimado esta ganando en 21.51% en capacidad predictiva con respecto al modelo de probabilidad constante.

19

Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 17:13Sample (adjusted): 5 3600Included observations: 1151 after adjustmentsPrediction Evaluation (success cutoff C = 0.5)

Estimated Equation Constant ProbabilityDep=0 Dep=1 Total Dep=0 Dep=1 Total

P(Dep=1)<=C 93 95 188 0 0 0P(Dep=1)>C 388 575 963 481 670 1151

Total 481 670 1151 481 670 1151Correct 93 575 668 0 670 670

% Correct 19.33 85.82 58.04 0.00 100.00 58.21% Incorrect 80.67 14.18 41.96 100.00 0.00 41.79Total Gain* 19.33 -14.18 -0.17

Percent Gain** 19.33 NA -0.42

Estimated Equation Constant ProbabilityDep=0 Dep=1 Total Dep=0 Dep=1 Total

E(# of Dep=0) 208.64 272.36 481.00 201.01 279.99 481.00E(# of Dep=1) 272.36 397.64 670.00 279.99 390.01 670.00

Total 481.00 670.00 1151.00 481.00 670.00 1151.00Correct 208.64 397.64 606.28 201.01 390.01 591.02

% Correct 43.38 59.35 52.67 41.79 58.21 51.35% Incorrect 56.62 40.65 47.33 58.21 41.79 48.65Total Gain* 1.59 1.14 1.33

Percent Gain** 2.72 2.72 2.72

Normalidad de los residuos

- H0= Los residuos se distribuyen con una normal.

20

Se compara el Jarque-Bera contra el chi-cuadrado

JB= 171.9668 VS X (0.95 ,2)

2 = 5.99

Como el JB es mayor al Chi-cuadrado, se rechaza la hipótesis nula, concluyendo que los

residuos no se distribuyen con una normal.

6. COMPARACION DEL MODELO LOGIT Y PROBIT

MODELO PROBIT


Dependent Variable: OCUPACIONMethod: ML - Binary Probit (Quadratic hill climbing)Date: 10/09/11 Time: 10:59Sample (adjusted): 5 3600Included observations: 1151 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives


C 0.353611 0.145569 2.429168 0.0151EDAD -0.010226 0.002515 -4.066159 0.0000

NIVESTU -0.217698 0.076096 -2.860822 0.0042PAGO 0.343216 0.128059 2.680134 0.0074

Mean dependent var 0.582103 S.D. dependent var 0.493428S.E. of regression 0.487331 Akaike info criterion 1.338124Sum squared resid 272.4028 Schwarz criterion 1.355668Log likelihood -766.0902 Hannan-Quinn criter. 1.344746

21

Restr. log likelihood -782.2245 Avg. log likelihood -0.665587LR statistic (3 df) 32.26871 McFadden R-squared 0.020626Probability(LR stat) 4.59E-07


Para comparar construimos la siguiente tabla:

MODELO LOGIT PROBIT

R2MC FADDEN

0.206712 MAYOR0.02062

AKAIKE1.338228 1.338124 MENOR

SCHWARZ 1.3557731.355668 MENOR

HANNAN QUINN

1.344851 1.344746 MENOR

Por el criterio del R2 el modelo Logit es el mejor modelo pues este es mayor que el R2 del modelo Probi, según el criterio del AKAIKE, SCHWARZ y el HANNAN QUINN el mejor modelo es el Probit pues estos estimadores son menores en este modelo. Pero tales estimadores son casi iguales y la diferencia es solo de centésimas, asi que elegiremos al modelo Logia como mejor modelo.

Por lo tanto el mejor modelo es el modelo Logia.

7. EFECTOS MARGINALES

Para el modelo Logit

∂Pi∂X ij

=EMgX=β j Pi(1−Pi)

Donde: - Pi: La variable endógena proyectada- Bi: El parámetro asociado a la variable exógena.

22

Efectos Promedios

a) Efecto marginal de Edad= -0.003878

b) Efecto marginal de Nivestu= -0.082370

c) Efecto marginal de Pago= 0.130163

MODELO DE PROBABILIDAD LINEAL

23

a) Primero estimamos por MCO y predecimos para hallar la varianza.

En el comando escribimos: Genr vau= y(1-y)

genr vau=ocupacionf2*(1-ocuf2)

b) Luego estimamos el modelo de probabilidad lineal

Dependent Variable: OCUPACIONMethod: Least SquaresDate: 10/09/11 Time: 11:22Sample (adjusted): 3606 3909Included observations: 105 after adjustmentsWeighting series: 1/SQR(VAR)

Variable Coefficient Std. Error t-Statistic Prob.

C 0.855748 0.173825 4.923036 0.0000EDAD -0.006678 0.003249 -2.055533 0.0424

NIVESTU -0.036780 0.092502 -0.397613 0.6918PAGO 0.040684 0.160000 0.254273 0.7998

Weighted Statistics

R-squared 0.085630 Mean dependent var 0.662935Adjusted R-squared 0.058471 S.D. dependent var 0.484779S.E. of regression 0.470393 Akaike info criterion 1.366855Sum squared resid 22.34825 Schwarz criterion 1.467959Log likelihood -67.75990 F-statistic 1.504437Durbin-Watson stat 1.265254 Prob(F-statistic) 0.217973

Unweighted Statistics

R-squared 0.035667 Mean dependent var 0.657143Adjusted R-squared 0.007024 S.D. dependent var 0.476941S.E. of regression 0.475263 Sum squared resid 22.81336Durbin-Watson stat 1.299452

8. PREDICCION DEL MODELO PROBIT

24

Para este ítem se evaluara la capacidad predictiva del modelo en base a los 316 últimos datos, luego se procederá a calcular el R2 de Conteo.

Rango: 1 – 3910Sample: 3601 3910

Utilizando el modelo Logit, para las 310 últimas observaciones, predecimos la variable ocupacion→ ocupaciónf1

Aplicando el siguiente criterio Ocupacionf1>0.5 →1 Ocupacionf1Ocupacionf1<=0.5 →0

PREDICCION

25

obs OCUPACION OCUPACIONF13601 NA NA3602 NA 1.0000003603 NA NA3604 NA NA3605 1.000000 NA3606 1.000000 1.0000003607 1.000000 1.0000003608 NA 1.0000003609 1.000000 NA3610 1.000000 NA3611 1.000000 1.0000003612 0.000000 NA3613 1.000000 NA3614 1.000000 1.0000003615 0.000000 1.0000003616 NA NA3617 NA NA3618 1.000000 NA3619 0.000000 NA3620 1.000000 NA3621 1.000000 1.0000003622 NA 1.0000003623 NA NA3624 1.000000 NA3625 0.000000 NA3626 NA NA3627 NA NA3628 NA NA3629 1.000000 NA3630 1.000000 1.0000003631 NA NA3632 1.000000 NA3633 1.000000 1.0000003634 0.000000 1.0000003635 NA NA3636 NA NA3637 NA NA3638 1.000000 NA3639 0.000000 0.0000003640 0.000000 NA3641 NA 1.0000003642 NA 1.0000003643 NA NA3644 0.000000 NA3645 1.000000 NA3646 0.000000 1.0000003647 1.000000 NA3648 1.000000 1.000000

26

3649 NA 1.0000003650 1.000000 NA3651 NA NA3652 1.000000 NA3653 NA 1.0000003654 NA NA3655 1.000000 NA3656 1.000000 NA3657 NA NA3658 NA 1.0000003659 1.000000 NA3660 0.000000 1.0000003661 1.000000 NA3662 1.000000 1.0000003663 1.000000 NA3664 1.000000 NA3665 1.000000 1.0000003666 NA NA3667 1.000000 NA3668 0.000000 1.0000003669 NA NA3670 NA 1.0000003671 NA NA3672 1.000000 NA3673 0.000000 1.0000003674 1.000000 NA3675 0.000000 1.0000003676 1.000000 NA3677 NA 1.0000003678 NA NA3679 1.000000 NA3680 1.000000 1.0000003681 NA 1.0000003682 NA NA3683 NA NA3684 1.000000 1.0000003685 1.000000 NA3686 0.000000 1.0000003687 1.000000 NA3688 1.000000 1.0000003689 1.000000 1.0000003690 1.000000 NA3691 NA 1.0000003692 NA NA3693 1.000000 NA3694 1.000000 1.0000003695 1.000000 1.0000003696 1.000000 1.0000003697 1.000000 1.0000003698 1.000000 1.0000003699 NA NA

27

3700 0.000000 NA3701 1.000000 NA3702 0.000000 1.0000003703 NA NA3704 NA NA3705 1.000000 NA3706 1.000000 1.0000003707 1.000000 1.0000003708 NA 1.0000003709 1.000000 NA3710 1.000000 1.0000003711 NA 0.0000003712 NA NA3713 1.000000 NA3714 1.000000 1.0000003715 1.000000 1.0000003716 NA 1.0000003717 NA NA3718 1.000000 NA3719 0.000000 0.0000003720 0.000000 NA3721 1.000000 NA3722 NA NA3723 0.000000 NA3724 0.000000 NA3725 1.000000 NA3726 0.000000 0.0000003727 0.000000 NA3728 0.000000 NA3729 0.000000 NA3730 0.000000 NA3731 1.000000 NA3732 1.000000 0.0000003733 0.000000 1.0000003734 0.000000 NA3735 NA NA3736 NA NA3737 NA NA3738 1.000000 NA3739 1.000000 1.0000003740 0.000000 1.0000003741 NA NA3742 NA NA3743 1.000000 NA3744 1.000000 1.0000003745 1.000000 1.0000003746 1.000000 1.0000003747 0.000000 1.0000003748 0.000000 NA3749 0.000000 NA3750 1.000000 NA

28

3751 1.000000 1.0000003752 1.000000 1.0000003753 1.000000 0.0000003754 1.000000 1.0000003755 NA NA3756 0.000000 NA3757 1.000000 NA3758 1.000000 1.0000003759 0.000000 1.0000003760 1.000000 0.0000003761 NA NA3762 NA NA3763 1.000000 NA3764 0.000000 1.0000003765 0.000000 NA3766 1.000000 NA3767 NA NA3768 NA NA3769 0.000000 NA3770 0.000000 NA3771 1.000000 NA3772 1.000000 1.0000003773 0.000000 1.0000003774 0.000000 NA3775 1.000000 NA3776 0.000000 1.0000003777 0.000000 NA3778 NA NA3779 1.000000 NA3780 1.000000 1.0000003781 0.000000 1.0000003782 1.000000 NA3783 0.000000 1.0000003784 NA NA3785 0.000000 NA3786 0.000000 NA3787 1.000000 NA3788 0.000000 NA3789 NA NA3790 NA NA3791 0.000000 NA3792 1.000000 NA3793 1.000000 1.0000003794 1.000000 1.0000003795 NA NA3796 1.000000 NA3797 1.000000 1.0000003798 1.000000 1.0000003799 NA 1.0000003800 1.000000 NA3801 0.000000 1.000000

29

3802 0.000000 NA3803 0.000000 NA3804 0.000000 NA3805 1.000000 NA3806 1.000000 1.0000003807 0.000000 NA3808 1.000000 NA3809 1.000000 0.0000003810 1.000000 1.0000003811 0.000000 NA3812 1.000000 NA3813 NA NA3814 NA 1.0000003815 1.000000 NA3816 1.000000 NA3817 1.000000 1.0000003818 0.000000 1.0000003819 0.000000 0.0000003820 1.000000 NA3821 NA 0.0000003822 1.000000 1.0000003823 1.000000 NA3824 NA 1.0000003825 1.000000 NA3826 0.000000 NA3827 1.000000 0.0000003828 NA NA3829 NA 1.0000003830 1.000000 NA3831 1.000000 1.0000003832 1.000000 1.0000003833 1.000000 1.0000003834 1.000000 1.0000003835 1.000000 1.0000003836 1.000000 1.0000003837 1.000000 0.0000003838 1.000000 NA3839 0.000000 1.0000003840 NA NA3841 0.000000 1.0000003842 0.000000 1.0000003843 0.000000 1.0000003844 0.000000 1.0000003845 0.000000 0.0000003846 1.000000 1.0000003847 NA 1.0000003848 NA 1.0000003849 0.000000 NA3850 1.000000 1.0000003851 1.000000 NA3852 1.000000 1.000000

30

3853 1.000000 1.0000003854 NA NA3855 1.000000 NA3856 0.000000 1.0000003857 NA NA3858 1.000000 NA3859 1.000000 1.0000003860 NA NA3861 NA 1.0000003862 0.000000 NA3863 1.000000 1.0000003864 1.000000 NA3865 1.000000 1.0000003866 NA NA3867 1.000000 NA3868 1.000000 NA3869 1.000000 1.0000003870 NA NA3871 1.000000 1.0000003872 0.000000 NA3873 1.000000 NA3874 0.000000 1.0000003875 NA NA3876 1.000000 NA3877 1.000000 1.0000003878 1.000000 0.0000003879 1.000000 1.0000003880 NA NA3881 NA NA3882 0.000000 NA3883 1.000000 NA3884 1.000000 NA3885 NA 0.0000003886 NA 1.0000003887 NA NA3888 NA NA3889 1.000000 1.0000003890 0.000000 1.0000003891 NA NA3892 1.000000 NA3893 0.000000 1.0000003894 1.000000 NA3895 1.000000 NA3896 NA 1.0000003897 1.000000 NA3898 0.000000 1.0000003899 NA NA3900 NA 1.0000003901 NA NA3902 1.000000 NA3903 0.000000 1.000000

31

3904 1.000000 NA3905 NA 1.0000003906 NA NA3907 NA NA3908 1.000000 1.0000003909 1.000000 1.0000003910 NA NA

Luego se procede a generar la variable dife:

GENR D1=OCUPACION-OCUPACIONF1

Descriptive Statistics for DIFECategorized by values of DIFEDate: 10/09/11 Time: 11:17Sample (adjusted): 3606 3909Included observations: 105 after adjustments

DIFE Mean Std. Dev. Obs.-1 -1.000000 0.000000 310 0.000000 0.000000 671 1.000000 0.000000 7

All -0.228571 0.559140 105

RConteo2 =nº pred .correctas

nº total .observ .=67

105=0 .6380

El modelo predice bien a los individuos que no se encuentran ocupados por ahora en

algún empleo o trabajo.

Con un R2 de Conteo de 0.638 podemos concluir que el modelo predice bien el 63,8%

de las observaciones.

32

CONCLUSION

El mejor modelo resultante fue el modelo Logit, dado que cuenta con mejores estimadores y con un mejor R2 a comparación del modelo Probit, sin embargo los resultados varían por solo centésimas, por ello se puede considerar indiferente a la hora de elegir entre uno u otro. La predicción también no están acertada pues solo predice bien el 63% de las observaciones, esto debido a la falta de valores en varias observaciones.

33

BIBLIOGRAFÍA

1.- ARRANZ J.; GARCÍA, C. (2009) “Pobreza en España”. Universidad de

España.

2.- JARAMILLO, M. y MONTALVA, V. (2009) “Pobreza e impactos

heterogéneos de las políticas activas de empleo juvenil: el caso de PROJOVEN

en el Perú”. Documento de Trabajo N° 54; Grupo de Análisis para el Desarrollo

GRADE. Lima.

3.- LANJOUW P. (1996) “Empleo no agrícola y pobreza en El Salvador Rural”.

Banco Mundial. El Salvador.

4.- Cuadros estadísticos: De Lima Metropolitana y la Provincia Constitucional del Callao.Página Web (MICRODATOS INEI)

34

estimacion del modelo de variable dependiente binaria

Documents