estimacion del modelo de variable dependiente binaria
TRANSCRIPT
“UNIVERSIDAD NACIONAL DE PIURA”
“FACULTAD DE ECONOMÍA”
“ESTIMACION DEL MODELO DE VARIABLE DEPENDIENTE BINARIA EMPLEO PARA LIMA METROPOLITANA: trimestre febrero-marzo-abril 2010”
PROFESOR:
CURSO:
ALUMNA:
CUSCO-PERÚ
12 DE septiembre DE 2011.
1
TITULO:
UN MODELO ECONOMETRICO PARA EL EMPLEO EN EL DEPARTAMENTO DE LIMA METROPOLITANA
PERIODO 2010
2
INTRODUCCIÓN
Principalmente las políticas económicas están basadas tanto en
aspectos teóricos como en la evidencia empírica relacionada con el área en la
cual se está actuando. La teoría económica aporta las relaciones entre las
variables y los principios básicos que explican tanto su comportamiento, como
el posible tipo de función matemática que las entrelaza. Por su parte, la
evidencia empírica muestra la relación que existe en el mundo real entre las
variables estudiadas con respecto a un fenómeno económico determinado.
La econometría es aquella ciencia que se encarga de darnos los
métodos necesarios para comunicar ambos mundos, el teórico y el real,
mediante bases teóricas y procedimientos que facilitan la formulación y
estimación de modelos económicos para de esta manera explicar el
comportamiento de la variable en estudio durante un período en referencia,
asimismo nos permite hacer inferencia y pronostico de la misma con base en
las variables independientes seleccionadas en el modelo.
Todo este proceso contemplado en la econometría, nos permite la utilización
del modelo siendo el sustento teórico-práctico para formular políticas
relacionadas con el fenómeno en estudio.
El fin de este trabajo es formular un modelo econométrico que muestre
una importancia que tiene el empleo en el Perú (Departamento de Lima) y logre
explicar su comportamiento satisfactoriamente. La formulación del modelo está
basada en la Teoría Económica, conjuntamente con la evidencia empírica
obtenida a través de la Encuesta Nacional de Hogares ENAHO 2010.
3
MARCO TEORICO
CAPITULO 1: MARCO TEÓRICO
1.1. MARCO REFERENCIAL
POBREZA:
Siguiendo el modelo propuesto por RAVALLION (1998), donde un hogar cuyas
preferencias se pueden representar por la siguiente función de utilidad u = u (q,
x), la de gasto del consumidor es e = e (p, x, u), que se interpreta como el costo
mínimo de un nivel de utilidad u para un hogar con características x cuando se
enfrenta a un vector de precios p, y q representa las canastas de bienes que
consume el hogar; e = e (p, x, u) cuando se evalúa en el nivel de utilidad real,
se corresponde al gasto total real en consumo y = p*q, para un hogar que
aumenta su utilidad. Si tomamos a uz como nivel de utilidad de referencia
necesario para escapar de la pobreza, la línea de ésta sería igual a: z = e (p, x,
uz).
La línea de pobreza es el costo del nivel mínimo de utilidad para escapar de la
pobreza a los precios corrientes y dadas las características personales del
hogar. Esta ecuación relaciona cómo ir de la pobreza en términos de utilidad a
la pobreza en términos de dinero, pero no cómo definir el nivel de utilidad de la
pobreza.
Podemos decir que un individuo no se encontrara en situación de pobreza si
posee un nivel de ingresos suficiente para cubrir una canasta de bienes básica;
esto se logra teniendo ingresos fijos provenientes de un empleo. De esta forma
diremos que una persona que trabaja tiene altas posibilidades de no ser pobre.
DESEMPLEO:
Desempleo, paro forzoso o desocupación de los asalariados que pueden y
quieren trabajar pero no encuentran un puesto de trabajo. En las sociedades en
4
las que la mayoría de la población vive de trabajar para los demás, el
no poder encontrar un trabajo es un grave problema. Debido a los costes
humanos derivados de la privación y del sentimiento de rechazo y de
fracaso personal, la cuantía del desempleo se utiliza habitualmente como una
medida del bienestar de los trabajadores. La proporción de trabajadores
desempleados también muestra si se están aprovechando adecuadamente los
recursos humanos del país y sirve como índice de la actividad económica.
Políticas de Empleo
La intervención del Estado para fomentar el empleo topa con grandes
dificultades. Las políticas expansivas pueden producir desagradables efectos
secundarios, provocando inestabilidad monetaria y otros desequilibrios. Si lo
que se busca es una oferta de empleo bien remunerado, sostenida a largo
plazo, habrá que actuar de forma muy cuidadosa para que no sea peor el
remedio que la enfermedad.
El aumento de la demanda de trabajadores puede conseguirse con medidas
fiscales que reduzcan los costes salariales para las empresas, bien reduciendo
las contribuciones obligatorias a la Seguridad Social (que tendrían que ser
substituidas por otros ingresos del Estado), bien subvencionando la
contratación de trabajadores que por alguna circunstancia sean menos
eficientes, minusválidos, jóvenes en su primer empleo, etc. La flexibilización de
los empleos, autorizando contratos temporales y facilitando los despidos,
supone de hecho abaratar los costes laborales de las empresas aunque
acosta de la precarización del empleo.
Finalmente siguen siendo muchos los partidarios de las tradicionales medidas
keynesianas de aumentar la demanda agregada mediante el aumento del
gasto público, bien mediante contratación directa por el Estado-patrón, bien
mediante la realización de obras o inversiones públicas. A pesar de las
argumentaciones de Friedman, los programas y gobiernos socialdemócratas
siguen siendo partidarios de políticas activas de creación de empleo
especialmente en países con tasas altas de paro.
5
1.2. EVIDENCIA EMPÍRICA:
GALDO, JARAMILLO Y MONTALVA (2009) evalúan el impacto de
PROJOVEN a lo largo de la distribución de los ingresos laborales; se concluye
que el diseño de PROJOVEN no constituye solamente un mecanismo efectivo
para mejorar la productividad de jóvenes económicamente desfavorecidos, sino
que también mejora la equidad entre los grupos de diversos niveles de
pobreza. Además descubrió que los impactos en ingresos como en el empleo
son mayores para mujeres que para hombres, es decir PROJOVEN ayuda a
reducir las brechas de género en el mercado laboral. Además la intervención
en capacitación que realiza PROJOVEN parece adecuada para producir
cambios en las ganancias pero no parece funcionar del mismo modo para el
empleo.
ISGUT (2002) realiza un estudio para determinar la relación entre el empleo no
agrícola y los ingresos de los individuos en Honduras, este trabajo concluye
que los años de escolaridad están positivamente asociados a la participación
en el empleo no agrícola asalariado, y negativamente asociados a la
participación en el empleo agrícola asalariado. Esta actividad es más común
entre los trabajadores más jóvenes, mientras que es menos probable que los
jefes de familia o sus esposas sean asalariados agrícolas. Los promedios de
escolaridad de los adultos en el hogar del trabajador, están positivamente
asociados a las ganancias del trabajador, esto indica que a mayor escolaridad
de las familias, mayor es su capacidad de obtener información sobre buenas
oportunidades de trabajo.
6
CONSTRUCCIÓN DE UN MODELO DE VARIABLE DEPENDIENTE BINARIA:
SECTOR: EMPLEO
Encuesta Permanente del Empleo (EPE): La EPE es una encuesta realizada por el INEI, la cual permite muestra indicadores de empleo e ingreso en el Área Metropolitana de Lima y Callao, para el seguimiento y análisis del mercado laboral, permite desarrollar indicadores anticipatorios de la evolución del empleo, sirve como fuente de información para futuras investigaciones tanto para entidades públicas como privadas.
Este tipo de encuesta tiene carácter móvil, pues sus resultados son publicados trimestralmente, para el caso de esta investigación se tomo el I trimestre del año 2010, y solo se cogió los datos del mes de marzo.
Año: 2010. - Marzo
Departamento: Lima Metropolitana
1. ESPECIFICACIÓN DEL MODELO
1.1 Ecuación Funcional
Ocu= f (sexo, edad, nivestu, negocio, hrastrab, pago, buscotra, trabantes, ingreso)
1.1.1 Definición de variables del modelo:
a) Variable dependiente cualitativa dicotómica
Ocu (Ocu200)= Se encuentra ocupado o empleado en algo actualmente
1= Se encuentra ocupado o empleado
0= No se encuentra ocupado o empleado
b) Variables explicativas del modelo:
1. Sexo:
1=Hombre0=Mujer
7
2. Edad: ¿Qué edad tiene en años cumplidos?
3. Nivestu: Nivel de Estudios
1=Superior (técnica o universitaria)0=No superior
4. Negocio: ¿Tiene algún negocio propio?
1=Si 0=No
5. Hrastrab: Total de horas que trabaja
6. Pago: ¿En su ocupación principal a usted le pagan?
1=Si0=No
7. Buscotra: ¿Ha hecho algo para conseguir trabajo?
1=Si0=No
8. Trabantes: Ha trabajado antes
1=Si0=NO
9. Ingreso: Ingreso total mensual
1.2 FUNCIÓN ECONOMETRICA
Occupation= 0 + 1 sexo i + 2 edadi + 3nivestu i + 4 negocio i + 5 hrastrab i + 6
pagoi + 7 buscotra i + 8 trabantes i + 9 ingreso+ Ut i
Loa signos esperados de los parámetros son:
0: Parámetro Autónomo
8
1 ><0: El grado de sensibilidad de la variable dependiente respecto sexo se espera
que sea positivo.
2 <0: El grado de sensibilidad de la variable dependiente respecto a la edad se espera
que sea positivo o negativo.
3 >0: El grado de sensibilidad de la variable dependiente respecto al nivestu se espera
que sea positivo.
4 >0: El grado de sensibilidad de la variable dependiente respecto al negocio se espera que sea positivo.
5 >0: El grado de sensibilidad de la variable dependiente respecto a hrastrab se
espera sea de signo positivo.
6 >0: El grado de sensibilidad de la variable dependiente respecto al pago se espera
que sea de signo negativo.
7 >0: El grado de sensibilidad de la variable dependiente respecto a bucotra se espera
que sea de signo positivo.
8 >0: El grado de sensibilidad de la variable dependiente respecto a trabantes se espera
que sea de signo positivo.
9 >0: El grado de sensibilidad de la variable dependiente respecto al ingresos se espera
que sea de signo positivo.
9
ELABORACIÓN DEL MODELO LOGIT
Ocupacion= 0 + 1 sexo i + 2 edadi + 3nivestu i + 4 negocio i + 5 hrastrab i + 6
pagoi + 7 buscotra i + 8 trabantes i + 9 ingreso+ Ut i
1. REGRESIONES BIVARIANTES:
Rango: 1 3910 Yi=f(xi)Simple: 1 3600
ML1: LS OCUPACION C SEXO
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:08Sample (adjusted): 2 3909Included observations: 2977 after adjustmentsConvergence achieved after 3 iterationsCovariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 0.575616 0.056124 10.25613 0.0000SEXO 0.001486 0.076587 0.019398 0.9845
Mean dependent var 0.640242 S.D. dependent var 0.480010S.E. of regression 0.480091 Akaike info criterion 1.307901Sum squared resid 685.6989 Schwarz criterion 1.311931Log likelihood -1944.811 Hannan-Quinn criter. 1.309351Restr. log likelihood -1944.811 Avg. log likelihood -0.653279LR statistic (1 df) 0.000376 McFadden R-squared 9.67E-08Probability(LR stat) 0.984524
Obs with Dep=0 1071 Total obs 2977Obs with Dep=1 1906
ML2: LS OCUPACION C EDAD
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:08Sample (adjusted): 2 3909Included observations: 2977 after adjustments
10
Convergence achieved after 4 iterationsCovariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 1.106341 0.075385 14.67581 0.0000EDAD -0.015691 0.001874 -8.372240 0.0000
Mean dependent var 0.640242 S.D. dependent var 0.480010S.E. of regression 0.474567 Akaike info criterion 1.283938Sum squared resid 670.0119 Schwarz criterion 1.287968Log likelihood -1909.141 Hannan-Quinn criter. 1.285388Restr. log likelihood -1944.811 Avg. log likelihood -0.641297LR statistic (1 df) 71.34006 McFadden R-squared 0.018341Probability(LR stat) 0.000000
Obs with Dep=0 1071 Total obs 2977Obs with Dep=1 1906
ML3: LS OCUPACION C NIVESTU
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:09Sample (adjusted): 2 3909Included observations: 2766 after adjustmentsConvergence achieved after 3 iterationsCovariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 0.614336 0.049843 12.32535 0.0000NIVESTU 0.255711 0.078236 -3.268437 0.0011
Mean dependent var 0.626175 S.D. dependent var 0.483905S.E. of regression 0.482934 Akaike info criterion 1.319314Sum squared resid 644.6343 Schwarz criterion 1.323598Log likelihood -1822.611 Hannan-Quinn criter. 1.320861Restr. log likelihood -1828.216 Avg. log likelihood -0.658934LR statistic (1 df) 11.20960 McFadden R-squared 0.003066Probability(LR stat) 0.000814
Obs with Dep=0 1034 Total obs 2766Obs with Dep=1 1732
11
ML4: LS OCUPACION C NEGOCIO
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:09Sample (adjusted): 7 3904Included observations: 947 after adjustmentsConvergence achieved after 3 iterationsCovariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 0.535303 0.068388 7.827392 0.0000NEGOCIO -0.000133 4.07E-05 -3.275808 0.0011
Mean dependent var 0.620908 S.D. dependent var 0.485417S.E. of regression 0.482521 Akaike info criterion 1.318967Sum squared resid 220.0206 Schwarz criterion 1.329217Log likelihood -622.5309 Hannan-Quinn criter. 1.322873Restr. log likelihood -628.4461 Avg. log likelihood -0.657372LR statistic (1 df) 11.83029 McFadden R-squared 0.009412Probability(LR stat) 0.000583
Obs with Dep=0 359 Total obs 947Obs with Dep=1 588
ML5: LS OCUPACION C HRASTRAB
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:10Sample (adjusted): 3 3909Included observations: 1617 after adjustmentsConvergence achieved after 3 iterationsCovariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 0.581442 0.130894 4.442074 0.0000HRASTRAB -0.002151 0.002492 -0.863440 0.3879
Mean dependent var 0.617192 S.D. dependent var 0.486222S.E. of regression 0.486259 Akaike info criterion 1.332856Sum squared resid 381.8639 Schwarz criterion 1.339521Log likelihood -1075.614 Hannan-Quinn criter. 1.335329
12
Restr. log likelihood -1075.987 Avg. log likelihood -0.665191LR statistic (1 df) 0.746291 McFadden R-squared 0.000347Probability(LR stat) 0.387653
Obs with Dep=0 619 Total obs 1617Obs with Dep=1 998
ML6: LS OCUPACION C PAGO
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:11Sample (adjusted): 5 3909Included observations: 1288 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 0.067992 0.167337 0.406319 0.6845PAGO 0.344809 0.176486 1.953751 0.0507
Mean dependent var 0.593168 S.D. dependent var 0.491434S.E. of regression 0.490835 Akaike info criterion 1.351052Sum squared resid 309.8217 Schwarz criterion 1.359066Log likelihood -868.0776 Hannan-Quinn criter. 1.354060Restr. log likelihood -870.2821 Avg. log likelihood -0.673973LR statistic (1 df) 4.409086 McFadden R-squared 0.002533Probability(LR stat) 0.035748
Obs with Dep=0 524 Total obs 1288Obs with Dep=1 764
ML7: LS OCUPACION C BUSCOTRA
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:11Sample (adjusted): 3 3909Included observations: 1617 after adjustmentsConvergence achieved after 3 iterations
13
Covariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 0.492581 0.055082 8.942746 0.0000BUSCOTRA -0.110106 0.148827 -0.739821 0.4594
Mean dependent var 0.617192 S.D. dependent var 0.486222S.E. of regression 0.486290 Akaike info criterion 1.332981Sum squared resid 381.9126 Schwarz criterion 1.339645Log likelihood -1075.715 Hannan-Quinn criter. 1.335454Restr. log likelihood -1075.987 Avg. log likelihood -0.665254LR statistic (1 df) 0.544434 McFadden R-squared 0.000253Probability(LR stat) 0.460601
Obs with Dep=0 619 Total obs 1617Obs with Dep=1 998
ML8: LS OCUPACION C TRABANTES
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 09:03Sample (adjusted): 21 3904Included observations: 499 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 3.218876 0.509902 6.312735 0.0000TRABANTES 0.952944 0.655162 1.454517 0.1458
Mean dependent var 0.979960 S.D. dependent var 0.140278S.E. of regression 0.140099 Akaike info criterion 0.200527Sum squared resid 9.755015 Schwarz criterion 0.217411Log likelihood -48.03141 Hannan-Quinn criter. 0.207153Restr. log likelihood -48.99933 Avg. log likelihood -0.096255LR statistic (1 df) 1.935841 McFadden R-squared 0.019754Probability(LR stat) 0.164121
Obs with Dep=0 10 Total obs 499Obs with Dep=1 489
14
ML9: LS OCUPACION C INGRESO
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:12Sample (adjusted): 3 3909Included observations: 1600 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 0.505625 0.067787 7.459047 0.0000INGRESO -2.49E-05 3.73E-05 -0.666377 0.5052
Mean dependent var 0.616875 S.D. dependent var 0.486300S.E. of regression 0.486391 Akaike info criterion 1.333371Sum squared resid 378.0490 Schwarz criterion 1.340093Log likelihood -1064.697 Hannan-Quinn criter. 1.335867Restr. log likelihood -1064.917 Avg. log likelihood -0.665435LR statistic (1 df) 0.441042 McFadden R-squared 0.000207Probability(LR stat) 0.506620
Obs with Dep=0 613 Total obs 1600Obs with Dep=1 987
15
2. SELECCIÓN DE VARIABLES:
En el cuadro se muestra las variables que ya han sido seleccionadas en base a los critrios
estadísticos. Por lo tanto el modelo queda especificado de la siguiente forma:
Ocuàcion= 0 + 1 edad i + 2 nivestui + 3 pagoi + U
3. ANALISIS DE MULTICOLINEALIDAD: (< 0.5). En este punto se construye la
matriz de correlación, con la cual concluimos que no se eliminan ninguna variable ya
que ninguna genera multicolinealidad..
MATRIZ DE CORRELACON
EDAD NIVESTU PAGO
EDAD 1.000000 0.078643 0.003948
NIVESTU 0.078643 1.000000 0.054468
PAGO 0.003948 0.054468 1.000000
Por lo tanto en esta segunda etapa nuestro modelo seria
16
VARIABLE SIGNO Significanci
a
R2 Mc FADENN
0.2<R2<0.6Selec.
Esperado Estimad
o
Sexo + + 0.9845 No sig 9.67E-08 malo NO
Edad - - 0.0000 Altasig 0.018341 malo SI
Nivestu + + 0.0011 Alta sig 0.003066 malo SI
Negocio + - 0.0011 Alta sig 0.009412 malo NO
Hrastrab + - 0.38 No sig 0.000347 malo NO
Pago + + 0.0507 sig 0.002533 malo SI
Buscotra + + 0.4594 No sig 0.000253malo NO
Trabantes + - 0.1458 No sig 0.019754 malo NO
Ingreso + - 0.5052 No sig 0.000207 malo No
Ocu= f(edadi , nivestu I, pago )
LUEGO REGRECIONAMOS EL MODELO LOGIT CON LAS VARIABLES SELECCIONADAS
2. ESTIMACION DEL MODELO MULTIVARIANTE
Ocuàcion= 0 + 1 edad i + 2 nivestui + 3 pagoi + U
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 10:13Sample (adjusted): 5 3600Included observations: 1151 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 0.567133 0.233417 2.429695 0.0151EDAD -0.016414 0.004066 -4.037424 0.0001
NIVESTU -0.348614 0.122672 -2.841827 0.0045PAGO 0.550889 0.205233 2.684218 0.0073
Mean dependent var 0.582103 S.D. dependent var 0.493428S.E. of regression 0.487354 Akaike info criterion 1.338228Sum squared resid 272.4290 Schwarz criterion 1.355773Log likelihood -766.1505 Hannan-Quinn criter. 1.344851Restr. log likelihood -782.2245 Avg. log likelihood -0.665639LR statistic (3 df) 32.14806 McFadden R-squared 0.020549Probability(LR stat) 4.87E-07
Obs with Dep=0 481 Total obs 1151Obs with Dep=1 670
17
3. EVALUACION DEL MODELO
1º signos
Signo esperado Signo estimado
EDAD- -
NIVESTU+ -
PAGO+ +
2º Significancia Individual
variables probabilidad Significancia
Edad
Nivestu
Pago
0.0001
0.0045
0.0073
Alta sig
Alta sig.
Alta sig.
3º Significancia Conjunta
H0: Bj = 0 (Los parámetros no son significativos, y en consecuencia el modelo en su conjunto no es significativo.).H1: Bj ≠ 0 (Los parámetros son significativos, y en consecuencia el modelo en su conjunto es significativo).
El estadístico de prueba es: LR Chi- Cuadrado.
LR =-2(ln l¿
(r )−lnl¿
(ur )) v/s X (0.95 ,3 )2 = 7.81
Entonces:
lr=-2*(-782.224532220058-(-766.15050142041))= 32.14806
18
2)3,95.0(X 7.81
LR > X (0.95 ,3 )
2
Se rechaza H0, por lo tanto el modelo en su conjunto es estadísticamente significativo. Por lo tanto, podemos concluir que las variables exógenas explican conjuntamente los valores de la variable dependiente cualitativa.
4º Coeficiente de Bondad de Ajuste:
R2Mc−Fadden=1−lnLURlnLR
r2mcf=1-(-766.15050142041/-782.224532220058)= 0.020549
El modelo es bueno ya que el McFadden R-squared esta entre 0.2<0.206712<0.6
RCorrelacion
2 =0. 1643
El R2 de correlación no es aceptable dado que no se encuentra comprendido entre 0.2 y 0.6.
RConteo2 =nº pred .correctas
nº total .observ .=668
1151=0 .5804
Por lo tanto se puede afirmar que nuestro modelo predice correctamente el 58.04% de las observaciones
Percent Gain (probabilidad=0.5): esta tabla nos permite observar que el modelo estimado esta ganando en 21.51% en capacidad predictiva con respecto al modelo de probabilidad constante.
19
Dependent Variable: OCUPACIONMethod: ML - Binary Logit (Quadratic hill climbing)Date: 10/09/11 Time: 17:13Sample (adjusted): 5 3600Included observations: 1151 after adjustmentsPrediction Evaluation (success cutoff C = 0.5)
Estimated Equation Constant ProbabilityDep=0 Dep=1 Total Dep=0 Dep=1 Total
P(Dep=1)<=C 93 95 188 0 0 0P(Dep=1)>C 388 575 963 481 670 1151
Total 481 670 1151 481 670 1151Correct 93 575 668 0 670 670
% Correct 19.33 85.82 58.04 0.00 100.00 58.21% Incorrect 80.67 14.18 41.96 100.00 0.00 41.79Total Gain* 19.33 -14.18 -0.17
Percent Gain** 19.33 NA -0.42
Estimated Equation Constant ProbabilityDep=0 Dep=1 Total Dep=0 Dep=1 Total
E(# of Dep=0) 208.64 272.36 481.00 201.01 279.99 481.00E(# of Dep=1) 272.36 397.64 670.00 279.99 390.01 670.00
Total 481.00 670.00 1151.00 481.00 670.00 1151.00Correct 208.64 397.64 606.28 201.01 390.01 591.02
% Correct 43.38 59.35 52.67 41.79 58.21 51.35% Incorrect 56.62 40.65 47.33 58.21 41.79 48.65Total Gain* 1.59 1.14 1.33
Percent Gain** 2.72 2.72 2.72
Normalidad de los residuos
- H0= Los residuos se distribuyen con una normal.
20
Se compara el Jarque-Bera contra el chi-cuadrado
JB= 171.9668 VS X (0.95 ,2)
2 = 5.99
Como el JB es mayor al Chi-cuadrado, se rechaza la hipótesis nula, concluyendo que los
residuos no se distribuyen con una normal.
6. COMPARACION DEL MODELO LOGIT Y PROBIT
MODELO PROBIT
Ocuàcion= 0 + 1 edad i + 2 nivestui + 3 pagoi + U
Dependent Variable: OCUPACIONMethod: ML - Binary Probit (Quadratic hill climbing)Date: 10/09/11 Time: 10:59Sample (adjusted): 5 3600Included observations: 1151 after adjustmentsConvergence achieved after 4 iterationsCovariance matrix computed using second derivatives
Variable Coefficient Std. Error z-Statistic Prob.
C 0.353611 0.145569 2.429168 0.0151EDAD -0.010226 0.002515 -4.066159 0.0000
NIVESTU -0.217698 0.076096 -2.860822 0.0042PAGO 0.343216 0.128059 2.680134 0.0074
Mean dependent var 0.582103 S.D. dependent var 0.493428S.E. of regression 0.487331 Akaike info criterion 1.338124Sum squared resid 272.4028 Schwarz criterion 1.355668Log likelihood -766.0902 Hannan-Quinn criter. 1.344746
21
Restr. log likelihood -782.2245 Avg. log likelihood -0.665587LR statistic (3 df) 32.26871 McFadden R-squared 0.020626Probability(LR stat) 4.59E-07
Obs with Dep=0 481 Total obs 1151Obs with Dep=1 670
Para comparar construimos la siguiente tabla:
MODELO LOGIT PROBIT
R2MC FADDEN
0.206712 MAYOR0.02062
AKAIKE1.338228 1.338124 MENOR
SCHWARZ 1.3557731.355668 MENOR
HANNAN QUINN
1.344851 1.344746 MENOR
Por el criterio del R2 el modelo Logit es el mejor modelo pues este es mayor que el R2 del modelo Probi, según el criterio del AKAIKE, SCHWARZ y el HANNAN QUINN el mejor modelo es el Probit pues estos estimadores son menores en este modelo. Pero tales estimadores son casi iguales y la diferencia es solo de centésimas, asi que elegiremos al modelo Logia como mejor modelo.
Por lo tanto el mejor modelo es el modelo Logia.
7. EFECTOS MARGINALES
Para el modelo Logit
∂Pi∂X ij
=EMgX=β j Pi(1−Pi)
Donde: - Pi: La variable endógena proyectada- Bi: El parámetro asociado a la variable exógena.
22
Efectos Promedios
a) Efecto marginal de Edad= -0.003878
b) Efecto marginal de Nivestu= -0.082370
c) Efecto marginal de Pago= 0.130163
MODELO DE PROBABILIDAD LINEAL
23
a) Primero estimamos por MCO y predecimos para hallar la varianza.
En el comando escribimos: Genr vau= y(1-y)
genr vau=ocupacionf2*(1-ocuf2)
b) Luego estimamos el modelo de probabilidad lineal
Dependent Variable: OCUPACIONMethod: Least SquaresDate: 10/09/11 Time: 11:22Sample (adjusted): 3606 3909Included observations: 105 after adjustmentsWeighting series: 1/SQR(VAR)
Variable Coefficient Std. Error t-Statistic Prob.
C 0.855748 0.173825 4.923036 0.0000EDAD -0.006678 0.003249 -2.055533 0.0424
NIVESTU -0.036780 0.092502 -0.397613 0.6918PAGO 0.040684 0.160000 0.254273 0.7998
Weighted Statistics
R-squared 0.085630 Mean dependent var 0.662935Adjusted R-squared 0.058471 S.D. dependent var 0.484779S.E. of regression 0.470393 Akaike info criterion 1.366855Sum squared resid 22.34825 Schwarz criterion 1.467959Log likelihood -67.75990 F-statistic 1.504437Durbin-Watson stat 1.265254 Prob(F-statistic) 0.217973
Unweighted Statistics
R-squared 0.035667 Mean dependent var 0.657143Adjusted R-squared 0.007024 S.D. dependent var 0.476941S.E. of regression 0.475263 Sum squared resid 22.81336Durbin-Watson stat 1.299452
8. PREDICCION DEL MODELO PROBIT
24
Para este ítem se evaluara la capacidad predictiva del modelo en base a los 316 últimos datos, luego se procederá a calcular el R2 de Conteo.
Rango: 1 – 3910Sample: 3601 3910
Utilizando el modelo Logit, para las 310 últimas observaciones, predecimos la variable ocupacion→ ocupaciónf1
Aplicando el siguiente criterio Ocupacionf1>0.5 →1 Ocupacionf1Ocupacionf1<=0.5 →0
PREDICCION
25
obs OCUPACION OCUPACIONF13601 NA NA3602 NA 1.0000003603 NA NA3604 NA NA3605 1.000000 NA3606 1.000000 1.0000003607 1.000000 1.0000003608 NA 1.0000003609 1.000000 NA3610 1.000000 NA3611 1.000000 1.0000003612 0.000000 NA3613 1.000000 NA3614 1.000000 1.0000003615 0.000000 1.0000003616 NA NA3617 NA NA3618 1.000000 NA3619 0.000000 NA3620 1.000000 NA3621 1.000000 1.0000003622 NA 1.0000003623 NA NA3624 1.000000 NA3625 0.000000 NA3626 NA NA3627 NA NA3628 NA NA3629 1.000000 NA3630 1.000000 1.0000003631 NA NA3632 1.000000 NA3633 1.000000 1.0000003634 0.000000 1.0000003635 NA NA3636 NA NA3637 NA NA3638 1.000000 NA3639 0.000000 0.0000003640 0.000000 NA3641 NA 1.0000003642 NA 1.0000003643 NA NA3644 0.000000 NA3645 1.000000 NA3646 0.000000 1.0000003647 1.000000 NA3648 1.000000 1.000000
26
3649 NA 1.0000003650 1.000000 NA3651 NA NA3652 1.000000 NA3653 NA 1.0000003654 NA NA3655 1.000000 NA3656 1.000000 NA3657 NA NA3658 NA 1.0000003659 1.000000 NA3660 0.000000 1.0000003661 1.000000 NA3662 1.000000 1.0000003663 1.000000 NA3664 1.000000 NA3665 1.000000 1.0000003666 NA NA3667 1.000000 NA3668 0.000000 1.0000003669 NA NA3670 NA 1.0000003671 NA NA3672 1.000000 NA3673 0.000000 1.0000003674 1.000000 NA3675 0.000000 1.0000003676 1.000000 NA3677 NA 1.0000003678 NA NA3679 1.000000 NA3680 1.000000 1.0000003681 NA 1.0000003682 NA NA3683 NA NA3684 1.000000 1.0000003685 1.000000 NA3686 0.000000 1.0000003687 1.000000 NA3688 1.000000 1.0000003689 1.000000 1.0000003690 1.000000 NA3691 NA 1.0000003692 NA NA3693 1.000000 NA3694 1.000000 1.0000003695 1.000000 1.0000003696 1.000000 1.0000003697 1.000000 1.0000003698 1.000000 1.0000003699 NA NA
27
3700 0.000000 NA3701 1.000000 NA3702 0.000000 1.0000003703 NA NA3704 NA NA3705 1.000000 NA3706 1.000000 1.0000003707 1.000000 1.0000003708 NA 1.0000003709 1.000000 NA3710 1.000000 1.0000003711 NA 0.0000003712 NA NA3713 1.000000 NA3714 1.000000 1.0000003715 1.000000 1.0000003716 NA 1.0000003717 NA NA3718 1.000000 NA3719 0.000000 0.0000003720 0.000000 NA3721 1.000000 NA3722 NA NA3723 0.000000 NA3724 0.000000 NA3725 1.000000 NA3726 0.000000 0.0000003727 0.000000 NA3728 0.000000 NA3729 0.000000 NA3730 0.000000 NA3731 1.000000 NA3732 1.000000 0.0000003733 0.000000 1.0000003734 0.000000 NA3735 NA NA3736 NA NA3737 NA NA3738 1.000000 NA3739 1.000000 1.0000003740 0.000000 1.0000003741 NA NA3742 NA NA3743 1.000000 NA3744 1.000000 1.0000003745 1.000000 1.0000003746 1.000000 1.0000003747 0.000000 1.0000003748 0.000000 NA3749 0.000000 NA3750 1.000000 NA
28
3751 1.000000 1.0000003752 1.000000 1.0000003753 1.000000 0.0000003754 1.000000 1.0000003755 NA NA3756 0.000000 NA3757 1.000000 NA3758 1.000000 1.0000003759 0.000000 1.0000003760 1.000000 0.0000003761 NA NA3762 NA NA3763 1.000000 NA3764 0.000000 1.0000003765 0.000000 NA3766 1.000000 NA3767 NA NA3768 NA NA3769 0.000000 NA3770 0.000000 NA3771 1.000000 NA3772 1.000000 1.0000003773 0.000000 1.0000003774 0.000000 NA3775 1.000000 NA3776 0.000000 1.0000003777 0.000000 NA3778 NA NA3779 1.000000 NA3780 1.000000 1.0000003781 0.000000 1.0000003782 1.000000 NA3783 0.000000 1.0000003784 NA NA3785 0.000000 NA3786 0.000000 NA3787 1.000000 NA3788 0.000000 NA3789 NA NA3790 NA NA3791 0.000000 NA3792 1.000000 NA3793 1.000000 1.0000003794 1.000000 1.0000003795 NA NA3796 1.000000 NA3797 1.000000 1.0000003798 1.000000 1.0000003799 NA 1.0000003800 1.000000 NA3801 0.000000 1.000000
29
3802 0.000000 NA3803 0.000000 NA3804 0.000000 NA3805 1.000000 NA3806 1.000000 1.0000003807 0.000000 NA3808 1.000000 NA3809 1.000000 0.0000003810 1.000000 1.0000003811 0.000000 NA3812 1.000000 NA3813 NA NA3814 NA 1.0000003815 1.000000 NA3816 1.000000 NA3817 1.000000 1.0000003818 0.000000 1.0000003819 0.000000 0.0000003820 1.000000 NA3821 NA 0.0000003822 1.000000 1.0000003823 1.000000 NA3824 NA 1.0000003825 1.000000 NA3826 0.000000 NA3827 1.000000 0.0000003828 NA NA3829 NA 1.0000003830 1.000000 NA3831 1.000000 1.0000003832 1.000000 1.0000003833 1.000000 1.0000003834 1.000000 1.0000003835 1.000000 1.0000003836 1.000000 1.0000003837 1.000000 0.0000003838 1.000000 NA3839 0.000000 1.0000003840 NA NA3841 0.000000 1.0000003842 0.000000 1.0000003843 0.000000 1.0000003844 0.000000 1.0000003845 0.000000 0.0000003846 1.000000 1.0000003847 NA 1.0000003848 NA 1.0000003849 0.000000 NA3850 1.000000 1.0000003851 1.000000 NA3852 1.000000 1.000000
30
3853 1.000000 1.0000003854 NA NA3855 1.000000 NA3856 0.000000 1.0000003857 NA NA3858 1.000000 NA3859 1.000000 1.0000003860 NA NA3861 NA 1.0000003862 0.000000 NA3863 1.000000 1.0000003864 1.000000 NA3865 1.000000 1.0000003866 NA NA3867 1.000000 NA3868 1.000000 NA3869 1.000000 1.0000003870 NA NA3871 1.000000 1.0000003872 0.000000 NA3873 1.000000 NA3874 0.000000 1.0000003875 NA NA3876 1.000000 NA3877 1.000000 1.0000003878 1.000000 0.0000003879 1.000000 1.0000003880 NA NA3881 NA NA3882 0.000000 NA3883 1.000000 NA3884 1.000000 NA3885 NA 0.0000003886 NA 1.0000003887 NA NA3888 NA NA3889 1.000000 1.0000003890 0.000000 1.0000003891 NA NA3892 1.000000 NA3893 0.000000 1.0000003894 1.000000 NA3895 1.000000 NA3896 NA 1.0000003897 1.000000 NA3898 0.000000 1.0000003899 NA NA3900 NA 1.0000003901 NA NA3902 1.000000 NA3903 0.000000 1.000000
31
3904 1.000000 NA3905 NA 1.0000003906 NA NA3907 NA NA3908 1.000000 1.0000003909 1.000000 1.0000003910 NA NA
Luego se procede a generar la variable dife:
GENR D1=OCUPACION-OCUPACIONF1
Descriptive Statistics for DIFECategorized by values of DIFEDate: 10/09/11 Time: 11:17Sample (adjusted): 3606 3909Included observations: 105 after adjustments
DIFE Mean Std. Dev. Obs.-1 -1.000000 0.000000 310 0.000000 0.000000 671 1.000000 0.000000 7
All -0.228571 0.559140 105
RConteo2 =nº pred .correctas
nº total .observ .=67
105=0 .6380
El modelo predice bien a los individuos que no se encuentran ocupados por ahora en
algún empleo o trabajo.
Con un R2 de Conteo de 0.638 podemos concluir que el modelo predice bien el 63,8%
de las observaciones.
32
CONCLUSION
El mejor modelo resultante fue el modelo Logit, dado que cuenta con mejores estimadores y con un mejor R2 a comparación del modelo Probit, sin embargo los resultados varían por solo centésimas, por ello se puede considerar indiferente a la hora de elegir entre uno u otro. La predicción también no están acertada pues solo predice bien el 63% de las observaciones, esto debido a la falta de valores en varias observaciones.
33
BIBLIOGRAFÍA
1.- ARRANZ J.; GARCÍA, C. (2009) “Pobreza en España”. Universidad de
España.
2.- JARAMILLO, M. y MONTALVA, V. (2009) “Pobreza e impactos
heterogéneos de las políticas activas de empleo juvenil: el caso de PROJOVEN
en el Perú”. Documento de Trabajo N° 54; Grupo de Análisis para el Desarrollo
GRADE. Lima.
3.- LANJOUW P. (1996) “Empleo no agrícola y pobreza en El Salvador Rural”.
Banco Mundial. El Salvador.
4.- Cuadros estadísticos: De Lima Metropolitana y la Provincia Constitucional del Callao.Página Web (MICRODATOS INEI)
34