separata de mÉtodos_estadisticos-gp y educ..pdf

Upload: antonioorlando

Post on 05-Mar-2016

71 views

Category:

Documents


4 download

TRANSCRIPT

  • 1

    Mag. Rosa Vilchez Vsquez

    SEMESTRE 2015-II

    SEDE HUARAZ

  • 2

    INDICE

    INTRODUCCION..03 I. ESTADISTICA DESCRIPTIVA

    1. LA ESTADISTICA. 04 2. POBLACION.. 04 3. PARAMETRO 04 4. MUESTRA.. 04 5. ESTADISTICO.. 04 6. VARIABLE.. 04 7. EL METODO ESTADISTICO 05

    II. MUESTREO 1. VENTAJAS DEL MUESTREO.. 10 2. TIPO DE MUESTREO.. 11

    A) MUESTREO NO PROBABILISTICO.. 11 B) MUESTREO PROBABILISTICO 12

    3. TAMAOS DE MUESTRA 13 PARA LA MEDIA POBLACIONAL... 13 PARA LA PROPORCION POBLACIONAL.... 14

    4. AGRUPACION Y PRESENTACION DE DATOS.... 15 DISTRIBUCION DE FRECUENCIAS.... 16

    5. REPRESENTACIONES GRAFICAS.. 17 6. MEDIDAS DE TENDENCIA CENTAL. 25 7. MEDIDAS DE DISPERSION. 26

    III. PROBABILIDADES 1. EXPERIMENTO ALEATORIO.. 36 2. ESPACIO MUESTRAL. 32 3. PROBABILIDAD DE UN EVENTO ALEATORIO.. 33 4. PROBABILIDAD CONDICIONAL. 34 5. REGLA DE LA MULTIPLICACION 36 6. PRUEBA DE BAYES. 37

    IV. PRUEBA DE HIPOTESIS 1. PRUEBA DE HIPOTESIS. 39 2. HIPOTESIS ESTADISTICAS 39 3. TIPOS DE ERRORES. 40 4. PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL 41 5. PRUEBA DE HIPOTESIS PARA LA COMPARACION DE MEDIAS DE DOS

    POBLACIONALES.. 42 6. PRUEBA DE HIPOTESIS PARA LA PROPORCIN POBLACIONAL. 43 7. PRUEBA DE HIPOTESIS PARA LA COMPARACION DE PROPORCIONES DE

    DOS POBLACIONES... 44 8. PRUEBA DE INDEPENDENCIA... 45

    V. REGRESION Y CORRELACION LINEAL 1. INTRODUCCION.. 47 2. REGRESION LINEAL SIMPLE.. 48 3. COEFICIENTE DE DETERMINACION.. 48 4. CORRELACION LINEAL 49 5. PRUEBA DE HIPOTESIS PARA LA CORRELACION. 49 6. REGRESION LINEAL MULTIPLE 51

    VI. TABLAS ESTADSTICAS: . 56

  • 3

    INTRODUCCIN

    La estadstica es una ciencia con base matemtica referente a la recoleccin, anlisis e interpretacin de

    datos, que busca explicar condiciones regulares en fenmenos de tipo aleatorio. Se considera un eje

    transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, y es usada para

    la toma de decisiones en reas de negocios e instituciones gubernamentales.

    Es por ello que no existe posibilidad de tener sistemas eficientes de monitoreo y evaluacin de resultados

    de la gestin pblica sin confiables y oportunos sistemas nacionales de estadstica, de all que esta

    herramienta resulta fundamental para la Gerencia Pblica.

    Existen bsicamente 4 niveles en la administracin pblica que producen y demandan informacin

    estadstica: el estado, las comunidades autnomas, los estados y los municipios.

    La estadstica mide intensidad, cambio, ubicacin y distribucin y su aplicabilidad permite generar,

    formular, implementar y monitorear polticas, al mismo tiempo que sirve para declarar que una poltica

    fue exitosa o que fue un fracaso.

    La aplicabilidad de la estadstica permite obtener informacin oportuna, creble y relevante esencial para

    mejorar el funcionamiento del sector pblico y privado en nuestro pas. La necesidad de datos de alta

    calidad, producidos a tiempo, ampliamente accesibles, y que sean tiles para la gestin pblica se ha

    vuelto una prioridad en la agenda del gobierno.

    Este ejemplar se ha distribuido en ocho partes, que proporcionan los principios bsicos del curso de

    Mtodos Estadsticos. Las primeras partes estn dedicadas a la Estadstica Descriptiva, la cual constituye

    la base previa de cualquier anlisis estadstico considerando las Tcnicas de muestreo y la Regresin

    Lineal y Correlacin.

    En las dos ltimas partes, estn dedicadas al estudio de la Inferencia Estadstica, comprendiendo tcnicas

    como loa estimacin por intervalos y el contraste de hiptesis, con objeto de proporcionar al participante

    instrumentos para la toma de decisiones cuando prevalece el azar.

  • 4

    I. ESTADISTICA DESCRIPTIVA

    1. LA ESTADSTICA: La Estadstica es una ciencia que trata de la recoleccin, organizacin, presentacin

    y anlisis de datos con el fin de realizar una toma de decisiones ms adecuada.

    2. POBLACIN: Una poblacin es un conjunto de elementos (que consiste de personas, objetos, etc.),

    que contienen una o ms caractersticas observables de naturaleza cualitativa o cuantitativa que se

    pueden medir en ellos.

    Las poblaciones se clasifican: por extensin y por el objeto de estudio;

    POR EXTENSIN: las poblaciones pueden ser:

    a) Poblacin finita: cuando los elementos son numerables.

    b) Poblacin infinita: cuando no se puede determinar el ltimo elemento.

    POR EL OBJETO DE ESTUDIO: las poblaciones pueden ser:

    a) Poblacin objeto: es la totalidad de elementos en discusin y acerca de los cuales

    necesitamos informacin. Ejemplo: Poblacin de estudiantes universitarios

    b) Poblacin muestreada: Es la que restringe solo al conjunto de la cual se obtiene la muestra.

    Ejemplo: Poblacin de estudiantes de pre-grado de contabilidad de la UNASAM

    matriculados en el semestre 2014-I.

    3. UNIDAD DE ANLISIS: Es el objeto del cual se desea obtener informacin. Muchas veces nos

    referimos a las unidades de anlisis con el nombre de elementos. Una poblacin puede definirse

    como el conjunto de unidades de anlisis.

    4. PARAMETRO: Es una medida descriptiva que resume una caracterstica de la poblacin, tal como la

    media poblacional (), la varianza poblacional (2) o la proporcin poblacional (P); calculado a partir

    de los datos observados de toda la poblacin.

    5. MUESTRA: Es un subconjunto que seleccionamos de la poblacin de acuerdo a un plan de muestreo

    y cumple con dos caractersticas de ser representativo y adecuado.

    6. ESTADISTICO: Es una medida descriptiva que resume una caracterstica de la muestra, tal como la

    media muestral (), la varianza muestral (S2) o la proporcin muestral (), calculada a partir de los

    datos observados de una muestra aleatoria.

    7. VARIABLE: es una caracterstica definida en la poblacin por la investigacin estadstica, que puede

    tomar dos o ms valores (cualidades o nmeros).

  • 5

    Las variables pueden ser de dos tipos,

    Segn su naturaleza:

    7.1 Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo:

    nacionalidad, color de la piel, sexo, ocupacin, opinin sobre un servicio, etc).

    Nominal.- Los elementos solo pueden ser clasificados en categoras pero no se da un

    orden o jerarqua.

    Ordinal.- Existe un orden o jerarqua entre las categoras.

    De intervalo.- Establece la distancia entre una medida y otra. Carece de un cero

    absoluto.

    De razn.- Es posible establecer la proporcionalidad. Existe el cero absoluto. Se permiten

    todas las operaciones aritmticas.

    7.2 Variables cuantitativas: utiliza un instrumento de medicin, tienen valor numrico

    Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

    Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: tamao

    familiar, nmero de empresas que no cumplen las normas de saneamiento ambiental,

    etc.

    Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,

    ingreso familiar, peso, talla, presin sangunea, temperatura, etc.

    Segn su funcin:

    7.3 Variable independiente: Es aquella caracterstica o propiedad que se supone es la causa

    del fenmeno estudiado.

    7.4 Variable dependiente: Es el factor que es observado y medido para determinar el efecto

    de la variable independiente.

    8. EL METODO ESTADISTICO:

    Existe similitud entre el mtodo estadstico y el mtodo cientfico, por lo que consta de cuatro

    etapas: planteamiento, recoleccin de datos, procesamiento y anlisis e interpretacin.

    Etapa 1. PLANTEAMIENTO

    En esta etapa se disea la investigacin en todos sus aspectos:

    Formulacin del problema de investigacin

    Se fijan los objetivos

  • 6

    Se plantean las hiptesis

    Definicin de trminos y variables

    Se define la metodologa del estudio: tipo de estudio, poblacin, diseo muestral,

    tcnicas de procesamiento y anlisis de datos.

    Se define el cronograma, presupuesto y financiamiento del estudio.

    DEFINICION DE TERMINOS Y VARIABLES (OPERACIONALIZACION DE VARIABLES)

    Es la definicin conceptual y operacional de las variables, pasando de un nivel abstracto a un

    nivel concreto y especifico a efectos de poder observarla, medirla o manipularla, con el

    propsito de contrastar la hiptesis. Se debe de precisar el significado de las variables en estudio

    y como se miden.

    Las variables deben ser descompuestas en dimensiones y estas a su vez traducidas en

    indicadores que permitan la observacin directa y la medicin

    Procedimiento para operacionalizar las variables:

    Identificacin de las variables (reconoce el tipo de variable)

    Definicin conceptual (depende del enfoque terico y las hiptesis que se plantea)

    Definicin operacional (seala su dimensin)

    El indicador (sub-variable que se pueda observar, medir, controlar, manipular o evaluar.

    Los indicadores cumplen las siguientes funciones:

    - Sealar con exactitud la informacin que se desea recoger.

    - Indicar las fuentes a las que se debe recurrir.

    - Ayudar a determinar y a elaborar los instrumentos de recoleccin de datos.

    Etapa 2. RECOLECCION DE DATOS

    La recoleccin de datos se refiere a los mtodos usados para obtener informacin

    pertinente de las unidades de anlisis introducidas en una muestra o en una poblacin.

    A esta etapa tambin se le conoce como Recopilacin de datos

    A) METODOS DE RECOLECCION DE DATOS

    Se refiere a los instrumentos a aplicar en la poblacin o muestra.

    Censo: Cuando se recoge datos de todos los elementos de la poblacin.

    Encuesta: Cuando se recoge datos de una muestra de la poblacin.

  • 7

    B) TECNICAS DE RECOLECCION DE DATOS

    Son aquellas que provienen de las fuentes originales y se recopilan directamente en el campo

    especfico. Las tcnicas que se emplean son:

    Observacin

    Entrevista (por cuestionario, por telfono, por correo)

    Experimento

    Registros documentarios, entre otros

    C) FUENTES DE RECOLECCION DE DATOS

    Primarias: Son aquellas que provienen de las fuentes originales y se recopilan directamente en

    el campo especifico.

    Secundarias: Cuando los datos obtenidos fueron previamente recogidos y procesados por

    otros individuos (textos, revistas)

    Ejemplos:

    Portal del Estado Peruano. www.peru.gob.pe/

    Instituto Nacional de Estadstica e Informtica. www.inei.gon.pe/

    Ministerio de Trabajo. www.mintra.org.pe

    Ministerio de Educacin. www.minedu.org.pe

    D) ERRORES EN LA RECOLECCION DE DATOS

    Los errores que pueden cometerse en la recoleccin de datos de una investigacin dependen

    de:

    El observador. Se refiere al nivel diferente de preparacin o entrenamiento de los

    observadores, el estado fsico, condiciones de trabajo de la persona que realiza la

    observacin; estos aspectos pueden distorsionar la medicin de los registros y

    caractersticas estudiadas.

    El mtodo de observacin. Se refiere a la calibracin y a la utilizacin de diferentes

    mtodos y tcnicas de recoleccin de datos, tanto de los entrevistados como de los

    instrumentos utilizados para realizar mediciones.

    El objeto o individuo observado. En algunas ocasiones los individuos al sentirse

    observados, cambian sus actitudes, hbitos o conductas.

    E) INSTRUMENTOS DE RECOLECCION DE DATOS

    Cuestionarios

    Test

    Fichas

  • 8

    Guas

    Listas de cotejo

    F) DISEO DE CUESTIONARIOS

    El cuestionario es un instrumento de investigacin, es un medio til y eficaz para recoger

    informacin en un tiempo relativamente breve. Este instrumento se utiliza de un modo

    preferente en el desarrollo de muchas investigaciones.

    En su construccin pueden considerarse preguntas cerradas, abiertas o mixtas.

    Preguntas abiertas (no estructuradas). El encuestado responde con sus propias palabras

    a la pregunta formulada.

    Ejemplos:

    Qu opinin tiene de la biblioteca?..............................................................

    Qu ms le gusta de la biblioteca?...............................................................

    Preguntas cerradas (estructuradas). Cuando la pregunta establece varias respuestas, de

    las cuales el encuestado elegir segn le corresponda.

    Ejemplos:

    Sexo: Femenino ( ) Masculino ( )

    El personal de la biblioteca del colegio es amable al atender a los estudiantes y docentes

    1) Muy en desacuerdo 2) En desacuerdo 3) Ni de acuerdo, ni en

    desacuerdo 4) De acuerdo 5) Muy de acuerdo

    G) REQUISITOS DEL INSTRUMENTO DE MEDICIN

    VALIDEZ. Representa el grado en que un instrumento realmente mida la variable que

    pretende medir. Medida por expertos o jueces

    CONFIABILIDAD. Es una medida que asegura su repetitividad con los mismos resultados.

    Mtodos de mitades partidas, coeficiente de Cronbach, coeficiente KR-20 (variable tipo

    binomial-dicotmica)

    Etapa 3. PROCESAMIENTO

    Es necesario la depuracin de los datos recogidos Representarlos en tablas y grficos estadsticos para facilitar los anlisis.

    Etapa 4. ANALISIS E INTERPRETACION

    Determinacin de los parmetros y estadsticos muestrales para las estimaciones, el ajuste de modelos y las pruebas de las hiptesis planteadas

    Establecer y redactar las conclusiones definitivas.

  • 9

    Ejemplos de modelos de encuestas:

    1. ENCUESTA DE LA COMERCIALIZADORA UNIPEZ S.R.

    Se est realizando un estudio de mercado con el objetivo de analizar informacin para la toma de decisiones con respecto a la venta de la conserva de pescado BELLS con verduras. Para lo cual se ha encuestado a un grupo de amas de casa de una localidad urbana, para conocer el consumo de conservas enlatados. I. DATOS GENERALES

    Edad: ________________

    Sexo: Masculino.. 1 Femenino.. 2

    Zona Geogrfica: Urbanizacin: __________________________

    II. INSTRUCCIONES: Lea atentamente cada interrogante y conteste de manera clara y veraz. Gracias. 1. Consume usted conserva de pescado, es decir pescado en lata?

    SI1 NO 2 2. Si su respuesta fuese SI Qu marca de conserva de pescado consume con mayor

    frecuencia? A1.1 Gloria.4 Compass..2 Fanny.5 Campomar.3 Otros..6

    3. Con respecto a la marca que Ud. utiliza, Cmo lo calificara su calidad?: Baja....1 Media... 2 Alta.... 3

    4. Dnde adquiere Ud. dicha marca de conserva de pescado? Supermercados.1 Mercado.2 Bodegas....3

    5. Indique Ud. en ORDEN DE IMPORTANCIA, los atributos que influyen en su decisin de compra, siendo : 1 Muy importante; 2 Importante; 3 Indiferente; 4 Poco importante; 5 Insignificante

    1 2 3 4 5

    Calidad

    Precio

    Presentacin

    Sabor

    Marca

    6. Con qu frecuencia consume usted conserva de pescado? 1 2 veces a la semana..1 2 3 veces a la semana..2 3 4 veces al mes.....3 6 o ms veces al mes...4

    7. En qu cantidad, en unidades, compra usted la conserva de pescado? 1 lata. 1 3 latas... 3 2 latas... 2 4 a ms..... 4

    8. A qu precio compra usted la conserva de pescado?

  • 10

    s/.3.00 1 s/. 3.50 ... 2 s/.4.00 ... 3 s/.4.50 a ms 4

    9. Con respecto al Producto que Ud. adquiere, su grado de satisfaccin es: Muy satisfechos...1 Poco satisfecho.4 Satisfecho..2 Insatisfecho.5 Indiferente.3

    10. Usted ha probado una Conserva de Pescado con verduras, la cual est incluida dentro de la conserva?

    SI..1 NO2

    11. Si entrara al mercado una nuevo distribuidor UNIPEZ SRL, y este le ofreciera un producto de calidad, especficamente, conservas de pescado, pero que contenga verduras, estara dispuesto a adquirir este producto:

    Muy dispuesto..1 Dispuesto..2 Indiferente..3 Poco Dispuesto.4 Indispuesto..5

    12. Usted, comprara BELLS VERDURAS, a la distribuidora UNIPEZ SRL:

    SI..1 NO.......2

    13. Cunto estara dispuesto a pagar por este producto, sabiendo que es una conserva con trozos de pescado y vegetales, listo para comer?

    s/.3.50 . 1 s/. 4.00 ... 2 s/.4.50 . 3 s/.5.00 a ms 4

    14. Dnde le gustara encontrar este producto? Supermercados.....1 Mercado..2 Bodegas..3

    15. Cul es el medio de comunicacin por el cual Ud. adquiere mayor informacin sobre las

    conservas de pescado? a) Televisin ( ) d) Revistas ( ) b) Radio ( ) e) Afiches ( ) c) Boletines ( )

    16. Qu tipo de promociones le gustara que se promoviera, para la adquisicin de dicho producto?

    a) Ofertas ( ) c) Descuentos ( ) b) Degustaciones ( ) d) Sorteos ( ) e) Otros (especifique):.......................................................

    II. MUESTREO

    Es el proceso de seleccin de una parte representativa de la poblacin que permita estimar los

    parmetros de la poblacin.

    1. VENTAJAS DEL MUESTREO

  • 11

    - Proporciona informacin confiable con costos mucho menores que las de un censo.

    - Los datos se pueden reunir ms rpido.

    - Las estimaciones con frecuencia son mucho ms precisas que las basadas en un censo.

    - Permiten inferir la realidad sin necesidad de estar examinando a toda la poblacin.

    2. TIPOS DE MUESTREO

    A. MUESTREO NO PROBABILISTICO

    En el proceso de seleccin de la muestra hay un juicio personal. No es posible evaluar la

    probabilidad de inclusin de cada elemento en la muestra.

    MUESTREO POR CONVENIENCIA

    Se usa por razones de comodidad o por acceso factible. Por ejemplo realizar una

    encuesta en una de las secciones de un determinado grado de estudios porque es la

    seccin que tiene a su cargo el docente.

    MUESTREO DE JUICIO O INTENCIONAL

    Los elementos de la muestra se espera que sirvan para un propsito de la

    investigacin.

    Ejemplo una encuesta a personas de 20 a 25 aos referente a la msica de moda

    juvenil.

    MUESTREO DE CUOTA

    Es una muestra no probabilstica de manera que la proporcin de elementos con

    ciertas caractersticas estn representados en el grado que al investigador lo

    considere. Por ejemplo a un entrevistador en una ciudad en particular se le asigna 100

    entrevistas 45 para celulares de la empresa A 30 para celulares de la empresa B y 25

    para celulares de la empresa C.

    MUESTREO DE BOLA DE NIEVE:

    En este tipo de muestreo cada unidad muestral es localizada por indicacin de otra

    persona se caracteriza porque hay comodidad en la seleccin de la muestra no tiene

    por qu ser rpida ni cmoda el muestre bola de nieve se emplea cuando se trata de

    estudiar poblaciones muy especializadas, que son difciles de localizar por no existir

    censos o ser inaccesibles y cuando se hacen estudios con poblaciones "marginales",

    delincuentes, sectas, determinados tipos de enfermos, etc. Se trata cuando se busca

  • 12

    estudiar poblaciones pequeas y difcilmente localizables. Por ejemplo la poblacin de

    personas que practican el deporte de esgrima en el puerto de Veracruz, puede no estar

    censado, por lo cual se busca a una persona o profesor que practica dicho deporte, se

    entrevista, y despus se le pregunta dnde y cmo localizar a otros que practican el

    mismo deporte y as se contina el muestreo sucesivamente. Identificar una muestra de

    dueos de perros pequineses. Identificar una muestra de aficionados al parapente.

    B. MUESTREO PROBABILISTICO

    MUESTREO ALEATORIO SIMPLE (MAS)

    Es el muestreo mediante el cual todas las unidades de la poblacin tienen la misma

    probabilidad de constituir la muestra, para evitar la participacin subjetiva, que cambien

    la igualdad de oportunidad que tiene cada elemento, se utiliza los nmeros aleatorios o

    cualquier tipo de proceso aleatorio.

    Ventajas:

    Sencillo y de fcil comprensin

    Calculo rpido de medias y varianzas

    Se basa en la teora estadstica y por tanto existe paquetes informticos para analizar

    los datos.

    MARCO MUESTRAL: la palabra marco se usa ampliamente en lugar de listas de muestreo

    (poblacin muestreada)

    NMEROS ALEATORIOS: Las tablas de nmeros aleatorios son tablas de dgitos del 0, 1,

    2,, 9 donde cada digito tiene la misma probabilidad de ser elegido o seleccionado en cada

    extraccin. Entre las tablas ms grandes estn las que publico la Rand Corporation (1955)

    con milln de dgitos y las de Kendall y Smith (1938) con 100,000 dgitos.

    USOS DE LA TABLA DE NMEROS ALEATORIOS: Cuando se usan las tablas de nmeros

    aleatorios para seleccionar una muestra se debe tener en cuenta los siguientes pasos:

    1. Se determina el tamao de la poblacin N (cuantos dgitos tiene la poblacin).

    2. La tabla de nmeros aleatorios se sectoriza en filas y columnas (nmero de dgitos de

    la poblacin).

    3. Se busca un inicio cualesquiera de la forma matricial.

  • 13

    4. Los nmeros son seleccionados sin repeticin en el rango entre 1 y N

    NUMEROS ALEATORIOS:

    5692 9870 3583 8997 1533 6466 8830 7271 3809 4256

    2080 3828 7880 0586 8482 7811 6807 3309 2729 2235

    1039 3382 7600 1077 4455 8806 1822 1669 7501 8330

    6477 5289 4092 4223 6454 7632 7577 2816 9002 2365

    4554 6146 4846 4647 5034 4646 5139 5355 5249 2224

    0772 2160 7236 0812 4195 5589 0830 8261 9232 0902

    0092 1629 0377 3590 2209 4839 6332 1490 3092 2390

    7315 3365 7203 1231 0546 6612 1038 1425 2709 3092

    5775 7517 8974 3961 2183 5295 3096 8536 9442 2392

    5500 2276 6307 2346 1285 7000 5306 0414 3383 2303

    3251 8902 8843 2103 8567 8131 8116 5270 5994 9092

    3. TAMAOS DE MUESTRA:

    Para determinar el tamao de muestra se debe tener en cuenta la ecuacin fundamental del

    muestreo:

    Precisin: Es la diferencia en trminos de probabilidad entre el parmetro y su estimador (e).

    Nivel de confianza: Es la probabilidad de que la estimacin efectuada se ajusta a la realidad. Es

    el punto crtico de la normal (z) que cuantifica la relatividad del error

    Nivel de confianza (1-) 99.73% 99% 95% 90% 80%

    Valores de Z 3.00 2.58 1.96 1.645 1.28

    CALCULO DEL TAMAO MUESTRAL

    Tamao de muestra para estimar la media poblacional :

    Poblacin infinita o finita muy grande.

    Poblacin finita, cuando se conoce el tamao de la poblacin.

  • 14

    n : tamao de la muestra.

    N : tamao de la poblacin

    Z : valor crtico normal que depende del nivel de confianza.

    2 : varianza poblacional.

    E : margen de error o nivel de precisin.

    Tamao de muestra para la estimacin de la proporcin poblacional:

    Poblacin infinita o finita muy grande.

    Poblacin finita, cuando se conoce el tamao de la poblacin.

    n : tamao de la muestra

    N : tamao de la poblacin

    Z : valor crtico normal que depende del nivel de confianza.

    P : proporcin de la poblacin que tienen la caracterstica de inters. Q = 1 - P

    Ejemplos:

    1. En una ciudad se desea conocer el nmero promedio de oportunidades de trabajo que los

    pobladores mayores de 20 aos han intentado en diferentes instituciones hasta lograr un

    trabajo estable. Por estudios anteriores se sabe que la desviacin estndar es 2 veces

    (oportunidades) y que la poblacin para el estudio es 20550. Cuntas personas deben de

    considerarse en la muestra para que con un error de 0,08 se obtenga los resultados con una

    confianza del 95%?

    Solucin:

    N = 20500

    Z = 1,96

    E = 0,08

    = 2

  • 15

    = 2150

    Se requiere una muestra de 2150 personas, como mnimo.

    2. Una organizacin de apoyo desea saber la proporcin de estudiantes con problemas de

    aprendizaje en un determinado lugar para implementar un programa de actualizacin

    educativa. Qu tamao de muestra ser necesario para realizar el estudio si se considera

    un error de estimacin del 5%, P = 0,4 y una confianza del 95%?

    Solucin:

    P = 0,4; Q = 0,6

    Z = 1,96

    E = 0,05

    n = 369

    El tamao de muestra necesario es 369 estudiantes.

    PROCEDIMIENTOS PARA OBTENER MUESTRAS PTIMAS

    1. Primero se obtiene 0

    2. si 0

    10%, entonces 0 es optimo.

    3. si 0

    > 10%, entonces se corrige con el muestreo sin reemplazo donde n es

    optimo

    =0

    1 +0

    ;

    =0

    1 +0 1

    ;

    4. AGRUPACION Y PRESENTACION DE DATOS

  • 16

    La informacin que se recolecta, antes de ser organizada y analizada se conoce como datos sin

    procesar. Ejemplo la edad, condicin laboral, tiempo de servicio, sueldo mensual y actitud frente al

    trabajo de los 150 empleados de una empresa. Una forma de organizar los datos es

    presentndolos en una tabla o distribucin de frecuencias.

    DISTRIBUCION DE FRECUENCIAS

    Es una forma de presentar los datos organizados en filas y columnas para facilitar la descripcin del

    comportamiento de la variable de inters. Despus de recoger la informacin, se clasifica y ordena

    en una tabla de frecuencias o tabla estadstica.

    Ejemplo 1.

    La informacin siguiente son edades de 30 profesionales que asisten a la Escuela de Postgrado de la

    UCV.

    45 32 43 40 28 36

    47 41 50 37 34 59

    25 45 48 42 51 50

    30 48 41 35 40 55

    37 24 45 47 45 49

    Rango: R = max min = 59 24 = 35

    El nmero de intervalos segn sturges es :

    K = 1 + 3,3 log 30 (log 30 = 1.48)

    K = 5,87 6 intervalos

    Amplitud Intervlica: =

    =

    35

    6= 5,83 6

    Teniendo en cuenta esta amplitud formamos 6 intervalos o clases, en la primera columna de

    la tabla y, si es necesario, se calculan los puntos medios o marcas de clase para cada clase.

    =+

    2

    Li = lmite inferior de clase Ls = lmite superior de clase

    Frecuencias absolutas

  • 17

    Frecuencia absoluta simple (fi) es el nmero de veces que aparece cada observacin en el

    conjunto de datos originales, la suma de todas las frecuencias absolutas es igual al tamao de la

    muestra o poblacin, segn sea el caso ( fi = n). Las frecuencias absolutas acumuladas (Fi) se

    obtienen acumulando las frecuencias absolutas simples, excepto la primera frecuencia (F1 = f1).

    Frecuencias relativas

    Frecuencia relativa simple (hi) es la proporcin que existe entre la frecuencia absoluta simple y

    el tamao de muestra hi = fi/n, hi = 1. Para obtener las frecuencias relativas acumuladas (Hi),

    se acumulan las frecuencias relativas simples, excepto la primera frecuencia (H1 = h1).

    Algo importante a tener en cuenta es que, en la prctica cuando se publica una tabla,

    generalmente no se requieren utilizar o presentar los diferentes tipos de frecuencias

    mencionados. Lo usual es considerar slo las frecuencias absolutas, los porcentajes simples y,

    cuando es pertinente, los porcentajes acumulados. Asimismo, se debe utilizar la simbologa

    estadstica slo cuando sea estrictamente necesaria y siempre indicar la fuente de origen de los

    datos. Tambin es importante sealar que las tablas deben tener un nmero que las identifique

    y su correspondiente ttulo, claro y preciso.

    Tabla 1.

    Edades de 30 profesionales de la Escuela de Postgrado de la Universidad Csar

    Vallejo Edad Xi N de Profe-

    sionales Fi hi Hi % %

    acumulado 24 a menos de 30

    30 a menos de 36

    36 a menos de 42

    42 a menos de 48

    48 a menos de54

    54 a menos de 60

    27

    33

    39

    45

    51

    57

    3

    4

    7

    8

    6

    2

    3

    7

    14

    22

    28

    30

    0,10

    0,13

    0,23

    0,27

    0,20

    0,07

    0,10

    0,23

    0,46

    0,73

    0,93

    1,00

    10

    13

    23

    27

    20

    7

    10

    23

    46

    73

    93

    100 Total 30 1,00 100

    Fuente. Base de datos de la Escuela de Postgrado

    Segn la informacin que presenta la tabla 1, la clase de edad ms frecuente es la de 42 a

    menos de 48 aos, con el 27% de profesionales, le sigue la clase de 36 a menos de 42 aos con

    el 23 % de profesionales y la clase de edad menos frecuente es la de 54 a menos de 60 aos con

    un 7% de profesionales. Asimismo, el 73% de los profesionales tienen edad menor de 48 aos.

  • 18

    Como se dijo anteriormente, en la prctica al presentar esta tabla para difusin, se consideraran

    slo la primera, tercera, penltima y ltima columna y se agregara la fuente de donde provienen

    los datos. Adems se debe remplazar fi por n de profesionales.

    5. REPRESENTACIONES GRFICAS

    Histograma de frecuencias

    Se caracterizan por considerar rectngulos adyacentes teniendo como base la amplitud de cada

    intervalo y como altura las frecuencias. A continuacin se presenta el histograma de frecuencias

    simples correspondiente a la tabla 1.

    Polgono de frecuencias

    Se grafica teniendo en cuenta los puntos medios o marcas de clase y las frecuencias

    correspondientes. El polgono simple para la tabla 1 es el siguiente.

    En su presentacin, para difusin, los grficos deben tener, como la tabla, n, ttulo y fuente.

    Ejemplo 2.

    3 24 0 36 42 48 54 X

    fi

    5

    57 33 39 45 51 27

    X

    fi

    5

  • 19

    Se ha clasificado a 20 individuos (n=20 y k=4), segn su nivel de estudios que puede

    tomar valores: Nivel de estudios

    1 Sin estudios

    2 Primarios

    3 Secundarios

    4 Superiores

    y se han obtenido los siguientes datos: 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3

    Frecuencias absolutas:

    f1=3; f2=7; f3=6; f4=4

    = + + + = + + + =

    Frecuencias relativas:

    =

    = . ; =

    = . ; =

    = . ; =

    = .

    + + + = . + . + . + . = .

    Distribucin de frecuencias:

    Tabla 2

    Nivel de estudios de un grupo de individuos que

    laboran en la UGEL. Huaraz Categoras fi hi Fi

    Sin estudios 3 0,15 3

    Primaria 7 0,35 10

    Secundaria 6 0,3 16

    Superior 4 0,2 20

    Total n=20 1

    Fuente: Resultados de encuesta aplicado a los individuos

    La categora ms frecuente es la de estudios primarios y la menos frecuente la de sin estudios.

    REPRESENTACIN GRFICA DE LA DISTRIBUCIN DE FRECUENCIAS

  • 20

    a) Grfico de barras: Cada barra representa una categora, puede representarse en forma

    absoluta o porcentual; de la tabla 2 obtenemos la siguiente grfica de barras.

    Grfico N 3. Nivel de estudios de un grupo de individuos que

    laboran en la UGEL. Huaraz

    b) Grfica Circular: Llamada tambin de sectores o de pastel, resulta til para representar una

    distribucin de frecuencias porcentuales. Se puede preferir al grfico de barras, cuando el n de

    categoras no es muy grande. A partir de la tabla 2, se obtiene el siguiente grfico circular.

    Grfico N 4. Nivel de estudios de un grupo de individuos que laboran en la UGEL. Hz.

    Ejemplo 3:

    Se aplic una encuesta a 27 trabajadores de la empresa ANITA y se les pregunto su edad, los

    datos obtenidos fueron:

    30 26 29 27 31 22 29 17 21

    36 41 30 21 36 26 18 31 23

    27 29 19 17 23 29 30 24 29

    a) Identificar: poblacin, muestra, unidad estadstica, variable y tipo de variable.

    0%

    5%

    10%

    15%

    20%

    25%

    30%

    35%

    Sin estudios Primarios Secundarios Superiores

    15%

    35% 30%

    20%

    Sin estudios, 15%

    Primarios, 35%

    Secundarios, 30%

    Superiores, 20%

  • 21

    Poblacin : Todos los trabajadores de la empresa Anita

    Muestra : 27 trabajadores

    Unidad estadstica : Un trabajador

    Variable : Edad

    Tipo de variable : Cuantitativa-continua.

    b) Construir una tabla de distribucin de frecuencias adecuada.

    Rango = Dato mayor-Dato menor, R= 41-17= 24

    - Determinar el valor de k (nmero de intervalos):

    Ley de Sturges: k = 1+3.3 log (n) (muestra)

    K = 1+3.3 log (27)= 5.7 6 (redondeando al entero)

    k= 5 < n

  • 22

    Creamos etiquetas:

    Analizar Estadsticos descriptivos frecuencias

    y arrastrar la nueva variable y aceptar

    Edad de los trabajadores (agrupado)

    Marca de

    clase

    Frecuencia Porcentaje Porcentaje

    vlido

    Porcentaje

    acumulado

    Vlidos

    17-21 19 4 14,8 14,8 14,8

    21 - 25 23 6 22,2 22,2 37,0

    25 - 29 27 4 14,8 14,8 51,9

    29 - 33 31 10 37,0 37,0 88,9

    33 - 37 35 2 7,4 7,4 96,3

    37-41 39 1 3,7 3,7 100,0

    Total 27 100,0 100,0

  • 23

    c) Interpretar: f2; h3 ; h1 % ; F4

    f2 = 6 seis trabajadores tienen desde 21 aos pero menos de 25 aos

    h3 = la proporcin de trabajadores que tienen de 25 aos pero menos de

    29 aos es de 0.148

    h1% = 14.8%, el 14.8% de los trabajadores tienen de 17 a menos de 21 aos.

    Grfica del Histograma:

    Analizar Estadsticos descriptivos Frecuencias

    Seleccionar la variable a graficar y desactivar mostrar tabla de frecuencia

    Seleccionar grficos Tipos de grficos Seleccionar Histogramas, mostrar

    curva normal, continuar y aceptar.

    POLIGONO DE FRECUENCIA

  • 24

    Segn la grfica se observa que del segundo y cuarto intervalo del grupo de edades de los

    trabajadores, representados 21 a 25 aos y de 29 a 33 aos respectivamente; corresponden

    a un 22.2% y 37.0% lo que equivalen a ms del 50% de los trabajadores.

    EJERCICIOS DE REPASO N 1

    1. Las edades de los 50 integrantes de un programa social municipal son:

    75 92 65 64 82

    94 74 83 78 51

    80 78 44 88 84

    60 65 63 76 68

    51 72 40 83 70

    56 60 91 61 45

    66 67 51 64 50

    75 62 85 69 48

    42 41 88 95 70

    53 55 71 80 43

    a) Construir distribuciones de frecuencias con 7 clases y calcular los porcentajes simples y

    acumulados.

    b) Graficar los histogramas de frecuencias absolutas y porcentuales simples y los polgonos

    correspondientes.

    c) Interpretar la segunda frecuencia absoluta simple, el tercer % simple.

    d) Interpretar los porcentajes acumulados tercero, cuarto y quinto.

    2. El nmero de minutos que les toma a 30 empleados de una institucin en llegar desde su casa a su centro de trabajo son:

    40.3 40.1 41.6 25.4 26.3

    20.5 28.3 35.5 38.2 40.2

    50.5 48.5 28.0 42.5 39.5

    35.7 14.0 50.2 50.0 20.3

    30.4 17.2 30.3 41.7 17.2

    25.2 20.8 36.5 38.5 40.5

    a) A partir de los datos elabore una distribucin de frecuencias con intervalos de clases iguales.

    b) Calcular los porcentajes simples y acumulados.

  • 25

    c) Interpretar dos porcentajes simples y dos acumulados.

    d) Graficar el histograma y polgono de frecuencias

    3. Los siguientes datos representan los tamaos de 40 familias que residen en la ciudad.

    4, 7,10, 8, 10, 6, 7, 5, 6, 10, 3, 2, 4, 3, 5, 4 5, 6, 6, 4,

    12, 6, 8, 9, 3, 5, 8, 4, 5, 3, 7, 5, 10, 4, 6, 3, 12, 8, 4, 5.

    a) Construya una tabla de frecuencias para estos datos.

    b) Representar la informacin mediante el grfico de barras.

    6. MEDIDAS DE TENDENCIA CENTRAL:

    MEDIA ARITMETICA.- La media aritmtica es la suma de los valores observados dividido entre el

    nmero de observaciones. La media aritmtica de una muestra se obtiene mediante

    =

    datos no tabulados (I)

    =

    datos tabulados (II)

    = valores de la variables o puntos medios

    =

    Debe tenerse presente que cuando se calcula la media aritmtica con la frmula (II) y los datos estn

    agrupados en clases, el promedio que se obtiene es aproximado.

    MODA.-Moda es el valor ms comn en una distribucin. Si se trata de una tabla de datos agrupados

    en clases, tambin se puede hallar la clase modal.

    MEDIANA

    Se ubica en la posicin central que ocupa el orden de su magnitud, dividiendo la informacin en dos

    partes iguales, dejando igual nmero de datos por encima y por debajo de la mediana.

    CUARTILES

    Son tres valores posicionales que dividen a la distribucin o conjunto de datos ordenado en cuatro

    partes iguales: 1; 2 3

    Ejemplo 4:

    Las puntuaciones obtenidas en una muestra de 10 participantes en un torneo de ajedrez en base a 100

    puntos como mximo son:

    70, 80, 50, 95, 75, 65, 90, 85, 60, 90

  • 26

    a) La puntuacin promedio es:

    = 76 puntos

    b) El puntaje que se presenta con mayor frecuencia es 90 puntos que representa la moda.

    c) Cul es la mediana?

    Ordenando los datos en forma ascendente se obtiene:

    50; 60; 65; 70; 75; 80; 85; 90; 90; 95

    Como el tamao de muestra es 10 (n par) la mediana es:

    Me =

    El 50% de los participantes en el torneo de ajedrez obtuvieron puntajes menores de 77.5

    7. MEDIDAS DE DISPERSIN

    RANGO O RECORRIDO

    Es la diferencia entre el valor mximo y el valor mnimo de la distribucin: R = max min.

    VARIANZA

    Es la media de los cuadrados de las desviaciones de los valores de la variable respecto a la media

    aritmtica.

    Varianza Poblacional:

    2 =( )

    2

    Varianza Muestral:

    2 =( )

    2

    1 , para datos no tabulados

    2 =( )

    2 1

    , para datos tabulados

    DESVIACION ESTANDAR

    Es la raz cuadrada de la varianza. La desviacin estndar es: = 2

  • 27

    COEFICIENTE DE VARIACION

    El coeficiente de variacin considera la desviacin estndar con la media aritmtica para

    establecer un valor relativo que hace comparable el grado de dispersin entre dos o ms

    variables o distribuciones de una misma variable. Se utiliza con frecuencia para medir el grado

    de homogeneidad o heterogeneidad de un conjunto de datos.

    S CV =

    X

    Para los datos del ejemplo 4:

    2 =1940

    9= 215.56

    = 215.56 = 14.6818

    =14.6818

    76= 0.1932

    La dispersin de las puntuaciones obtenidas por los participantes en ajedrez es

    aproximadamente 15 puntos. La variacin relativa es 19,3%. Segn este resultado se puede

    considerar que los datos del ejemplo 4 son homogneos.

    MEDIDAS DE ASIMETRA

    La asimetra o sesgo en una distribucin ocurre cuando los valores de la media aritmtica, la

    moda y la mediana no son iguales por la presencia de algunos datos muy diferenciados. Una

    medida para evaluar el sesgo o asimetra de la distribucin se denomina coeficiente de asimetra

    (C.A.)

    Coeficiente de Asimetra

    Teniendo en cuenta la media aritmtica y moda el coeficiente de asimetra es:

    CA =

    Si se considera la media aritmtica con la mediana, el coeficiente de asimetra es:

  • 28

    CA =

    Si CA < 0 la distribucin tiene asimetra negativa.

    Si Ca > 0, la distribucin tiene asimetra positiva.

    Si CA = 0, la distribucin es simtrica.

    CURTOSIS

    Mide el grado de apuntamiento de una distribucin en relacin con la distribucin normal.

    Coeficiente De Curtosis El coeficiente de curtosis para analizar el apuntamiento en una muestra es:

    =(

    2)4/

    (2)2

    Si:

    C < 3 La distribucin es Platicrtica.

    C = 3 La distribucin es Mesocrtica.

    C > 3 La distribucin es Leptocrtica.

    Ejemplo 5

    Una institucin investiga los tiempos en minutos por llamadas telefnicas que hace cada oficina

    durante un da de trabajo. En una muestra de 40 oficinas obtiene lo siguiente:

    Tiempo Xi N de

    llamadas (fi) Fi xi*fi (xi-)2*fi

    10 a menos de 13 11.5 3 3 34.5 113.4675

    13 a menos de 16 14.5 11 14 159.5 109.1475

    16 a menos de 19 17.5 12 26 210 0.27

    19 a menos de 22 20.5 9 35 184.5 73.1025

    22 a menos de 25 23.5 5 40 117.5 171.1125

    Total 706 467.1

  • 29

    Las medidas estadsticas necesarias para calcular los coeficientes de asimetra y curtosis son:

    S

    S = 3,46

    Mo = 16 + Mo = 16,75

    Me = 16 + 3 Me = 17,5

    El coeficiente de asimetra segn la Moda es:

    CA = CA = 0,26

    El coeficiente de asimetra segn la mediana es

    CA = 3 CA = 0,13

    Luego los dos coeficientes de asimetra nos indican que la distribucin tiene una asimetra

    positiva. El coeficiente de curtosis es

    C = C = 2,06

    El valor 2,06 nos indica que la distribucin tiene forma platicurtica.

    Usando el software estadstico SPSS. (Ejemplo de las edades de los trabajadores de la empresa ANITA)

  • 30

    MEDIDAS DESCRIPTIVAS PARA VARIABLES CUANTITATIVA CONTINUA:

    EJERCICIOS DE REPASO N 2

    1. Los siguientes datos (en miles de nuevos soles) representan las

    rentas netas anuales de una muestra de 32 trabajadores de una

    institucin.

    15; 23; 18; 15; 20; 22; 19; 18; 16; 30; 25; 18; 17; 16; 37; 19

    25; 28; 40; 35; 22; 21; 17; 21; 36; 30; 19; 26; 35. 20; 15; 35

    a) Representa un histograma de frecuencias absolutas relativas

    con 5 intervalos de clase.

    b) Cul es la renta promedio de los contribuyentes. Cul su

    dispersin.

    c) Dividir, a partir de datos tabulados la distribucin en 2

    categoras.

    Estadsticos

    Das de la semana

    N Vlidos 89

    Perdidos 0

    Media 2,44

    Mediana 2,00

    Moda 2

    Desv. tp. 1,215

    Varianza 1,476

    Asimetra ,692

    Error tp. de asimetra ,255

    Curtosis ,038

    Error tp. de curtosis ,506

    Rango 5

    Mnimo 1

    Mximo 6

    Suma 217

    Percentiles 25 1,50

    50 2,00

    75 3,00

    Estadsticos

    Edad de los trabajadores (agrupado)

    N Vlidos 27

    Perdidos 62

    Media 3,11

    Mediana 3,00

    Moda 4

    Desv. tp. 1,368

    Varianza 1,872

    Asimetra -,020

    Error tp. de asimetra ,448

    Curtosis -,753

    Error tp. de curtosis ,872

    Rango 5

    Mnimo 1

    Mximo 6

    Suma 84

    Percentiles 25 2,00

    50 3,00

    75 4,00

    Perodo

    de

    atencin

    (minutos)

    Puntuacin

    IQ

    3,0

    5,2

    4,9

    6,3

    5,4

    6,6

    7,0

    6,5

    7,2

    5,5

    5,4

    3,8

    2,7

    2,2

    88

    94

    90

    105

    108

    112

    116

    122

    110

    118

    128

    130

    140

    142

  • 31

    d) Es la distribucin simtrica?

    2. Los datos siguientes se refieren al perodo de atencin (en minutos) y la puntuacin en un test de

    inteligencia (IQ) de 14 nios en edad escolar.

    a) Cules son los promedios del perodo de atencin y del coeficiente de inteligencia?

    b) Calcular e interpretar comparativamente las dispersiones absolutas y relativas para cada

    variable.

    c) Calcular e interpretar el coeficiente de asimetra.

    3. Una empresa que vende computadoras recopil datos con respecto al nmero de entrevistas que

    requeran cada uno de los 40 vendedores para iniciar una venta. La tabla siguiente representa la

    distribucin de frecuencias absolutas.

    a) Graficar el polgono de frecuencias porcentuales simples. b) Cul es el nmero promedio de entrevistas que necesitaron los vendedores para iniciar su

    venta.

    c) Cul es su variacin absoluta y cul su variacin relativa. Interpretar.

    d) Cul es el nmero de entrevistas que la mayora requiri.

    e) Calcular e interpretar el coeficiente de asimetra.

    4. La siguiente distribucin de frecuencias representa

    el tiempo en segundos que los cajeros de un banco

    necesitan para servir a una muestra de clientes en

    el mes de diciembre.

    Hacer el anlisis estadstico descriptivo.

    N de entrevistas N de vendedores

    0 4

    5 9

    10 14

    15 19 20 -25

    6 10 12 8 4

    Tiempo (segundos) N de clientes

    20 -29

    30 39

    40 49

    50 59

    60 69

    70 79

    80 89

    90 99 100 109

    110 119 120 -129

    6 15 20 30 25 22 11 6 4 0 2

  • 32

    III. PROBABILIDADES

    1. EXPERIMENTO ALEATORIO

    Un experimento aleatorio es un proceso de medicin u observacin en el que los resultados no

    se pueden predecir. Por ejemplo el lanzamiento de una moneda y observar si el resultado es

    cara o sello, se fabrican artculos en una lnea de produccin y se cuentan el nmero de artculos

    defectuosos producidos diariamente; observar el tiempo de servicio til en horas de una

    computadora.

    2. ESPACIO MUESTRAL

    Es el conjunto de todos los resultados posibles de un experimento aleatorio. A cada elemento, se

    denomina punto muestral, se nombra por

    S = {s1, s2, . . . , sn}

    Ejemplo 1

    Se lanzan dos monedas simultneamente, el espacio muestral correspondiente es S = {cc,

    cs, sc, ss}

    Ejemplo 2

    Se entrevista a 10 personas preguntndoles la preferencia por determinado diario de

    circulacin nacional. Se reporta el nmero de personas que leen el diario. El espacio muestral es:

    S = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

    EVENTO ALEATORIO

    Es un posible resultado o una combinacin de resultados de un experimento aleatorio. Es un

    subconjunto del espacio muestral S, se conoce tambin como suceso aleatorio.

    Ejemplo 3

    Sea el experimento: lanzar un dado y observar el nmero que aparece en la cara superior. El

    espacio muestral correspondiente es

    S = {1, 2, 3, 4, 5, 6}

    De este experimento podemos definir los siguientes eventos:

    A: Obtener exactamente el nmero 3

    A = {3}

    B : Obtener un nmero menor que 5

  • 33

    B = {1, 2, 3, 4}

    C : Obtener un nmero par

    C = {2, 4, 6}

    D : Obtener un nmero mayor o igual que 4.

    D = {4, 5, 6}

    Evento simple. Consta de un elemento, llamado tambin evento elemental, cada resultado est

    definido por la aparicin de un elemento sencillo, como muestra en el evento A del ejemplo 3.

    Evento compuesto. Est formado por ms de un elemento o punto muestral. Los eventos B, C y D del

    ejemplo 3 son eventos compuestos.

    Eventos Incompatibles. Se llama tambin mutuamente exclusivos, no pueden suceder al mismo

    tiempo, como ejemplo, considere obtener un nmero par e impar al tirar un solo dado una vez;

    si ocurre uno de estos eventos no es posible que el otro evento ocurra.

    Evento Complementario. Dos eventos aleatorios son complementarios si los resultados que no estn

    contenidos en uno estn contenidos en el otro evento. En el ejemplo 3, el evento complementario

    de D: obtener un nmero mayor o igual que 4 es D: obtener un nmero menor que 4.

    D = {1, 2, 3}

    3. PROBABILIDAD DE UN EVENTO ALEATORIO

    Para determinar la probabilidad de un evento A en el espacio muestral S se divide el nmero

    de resultados o elementos del evento A entre el nmero de resultados posibles del espacio

    muestral S. Es decir

    () =

    La probabilidad de un evento A, es un nmero real P(A) que cumple las siguientes propiedades.

    i) P(A) 0

    ii) P(S) = 1

    iii) Si A, A2, , An son eventos mutuamente excluyente de S, entonces

    = (=1

    =1 )

  • 34

    Propiedades de la probabilidad

    1. Para cualquier evento A

    0 P(A) 1

    2. Si A y A son eventos complementarios del espacio muestral S, entonces P(A) = 1 P(A)

    3. Si es un evento imposible o conjunto vaco, P () = 0 para cualquier espacio muestral S.

    4. Si A, B son eventos de un espacio muestral S y A B, entonces P(A) P(B).

    5. Regla de adicin

    Si A, B dos eventos cualesquiera del espacio muestral S, entonces

    P (AB) = P (A) + P (B) P (AB)

    6. Si A, B eventos mutuamente excluyentes, entonces

    P(AB) = P(A) + P (B)

    Ejemplo 4

    De 100 profesionales que solicitaron empleo en una institucin 50 tenan experiencia

    profesional, 20 tenan maestra y 10 tenan experiencia profesional y maestra. Cul es la

    probabilidad que un profesional aleatoriamente elegido tenga experiencia profesional o

    maestra.

    Solucin:

    Sea E el evento que el profesional elegido tenga experiencia profesional.

    Sea M el evento que el profesional elegido tenga maestra.

    P(E M) = P(E) + P(M) P(E M)

    = + - = 0.60

    4. PROBABILIDAD CONDICIONAL

    Una medida de probabilidad en el espacio muestral S de que ocurra el evento A, dado el

    evento B ha ocurrido se llama probabilidad condicional para dos eventos, se denota P(A/B).

    Definicin.-Si A, B dos eventos cualesquiera del espacio muestral S y P(B) > 0. La probabilidad condicional de A dado B es

    (/) =( )

    ()

  • 35

    P(A B) se llama probabilidad conjunta de los eventos A y B, se simboliza tambin P(AB).

    Ejemplo 5

    La probabilidad que una computadora tenga alta selectividad y alta resolucin es 0.25 y la

    probabilidad que tenga alta resolucin es 0.70. . Cul es la probabilidad de que una

    computadora tenga alta selectividad dado que tiene alta resolucin? .

    Solucin:

    Sean los eventos:

    A: La computadora tiene alta selectividad

    B: La computadora tiene alta resolucin

    (A B): La computadora tiene alta selectividad y alta resolucin.

    (/) =( )

    ()=

    0.25

    0.70= 0.40

    Ejemplo 6

    Una empresa estudia dos grupos de industrias para invertir en sus acciones y clasifica como

    industrias de alto costo o de costo moderado y de alimentos o de servicios. Los resultados

    se muestran en la siguiente tabla:

    Tipo de industria Costo moderado Alto costo Total

    Alimentos

    Servicios

    12

    15

    9

    14

    21

    29

    Total 27 23 50

    Si se elige al azar una empresa.

    a) Cul es la probabilidad que sea de alimentos dado que es de costo moderado?

    b) Cul es la probabilidad que sea de servicios dado que es de alto costo?

    Solucin:

    Sea: A el evento de elegir una empresa de alimentos.

    B el evento de elegir una empresa de servicios.

    C el evento de elegir una empresa de costo moderado.

    C el evento de elegir una empresa de alto costo.

  • 36

    Entonces:

    a) (/) =()

    ()=

    0.24

    0.54= 0.44

    b) P(S/C) = = 0.61

    5. REGLA DE MULTIPLICACIN

    Definicin:

    Si A, B dos eventos cualesquiera del espacio muestral y P(A) > 0, entonces

    P (A.B) = P(A) P(B/A)

    Esta regla se conoce a veces como el teorema de multiplicacin y se aplica al clculo de la

    probabilidad de la ocurrencia simultnea de dos eventos A y B.

    Ejemplo 7

    Si se eligen al azar en sucesin dos gaseosas de determinada marca de un lote de 240

    gaseosas de los cuales 12 tienen premio Cul es la probabilidad de que las dos gaseosas

    estn premiadas?

    Solucin:

    Supongamos A, el evento de que la primera gaseosa tenga premio y B, el evento de que la

    segunda gaseosa tenga premio.

    La probabilidad de obtener dos gaseosas con premio es

    P(A.B) = . = 0.0023

    Ejemplo 8

    Una caja de USB tiene 15 unidades de los cuales 5 estn con virus informtico. Si selecciona

    al azar tres USB sin reemplazo. Cul es la probabilidad de que los tres USB estn con virus?

    Solucin:

    Si A es el evento de que el primer USB est con virus, B el evento de que el segundo USB

    est con virus y C el evento de que el tercer USB tambin est con virus, entonces

    P (A) = 5/15, P (A/B) = 4/14, P(C/A.B) = 3/13

  • 37

    P (A.B.C) = . . = 0.022

    6. PROBABILIDAD DE BAYES

    TEOREMA.-Sean A1, A2, An eventos que forman una particin del espacio muestral S y sea B un evento cualquiera en S, entonces.

    (/) =()(/)

    ()

    Ejemplo 9

    El departamento de crdito de una empresa comercial inform que 20% de sus ventas son en

    efectivo, 50% se pagan con cheque en el momento de la adquisicin y 30% son a crdito. Se

    sabe que el 40% de las ventas en efectivo, 80% en cheques y 70% de las ventas a crdito son

    artculos nacionales. Se elige aleatoriamente un cliente de la empresa y resulta que el artculo

    vendido es nacional Cul es la probabilidad que la venta haya sido a crdito?

    Solucin:

    Sean los eventos de las ventas:

    E: efectivo, CH: cheque, C: a crdito

    N: articulo nacional

    I: articulo importado

    P(N) = P (EN + CHN + CN) = P(E) P(N/E) + P(CH) P(N/CH) + P(C) P(N/C)

    = 0.20 (0.40) + 0.50 (0.80) + 0.30(0.70) = 0.69

    Ahora se calcula mediante el teorema de Bayes.

    (/) =()(/)

    ()=

    0.30(0.70)

    0.69 = 0.3043

  • 38

    EJERCICIOS DE REPASO N 3

    1. Un encuesta a ejecutivos revel que 65% leen con regularidad la revista A, 45% leen la

    Revista B y 30% leen ambas revistas.

    a) Cul es la probabilidad que un ejecutivo especfico lea con regularidad la revista

    A o la revista B.

    b) Como se le denomina a la probabilidad 0,30.

    c) Los eventos son mutuamente excluyentes? Explique la respuesta.

    2. Explique la diferencia entre un evento colectivamente exhaustivo y uno mutuamente

    excluyente. De un ejemplo de cada uno.

    3. En los ltimos aos una compaa de tarjetas de crdito ha desarrollado una estrategia

    para atraer nuevas cuentas a profesionales recin egresados de la Universidad. Una muestra

    de 200 profesionales se entrevist para ver si posea una tarjeta de crdito bancaria o una

    tarjeta de dbito obteniendo la siguiente informacin:

    Tarjeta de crdito

    Tarjeta de dbito

    SI NO

    SI 70 60

    NO 40 30

    a) De un ejemplo de evento simple.

    b) De un ejemplo de evento conjunto.

    c) Cul es el complemento de tener una tarjeta de crdito.

    d) Si se sabe que el profesional tiene una tarjeta de crdito bancaria Cul es la

    probabilidad de que tenga una tarjeta de dbito?

    e) Si se sabe que el profesional no tiene tarjeta de dbito Cul es la probabilidad

    que tenga una tarjeta de crdito?

    4. Una caja de 10 CD, 6 son marca A y 4 marca B, todos estn en sobres de igual color.

    Si se seleccionan 2 CD aleatoriamente de la caja sin reemplazo:

    a) Cul es la probabilidad de que ambos CD sean de la marca A.

    b) Cul es la probabilidad que un CD sea marca A y el otro CD marca B.

  • 39

    5. Un director de una organizacin de seguros distribuy solicitudes de afiliacin a nuevos

    trabajadores durante una reunin de orientacin 55% de los que recibieron estas solicitudes

    eran hombres y el 45% mujeres. Posteriormente el 8% de los hombres y el 10% de las

    mujeres que recibieron la solicitud se afili a la organizacin.

    a) Cul es la probabilidad de que un nuevo trabajador elegido al azar que recibe la

    solicitud se afilie a la organizacin.

    b) Cul es la probabilidad de que un nuevo trabajador elegido al azar que se afilia

    a la organizacin despus de recibir la solicitud sea hombre.

    IV. PRUEBA DE HIPOTESIS

    1. PRUEBA DE HIPOTESIS

    INTRODUCCIN

    Mediante una prueba de hiptesis se puede decidir, a partir de la informacin que proporciona

    una muestra aleatoria, si lo que se afirma respecto a un parmetro es verdadero o no.

    El planteamiento y prueba de hiptesis son partes muy importantes del diseo metodolgico

    de una investigacin cuantitativa.

    2. HIPOTESIS ESTADISTICA

    La hiptesis estadstica es un supuesto para tomar decisiones estadsticas referidas a uno o ms

    parmetros poblacionales.

    Hiptesis Nula y Alternativa

    Hiptesis Nula: Se denomina hiptesis nula y se representa por Ho a la hiptesis que es

    aceptada provisionalmente y cuya validez ser sometida a comprobacin.

    Hiptesis Alternativa: Se designa por H1 y constituye una alternativa en caso que la hiptesis

    nula no sea aceptada. En investigacin, generalmente corresponde a la hiptesis de

    investigacin.

    Ejemplo

    Para probar si el rendimiento promedio de los alumnos de una institucin educativa es

    mayor que 14, se toma una muestra aleatoria de los alumnos de la institucin y de acuerdo

  • 40

    a la informacin que sta proporciona se aceptar o rechazar una de las siguientes

    afirmaciones.

    Ho: El rendimiento acadmico promedio de los alumnos de la institucin educativa no es mayor

    a 14.

    H1: El rendimiento acadmico promedio de los alumnos de la institucin educativa es mayor a

    14

    3. TIPOS DE ERRORES QUE SE COMETEN EN UNA PRUEBA DE HIPTESIS

    En todo proceso inferencial, por el hecho de trabajar con informacin muestral, se corre

    el riego de cometer error. Este error en estadstica se mide en trminos de probabilidad

    y se trata de minimizar.

    Error tipo I: Consiste en tomar la decisin de rechazar la hiptesis nula cuando es cierta

    en trminos de probabilidad.( nivel de significancia)

    Error tipo II: Consiste en tomar la decisin de aceptar la hiptesis nula cuando sea falsa

    en trminos de probabilidad. ( potencia de la prueba )

    0 FALSA 0 CIERTO

    RECHAZAR 0 CORRECTO ERROR I

    ACEPTAR 0 ERROR II CORRECTO

    .

    Regin de aceptacin y Regin crtica

    Prueba unilateral de cola a la izquierda.

    Cuando la hiptesis alternativa es planteada usando la relacin menor que (). Dado

    un nivel de significacin , 1- es la probabilidad de aceptar Ho. Se rechaza Ho si el

    valor calculado de la estadstica de la prueba es mayor que el valor tabular.

  • 41

    Prueba bilateral

    Cuando la hiptesis alternativa es planteada usando la relacin diferente (). Dado un

    nivel de significacin , 1- es la probabilidad de aceptar Ho. Se acepta Ho si el valor

    calculado de la estadstica de la prueba est entre los valores tabulares.

    Procedimiento

    El procedimiento general en una prueba de hiptesis es:

    1. Formular la hiptesis nula Ho y la hiptesis alternativa Ha.

    2. Especificar el nivel de significacin .

    3. Determinar la estadstica de la prueba a usar.

    4. Determinar la regin de aceptacin y la regin crtica o de rechazo.

    5. Calcular el valor de la estadstica a partir de los datos de la muestra.

    6. Tomar la decisin: rechazar Ho si el valor calculado de la estadstica est en la regin

    de rechazo de H0 y por lo tanto, aceptar H1. En caso contrario no rechazar Ho y por lo

    tanto no aceptar H1

    4. PRUEBA DE HIPTESIS PARA LA MEDIA DE UNA POBLACIN ()

    Ho: o Ho: o Ho: = o

    Ha: < o Ha: > o Ha: o

    1. Cuando se conoce la varianza poblacional.

    La estadstica para la prueba es:

    =

    que tiene distribucin normal estndar.

    2. Cuando no se conoce la varianza poblacional.

    Para una muestra pequea, la estadstica para la prueba es:

    =

    que tiene distribucin t con n-1 grados de libertad.

    Ejemplo 1. El director de una institucin educativa afirma que el ingreso mensual promedio de las

    familias de los alumnos de su institucin es mayor de S/. 850. Para probar esta afirmacin

    selecciona una muestra aleatoria de 25 familias y calcula que el ingreso promedio es S/. 870

  • 42

    con una desviacin estndar de S/. 50. Con un nivel de significacin del 5%, Cul es su

    conclusin?

    Solucin:

    Ho: 850

    Ha: > 850

    = 0,05

    La muestra es pequea y no se conoce la varianza poblacional, por lo tanto, la estadstica para

    la prueba es:

    =

    =

    =

    (.;) = 1,729

    Como tc es mayor que el valor tabular, es decir, se encuentra en la regin de rechazo de H0,

    entonces se rechaza H0 y se acepta H1. Se concluye que la afirmacin del director se acepta,

    al nivel de significacin del 5% o 0.05

    5. PRUEBA DE HIPTESIS PARA LA COMPARACIN DE MEDIAS DE DOS

    POBLACIONES

    Caso 1. Las varianzas de las poblaciones 2x, 2y se conocen

    Ho: x y Ho: x y Ho: x = y

    H1: x < y H1: x > y H1: x y La estadstica para la prueba es:

    =

    2

    +

    2

    que tiene una distribucin normal estndar.

    Caso 2. Las varianzas de las poblaciones 2x, 2y no se conocen

    Ho: x y Ho: x y Ho: x = y

    H1: x < y H1: x > y H1: x y

  • 43

    Varianzas desconocidas iguales: 2x = 2y = 2 La estadstica para

    la prueba, para muestras pequeas, es:

    =

    ( 1)

    2 + ( 1)2

    + 2[

    1

    +1

    ]

    La estadstica para la prueba es:

    que tiene distribucin t con nx + ny 2 grados de libertad.

    Ejemplo 3.

    En un sistema educativo se aplican dos mtodos de enseanza X, Y. En el primer grupo de

    120 alumnos se aplic el mtodo X y en el segundo grupo de 250 alumnos se aplic el

    mtodo Y. Las medias de las calificaciones obtenidas fueron = 12 y = 12,2

    respectivamente Puede admitirse que los mtodos de enseanza no difieren en los

    resultados y que las diferencias encontradas en las muestras se deben al azar? Por

    experiencias anteriores se conoce que las varianzas poblacionales son 2x = 4 y 2y = 4,12

    respectivamente. Use = 0,05.

    Solucin: Ho: x = y

    H1: x y = 0,05.

    =

    2

    +

    2

    = 12 12.2

    4120 +

    4.12250

    = 0.896

    0.975 = 1.96

    El valor de Z calculado (Zc) no cae en la regin de rechazo, podemos considerar que la

    diferencia observada entre los valores promedios no es significativo al nivel 0,05.

    6. PRUEBA DE HIPTESIS PARA LA PROPORCIN DE UNA POBLACIN

    Ho: P Po Ho: P Po Ho: P = Po

    H1: P < Po H1: P > Po H1: P Po

  • 44

    =

    que tiene distribucin normal estndar, por aproximacin.

    Ejemplo 5.

    Un profesor de educacin secundaria acus a una editorial diciendo que ms del 15% de los

    textos que publica la editorial tienen algn defecto. Para continuar con la investigacin se tom

    una m.a. de 50 textos de la produccin en circulacin de la editorial y se encontr que 10 de los

    textos tenan por lo menos un defecto (falla) Cul es su conclusin? Use = 0,05

    Solucin:

    Ho: P 0,15

    Ha: P > 0,15

    = 0,10

    =

    = .

    =

    =. .

    (. )(. )

    = .

    . = .

    El valor de Z calculado es menor que el valor tabular por lo tanto la acusacin del profesor

    no se acepta al nivel de 5% de significacin.

    7. PRUEBA DE HIPTESIS PARA LA COMPARACIN DE PROPORCIONES DE DOS POBLACIONES

    Ho: Px Py Ho: Px Py Ho: Px = Py

    H1: Px < Py H1: Px > Py H1: Px Py

    La estadstica para la prueba es:

    =

    +

    tiene distribucin normal estndar.

    Considerando el estimador de la proporcin comn ()

  • 45

    =

    (

    +

    )

    donde: = +

    +=

    +

    +

    Ejemplo 6.

    Un escritor que promociona su novela afirma que su obra representa un atractivo igual para los

    hombres que para las mujeres, pero el equipo de prensa piensa que es mayor el porcentaje de

    hombres al de mujeres que leen la novela. En una muestra aleatoria de 200 hombres y 250

    mujeres revel que 110 hombres y 110 mujeres leen la novela Puede considerarse que la

    proporcin de lectores hombres es mayor que la proporcin de lectoras mujeres, para un nivel

    de significacin del 5%?

    Solucin:

    Ho: Px Py Px : proporcin de lectores hombres

    Ha: Px > Py Py : proporcin de lectoras mujeres

    = 0,05

    =

    = . =

    = .

    = +

    + =

    +

    + = .

    =

    (

    +

    )

    =. .

    (. )(. )(

    +

    )

    = .

    El valor calculado Zc pertenece a la regin crtica por lo tanto, se rechaza Ho y se acepta H1,

    es decir, la proporcin de lectores hombres es mayor que la proporcin de lectoras mujeres,

    al nivel de 5%

    8. PRUEBA DE INDEPENDENCIA.

    La prueba de independencia se utiliza en investigaciones donde interesa analizar la relacin o

    la independencia de dos variables cualitativas X e Y.

  • 46

    Cada variable se divide en categoras o niveles de acuerdo a un criterio de clasificacin y los

    datos se presentan en una tabla bidimensional o tabla de contingencia con r filas y c

    columnas. Las hiptesis se suelen presentar de dos formas:

    1) Ho: La variable X no est relacionada con la variable Y.

    Ha: La variable X est relacionada con la variable Y, o

    2) Ho: La variable X e Y son independientes.

    Ha: La variable X e Y no son independientes.

    La estadstica para la prueba es

    2 = ( )

    2

    que tiene distribucin chi cuadrado con gl grados de libertad ( gl = (r-1)(c-1) ) .

    Oij = valores observados, Eij = valores esperados, Eij = ri cj / n, ri: total de la fila i, cj: total de

    la columna j, n: nmero de datos

    Ejemplo 6.

    Se aplic una encuesta a una muestra de 400 trabajadores de una empresa. Despus de

    procesar los datos se obtuvo la siguiente tabla de contingencia para las variables gnero

    y opinin sobre como avanzar en el trabajo. Al nivel de = 0,05 existe relacin entre la

    opinin de los trabajadores y el gnero?

    Gnero

    Opinin

    Total Trabajo duro

    Trabajo duro y suerte

    Suerte

    Hombre

    Mujer

    145 48 40 233

    115 32 20 167

    Total 260 80 60 400

    Solucin:

    Ho: No existe relacin entre la opinin de los trabajadores y el gnero.

    H1: Existe relacin entre la opinin de los trabajadores y el gnero.

    = 0,05

    2 = ( )

    2

  • 47

    gl = (2-1)(3-1) = (1)(2) = 2

    (2;0.05)2 = 5.99

    Calculando los Eij :

    E11 = 233x260/400 = 151.45 E21 = 167x260/400 = 108.55

    E12 = 233x80/400 = 46.6 E22 = 167x80/400 = 33.4

    E13 = 233x60/400 = 34.95

    E23 = 167x60/400 = 25.05

    X2c = (145-151.45)2 /151.45 + (48-46.6)2 / 46.6 + (40- 34.95)2 / 34.95 +

    (115-108.55)2 / 108.55 + (32-33.4)2 / 33.4 + (20-25.05)2 / 25.05

    X2c = 2.5

    Considerando que el valor calculado de X2 = 2.5, es menor que el valor tabular 5.99, es

    decir cae en la regin de aceptacin de H0 , no se puede rechazar Ho, es decir, se puede

    concluir que no existe relacin entre la opinin de los trabajadores y el gnero al nivel de

    significacin = 0,05.

    V. REGRESIN Y CORRELACIN LINEAL

    1. INTRODUCCIN

    Mediante la regresin lineal se desarrolla una ecuacin para predecir el valor de la variable

    dependiente (Y) dado el valor de una variable independiente (X) y para medir el grado en

    que la variable dependiente puede ser explicada por la variable independiente. Mediante la

    correlacin se mide el grado de asociacin entre las variables.

    Por ejemplo, un investigador desea estimar la relacin existente entre los ingresos familiares

    y sus gastos familiares en 30 profesores de la ciudad de Trujillo. Aplicando la correlacin se

    medir en que medida estn correlacionadas estas variables. Asimismo, si se halla una

    relacin funcional que se ajuste a los datos de las variables, ser posible medir en que medida

    la variable dependiente explica el comportamiento de la variable dependiente.

  • 48

    2. REGRESIN LINEAL SIMPLE

    Consideremos una variable dependiente (Y) y una variable independiente (X) La

    forma general de la ecuacin de regresin poblacional es:

    Yi = + xi + Ei

    donde:

    : ordenada en el origen

    : pendiente de la ecuacin de regresin lineal

    E : error

    Diagrama de dispersin:

    Es la grfica de los datos muestrales en el plano XY. Indica el patrn de comportamiento de

    los datos. A partir de este grfico se puede tener una idea de la asociacin entre las variables

    y la posible relacin funcional entre ellas.

    Estimacin de la Ecuacin de Regresin Lineal:

    Se utiliza el mtodo de mnimos cuadrados. Este mtodo consiste en calcular los estimadores

    a y b de manera que la suma de los cuadrados de las distancias entre los valores verdaderos

    y los valores estimados sea mnima.

    La estimacin de la ecuacin de regresin poblacional o ecuacin de regresin muestral es:

    i = a + b Xi i = + xi

    Donde

    =

    2( )2

    =

    =

    3. COEFICIENTE DE DETERMINACIN

    El coeficiente de variacin R2 es la proporcin de variacin de la variable dependiente que se

    explica por la variacin de la variable independiente.

    Se puede describir en trminos de la variacin total en Y comparada con la variacin no explicada

    en la variable dependiente (Y).

    2 = 1 Variacin de los errores que no es explicada mediante la lnea de regresin

    Variacin total de los valores de y

  • 49

    R 0 R2 1

    4. CORRELACIN LINEAL

    La correlacin lineal mide el grado de asociacin o relacin entre dos variables X, Y. Si al

    aumentar X aumenta Y la correlacin lineal es directa. Si al aumentar X disminuye Y la

    correlacin lineal es inversa. Si no existe ninguna relacin entre los datos graficados, las

    variables no estn correlacionadas.

    Coeficiente de Correlacin Lineal.

    El coeficiente de correlacin lineal(r) de la muestra segn Pearson es:

    =

    2 ( )2

    2 ( )2 1 1

    r = 1 : correlacin perfecta r = 0 : correlacin nula

    Criterios para interpretar r

    Cuando r es positivo, la relacin entre las variables es directa.

    Cuando r es negativo, la relacin entre las variables es

    inversa

    5. PRUEBA DE HIPTESIS PARA LA CORRELACIN

    Ho: = 0 : No existe correlacin

    Ha: 0 : Existe correlacin

    Para contrastar la hiptesis se aplica la prueba T de Student. El estadstico para la prueba es:

    t , gl = n - 2

    r interpretacin

    0.80 0.99 Muy alta

    0.60 0.79 Alta

    0.40 0.59 Moderada

    0.20 0.39 Baja

    0.01 0.19 Muy baja

  • 50

    Ejemplo 1.

    La informacin siguiente corresponde a puntajes obtenidos por 8 estudiantes en su examen

    parcial de unidad y su nota promedio de unidad.

    a) Determinar la ecuacin de regresin lineal. Hacer su grfica.

    b) Calcular los coeficientes de determinacin y correlacin lineal.

    c) Hacer una prueba de hiptesis para .

    Examen parcial 10 16 15 14 12 11 17 14

    Nota Promedio de unidad 11 15 14 12 12 12 16 15

    Solucin:

    Ex. Parcial

    X

    Pro. Unidad

    Y

    XY X 2 Y2

    10

    16

    15

    14

    12

    11

    17

    14

    11

    15

    14

    12

    12

    12

    16

    15

    110

    240

    210

    168

    144

    132

    272

    210

    100

    256

    225

    196

    144

    121

    289

    196

    121

    225

    196

    144

    144

    144

    256

    225

    109 107 1486 1527 1455

    =8(1468)(109)(107)

    8(1527)(1096)2 = 4.224

    = 1074

    8 (4.224)

    109

    8= 0.672

    La ecuacin de regresin lineal es: = 4,224 + 0,672 Xi

    R2 = 0,7912

    El 79% de la variacin en la nota promedio de unidad se explica est determinada mediante su

    relacin lineal con el examen parcial. Tambin se puede decir que la nota promedio de la unidad se

    explica en un 79% por la nota del examen parcial.

    El coeficiente de correlacin lineal es:

    r = 0,8895

  • 51

    Prueba de hiptesis para

    Ho: = 0

    Ha: 0

    Se rechaza Ho.

    Se concluye que existe una relacin lineal entre los puntajes del examen parcial y la nota

    promedio de unidad.

    Prueba de hiptesis para

    Ho: = 0 Ha: 0

    To

    Se concluye que el coeficiente de correlacin calculado es significativo, es decir es diferente de cero. Como se puede observar las pruebas para el coeficiente de regresin y para el coeficiente de correlacin son equivalentes.

    6. REGRESIN LINEAL MLTIPLE

    La regresin mltiple estudia la relacin de una variable dependiente con dos o ms variables

    independientes. El modelo de regresin mltiple es: y = 0 + 1X1 + 2X2 + + KXK +

    donde: X1, X2, , XK son variables independientes

    0, 1, , K parmetros

    error aleatorio

    El modelo de regresin mltiple estimado, denominado tambin ecuacin de regresin

    mltiple estimada es: = b0, + b1x1 + + bK xk

    Dnde: b0, b1, , bk son los estimadores de los parmetros.

  • 52

    Mediante el mtodo de mnimos cuadrados se obtienen los coeficientes b0, b1,, bk de tal manera

    que la suma de los cuadrados de los residuos se hagan mnima.

    Ejemplo 2.

    El gerente de la empresa desea conocer el comportamiento de la demanda de laptops que la

    empresa ofrece. Considera que la publicidad y el precio son los factores determinantes de la

    demanda. Para ello toma informacin de los ltimos 10 meses, la informacin obtenida es la

    siguiente:

    Demanda

    (unidades)

    Publicidad (N de

    anuncios)

    Precio mensual promedio

    ($)

    40

    65

    70

    60

    50

    62

    35

    75

    74

    30

    11

    16

    15

    18

    10

    14

    15

    16

    12

    14

    500

    600

    750

    400

    700

    580

    520

    500

    450

    550

    Utilizando la hoja de clculo Excel u otro software estadstico se obtienen los coeficientes de la

    ecuacin de regresin lineal mltiple que determina el comportamiento de la demanda con

    relacin a la publicidad y el precio. La ecuacin es: = 15, 92 + 2,08 x1 + 0,02 x2

    Si el nmero de anuncio es 20 y el precio es $ 720, la demanda esperada es aproximadamente

    72 laptops.

    EJERCICIOS DE REPASO N 4

    1. Un establecimiento de comida rpida tiene una venta media de $ 2000 por da. Para

    contrastar si las cifras del negocio estn cambiando debido al deterioro de la economa,

    la direccin ha decidido registrar cuidadosamente las cifras de negocio de los 8 das

    prximos.

    Si los valores fueron:

    2050; 2212; 1880; 2121; 2205; 2018; 1980; 2188.

    a) Cules son las hiptesis nula y alternativa?

    b) Estos datos son lo suficientemente significativos para probar al nivel de 5% que se ha

    producido un cambio?

  • 53

    c) Qu ocurre al nivel de significancia del 1%?

    2. Hace 20 aos, los alumnos del curso de comunicacin en la universidad podan contestar

    en promedio 24 preguntas buenas en 60 minutos. Para ver si esto contina igual en la

    actualidad se ha seleccionado una muestra de 36 alumnos del curso de comunicacin. Si

    la media muestral result ser de 25,5 preguntas buenas con una desviacin tpica de 3,5

    Se puede concluir que el promedio de contestar preguntas buenas ha mejorado?. Utilice

    el nivel de significacin de 5%.

    3. Un comercio ha recibido un envo de artculos de cierto tipo. Si se puede establecer que

    ms de 4% de los artculos recibidos son defectuosos, se devuelve el envo. Si en una

    muestra de 90 artculos se encontr que 5 de ellos eran defectuosos Se debera devolver

    el envo al proveedor? Utilice un nivel de significacin de 10%. Qu ocurrir al nivel de

    5%?

    4. Se recogen datos para determinar si existe una diferencia entre los resultados del test de

    los estudiantes de la institucin A y los de la institucin B. Se toma una m.a. de 100

    estudiantes de la institucin A, se obtuvo una puntuacin media de 102,2 y una

    desviacin estndar de 11,8. Por parte de la institucin B se obtiene una m.a. de 60

    estudiantes, la puntuacin media fue de 105,3 con una desviacin estndar de 10,6. Los

    datos son suficientemente significativos al nivel de 5% para rechazar la hiptesis de que

    las puntuaciones medias de los estudiantes de las instituciones A y B son iguales?

    5. Una agencia de publicidad pretende determinar la composicin demogrfica del mercado

    para un nuevo producto. Selecciona al azar una m.a., de 120 de los diferentes grupos de

    edad segn su actitud de compra. Los resultados de la encuesta son los siguientes:

    a) Existe relacin o independencia entre los grupos de edad y la actitud de compra, a un nivel de

    significacin de 5%?

    b) Qu ocurre si el nivel es de 10%?

    6. Dado el siguiente conjunto de datos:

    X 12 15 14 11 18 9 13 17 18 12

    Y 6,2 8,6 7,2 4,5 9,0 3,5 6,5 9,3 9,5 5,7

    a) Dibuje un diagrama de dispersin.

    b) Estime la ecuacin de regresin lineal.

    Actitud

    Grupo de Edad

    18 29 30 39 40 50

    Compra frecuente 12 15 10

    Compra alguna vez 20 25 18

    Nunca compra 8 5 7

  • 54

    c) Pronostique Y para X = 10; 16; 20.

    d) Calcular el coeficiente de correlacin lineal de la muestra.

    A) Usando el SPSS:

    Analizar > Regresin > Lineales

    y vamos solicitando las diferentes opciones en los distintos botones de Estadsticos, Grficos,

    Guardar y Opciones.

    La salida correspondiente a las opciones marcadas, en primer lugar, nos seala el porcentaje de

    varianza explicada, que es el coeficiente de determinacin

    (Coeficiente de correlacin de Pearson al cuadrado), as como un ANOVA de la

    Regresin

  • 55

    R cuadrado, es considerado el ndice de bondad de ajuste del modelo de regresin o que es

    tambin llamado coeficiente de determinacin.

    A continuacin nos indica las diferentes estimaciones de los parmetros de la ecuacin de

    regresin de tal manera que Y = -13,628 + 0,038X + 22,75144

    Posteriormente, se evalan los residuos mediante ndices numricos y grficos. Se tienen en

    cuentan los residuos tipificados a partir de +3 y -3, que se dan en este caso.

    Los datos no se ajustan al modelo lineal.

    Como en guardar marcamos la opcin de valores

    pronosticados no tipificados, en el fichero de datos

    nos aparece una columna con los valores que tendra

    la variable dependiente (Y), al aplicar la ecuacin de

    regresin sobre la variable independiente (X), esto es,

  • 56

    VI. TABLAS ESTADISTICAS

    DISTRIBUCIN DE PROBABILIDAD NORMAL ESTANDAR

    z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

    0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359

    0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753

    0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141

    0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517

    0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879

    0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224

    0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549

    0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852

    0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133

    0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389

    1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621

    1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830

    1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015

    1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177

    1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319

    1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441

    1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545

    1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633

    1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706

    1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767

    2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817

    2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857

    2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890

    2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916

    2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936

    2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952

    2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964

    2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974

    2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981

    2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986

    3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

    3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993

    3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995

    3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997

    3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998

    3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998

    3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999

    3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999

    3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999

    3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

  • 57

    TABLA DE LA DISTRIBUCIN t - STUDENT

    0,25 0,2 0,15 0,1 0,05 0,025 0,01 0,005 0,0005

    r

    1 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,656 636,578

    2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,600

    3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,924

    4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610

    5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869

    6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959

    7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408

    8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041

    9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781

    10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587

    11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437

    12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318

    13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221

    14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140

    15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073

    16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015

    17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965

    18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922

    19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883

    20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850

    21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819

    22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792

    23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,768

    24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745

    25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,725

    26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707

    27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,689

    28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,674

    29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,660

    30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646

    40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551

    60 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 3,460

    120 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373

    0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,290

  • 58

    TABLA DE LA DISTRIBUCIN CHI-CUADRADO

    Chi-cuadrado rea de la cola,

    /v 0.995 0.990 0.975 0.950 0.900 0.800 0.700 0.500

    1 0.00 0.00 0.00 0.00 0.02 0.06 0.15 0.45

    2 0.01 0.02 0.05 0.10 0.21 0.45 0.71 1.39

    3 0.07 0.11 0.22 0.35 0.58 1.01 1.42 2.37

    4 0.21 0.30 0.48 0.71 1.06 1.65 2.19 3.36

    5 0.41 0.55 0.83 1.15 1.61 2.34 3.00 4.35

    6 0.68 0.87 1.24 1.64 2.20 3.07 3.83 5.35

    7 0.99 1.24 1.69 2.17 2.83 3.82 4.67 6.35

    8 1.34 1.65 2.18 2.73 3.49 4.59 5.53 7.34

    9 1.73 2.09 2.70 3.33 4.17 5.38 6.39 8.34

    10 2.16 2.56 3.25 3.94 4.87 6.18 7.27 9.34

    11 2.60 3.05 3.82 4.57 5.58 6.99 8.15 10.34

    12 3.07 3.57 4.40 5.23 6.30 7.81 9.03 11.34

    13 3.57 4.11 5.01 5.89 7.04 8.63 9.93 12.34

    14 4.07 4.66 5.63 6.57 7.79 9.47 10.82 13.34

    15 4.60 5.23 6.26 7.26 8.55 10.31 11.72 14.34

    16 5.14 5.81 6.91 7.96 9.31 11.15 12.62 15.34

    17 5.70 6.41 7.56 8.67 10.09 12.00 13.53 16.34

    18 6.26 7.01 8.23 9.39 10.86 12.86 14.44 17.34

    19 6.84 7.63 8.91 10.12 11.65 13.72 15.35 18.34

    20 7.43 8.26 9.59 10.85 12.44 14.58 16.27 19.34

    21 8.03 8.90 10.28 11.59 13.24 15.44 17.18 20.34

    22 8.64 9.54 10.98 12.34 14.04 16.31 18.10 21.34

    23 9.26 10.20 11.69 13.09 14.85 17.19 19.02 22.34