inferencia estadistica
TRANSCRIPT
![Page 1: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/1.jpg)
2.1 Inferencia Estadistica.Integrantes:
Jesus Felix Limon Cortes 15100549
Pedro Abraham Moreno Diaz 15100559
Jorge Sifuentes Castillo 15100591
Juan Eduardo Valle Velazquez 15100596
Luis Alejandro Puente Velazquez 15100573
![Page 2: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/2.jpg)
Introducción a la Inferencia Estadística
![Page 3: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/3.jpg)
¿Que es la inferencia estadística?La inferencia estadística es el conjunto de métodos y técnicas que permiten inferir, a partir de la información empírica proporcionada por una muestra, cual es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad.
En pocas palabras la inferencia estadística se ocupa de predecir y sacar conclusiones sobre una población tomando como base una muestra, es decir una parte de dicha población.
También es denominada Estadística Inductiva o Inferencia Inductiva ya que es un procedimiento para generar nuevo conocimiento científico.
![Page 4: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/4.jpg)
¿Que es la inferencia estadística?La inferencia estadística es el conjunto de métodos y técnicas que permiten inferir, a partir de la información empírica proporcionada por una muestra, cual es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad.
En pocas palabras la inferencia estadística se ocupa de predecir y sacar conclusiones sobre una población tomando como base una muestra, es decir una parte de dicha población.
También es denominada Estadística Inductiva o Inferencia Inductiva ya que es un procedimiento para generar nuevo conocimiento científico.
![Page 5: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/5.jpg)
A partir de una población se extrae una muestra por algunos de los métodos existentes, con la que se generan datos numéricos que se van a utilizar para generar estadísticos con los que realizar estimaciones o contrastes poblacionales.
![Page 6: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/6.jpg)
Inferencia estadistica
Los métodos básicos de la estadística inferencial son la estimación y el contraste de hipótesis. Ambas se apoyan en cantidades o datos estadísticos calculados a partir de las observaciones en una muestra.
En ambos casos se trata de generalizar la información obtenida en una muestra a una población.
Estas técnicas exigen que la muestra sea aleatoria.
![Page 7: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/7.jpg)
Un fabricante de medicinas afirma que una nueva vacuna contra el catarro desarrollada por su compañía tiene una efectividad del 95%, esto es, en promedio 95 de cada 100 personas que emplean la vacuna, pasarán el invierno sin contagiarse de catarro. Como resulta imposible probar la vacuna en todas las personas, consideremos que 40 personas han recibido la vacuna, y que de las 40, 35 no se contagiaron de catarro.Vemos que si la información del fabricante es correcta se esperaría que 38 personas (40 x 0.95 = 38) pasarán el invierno sin catarro.
Puesto que el número observado es 35, lo cual es inferior al número esperado, ¿debería rechazarse la afirmación del fabricante en base a la evidencia? El proceso de decisión de rechazar o no la afirmación es un problema de inferencia estadística.
¿para que la inferencia estadística?
![Page 8: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/8.jpg)
Población: es el conjunto de individuos sobre los que realizamos un estudio estadístico. Muestra: es un subconjunto de una población. La muestra debe de representar bien a la población para que los datos a inferir sean correctos.
Parámetro: es la cantidad numérica calculada sobre una población.Intenta resumir toda la información que hay en la población en unos pocos números.
Estadístico: es la cantidad numérica calculada sobre una muestra que resume su información sobre algún aspecto. Si un estadístico de usa para aproximar un parámetro también se le suele llamar estimador.
Normalmente nos interesa saber un parámetro, pero dada la dificultad que conlleva estudiar a toda la población calculamos un estimador sobre una muestra y confiamos que sean próximos.
Conceptos
![Page 9: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/9.jpg)
Muestreo Dado que en la mayoría de las ocasiones no es posible contar con los datos completos de una población, es habitual que tengamos que manejarnos con muestras, de modo que es importante saber elegir bien una muestra de la población.
Si la muestra está mal elegida, diremos que no es representativa. En este caso, se pueden producir errores imprevistos denominados sesgos.
Es importante la muestra sea elegida de forma aleatoria.
![Page 10: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/10.jpg)
Básicamente hay dos tipos de muestreos:
1. Muestreo no probabilístico: la muestra se elige mediante determinados criterios subjetivos.
2. Muestreo probabilístico: Cuando la muestra se elige al azar. En este caso podemos distinguir varios tipos:
![Page 11: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/11.jpg)
a) Muestreo aleatorio simple:
Aquel en el que cada individuo de la población tiene las mismas posibilidades de salir en la muestra.
Ejemplo:
En una escuela de 600 alumnos elegimos un alumno al azar y su probabilidad de elegirlo sería de 1/600. Lo devolvemos a la población y se elige otro con las misma probabilidad de ser elegido 1/600, y asi hasta sacar a 20 alumnos.
Notemos que si no devolvieramos al alumno, entonces, la probabilidad de escoger al 2º alumno sería de 1/599, y ya no todos tendrían la misma probabilidad de ser elegidos. El problema es que entonces permitimos que se puedan repetir individuos.
![Page 12: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/12.jpg)
b) Muestreo sistemático:
En el que se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra.
Ejemplo:
De 600 alumnos hemos de elegir 20 alumnos, es decir, 1 de cada 30, se procede asi:
Se ordenan los alumnos y se enumeran, se elige uno al azar, por ejemplo el alumno 27, y luego los demás se eligen a partir de este a intervalos de 30 alumnos. Entonces escogemos por tanto a los alumnos:
27,57,87,117,147,177,207,237,267,297,327,357,387,417,447,477,507,537,567,597 y el alumno 627 ya es otra vez el 27.
![Page 13: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/13.jpg)
c) Muestreo estratificado:
Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de cada estrato proporcional al número de componentes de cada estrato.
Ejemplo:De 600 alumnos, para que la muestra sea representativa, lo mejor seria conocer cuántos alumnos de cada curso hay: 200 alumnos de 3º, 150 de 4º, 150 de 1º de Bachillerato y 100 de 2º de Bachillerato.
Como de 600 en total hemos de elegir a 20, de 200 de 3º hemos de elegir x:
20/600 = x/200 → x = 4000/600 =6.6 ≈ 7 alumnos de 3º
![Page 14: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/14.jpg)
De igual manera podemos calcular los alumnos correspondientes a los demás cursos:
20/600 = y/150 → y = 3000/600 = 5 alumnos de 4º
20/600 = z/150 → z = 3000/600 = 5 alumnos de 1º de bachillerato
20/600 = t/100 → t = 2000/600 =3.3 alumnos de 2º de bachillerato
De modo que en nuestra muestra de 20 alumnos; 7 son de 3º, 5 de 4 º, 5 de 1 º y 3 de 2 º.
Para la elección de cada alumno dentro de cada curso, utilizamos el muestreo aleatorio simple.
![Page 15: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/15.jpg)
d) Muestreo por conglomerados:
Aquí, en lugar de elegir individuos directamente, se eligen unidades más amplias donde se clasifican los elementos de la población, llamados conglomerados.
Los conglomerados deben ser tan heterogéneos como la población a estudiar, para que la represente bien.
No debemos confundir estrato y conglomerado. Un estrato es homogéneo (sus elementos tienen las mismas características), mientras que un conglomerado es heterogéneo (debe representar bien a la población).
![Page 16: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/16.jpg)
Ejemplo:
Supongamos que queremos extraer una muestra aleatoria de los estudiantes universitarios del país. Se necesitaria una lista con todos ellos para poder realizar algún muestreo del tipo de los 3 anteriores, lo cual es muy dificil de conseguir.
Sin embargo, los estudiantes están clasificados por Universidades, Facultades y Clases. Podemos seleccionar en una primera etapa algunas Universidades, después algunas facultades al azar, dentro de las facultades algunas clases y dentro de las clases, algunos estudiantes por muestreo aleatorio simple.
Los conglomerados en cada etapa serían las diferentes Universidades, las diferentes facultades y los diferentes clases.
![Page 17: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/17.jpg)
Ejercicio 1… En una población de 1500 jóvenes, 7500 adultos y 1000 ancianos, se hace una encuesta a 200 personas para conocer sus actividades de ocio preferidas. Si se utiliza un muestreo estratificado, ¿que tamaño muestral corresponde a cada estrato?.
![Page 18: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/18.jpg)
Ejercicio 2… Suponga que estamos investigando sobre el porcentaje de alumnos que trabajan de una población de 20 alumnos de la universidad de talca.
![Page 19: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/19.jpg)
Elija una muestra aleatoria simple de tamaño muestral de tamaño n=8 de esta población.
![Page 20: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/20.jpg)
Estimación
Una estimación estadística es un proceso mediante el cual establecemos qué valor debe tener un parámetro según deducciones que realizamos a partir de estadísticos. En otras palabras, estimar es establecer conclusiones sobre características poblacionales a partir de resultados muestrales.
La estimación se divide en:
Estimación puntual
Estimación de intervalos de confianza
![Page 21: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/21.jpg)
Estimación Puntual Estimación mediante un solo valor de los parametros de una distribución.
La estimación puntual consiste en utilizar el valor de un estadístico para inferir el par´ametro de una población.
❖Usamos la media muestral X¯ para estimar la media de una población µ.
❖Usamos la proporción de una muestra ˆp para estimar la proporción poblacional p.
![Page 22: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/22.jpg)
Propiedades deseables de los estimadores puntualesBásicamente para que un estimador sea bueno, se desea que la varianza del estimador sea lo más pequeña posible, mientras que la distribución de muestreo debe concentrarse alrededor del valor del parámetro.
Estimadores Insesgados (Centrados): Se dice que la estadística = H(X 1, X 2,..., X n ) es un estimador insesgado del parámetro, si. Es decir, si los valores del estimador se centran alrededor del parámetro en cuestión.
![Page 23: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/23.jpg)
Estimadores Consistentes: Si un estimador es consistente, converge en probabilidad al valor del parámetro que está intentando estimar conforme el tamaño de la muestra crece. Esto implica que la varianza de un estimador consistente disminuye conforme n crece.
Estimadores Eficientes (Insesgados de Varianza Mínima): El hecho de que unestimador sea centrado no garantiza que sus realizaciones caigan cerca del valor del parámetro, hace falta además que tenga la varianza pequeña.
![Page 24: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/24.jpg)
La varianza de un estimador insesgado es la cantidad más importante para decidir qué tan bueno es el estimador para estimar el parámetro.
Estimación de la Media Poblacional: La media muestral es un estimador centrado y consistente de la media poblacional. Este resultado es válido sin importar la distribución de probabilidad de la población de interés, siempre y cuando la varianza tenga un valor finito.
![Page 25: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/25.jpg)
Estimación puntual Estimación de la Proporción: Tenemos una población dividida en dos subconjuntos, en función de una característica determinada, de forma que la proporción de la población que posee la característica es p, y la de los que no la poseen es 1-p. Tratamos de estimar el valor de p. El estadístico dado por la expresión siguiente, es un estimador centrado y consistente de la proporción poblacional.
Estimación de la Varianza Poblacional: Cuando se desconoce la media poblacional, debemos sustituir este parámetro por su estimador muestral, y el estimador a usar para la varianza poblacional, que es centrado o insesgado sin importar cuál sea la distribución de la población de interés, es la cuasivarianza muestral S^(2).
![Page 26: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/26.jpg)
Ejemplo:Se han anotado las calificaciones de los exámenes de recuperación de matemáticas de los alumnos de un colegio. Las notas de 15 de ellos son: 4.8, 5.3, 6.2, 3.1, 5.4, 7.2, 8.4, 6.5, 7, 7.2, 0.5, 5.2, 6.8, 7.8, 4.2;
Además 9 de estos alumnos eran chicas. Determina un estimador puntual para:
A.La nota media de la población
B.La proporción de alumnas que se presentan a la recuperación.
![Page 27: inferencia estadistica](https://reader034.vdocuments.us/reader034/viewer/2022050800/58819aef1a28ab0d358b778f/html5/thumbnails/27.jpg)
Estimación de la Varianza Poblacional:
Salario mensual y participación en el programa de adiestramiento para una muestra aleatoria simple de 6 personas.
Formula:
S^(2)= (6){[(320)^2]+[(420)^2]+[(428)^2]+[(430)^2]+[(380)^2]+[(510)^2]} - (320+420+428+430+380+510)^2 6(6-1)S^(2)=(6)(102,400+176,400+183,184+184,900+144,400+260,100) - (2,488)^2 6(5)S^(2)=(6,308,304) - (6,190,144) 30S^(2)=118,160 30
S^(2)=3,938.6666