estadistica y probabilidades2
TRANSCRIPT
-
UNIVERSIDAD TECNICA DE AMBATO FACULTAD DE INGENIERIA EN SISTEMAS, ELECTRONICA E INDUSTRIAL
ESTADISTICA Y PROBABILIDADES
Nivel: TERCERO
Carreras: Sistemas, Electrnica e Industrial
Docente: Ing. LUIS MORALES
-
ESTADISTICA
-
INTRODUCCIN
QU ES LA ESTADSTICA?
Es una rama de las matemticas que tiene por objetivo la recopilacin, clasificacin,
interpretacin o anlisis y presentacin de datos del fenmeno o hecho que se est
estudiando.
DEFINICIN.- Es una ciencia cuantitativa que describe los fenmenos colectivos, los
analiza cientficamente y predice conclusiones o resultados lo ms objetivo posible.
OTRAS DEFINICIONES
Es la ciencia de la recopilacin, clasificacin, presentacin e interpretacin de
datos.
Es una ciencia incluida en el conjunto de las matemticas, cuyo campo de accin es
el de recoger, ordenar, clasificar e interpretar los datos proporcionados por la
investigacin cientfica, permitiendo conocer a travs de ellos con la mayor
precisin posible, los caracteres de los hechos y fenmenos observados o que se
produce en las diferentes ciencias.
OBJETIVOS DE LA ESTADSTICA
1. Clasificar o reordenar, analizar y presentar grficamente el conjunto de datos
obtenidos de manera que sea fcil reconocer los hechos ms importantes o
significativos del fenmeno o problema a analizar.
2. Mediante el clculo de probabilidades y correlacin estadstica pretende predecir
las condiciones futuras mediante el conocimiento de las condiciones pasadas y
presentes. Ejemplo: crecimiento poblacional
3. Lograr informacin sobre una gran masa de hechos, tomando para ello una
muestra representativa. Ejemplo: eleccin de autoridades de un pas.
TIPOS DE ESTADSTICA.
ESTADSTICA DESCRIPTIVA.- Se ocupa de la presentacin y anlisis de hecho o fenmeno,
explicando sus diferentes partes, pero sin extraer conclusiones que puedan generalizarse
a un todo.
Mtodo de la estadstica descriptiva.
1. Recoleccin de datos.- Obtener los datos relacionados con el problema motivo de
estudio para lo cual utiliza tcnicas de la investigacin cientfica.
-
2. Clasificacin.- Ordenar y tabular datos.
3. Anlisis.- Utilizar tcnicas estadsticas para buscar aspectos relevantes.
4. Presentacin.- Mediante tablas o grficos presentar los resultados obtenidos.
ESTADSTICA INFERENCIAL.- Extrae conclusiones vlidas de una muestra de la poblacin
investigada que una vez ensayada y analizada, pueden proporcionar ciertas caractersticas
comunes de la poblacin.
Mtodo de la estadstica inferencial.
1. Delimitar el problema o fenmeno motivo de estudio.
2. Formulacin de hiptesis.- Describir o hacer el enunciado o enunciados que sern
objetos de comprobacin (hiptesis) para que posteriormente sean admitidos o
rechazados.
3. Recoleccin de datos.- Obtener los datos relacionados con el problema motivo de
estudio para lo cual utiliza tcnicas de la investigacin cientfica.
4. Clasificacin.- Ordenar y tabular datos.
5. Anlisis.- Utilizar tcnicas estadsticas para buscar aspectos relevantes.
6. Aceptacin o rechazo de la hiptesis.- Una vez que se ha aplicado la prueba
estadstica conveniente, se debe realizar el ensayo de hiptesis, mediante el cual
se la acepta o se la rechaza
7. Conclusiones.- Bajo el supuesto de no haber incurrido en fallas se toman las
decisiones que sean confiables y oportunas para dar solucin al problema.
INVESTIGACIN ESTADSTICA
Cuando se realiza una investigacin las caractersticas bsicas que debe tener la misma
son:
Validez.- Que sea demostrable.
Confiabilidad.- Que permita ser aplicable con igual o parecidos resultados.
Precisin.- Que su exactitud sea satisfactoria en concordancia con el objetivos de la
investigacin.
Antes de realizar cualquier investigacin es imprescindible determinar el fenmeno que se
va a investigar y las caractersticas que interesa para el anlisis es decir clarificar Qu es
lo que se quiere investigar.
FENMENO ESTADSTICO
Es la conformacin de un grupo o colectivo alrededor de ciertas caractersticas que
permitan ser investigadas en cuanto a su comportamiento.
-
Los fenmenos pueden ser de carcter econmico, social, poltico, deportivo u otros.
ETAPAS DE LA INVESTIGACIN ESTADISTICA
Permite sealar con claridad las fases o actividades necesarias en cuanto a una
investigacin.
En un proceso de investigacin estadstica se debe seguir cuatro fases fundamentales:
1. RECOPILACIN DE DATOS
Esta fase tiene como objetivo recopilar u obtener informacin que se requiere en la
investigacin estadstica. Los datos pueden recopilarse de fuentes interna y externa.
Fuente Interna.- Los datos se obtienen dentro de la organizacin o institucin que
auspicia la investigacin.
Fuente Externa.- Los datos se obtienen de fuentes ajenas a la organizacin y se los
puede obtener a travs de datos publicados, encuestas, observacin directa.
2. CLASIFICACIN DE LOS DATOS
Los datos recolectados de cualquier fuente deben ser organizados. Los de fuente interna y
fuente externa mediante datos publicados deben ser relaborados. Mientras los obtenidos
a travs de encuestas deben ser organizados mediante un proceso que abarca tres etapas.
2.1 Correccin de datos.- Consiste en la depuracin de datos, descartando respuestas
vagas, incompletas y errneas.
2.2 Organizacin de los datos.- Es un proceso de ordenamiento en funcin de la
similitud de caractersticas y obedeciendo a cuatro aspectos diferenciales:
TIEMPO, AREAS ESPACIALES, MAGNITUD Y MODALIDADES o CATEGORAS, las
cuales determinan series cronolgicas, geogrficas, cuantitativas y cualitativas
respectivamente.
2.3 Tabulacin.- Resumir los datos clasificados en tablas.
3. PRESENTACIN DE DATOS
Es el proceso mediante el cual los datos deben presentarse definitivamente en forma clara
y adecuada para su respectivo anlisis e interpretacin.
Los datos se pueden presentar de tres formas: textual, tabular, grfica.
-
3.1 Presentacin textual.- Es un tipo particular de presentacin que se lo utiliza
cuando la investigacin abarca pocos datos y se los describe mediante palabras o
smbolos. Este tipo de presentacin los utiliza usualmente los medios de
comunicacin impresos.
3.2 Presentacin tabular.- Se utiliza tablas para presentar la informacin la cual debe
contener ttulo, encabezado, columna matriz y cuerpo.
3.3 Presentacin graficativa.- Se presenta los datos mediante grficas como
histogramas, Diagramas de pastel, polgonos de frecuencia.
MEDIDAS DE TENDENCIA CENTRAL
TRMINOS ESTADSTICOS
VARIABLE: Es una caracterstica cualitativa o cuantitativa que puede tomar diferentes
valores para cada uno de los elementos de la poblacin. Ejemplo: Estaturas de los
estudiantes de tercer nivel de la FISEI de la Universidad Tcnica de Ambato.
VARIABLE DISCRETA: Es una caracterstica cuantitativa que no puede tomar valores
comprendidos entre dos nmeros enteros consecutivos. Ejemplo: Nmero de presidentes
constitucionales del Ecuador.
VARIABE CONTINUA.- Es una caracterstica cuantitativa que puede tomar cualquier valor
numrico. Ejemplo: Edad de los Presidentes constitucionales del Ecuador.
POBLACIN: Es el grupo o colectivo que va hacer investigado y que posee caractersticas
comunes. Ejemplo: Profesores de educacin media de la provincia de Tungurahua.
Parmetros.- Son los valores numricos que corresponden a las caractersticas de la
poblacin. Ejemplo: Media aritmtica de la edad de los profesores de educacin media de
la provincia de Tungurahua.
MUESTRA: Es una parte de la poblacin de cuyo anlisis se puede obtener caractersticas
que corresponden a la poblacin. Ejemplo: Profesor de educacin media del cantn
Ambato.
Estadstico.- Son los valores numricos que corresponden a las caractersticas de la
muestra. Ejemplo: Media aritmtica de la edad de los profesores de educacin media del
cantn Ambato.
-
TAMAO DE LA MUESTRA
Para calcular el tamao de la muestra se puede recurrir a diferentes frmulas en las cuales
se toma en cuenta el tamao de la poblacin, el error que se considera aceptable en el
clculo de la muestra, la expresin que se utilizara en ste mdulo para dicho clculo es la
siguiente:
( )
Ejemplo: En una poblacin de 10000 alumnos Cul es tamao de la muestra si el
error mximo admisible es del 5%?
( ) ( )
n = 384.65 z 386 alumnos
Caractersticas de la muestra:
- Debe ser representativa.- Es decir que represente en verdad a toda la poblacin
salvo el margen de error admisible.
- Tamao adecuado.- De tal modo que los resultados de la investigacin no sean
dudosos por haber tomado una muestra muy pequea.
- Que el margen de error admisible est dentro del lmite aceptado por la estadstica
< = 15%.
Donde:
n: Tamao de la muestra
m: Tamao de la poblacin.
e: error admisible
-
REDONDEO DE DATOS
En la actualidad, con el uso de las computadoras, se pueden obtener miles de cifras
decimales o enteras, pero en la estadstica no se requiere de la precisin absoluta, sino
ms bien de la aproximacin o redondeo de ciertos valores. Para realizar la aproximacin
o redondeo se puede utilizar sistemas de redondeo.
Sistemas de redondeo:
Sistema convencional
ste sistema menciona que si el ltimo dgito es menor que 5 se lo suprime y la cantidad
resultante es la misma:
Ejemplos:
7,23 redondeando a la dcima sera 7,2
10, 284 redondeando a la centsima sera 10,28
Si el ltimo dgito es mayor o igual que 5, se lo suprime y el dgito anterior es redondeado
a la cifra inmediata superior.
Ejemplos:
8,277 redondeando a la centsima es 8,28
14,375 redondeando a la centsima es 14,38
Sistema internacional
Cuando la cantidad entera de un nmero es impar se aumenta una unidad ms.
Ejemplo:
39,5 redondeando a dos cifras enteras 40
Si la fraccin decimal es exactamente 5 y si le precede una cifra par, no vara el nmero.
Ejemplo:
74,5 redondeando a dos cifras enteras 74
-
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS
CONCEPTO.- Son los valores ms representativos de un conjunto de datos o valores con
los cuales se pueden hacer comparaciones y que sirven de base para un sistema
estadstico. TIPOS
1. COMPUTACIONALES: Utilizan formulas comprobadas matemticamente o
cientficamente
2. NO COMPUTACIONALES O POSICIONALES: Cuando se lo realiza por simple
observacin o se utilizan frmulas empricas con principios de interpolacin.
MEDIDAS COMPUTACIONALES
MEDIA ARITMETICA ( )
Es la razn de la sumatoria de los valores de la variable para el nmero total de ellas.
Ejemplo:
Mediante los siguientes datos hallar la media aritmtica. 10, 8, 6, 5, 10, 7
Aproximado
MEDIA ARITMETICA PONDERADA ( )
Consiste en asignar importancia pesos a cado uno de los valores de la variable:
Ejemplo: Promedio de calificaciones las materias seguidas en tercero.
-
MEDIA ARITMTICA CON FRECUENCIAS ( )
Es utilizada cuando los valores de la variable se repiten muchas veces.
Del ejemplo de la media aritmtica:
Aproximado
Propiedades de la media aritmtica:
1.- La sumatoria de los valores de la variable X menos la media aritmtica es cero o
aproximadamente cero.
( )
2.- La sumatoria ( ) es mnimo cuando X=
Materia Importancia Nota
Fsica 7 9
Estadstica 1 4.7
Redes 6 8.5
Programacin 8 9.1
Clculo 10 7.4
Circuitos 10 8.3
-
Desventaja:
La media aritmtica se ve muy afectada por valores extremos que tengan las variables.
MEDIA GEOMETRICA ( )
Se define como la raz ensima del producto de los n valores que puede tomar la variable X.
Ejemplo: Hallar la media geomtrica de los nmeros 3, 5, 6, 6, 7, 10, 12
Ventaja:
Es menos influenciada por valores externos a diferencia de la media aritmtica.
Desventaja:
No es aplicable cuando existe valor 0 o cuando en ciertos casos hay nmeros negativos.
MEDIA ARMNICA ( )
Es el recproco de la media aritmtica de los recprocos de los valores de la variable X.
Ejemplo: Una persona viaja de A hasta B con una velocidad media de 30 millas por hora
(mi/h) y regresa de B hasta A, a una velocidad media de 60 mi/h. Cul es la velocidad
media en el viaje completo.
-
mi/h
La media armnica est asociada directamente con series mecnicas donde intervenga el
tiempo. MEDIDAS POSICIONALES MEDIANA (MED)
Es el valor ms central de la serie, divide al conjunto de valores en 2 partes iguales. Se la
puede calcular mediante un promedio o por simple observacin. La mediana es un
parmetro de tendencia central muy aplicado y que es muy cercano a la media aritmtica
pero que no se ve influenciado en absoluto por los valores extremos. No se utiliza en
clculos matemticos muy profundos.
Ejemplo: encuentre la mediana de los siguientes nmeros: 9.6, 8.0, 7.7, 6.5, 10.0, 9.9
Para encontrar la mediana se sigue los siguientes pasos.
1. Ordenar los datos. Puede ser en forma ascendente o descendente.
10.0 9.9 9.6 8.0 7.7 6.5
2. Si el nmero de datos es par, se escoge los dos valores ms centrales y se les saca
un promedio.
3. En el caso de que el nmero de datos sea impar, se escoge el valor central de los
datos ordenados. Ejemplo: en los datos 14, 9, 8, 6, 5, 4, 3 la mediana sera 6.
MODA (MOD)
Es el valor que ms se repite en una serie estadstica
Ejemplo: encuentre la moda de los siguientes valores 3, 5, 6, 6, 7, 10, 12.
-
La moda es 6.
Nota: Cuando existe ms de un nmero que se repite el mismo nmero de veces se dice
que no existe moda, a su vez se denomina segn el nmero de veces que se repite el valor
seria bimodal, trimodal, etc. Segn sea el caso.
Ejemplo: 3, 5, 6, 6, 7, 10,10, 12.
Se puede decir que la moda es bimodal por el nmero 6 y 10; o a su vez que no existe moda.
CUANTILES
Es el nmero de partes que se divide una serie estadstica o un conjunto de valores. Se
tiene cuatro tipos de cuantiles a saber:
CUANTILES # DE PARTES QUE DIVIDE
LA SERIE
# DE CUANTILES A
ENCONTRAR
Cuartiles (Ki) 4 3
Quintiles (Qi) 5 4
Deciles (Di) 10 9
Percentiles (Pri) 100 99
Para el clculo de los cuantiles en datos no agrupados primeramente se debe ubicar la
posicin en la serie a travs de frmulas empricas para posteriormente determinar el
valor correspondiente.
Las frmulas empricas para encontrar la posicin de los cuantiles es:
1.- Cuartiles:
( )
2.- Quintiles:
( )
3.-Decil:
-
( )
4.-Percentil:
( )
Ejemplo: La estatura en metros de siete estudiantes de ingeniera fueron: 1.83, 1.72, 1.77,
1.80, 1.71, 1.85, 1.80; determinar el quintil nmero uno, decil nmero 6, cuartil nmero 3,
percentil nmero 61.
Para poder calcular los cuantiles es necesario en primer lugar ordenar los valores ya sea
en forma descendente o ascendente.
En forma descendente: 1.85 1.83 1.80 1.80 1.77 1.72 1.71
Cuartil 3
( )
( )
Es la posicin que va a tener el valor en la serie
Para encontrar el valor se procede a contar las posiciones en forma descendente por lo
tanto el valor de cuartil 3 es V(Q3) = 1.72
Quintil 1
( )
( )
Donde:
N: Nmero de valores de la variable
i: Nmero de posicin del cuantil.
-
Cuando la posicin del cuantil no es un nmero entero se procede a interpolar el valor de
la siguiente forma:
1. Se observa entre que datos esta contenido el valor dependiendo de la posicin
calculado, en ste ejemplo la posicin es 1.6 por lo tanto el valor buscado estar
entre 1.85 y 1.83
2. Se interpola de la siguiente forma:
( ) [ ( )]
( )
Decil 6
( )
( )
( ) [ ( )]
( )
Percentil 61
( )
( )
( ) [ ( )]
( )
-
MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS
CONCEPTO.- Es el grado de alejamiento de los valores de la serie estadstica con respecto
a una medida de tendencia central.
La dispersin de los datos intenta dar una idea de cun esparcidos se encuentran stos, es
de mucha utilidad cuando se realiza un anlisis estadstico en mediciones, en control de
produccin, en investigacin estadstica y cuando se requiere realizar anlisis de cualquier
informacin que se investigue.
Las ms utilizadas son rango, rango semiintercuartil, rango percentil, MAD, desviacin
tpica o estndar, coeficiente de variacin.
RANGO (R)
Es la diferencia entre el valor mximo y el valor mnimo del conjunto de valores de la serie
estadstica.
Ejemplo: Cul es el rango del conjunto de datos 2, 3, 3, 5, 5, 5, 8, 10, 12
RANGO SEMIINTERCUARTIL (RK)
El rango semiintercuartil es la distancia dividida para dos entre el cuartil tres y el cuartil
uno.
( ) ( )
RANGO PERCENTIL (RPr)
Es la distancia que existe entre el percentil noventa y el percentil diez.
( ) ( )
Ejemplo: Para los siguientes datos calcule el rango semiintercuartil y rango percentil. 12,
6, 7, 3, 15, 10, 18, 5.
L.max L.min
R
-
Antes de resolver se debe ordenar los datos en forma descendente o ascendente.
18 15 12 10 7 6 5 3
Se procede a calcular las posiciones y valores de los cuartiles y percentiles.
( )
( )
( )
( )
( )
( )
( )
( )
( ) [ ( )]
( )
( ) [ ( )]
( )
( )
( )
-
Finalmente se calcula los valores de los rangos.
( ) ( )
Recordar que el rango es una distancia por lo tanto no se toma en cuenta el signo.
DESVIACION MEDIA ABSOLUTA (MAD)
Permite determinar el promedio de las desviaciones con respecto a una medida de
tendencia central ya sea esta computacional o posicional.
Computacional
| |
Posicional
| |
DESVIACION TPICA O ESTANDAR ()
Permite calcular el grado de dispersin real de una serie estadstica por que utiliza
desviaciones cuadrticas para su clculo
Computacional
( )
Diferencia
Desviacin
Promedio
Media Sin el signo
Absoluta
-
Posicional
( )
VARIANZA (2)
La varianza no es ms que la desviacin tpica elevada al cuadrado y es utilizada para el
clculo inicial de la dispersin pero tiene el inconveniente de que las unidades quedan
elevadas al cuadrado.
( )
VARIANZA EXPERIMENTAL (2)
Es una variante de la varianza que se utiliza en el clculo de la incertidumbre
generalmente presente en las mediciones.
( )
( )
COEFICIENTE DE VARIACION (CV)
Permite determinar en porcentaje el grado de dispersin que existe en los valores de la
serie estadstica.
Ejemplo 1: Para el conjunto de datos mostrados calcule todas las medidas de dispersin
analizadas. 18, 15, 12, 10, 7, 6, 5, 3
Xi |Xi-X| (Xi-X)2
18 8.5 72.25
15 5.5 30.25
12 2.5 6.25
10 0.5 0.25
-
Media aritmtica
Desviacin media absoluta
| |
Desviacin Tpica
( )
7 2.5 6.25
6 3.5 12.25
5 4.5 20.25
3 6.5 42.25
sumatoria 34 190
-
Varianza
( )
Coeficiente de variacin
DATOS AGRUPADOS
La agrupacin de datos generalmente responde a necesidades de carcter metodolgico
debido a que cuando se tienen demasiados valores de las variables investigadas es
imposible analizarlos sin previamente ordenarlos o agruparlos de alguna manera. Razn
ms que fundamental para utilizar conceptos como frecuencias, distribucin de
frecuencias, intervalos, clases que a continuacin se definirn.
DISTRIBUCION DE FRECUENCIAS
Organizar los datos en series estadsticas de tipo cuantitativas a travs de clases y
frecuencias para posteriormente determinar por separado mediante tcnicas de conteo el
nmero de observaciones pertenecientes a cada una de ellas.
Tabla de distribucin de frecuencias.- Colocar las clases y frecuencias en tablas
tabulacin para su posterior anlisis mediante tcnicas estadsticas.
Clase.- Categoras o niveles que se establece al clasificar o dividir los datos obtenidos en
una investigacin.
Frecuencias (f) .- Es el nmero de veces que se repite un mismo valor de la variable. En la
distribucin de frecuencias se considera la frecuencia de la clase que es el nmero de
valores que estn contenidos en una clase.
-
Tabla de distribucin de frecuencias
CLASES f
0.1355 0.1287 5
0.1287 0.1219 6
0.1219 0.1151 10
0.1151 0.1083 14
0.1083 0.1015 9
0.1015 0.0947 5
0.0947 0.0879 1
Intervalo de clase.- Son todos los valores que estn comprendidos entre dos lmites
incluidos ellos. Ejemplo: en el intervalo de 70 a 75 estn incluidos los valores de 70, 71, 72,
73, 74, 75.
Lmites de clase.- Son los valores extremos que forman el intervalo, siendo los valores
ms grande y ms pequeo de la clase respectivamente. Del ejemplo anterior el lmite
inferior es 70 y el lmite superior es 75.
Lmites reales de clase.- Son los valores verdaderos que se consideran como lmites
tomando en cuenta que los valores pueden aproximarse a un nmero determinado de
cifras significativas. Ejemplo: en los datos anteriores los lmites reales son: 69.5 y 75.5.
Se considera el limite real inferior (LRi) y lmite real superior (LRs). Para encontrarlos se
debe considerar el nmero de cifras decimales que tiene los datos y aumentarle y quitarle
5 a las ltimas cifras segn sea el caso.
Ejemplo: los lmites de un intervalo son 56.786 y 60.787. Cules sern los lmites
reales?
LRi = 56.7855 LRs = 60.7875
Amplitud o recorrido de la variable Rango (R)
Se define como la distancia o diferencia que se establece entre el valor mayor y el valor
menor de la variable en el conjunto de datos recolectados.
Ancho del intervalo o longitud de clase (i).- Es la diferencia entre los lmites reales
superior e inferior.
Frecuencias de
clase
Clases
-
Nmero de intervalos (ni).- Constituye un nmero entero que refleja la totalidad de las
clases. Se puede calcular a travs de las siguientes frmulas.
Frmula de Sturges
( )
Donde: n = nmero de datos.
En el caso de que se plantee el ancho del intervalo el nmero de intervalos ser:
Generalmente se calcula primero el nmero de intervalos y luego el ancho del intervalo
con la expresin.
El nmero de intervalos no debe ser menor a 5 ya que las frecuencias
estaran muy concentradas
El nmero de intervalos no debe ser mayor que 15 ya que las frecuancias
estaran muy dispersas.
NOTA: i tiene que tener
un decimal ms que los
que tienen los datos.
NOTA: (ni) siempre va a
Ser un valor entero.
-
Frecuencia acumulada (fa).- Es la suma de las frecuencias a partir de la frecuencia del
ltimo de los intervalos.
Frecuencia relativa (fr).- Es la relacin que se establece al dividir la frecuencia de cada
clase para el nmero total de datos.
Frecuencia porcentual (%f).- Es el producto de la frecuencia relativa por el cien por ciento.
Marca de clase (Xm).- Es el valor promedio de cada intervalo.
Ejemplo: Elabore una tabla de distribucin de frecuencias para los siguiente datos
presentados.
0.110 0.110 0.126 0.112 0.117 0.113 0.135 0.107 0.122
0.113 0.098 0.122 0.105 0.103 0.119 0.100 0.117 0.113
0.124 0.118 0.132 0.108 0.115 0.120 0.107 0.123 0.109
0.117 0.111 0.112 0.101 0.112 0.111 0.119 0.103 0.100
0.108 0.120 0.099 0.102 0.129 0.115 0.121 0.130 0.134
0.118 0.106 0.128 0.094 0.111
Rango:
Nmero de intervalos (ni)
-
Ancho del intervalo (i)
Tabla de distribucin de frecuencias
Para comenzar a elaborar la tabla se toma el valor mayor de los datos y se lo toma como
lmite real superior es decir se lo adiciona 5 como ltima cifra decimal es decir: 0.135
como lmite real superior sera 0.1355.
Posteriormente para encontrar el lmite real inferior se lo hace restando del lmite real
superior el ancho del intervalo.
Este lmite calculado se convierte en el superior del siguiente intervalo y as se procede
hasta obtener el nmero de intervalos calculados.
CLASES Xm f fa fr %f
0.1355 0.1287 0.1321 5 50 0.1000 10.0000
0.1287 0.1219 0.1253 6 45 0.1200 12.0000
0.1219 0.1151 0.1185 10 39 0.2000 20.0000
0.1151 0.1083 0.1117 14 29 0.2800 28.0000
0.1083 0.1015 0.1049 9 15 0.1800 18.0000
0.1015 0.0947 0.0981 5 6 0.1000 10.0000
0.0947 0.0879 0.0913 1 1 0.0200 2.0000
SUMATORIA
50
1.0000 100.0000
Nota: La primera y la ltima siempre debe tener un valor de frecuencia y no puede ser
cero.
-
PRESENTACIN GRFICA DE LA DISTRIBUCIN DE FRECUENCIAS
Para observar mejor los datos agrupados en la distribucin de frecuencias se recurre a la
presentacin grfica de los mismos utilizando sistemas de referencia adecuados,
generalmente el primer cuadrante del sistema cartesiano.
Histograma.- Un histograma es un conjunto de rectngulos que estn juntos unos a otros
y que tienen el mismo espesor y que corresponde al ancho del intervalo. En el eje X se
representa las clases y en el eje Y las frecuencias. Ejemplo
Polgonos de frecuencia.- Es un grfico de trozos de la frecuencia de cada clase con
relacin a las marcas de clase; se lo puede representar en el mismo grfico del histograma
simplemente aadiendo un punto ms antes y despus de la ltima y la primera clase.
El polgono de frecuencias se grafica utilizando las marcas de clase en el eje X y las
frecuencias en el eje Y. Ejemplo
02468
10121416
46.3 42.1 37.9 33.7 29.5 25.3 21.1
50.5 46.3 42.1 37.9 33.7 29.5 25.3
Fre
cuenc
ias
Serie Estadstica
Histograma
-
Diagrama de sectores pastel.- El diagrama de sectores es una representacin de los
datos en un circulo para lo cual se utiliza los valores de la frecuencia porcentual (%f)
distribuidos en los 360 grados que posee dicho circulo. Para lo cual se puede recurrir
fcilmente a una regla de tres.
100 % 360 grados
%f x
Ejemplo:
0
2
4
6
8
10
12
14
16
0.1
32
1
0.1
25
3
0.1
18
5
0.1
11
7
0.1
04
9
0.0
98
1
0.0
91
3
POLIGONO DE FRECUENCIAS
POLIGONO DEFRECUENCIAS
10.0
12.0
20.0
28.0
18.0
10.0
2.0
DIAGRAMA DE SECTORES
1
2
3
4
5
6
7
-
Diagrama de frecuencias acumuladas Ojiva.- El diagrama de frecuencias acumuladas
permite observar la tendencia de concentracin de los datos segn la longitud de los
segmentos dibujados.
Para graficar se lo debe hacer colocando en el eje X las marcas de clase, y en el eje Y las
frecuencias acumuladas. Ejemplo
MEDIDAS DE TENDENCIAL CENTRAL PARA DATOS AGRUPADOS
CONCEPTO.- Son los valores ms representativos de un conjunto de datos o valores
agrupados en la tabla de distribucin de frecuencias con los cuales se pueden hacer
comparaciones y que sirven de base para el anlisis de un sistema estadstico.
TIPOS
COMPUTACIONALES: Utilizan formulas comprobadas matemticamente o cientficamente
para su clculo pero que utilizan las frecuencias y marcas de cada clase a diferencia de los
datos no agrupados.
NO COMPUTACIONALES O POSICIONALES: Se utilizan frmulas empricas con principios
de interpolacin y que utilizan las columnas de frecuencia, frecuencia acumulada y lmites
para su clculo.
0
10
20
30
40
50
60
0.1321 0.1253 0.1185 0.1117 0.1049 0.0981 0.0913
Frecuencia acumulada
Frecuencia acumulada
-
MEDIDAS COMPUTACIONALES
MEDIA ARITMETICA ( )
Es la razn de la sumatoria de los valores de la marca de clase por la frecuencia de cada
clase para el nmero total de datos.
MEDIA GEOMETRICA ( )
Se define como el antilogaritmo de la razn entre la sumatoria del producto de las frecuencias de cada clase y el logaritmo decimal de las marcas de clase para el nmero de datos.
El antilogaritmo es la operacin contraria al logaritmo.
(
)
MEDIA ARMNICA ( )
Es el recproco de la media aritmtica de los recprocos de la marca de clase por la
frecuencia de cada una de las clases.
Ejemplo: En la oficina de un diario, el tiempo que se tardan en imprimir la primera plana
fue registrado durante 50 das. A continuacin se presentan los datos.
Las operaciones de multiplicacin y
sumas se las realiza rpidamente en la
misma tabla de distribucin de
frecuencias
-
DATOS
20.8 22.8 21.9 22 20.7 20.9 25 22.2 22.8 20.1
25.3 20.7 22.5 21.2 23.8 23.3 20.9 22.9 23.5 19.5
23.7 20.3 23.6 19 25.1 25 19.5 24.1 24.2 21.8
21.3 21.5 23.1 19.9 24.2 24.1 19.8 23.9 22.8 23.9
19.7 24.2 23.8 20.7 23.8 24.3 21.1 20.9 21.6 22.7
Determine las medidas de tendencia central computacionales.
Rango:
Nmero de intervalos (ni)
( )
( )
Ancho del intervalo (i)
Tabla de distribucin de frecuencias
DISTRIBUCIN DE FRECUENCIAS CLASES f Xm fa fr %f f*Xm f*log(Xm) f*(1/Xm)
25.35 24.30 5 24.83 50 0.10 10.00 124.13 6.97 0.20
24.30 23.25 14 23.78 45 0.28 28.00 332.85 19.27 0.59
23.25 22.20 8 22.73 31 0.16 16.00 181.80 10.85 0.35
22.20 21.15 7 21.68 23 0.14 14.00 151.73 9.35 0.32
21.15 20.10 10 20.63 16 0.20 20.00 206.25 13.14 0.48
20.10 19.05 5 19.58 6 0.10 10.00 97.88 6.46 0.26
19.05 18.00 1 18.53 1 0.02 2.00 18.53 1.27 0.05
SUMATORIA 50
1.00 100.00 1113.15 67.31 2.26
Medidas computacionales
Media aritmtica
-
Media geomtrica
(
)
(
)
( )
Media Armnica
MEDIDAS POSICIONALES
MEDIANA (MED)
Es el valor ms central de la serie estadstica, divide al conjunto de las clases en 2 partes
iguales. La mediana es un parmetro de tendencia central muy aplicado y que para su
-
determinacin se utiliza la columna de las frecuencias acumuladas junto con el ancho del
intervalo.
Donde:
: Lmite real inferior de la clase de la mediana.
: Frecuencia acumulada anterior a la clase de la mediana.
: Frecuencia de la clase de la mediana.
: Ancho del intervalo.
MODA (MOD)
Es el valor que ms se repite en una serie estadstica, para su clculo se utiliza la columna
de las frecuencias junto con el ancho del intervalo.
Donde
: Lmite real inferior de la clase modal.
: Ancho del intervalo.
CUANTILES
Es el nmero de partes iguales que se divide una serie estadstica, para su clculo se
determina con la columna de las frecuencias acumuladas y el ancho del intervalo.
CUARTIL (K)
-
La frmula utilizada para encontrar los cuartiles segn su nmero es:
Donde:
: Lmite real inferior de la clase del cuartil.
: Frecuencia acumulada anterior a la clase del cuartil.
: Frecuencia de la clase del cuartil.
: Ancho del intervalo.
j: Nmero del cuartil.
QUINTIL (Q)
La frmula utilizada para encontrar los quintiles segn su nmero es:
Donde:
: Lmite real inferior de la clase del quintil.
: Frecuencia acumulada anterior a la clase del quintil.
: Frecuencia de la clase del quintil.
: Ancho del intervalo.
j: Nmero del quintil.
DECIL (D)
La frmula utilizada para encontrar los deciles segn su nmero es:
Donde:
: Lmite real inferior de la clase del decil.
: Frecuencia acumulada anterior a la clase del decil.
: Frecuencia de la clase del decil.
: Ancho del intervalo.
j: Nmero del decil.
-
PERCENTIL (Pr)
La frmula utilizada para encontrar los percentiles segn su nmero es:
Donde:
: Lmite real inferior de la clase del percentil.
: Frecuencia acumulada anterior a la clase del percentil.
: Frecuencia de la clase del percentil.
: Ancho del intervalo.
j: Nmero del percentil.
Ejemplo: La tabla adjunta muestra los dimetros en centmetros de una muestra de 60
bolas de cojinete manufacturados por una fbrica.
1.738 1.729 1.743 1.740 1.736 1.741 1.735 1.731 1.726 1.737 1.728 1.737
1.736 1.735 1.724 1.733 1.742 1.736 1.739 1.735 1.745 1.736 1.742 1.740
1.728 1.738 1.725 1.733 1.734 1.732 1.733 1.730 1.732 1.730 1.739 1.734
1.738 1.739 1.727 1.735 1.735 1.732 1.735 1.727 1.734 1.732 1.736 1.741
1.736 1.744 1.732 1.737 1.731 1.746 1.735 1.735 1.729 1.734 1.730 1.740
Determine la mediana, la moda el cuartil 3, quintil 2, decil 5 y percentil 90. Utilice la raz
para el clculo del nmero de intervalos
Rango:
Nmero de intervalos (ni)
Ancho del intervalo (i)
-
Medidas posicionales de tendencia central
CLASES f fa Xm
1.7465 1.7434 3 60 1.7450
1.7434 1.7403 5 57 1.7419
1.7403 1.7372 9 52 1.7388
1.7372 1.7341 17 43 1.7357
1.7341 1.7310 14 26 1.7326
1.7310 1.7279 7 12 1.7295
1.7279 1.7248 4 5 1.7264
1.7248 1.7217 1 1 1.7233
SUMATORIAS 60
Mediana
Procedimiento de clculo:
1. Determine el resultado de
2. Con el resultado anterior determine en la columna de la frecuencia acumulada en
que clase queda contenido dicho valor. En este ejemplo est en la clase nmero 4,
ya que el valor de 30 es mayor que 26 y menor 43.
3. Se localiza el , , observando en la tabla de distribucin de
frecuencias. Los valores son:
4. Se calcula la mediana
Moda
-
Procedimiento de clculo
1. En la tabla de distribucin de frecuencia se observa la clase que tiene mayor
frecuencia; sta se convierte en la frecuencia modal y se obtiene tambin el
. En ste ejemplo la frecuencia modal es 17 y lmite real inferior de la clase
modal es 1.7341. En el caso de haber ms de una clase con la misma frecuencia
no existir moda.
2. Se localiza la frecuencia premodal que es aquella que est antes de la frecuencia
modal en ste ejemplo es 14, y de la misma forma la postmodal que es la que est
despus de la frecuencia modal en ste ejemplo 9. Se comienza a contar desde la
ltima clase.
3. Se calcula y
4. Se calcula la moda.
Cuantiles
El procedimiento de clculo es similar al de la mediana ya que hay que recordar que la
mediana es un cuantil que divide en dos partes iguales a la serie estadstica.
Cuartil 3.
-
Quintil 2.
Decil 5
Percentil 90
MEDIDAS DE DISPERSION PARA DATOS AGRUPADOS
CONCEPTO.- Es el grado de alejamiento de los valores de la serie estadstica con respecto
a una medida de tendencia central.
RANGO (R)
Es la diferencia entre el lmite real superior de la primera clase y el lmite real inferior de
la ltima clase.
-
RANGO SEMIINTERCUARTIL (RK)
El rango semiintercuartil es la distancia dividida para dos entre el cuartil tres y el cuartil
uno que se encuentren en la tabla de distribucin de frecuencias.
RANGO PERCENTIL (RPr)
Es la distancia que existe entre el percentil noventa y el percentil diez encontrados en la
tabla de distribucin de frecuencias.
DESVIACION MEDIA ABSOLUTA (MAD)
Permite determinar el promedio de las desviaciones con respecto a una medida de
tendencia central ya sea esta computacional o posicional. Para su clculo se utiliza
frecuencias y marcas de clase.
Computacional
| |
Posicional
| |
DESVIACION TPICA O ESTANDAR ()
Permite calcular el grado de dispersin real de una serie estadstica por que utiliza
desviaciones cuadrticas para su clculo. Se determina con las frecuencias y marcas de
clase.
Diferencia
Desviacin
Promedio
Media Sin el signo
Absoluta
R
-
Computacional
( )
Posicional
( )
VARIANZA (2)
La varianza no es ms que la desviacin tpica elevada al cuadrado y es utilizada para el
clculo inicial de la dispersin pero tiene el inconveniente de que las unidades quedan
elevadas al cuadrado.
( )
COEFICIENTE DE VARIACION (CV)
Permite determinar en porcentaje el grado de dispersin que existe en los valores de la
serie estadstica.
Ejercicio: En el ejemplo anterior calcule las medidas de dispersin.
Medidas de dispersin para datos agrupados
CLASES f fa Xm f*|Xm-X| f*(Xm-X)^2
1.7465 1.7428 4 60 1.7447 0.0392 0.0004
1.7428 1.7391 7 56 1.7410 0.0427 0.0003
1.7391 1.7354 15 49 1.7373 0.0361 0.0001
1.7354 1.7317 20 34 1.7336 0.0259 0.0000
1.7317 1.7280 9 14 1.7299 0.0450 0.0002
1.7280 1.7243 4 5 1.7262 0.0348 0.0003
1.7243 1.7206 1 1 1.7225 0.0124 0.0002
SUMATORIAS 60
0.2361 0.0014
-
Rango
Rango semiintercuartil
Rango percentil
-
Desviacin media absoluta
| |
Desviacin tpica o estndar
( )
Varianza (2)
( )
Coeficiente de variacin
-
RELACIN ENTRE MEDIDAS DE TENDENCIA CENTRAL COMPUTACIONALES Y MEDIDAS DE
DISPERSIN
CAMPANA DE GAUSS
La estadstica nos sirve para encontrar patrones de comportamiento y, as, entender
mejor un proceso.
Cuando el dato es una variable continua, es decir, que puede tomar cualquier valor entre
infinito y menos infinito; y cuando las causas especiales de variacin han sido eliminadas
del proceso, la distribucin ser parecida a una curva normal o campana de Gauss.
En este tipo de distribucin se sabe que el 68 % de los datos caern entre +/- 1 desviacin
estndar (1 Sigma) a cada lado de la Media. A +/- 2 Sigmas el 95 % de los datos.
Este patrn es el que nos permitir saber rpidamente si los procesos estn controlados o
fuera de control.
-
CLCULO DE PERCENTILES
Los percentiles se pueden calcular en funcin de la media aritmtica y la desviacin tpica
o estndar ( ) de una forma rpida a travs de unas constantes que dependen del nmero
de percentil.
La expresin para determinar dichos percentiles es:
Donde:
Pr: Percentil
: Media aritmtica
Z: Constante segn el percentil elegido.
: Desviacin tpica o estndar.
Valores de la constante Z segn el percentil
Ejemplo de clculo:
-
En un estudio sobre la talla de una poblacin de estudiantes se la media aritmtica fue de
1750 mm, y la desviacin tpica de 67,07 mm. Calcular los valores de estatura que
quedaran comprendidos en el 90% de sta poblacin
Esto significa que se debe analizar los valores comprendidos entre el 5 y 95 % de la
poblacin por lo cual es necesario calcular el percentil 5 y 95.
El valor de Z segn la tabla para estos percentiles es de 1.65
Por lo tanto los valores de estatura que corresponden al 90% de la poblacin est entre
1639.3 mm y 1860.7 mm.
Utilidad de los percentiles
Los percentiles son muy tiles en el diseo y tienen mucha significancia en el
dimensionamiento. Ejemplo: analice el siguiente grfico.
-
Como dimensionar la estantera para que un porcentaje de la poblacin no tenga ningn
inconveniente en tomar la caja de la repisa. De una solucin.
MOMENTOS ESTADSTICOS
Al igual que las medidas de dispersin y de tendencia central los momentos estadsticos
permite tambin realizar un anlisis estadstico de los datos que resulten de la
investigacin estadstica.
Algunos de los momentos estadsticos son muy tiles en el anlisis de curvas de
distribucin de frecuencias por ejemplo en la determinacin el sesgo y el curtosis.
Concepto.- Es un parmetro que permite un anlisis cuantitativo de los datos de una serie
estadstica.
Se definen los momentos con respecto a la variable X y con respecto a la media aritmtica.
a) Con respecto a la variable X
Su frmula matemtica es:
Para datos no agrupados
Para datos agrupados
El momento de grado 1 con respecto a la variable X es la media aritmtica.
-
b) Con respecto a la media aritmtica
Su frmula matemtica es:
Para datos no agrupados
( )
Para datos agrupados
( )
Si r = 1, el momento de grado 1 con respecto a la media aritmtica es cero, si r = 2, el
momento de grado dos con respecto a la media aritmtica es la varianza.
Tambin se puede definir un momento con respecto a un valor constante cualquiera.
Para datos no agrupados
( )
Para datos agrupados
( )
Ejemplo 1:
Para los valores 5, 8, 7, 3, 2, 1, 9 calcule el momento de grado 1, momento de grado 4,
momento de grado 3 con respecto a la media aritmtica.
a) Momento de grado 1
-
Este valor corresponde a la media aritmtica.
b) Momento de grado 4.
c) Momento de grado 3 con respecto a la media aritmtica
( )
( ) ( ) ( ) ( ) ( ) ( ) ( )
Ejemplo 1:
Para la siguiente tabla de distribucin de frecuencias calcule el momento estadstico 6 y el
momento 5 con respecto a la media aritmtica.
Distribucin de frecuencias
CLASES f fa Xm f*Xm
1.7465 1.7434 3 60 1.7450 5.2349
1.7434 1.7403 5 57 1.7419 8.7093
1.7403 1.7372 9 52 1.7388 15.6488
1.7372 1.7341 17 43 1.7357 29.5061
1.7341 1.7310 14 26 1.7326 24.2557
1.7310 1.7279 7 12 1.7295 12.1062
1.7279 1.7248 4 5 1.7264 6.9054
1.7248 1.7217 1 1 1.7233 1.7233
SUMATORIAS 60
104.0894
-
f*Xm^6 f*(Xm-X)^5
84.6875 0.0000000003
139.6479 0.0000000001
248.6940 0.0000000000
464.7526 0.0000000000
378.6541 0.0000000000
187.3036 0.0000000000
105.8847 -0.0000000002
26.1872 -0.0000000002
1635.8117 -0.000000000001
a) Momento 6
b) Momento 5 con respecto a la media aritmtica
( )
MOMENTOS ESTADSTICOS ADIMENSIONALES
Para evitar unidades particulares se utiliza los momentos adimensionales respecto a la
media aritmtica.
-
Todo momento adimensional se lo obtiene dividiendo para la desviacin tpica elevada al
exponente del momento.
( )
Para momento adicional 1 su valor ser cero, y para el momento adicional 2 su valor ser
1.
Ejemplo: Para los valores 5, 8, 7, 3, 2, 1, 9 calcule el momento adimensional 4.
La media aritmtica es 5.
a) Momento de grado 4 con respecto a la media aritmtica
( )
( ) ( ) ( ) ( ) ( ) ( ) ( )
Desviacin tpica:
( )
Momento adimensional 4
-
SESGO
El sesgo es el grado de asimetra que tiene distribucin de frecuencia, es decir, cunto se
aparta de la simetra. Si la curva del polgono de frecuencias suavizado sin trazos rectos
de una distribucin tiende a la derecha una cola ms larga que a la izquierda, se dice
sesgada a la derecha, o de sesgo positivo. Por lo contrario si la distribucin tiene una cola
ms larga a la izquierda, se dice sesgada a la izquierda, o de sesgo negativo.
Sesgada a la derecha:
Sesgada a la izquierda:
Distribucin normal:
Coeficiente de Karl Pearson (SK)
Para una distribucin normal la media aritmtica, la moda, y la mediana tienen el mismo
valor. Mientras ms diferente sean media aritmtica y la moda, ms asimtrica es la curva
de distribucin. El coeficiente de Karl Pearson mide el grado de asimetra en unidades de
desviacin estndar con la siguiente expresin:
Si la media es mayor que la moda, entonces, SK es positivo. Es decir, el sesgo es positivo.
Si la media es menor que la moda, SK es negativo, es decir el sesgo es negativo.
Si la media es igual a la moda, SK=0 y la distribucin es simtrica.
-
Ejemplo: Para un conjunto de datos el valor de la media es 0.2608, el valor de la moda es
0.258. Por otra parte, el valor de la desviacin estndar es 0.0408. Qu tipo de
distribucin se tiene.
Respuesta: Se tiene una distribucin positiva o sesgada a la derecha.
Coeficiente de Arthur Bowley (SKK)
Este coeficiente, utiliza para su clculo los cuartiles de orden uno, dos y tres.
Si SKK es positivo, el sesgo es positivo.
Si SKK es negativo, el sesgo es negativo.
Si SKK = 0, la distribucin es simtrica.
Ejemplo: Calcular el coeficiente de Arthur Bowley para los datos en los cuales el cuartil 3
tiene un valor de 0.291, el cuartil 2 tiene un valor 0.260 y el cuartil 1 tiene un valor de
0.232.
El sesgo es positivo implica que es sesgada a la derecha.
Momento estadstico adimensional para la determinacin del sesgo
La expresin ms importante con sustento matemtico para la determinacin del sesgo es
a travs del momento estadstico adimensional 3.
-
Si es positivo, el sesgo es positivo.
Si es negativo, el sesgo es negativo.
Si = 0, la distribucin es simtrica.
Ejemplo: Para la distribucin de frecuencias presentada a continuacin determine qu
tipo de curva de distribucin se obtiene.
Distribucin de frecuencias
CLASES f fa Xm f*Xm f*(Xm-X)^2 f*(Xm-X)^3
1.7465 1.7428 4 60 1.7447 6.9786 0.0004 0.000004
1.7428 1.7391 7 56 1.7410 12.1867 0.0003 0.000002
1.7391 1.7354 15 49 1.7373 26.0588 0.0001 0.000000
1.7354 1.7317 20 34 1.7336 34.6710 0.0000 0.000000
1.7317 1.7280 9 14 1.7299 15.5687 0.0002 -0.000001
1.7280 1.7243 4 5 1.7262 6.9046 0.0003 -0.000003
1.7243 1.7206 1 1 1.7225 1.7225 0.0002 -0.000002
SUMATORIAS 60
104.0907 0.0014 -0.00000013
Media aritmtica
Desviacin tpica
Momento adimensional 3.
Momento estadstico 3 con respecto a la media.
-
Esto implica que la curva de distribucin de frecuencias est sesgada a la izquierda.
CURTOSIS
La curtosis mide cuan puntiaguda es una distribucin con respecto a la distribucin
normal. Si tiene un pico alto se dice que es leptocrtica, mientras si es aplastada se dice
que es platicrtica. La distribucin normal segn ste criterio es mesocrtica.
Leptocrtica
Platicrtica
0
5
10
15
20
25
1.7200 1.7250 1.7300 1.7350 1.7400 1.7450 1.7500
DISTRIBUCION DE FRECUENCIAS MEDIA ARITMTICA
-
Mesocrtica
Momento estadstico adimensional para la determinacin de la curtosis
Una medida del la curtosis utiliza el cuarto momento respecto a la media adimensional y
viene dada por:
Una distribucin es mesocrtica cuando = 3
Una distribucin es leptocrtica cuando > 3
Una distribucin es platicrtica cuando < 3
Otra medida de la curtosis se la puede obtener a travs del clculo del rango
semiintercuartil y el rango percentil.
Curtosis =
Ejemplo: En la tabla de distribucin mostrada anteriormente calcule la curtosis.
f*(Xm-X)^4
0.00000004
0.00000001
0.00000000
0.00000000
0.00000001
0.00000002
0.00000002
0.00000010
Momento estadstico 4 con respecto a la media.
Suma
-
Esto implica que la curva de distribucin de frecuencias platicrtica.
TEORIA ELEMENTAL DEL MUESTREO
La teora del muestreo estudia la relacin entre una poblacin y las muestras tomadas de
ella. Se utiliza para estimar magnitudes desconocidas de una poblacin, tales como la
media y la varianza llamados como parmetros de la poblacin, a partir del conocimiento
de esas magnitudes estadsticos sobre muestras.
Permite tambin determinar si las diferencias observadas entre dos muestras son debidas
a variaciones fortuitas o si son realmente significativas. Ejemplo si la seleccin de circuitos
para el armaje de un microcontrolador es mejor que la seleccin de otro tipo de circuitos
para armar el mismo microcontrolador.
( )
Caractersticas de la muestra
- Representativa. Todos los elementos de la poblacin tienen que tener la misma
oportunidad de ser considerado en la muestra.
- Tamao adecuado.- De tal modo que los resultados de la investigacin no sean
dudosos por haber tomado una muestra muy pequea.
- Que el margen de error admisible est dentro del lmite aceptado por la estadstica
< = 15%.
Muestras aleatorias
Para que las conclusiones del muestreo y de la inferencia estadstica sean vlidas, las
muestras deben escogerse representativamente de la poblacin. El anlisis de los
mtodos de muestreo y problemas relacionados se llama diseo del experimento.
Muestra
Poblacin
-
Una forma para obtener una muestra representativa es mediante muestreo aleatorio de
acuerdo con el cual, cada miembro de la poblacin tiene la misma probabilidad de ser
incluido en la muestra.
Un mtodo para lograr esto es recurrir a nmeros aleatorios. Ver apndice IX pgina 545
Estadstica Spiegel Murray segunda edicin
Muestreo con y sin reposicin
Si se saca un nmero de una urna, se lo puede volver a ponerlo o no, antes de la siguiente
extraccin. En el primer caso ese nmero puede salir de nuevo ms veces, mientras que
en el segundo caso slo puede salir cada nmero una vez. Esos dos tipos de muestreo se
llaman, respectivamente muestreo con reposicin y muestreo sin reposicin.
Ejemplo: Seleccionar 10 muestras de 4 estudiantes con reposicin de la siguiente tabla: Altura de 100 estudiantes de los niveles bsicos
Altura (pulgadas)
Nmero de estudiantes
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total = 100
1. Se debe asignar nmeros a los 100 estudiantes comenzando desde el 0.
Asignacin de nmeros de muestreo
Altura (pulgadas
Xm Nmero de estudiantes
Nmero de
muestreo
60-62 61 5 00-04
63-65 64 18 05 -22
66-68 67 42 23-64
69-71 70 27 65-91
72-74 73 8 92-99
-
2. Escoger nmeros de la tabla de valores aleatorios y hacer una correspondencia a
los intervalos en la columna del nmero de muestra en los cuales est contenido
as, el nmero aleatorio 51 corresponde al intervalo 66 68 pulgadas porque en el
nmero de muestra est entre 23 y 64 y el valor que toma es el de la marca de
clase 67.
Nmeros aleatorios
# de muestra Nmeros aparecidos en la muestra Altura correspondiente
1 51,77,27,46 67, 70, 67, 67
2 40,42,33,12 67, 67, 67,64
3 90,44,46,62 70, 67, 67, 67
4 16,28,98,93 64, 67, 73, 73
5 58,20,41,86 67, 64, 67, 70
6 19,64,08,70 64, 67, 64, 70
7 56,24,03,32 64, 67, 61, 67
8 34,9183,58 67, 70, 70, 67
9 70,65,68,21 70, 70, 70, 64
10 96,02,13,87 73, 61, 64, 70
Distribuciones de muestreo
Si se considera todas las posibles muestras de tamao (n) en una poblacin dada (con o
sin reposicin), y para cada una de las muestras se calcula un estadstico (media
aritmtica, desviacin tpica, etc.) que varan para cada una de ellas, de ste modo se
obtiene una distribucin del estadstico que se llama distribucin de la muestra.
Si el estadstico utilizado es la media, se obtiene una distribucin de muestreo de la
media.
Distribucin de muestreo de medias
Si se toman todas las posibles muestras de tamao de n, sin reposicin de una poblacin
finita de tamao m > n y de ellas se calcula la media y la desviacin tpica de la distribucin
de muestreo de medias se obtiene que:
-
Donde:
: Media aritmtica de la muestra.
: Desviacin tpica de la muestra
: Desviacin tpica de la poblacin.
: Media aritmtica de la poblacin.
Para una poblacin infinita o muestreo con reposicin las relaciones son:
Ejemplo: Para el problema anterior determine la media a partir de las muestras.
# de muestra Nmeros aparecidos en la muestra
Altura
correspondiente
1 51,77,27,46 67, 70, 67, 67 67.8
2 40,42,33,12 67, 67, 67,64 66.3
3 90,44,46,62 70, 67, 67, 67 67.8
4 16,28,98,93 64, 67, 73, 73 69.3
5 58,20,41,86 67, 64, 67, 70 67.0
6 19,64,08,70 64, 67, 64, 70 66.3
7 56,24,03,32 64, 67, 61, 67 64.8
8 34,9183,58 67, 70, 70, 67 68.5
9 70,65,68,21 70, 70, 70, 64 68.5
10 96,02,13,87 73, 61, 64, 70 67.0
Media de muestras 67.3
Para ste ejemplo a partir de las medias aritmticas de cada una de las muestras se
determina la media de todas ellas y por lo tanto la media de la poblacin ser:
Para valores grandes de tamao de la muestra n a partir de (n30), la distribucin de
muestreo de medias es aproximadamente normal independientemente de la poblacin
siempre y cuando la media poblacional y la varianza sean finitas y el tamao de la
poblacin sea al menos el doble que de la muestra.
-
CORRELACION Y REGRESION ESTADISTICA
Muchos fenmenos en la naturaleza estn asociados a la relacin de las variables que
rigen su comportamiento de tal modo que existen leyes que los gobiernan como es el caso
de una velocidad en el movimiento rectilneo uniforme en el cual dicha velocidad depende
del cambio de posicin en un intervalo de tiempo o la presin atmosfrica que cambia con
la altura de la localidad en la cual se mide. Existen otros fenmenos en los cuales es de
inters saber la relacin que existe entre sus variables por ejemplo el consumo de gasolina
de un auto en funcin del peso y la potencia del motor para lo cual sera conveniente
encontrar una relacin entre dichas variables. Cmo hacerlo?
CORRELACION
Es el grado de relacin que existe entre los datos o las variables en un fenmeno
estadstico.
Es el grado de interconexin entre las variables, para las cuales intenta determinar con
qu precisin describe o explica la relacin a travs de una ecuacin.
Se dice que los datos estn correlacionados si por su ubicacin grfica, pueden
definirse como parte de una familia, dependencia funcional o ley matemtica.
El grado de correlacin se concepta como el nivel de acercamiento o alejamiento
respectivamente de los datos respecto de una expresin funcional o ley.
Cuando todos los valores de la variable satisfacen una ecuacin exactamente, se dice que
las variables estn perfectamente correlacionadas. Ejemplo la circunferencias C y los
radios r de todos los crculos estn perfectamente correlacionados con la expresin.
Existe correlacin entre el peso de una persona y su altura?
Correlacin simple
Cuando la relacin existe entre solo dos variable se habla de una correlacin simple y
regresin simple, y se dice que se tiene una variable independiente y otra dependiente,
Caso contrario se trata de correlaciones y regresiones mltiples.
REGRESIN
Es el proceso matemtico que permite encontrar la relacin que existe entre las variables
de un fenmeno estadstico, o permite determinar la funcin que ms o mejor se ajuste a
los datos correlacionados.
-
Aplicaciones del anlisis de regresin
Descripcin cuantitativa de las relaciones existentes entre una variable dada y un
conjunto de variables.
Interpolacin entre valores de una funcin.
Prediccin y pronstico.
Seleccin entre varios modelos alternativos.
CORELACION LINEAL
Si dos variables X e Y que se estn analizando y que se las grafica en un sistema
coordenado dan como resultado puntos coordenados que parecen estar en una lnea
recta la correlacin se la llama lineal.
Correlacin lineal
Tipos de correlacin
a. Si la variable Y tiende a incrementarse cuando se incrementa X la correlacin se
dice que es positiva o correlacin directa.
b. Si la variable Y disminuye cuando se incrementa X la correlacin es negativa.
c. Si todos los puntos parecen estar sobre una cierta curva la correlacin es no lineal.
Correlacin lineal positiva Correlacin lineal negativa Sin correlacin
-
Diagrama de dispersin
El diagrama de dispersin es un grfico en un sistema coordenado donde se representa los
puntos coordenados de las variables que se estn analizando y que permiten observar la
correlacin que existe entre ellas.
Diagrama de dispersin
REGRESIN LINEAL
La regresin lineal consiste en encontrar la ecuacin de una lnea recta para lo cual se
puede seguir los siguientes pasos.
1. Definir: Que variable es dependiente y cual independiente.
2. Dibujar el diagrama de dispersin: Ubicar pares ordenados (solo puntos sin unir).
3. Observar: Si existe correlacin lineal ya sea positiva o negativa.
4. Determinar: La ecuacin de la lnea recta.
Para encontrar la ecuacin de la lnea recta se puede utilizar las herramientas de la
geometra analtica, en la cual una recta puede quedar defina por dos puntos y se puede
obtener la ecuacin de una recta:
Considerando los dos puntos P1 y P2 de coordenadas (X1, Y1) y (X2, Y2) se puede
determinar la ecuacin:
(
) ( )
Donde:
Pendiente de la recta.
( )
O la ecuacin general de la recta:
-
El inconveniente al utilizar las ecuaciones anteriores es que solo se utiliza dos puntos de la
dispersin por lo cual el grado de correlacin no es tan bueno, para mejorar esto se puede
utilizar el mtodo de los mnimos cuadrados.
REGRESIN LINEAL POR EL METODO DE MINIMOS CUADRADOS
La recta por mnimos cuadrados es aquella lnea que tiene por propiedad que las
sumatoria de las distancias al cuadrado de cada uno de los puntos de dispersin con
respecto a la recta es mnimo.
Recta de mnimos cuadrados
Para poder encontrar la recta de mnimos cuadrados se debe determinar los coeficientes
de la ecuacin general de la recta
Para lo cual se utiliza las siguientes expresiones:
Que pueden ser expresadas tambin como:
-
Estas expresiones representan un sistema de ecuaciones con incgnitas a y b, que
puede ser resuelto por cualquiera de los mtodos de resolucin de sistemas de
ecuaciones.
Ejemplo:
En una fbrica se est analizando la relacin que existe entre la fuerza aplicada a una
banda de transmisin de una mquina y la deformacin que sufre. Los valores arrojados
por las pruebas fueron.
Fuerza (N) Deformacin(mm)
0.5 3.2
1 4
1.5 5.6
2 7.1
2.5 8.6
3 20
1. Dado que la deformacin es consecuencia de la fuerza aplicada a la banda de
transmisin, sta es la variable dependiente y la fuerza la independiente.
Y: Deformacin en mm
X: Fuerza en Newton.
2. Diagrama de dispersin.
0
5
10
15
20
25
0 0.5 1 1.5 2 2.5 3 3.5
DEF
OR
MA
CI
N (
mm
)
FUERZA (N)
DIAGRAMA DE DISPERSIN
-
3. Del diagrama de dispersin se puede concluir que existe una correlacin lineal
positiva sobre todo en los primeros puntos coordenados por lo cual se procede a
determinar la ecuacin de la recta que ms se ajuste.
4. Determinar la ecuacin de la recta
En un clculo inicial se proceder a encontrar la ecuacin con la expresin:
(
) ( )
Se tomar los pares ordenados P1 (0.5; 3.2) y el punto P2 (2.5; 8.6)
(
) ( )
( )
Para mejorar el clculo se procede a determinar la recta por mnimos cuadrados:
Es necesario encontrar la sumatoria de la variable X y tambin su sumatoria al cuadrado,
la sumatoria de la variable Y, como tambin la sumatoria del producto de X por Y.
Tabulacin para el mtodo mnimos cuadrados
Fuerza (N) Alargamiento(mm)
X Y X^2 X*Y
0.5 3.2 0.25 1.6
1 4 1 4
1.5 5.6 2.25 8.4
2 7.1 4 14.2
2.5 8.6 6.25 21.5
3 20 9 60
SUMATORIA 10.5 48.5 22.75 109.7
-
22.75a + 10.5b = 109.7
10.5a + 6b = 48.5
Resolviendo para a y b se tiene que
a = 5.674 X 1.846
EVALUACIN Y SIGNIFICACIN DE LA CORRELACIN LINEAL
Cuando se elabora el proceso de correlacin lineal se llega a determinar una ecuacin de
una lnea recta a travs de la regresin pero queda la incertidumbre de que si la recta
encontrada es la apropiada o si es posible encontrar otra lnea curva que se ajuste mejor
a los datos, razn por la cual es necesario realizar la evaluacin de la ecuacin
encontrada.
La evaluacin se realiza con los valores de la variable dependiente Y, es decir los valores
que se encuentran remplazando en la ecuacin, y con ellos se determinan las desviaciones
medias absolutas para comprobar a travs de valores de tolerancia la bondad de la recta
de regresin, es decir si a futuro los pronsticos pueden ser o no abalizados.
y = 5.6743x - 1.8467
0
5
10
15
20
25
0 0.5 1 1.5 2 2.5 3 3.5
DEF
OR
MA
CI
N (
mm
)
FUERZA (N)
DIAGRAMA DE DISPERSIN
-
Los parmetros de tolerancia son:
VARIACIN TOTAL (VT)
Representa la sumatoria de las desviaciones cuadradas de los valores dados de la variable
independiente Y respecto a su media aritmtica ( ).
( )
DONDE
: Valores de la variable dependiente.
: Media aritmtica de los valores de la variable dependiente.
VARIACIN EXPLICADA (VE)
Representa la parte de la variacin total que depende de la variable independiente X
influenciando a la variable dependiente Y. Se calcula como la sumatoria de las
desviaciones cuadradas de los valores de la variable dependiente pronosticada (Yc)
respecto a la media aritmtica ( ).
( )
VARIACION NO EXPLICADA (VI)
Es la variacin residual que refleja el comportamiento de las fluctuaciones de la variable
independiente X sobre la variable dependiente Y. Se calcula como la sumatoria de las
desviaciones al cuadrado de los valores de la variable dependiente Y, respecto de los
valores pronosticados (Yc).
( )
COEFICIENTE DE CORRELACION (CR)
Expresa el grado de asociacin de las dos variables dependiente e independiente.
Para que la correlacin se considere aceptable el valor de coeficiente de correlacin debe
ser mayor que 0.75.
-
ERROR DE ESTIMACIN (m)
El error de estimacin se debe que al determinar la ecuacin de una lnea se comete un
error al calcular la pendiente de la misma.
( )
El valor de K depende del nmero de variables en la correlacin, en una correlacin
simple es de solamente 2.
Ejemplo: Se desea hacer una correlacin lineal entre la produccin de dixido de uranio
(kg) de Rusia en el periodo 1989-1993 segn la tabla presentada a continuacin.
AO Kg(Dixido de Uranio)
1989 144.6
1990 129.5
1991 107.5
1992 93.5
1993 80.5
Para poder trabajar con series cronolgicas estas deben ser transformadas a cuantitativas
se lo hace fcilmente numerando los aos desde el 0.
# AO Kg(Dixido de uranio)
0 1989 144.6
1 1990 129.5
2 1991 107.5
3 1992 93.5
4 1993 80.5
1. La produccin de dixido de uranio depende del ao en cuestin por lo tanto
Y: Kg (Dixido de uranio)
X: Nmero de ao
-
2. Diagrama de dispersin.
3. Del diagrama de dispersin se puede concluir que existe una correlacin lineal
negativa, por lo cual se procede a determinar la ecuacin de la recta que ms se
ajuste.
4. Regresin lineal por el mtodo de los mnimos cuadrados
Tabulacin datos
X Y X^2 X*Y
0 144.6 0 0
1 129.5 1 129.5
2 107.5 4 215
3 93.5 9 280.5
4 80.5 16 322
SUMATORIA 10 555.6 30 947
0
20
40
60
80
100
120
140
160
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
DI
XID
O D
E U
RA
NIO
(K
g)
# AO
DIAGRAMA DE SIPERSIN
-
30a + 10b = 947
10a + 5b = 555.6
Resolviendo para a y b se tiene que
a = -16.42
b = 143.9
Por lo cual la ecuacin ser
La produccin baja con forme transcurre los aos.
5. Evaluacin de la correlacin lineal.
Se elabora la tabla para la evaluacin de la correlacin lineal segn los parmetros
necesarios de clculo.
y = -16.42x + 143.96 R = 0.9913
0
20
40
60
80
100
120
140
160
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
DI
XID
O D
E U
RA
NIO
(K
g)
# AO
DIAGRAMA DE SIPERSIN Lineal (DIAGRAMA DE SIPERSIN)
-
Evaluacin y significacin de la Correlacin.
X Y X^2 X*Y Yc (Y-Yc)^2 (Y- )^2 (Yc- )^2 (Xi- )^2
0 144.6 0 0 143.9 0.49 1120.91 1074.53 4
1 129.5 1 129.5 127.48 4.08 337.82 267.65 1
2 107.5 4 215 111.06 12.67 13.10 0.00 0
3 93.5 9 280.5 94.64 1.30 310.46 271.59 1
4 80.5 16 322 78.22 5.20 937.58 1082.41 4
SUMATORIA 10 555.6 30 947
23.74 2719.89 2696.18 10
Medias aritmticas de las variables
Independiente
Dependiente
Variacin total (VT)
( )
Variacin explicada (VE)
( )
Variacin no explicada (VI)
( )
-
Coeficiente de correlacin (CR)
El valor del coeficiente es mayor que 0.75 lo que se considera una buena correlacin.
Error de estimacin (m)
( )
REGRESIONES NO LINEALES
Muchas ocasiones el clculo del coeficiente de correlacin determina que la regresin
lineal no sea la que ms se ajusta a los datos de dispersin, por lo cual es necesario
encontrar lneas que se ajusten de mejor forma a dichos datos, para ello se puede recurrir
a las mismas ecuaciones que determina el mtodo de mnimos cuadrados.
LA PARABOLA DE MNIMOS CUADRADOS
La parbola de mnimos cuadrados se acerca a los puntos de dispersin por medio de la
ecuacin:
Las ecuaciones que permiten calcular los valores constantes (a, b, c) son:
-
Ejemplo: La tabla mostrada a continuacin representa la temperatura media anual en
varios sitios de Pas de acuerdo a su altura del nivel del mar.
Altura (metros) Temperatura ( C )
10 32
200 27
800 23
1200 20
1500 17
2500 15
3000 13
3500 12
La dispersin resultante es:
Realice una regresin no lineal con los datos.
1. Se procede a calcular los coeficientes y las sumatorias para establecer las
ecuaciones.
0
5
10
15
20
25
30
35
0 500 1000 1500 2000 2500 3000 3500 4000
DISPERSIN NO LINEAL
DISPERSIN NO LINEAL
-
Regresin no lineal
Altura (metros) Temperatura ( C )
X Y X^2 X^3 X^4 x^2*Y X*Y
10 32 100 1000 10000 3200 320
200 27 40000 8000000 1600000000 1080000 5400
800 23 640000 512000000 4.096E+11 14720000 18400
1200 20 1440000 1728000000 2.0736E+12 28800000 24000
1500 17 2250000 3375000000 5.0625E+12 38250000 25500
2500 15 6250000 1.5625E+10 3.9063E+13 93750000 37500
3000 13 9000000 2.7E+10 8.1E+13 117000000 39000
3500 12 12250000 4.2875E+10 1.5006E+14 147000000 42000
12710 159 31870100 9.1123E+10 2.7767E+14 440603200 192120
2. Formar el sistema de ecuaciones.
Resolviendo el sistema de ecuaciones tendramos:
y = 2x10 -6 X2 - 0.010X + 30.60
-
y = 2E-06x2 - 0.0109x + 30.609
0
5
10
15
20
25
30
35
0 500 1000 1500 2000 2500 3000 3500 4000
REGRESIN NO LINEAL
DISPERSIN NO LINEAL Polinmica (DISPERSIN NO LINEAL)
-
PROBABILIDADES
-
TEORA DE PROBABILIDADES
INTRODUCCIN
La teora de probabilidades es muy importante en muchos campos de estudio como
economa, administracin y la INGENIERA no se es indiferente, ya que siempre se
necesita tomar decisiones ante situaciones de incertidumbre preguntndose por ejemplo
cunto horas durar un circuito electrnico, el software desarrollado ser aceptado para
ms del 50% del mercado para el cual fue diseado, para un cierto poltico cuantos
votantes lo hicieron por l, para un ingeniero industrial sera importante saber cuntos
horas de funcionamiento tendr una mquina en su rea de produccin antes que se
dae.
Todos estos cuestionamientos provienen de fenmenos cuyo resultado no puede ser
anticipado con certeza, si no que existe cierta probabilidad de que un cierto resultado se
d, a diferencia de los fenmenos cuyo resultado se determina unvocamente a partir de
ciertas condiciones, por ejemplo, los resultados de mediciones geomtricas, clculos
financieros o procesos mecnicos.
Histricamente se puede decir que las probabilidades surgieron de los juegos de azar en
los siglos XV y XVI con resolucin de puntuales problemas de juego de dados por personas
como: Blaise Pascal y Pierre de Fermat.
Otras personas influyentes fueron Christian Huygens quien public el primer libro de
probabilidades, James Bernoulli y Abraham de Moivre fueron las personas que ms
influyeron en el desarrollo de probabilidades.
Por el Ao de 1812 Pierre de Laplace introdujo gran cantidad de ideas nuevas y tcnicas
matemticas en su libro, Teora Analtica de Probabilidades con lo cual la probabilidad ya
no solo estaba destinada a los juegos de azar sino aplicaciones ms all de ella.
DEFINICIN TERICA
Las probabilidades constituyen una rama de las matemticas que se ocupa de medir o
determinar cuantitativamente la posibilidad de que un experimento produzca un
determinado resultado.
Es el estudio de las posibilidades de que ocurra o no un evento.
EXPERIMENTO ALEATORIO, ESPACIO MUESTRAL Y EVENTOS
EXPERIMENTO ALEATORIO ()
Los experimentos u operaciones reales o hipotticos pueden dividirse en dos clases:
determinsticos y no determinsticos.
-
Determinstico.- Si los resultados del experimento estn completamente determinados y
puede describirse por una frmula matemtica llamado modelo Determinstico. Ejemplos:
a) Soltar una piedra desde una cierta altura Cada libre de los cuerpos.
b) Colocar una pelota en el agua Principio de flotacin.
c) Los cambios de aceleracin que produce una fuerza Segunda ley de Newton
No Determinstico.- Si los resultados del experimento no pueden predecirse con exactitud
antes de realizar el experimento. Ejemplos:
a) Lanzar una moneda y observar el resultado cara o sello.
b) Lanzar una moneda y observar el nmero que aparece uno, dos, tres, cuatro,
cinco, seis.
c) Observar el nmero de autos que pasan por una estacin de servicio en un da
uno, dos, tres,, n.
Caractersticas de un experimento no Determinstico:
Cada experimento puede repetirse indefinidamente sin cambiar esencialmente las
condiciones.
Cada experimento es no Determinstico.
Cada experimento tiene varios resultados posibles que pueden describirse de
antemano con precisin. En el caso del lanzamiento de la moneda sus
posibilidades son cara o sello no sabremos cual sale pero si los resultados posible.
Por lo tanto un experimento aleatorio es aquel que tiene las tres caractersticas
mencionadas.
Para denotar un experimento aleatorio se utilizar el smbolo:
Ejemplos de experimentos aleatorios:
1: Fabricar artculos, hasta fabricar cinco defectuosos y contar el nmero total de
artculos fabricados.
2: Elegir un punto en el intervalo cerrado [0 ,1].
3: Verificar el estado de un transistor (0 = apagado, 1 = encendido).
4: Elegir un presidente de un curso de 30 estudiantes.
5: Extraer un artculo de un lote que contiene artculos defectuosos y no defectuosos.
ESPACIO MUESTRAL ()
Es el conjunto de todos los resultados posibles de un experimento aleatorio ().
-
Por lo cual es muy conveniente utilizar notacin de conjuntos y consecuencia de ello
utilizar algebra de conjuntos.
Ejemplos:
1) 1: Lanzar una moneda y observar su resultado.
1 = {cara, sello}
2) 2: Lanzar un dado y observar el nmero resultante.
2 = {1, 2, 3,4, 5, 6}
3) 3: Fabricar artculos hasta producir 5 defectuosos y contar el total de nmeros de
artculos producidos.
3 = {5, 6, 7, 8, 9, 10,}
4) 4: Contar el nmero de vehculos que llegan a una estacin de servicio a recargar
gasolina.
4 = {0, 1, 2, 3, 4,.}
5) 5: Verificar el estado de un transistor (0 = apagado, 1 = encendido).
5 = {0, 1}
6) 6: Elegir un punto en el intervalo cerrado [0 ,1].
6 = {X R/ 0 X 1}
7) 7: Elegir un presidente de un curso de 30 estudiantes.
7 = {A1, A2, A3, A4, A5,, A30} A: Representa a cada uno de los estudiantes
Clasificacin del Espacio Muestral
1. El espacio muestral puede ser finito o infinito
Espacio muestral finito.- Posee un determinado nmero de posibilidades, o se le puede
considerar como un experimento sin reposicin.
Ejemplo:
2: Lanzar un dado y observar el nmero resultante.
2 = {1, 2, 3,4, 5, 6}
Espacio muestral infinito.- Posee un nmero indeterminado de posibilidades, o se le
puede considerar un experimento con reposicin.
-
Ejemplo:
4: Contar el nmero de vehculos que llegan a una estacin de servicio a recargar
gasolina.
4 = {0, 1, 2, 3, 4,.}
2. El espacio muestral puede ser Simple o compuesto
Espacio muestral simple.- Es el espacio que resulta de un solo experimento aleatorio
(experimento simple).
2: Lanzar un dado y observar el nmero resultante.
2 = {1, 2, 3,4, 5, 6}
Espacio muestral compuesto.- Es aquel que resulta de dos o ms experimentos simples
sucesivos o simultneos.
1: Lanzar una moneda y un dado a la vez
Cul ser su espacio muestral?
Para responder la pregunta anterior se debe incluir el criterio que los espacios muestrales
compuestos son de dos tipos bsicos aquellos que estn unidos por la letra gramatical O
y la letra gramatical Y.
Experimentos unidos por la O excluyente
Un experimento compuesto , es una O combinacin de los experimentos simples, 1
y 2, slo si el experimento 1 ocurre y 2 no, o viceversa.
Ejemplo: Considere el experimento, que consiste en lanzar un dado o una moneda. Hallar
El espacio muestral para ste experimento.
: lanzar un dado o una moneda.
El experimento consiste de dos simple unidos por la O.
1: Lanzar una moneda y observar su resultado.
1 = {cara, sello}
2: Lanzar un dado y observar el nmero resultante.
2 = {1, 2, 3,4, 5, 6}
= 1 O 2 Por lo tanto el espacio muestral ser:
= {cara, sello, 1, 2, 3, 4, 5, 6}
-
Experimentos unidos por la Y
Un experimento compuesto , es una Y combinacin de los experimentos simples, 1
y 2, cuando ambos experimentos, 1 Y 2 ocurren.
Una consecuencia directa del experimento compuesto por la Y combinacin es que su
espacio muestral resultante es el producto cartesiano de los espacios muestrales de los
experimentos simples correspondientes. Es decir: = 1 x 2
Ejemplo: Cul es el espacio muestra de lanzar una moneda y un dado a la vez:
: Lanzar una moneda y un dado a la vez.
Experimentos simples:
1: Lanzar una moneda y observar su resultado.
1 = {cara, sello}
2: Lanzar un dado y observar el nmero resultante.
2 = {1, 2, 3,4, 5, 6}
= 1 x 2: Por lo tanto el espacio muestral ser:
= {(C, 1); (C, 2); (C, 3); (C, 4); (C, 5); (C, 6); (S, 1); (S, 2); (S, 3); (S, 4); (S, 5); (S, 6)}
Cuando se desea determinar un espacio muestral resultado de una Y combinacin de
dos experimentos aleatorios simples es til usar tablas de doble entrada para encontrar
dicho espacio muestral.
Ejemplo: Se lanzan dos monedas simultneamente y se observan las secuencias de caras o
sellos. Determine su espacio muestral.
: Se lanzan dos monedas simultneamente y se observan las secuencias de caras o sellos.
= 1 x 2
1: Lanzar una moneda y observar su resultado.
1 = {cara, sello}
2: Lanzar una moneda y observar su resultado.
2 = {cara, sello}
-
Tabla de doble entrada
SEGUNDA MONEDA
PRIMERA MONEDA
CARA SELLO
CARA CARA- CARA CARA - SELLO
SELLO SELLO - CARA SELLO - SELLO
= {cara-cara, cara-sello, sello-cara, sello-sello}
Ejemplo: Se lanzan dos dados simultneamente y se observan los resultados. Determine
su espacio muestral.
: Se lanzan dos dados simultneamente y observar los resultados.
= 1 x 2
Experimentos simples:
1: Lanzar una dado y observar su resultado.
1 = {1, 2, 3, 4, 5, 6}
2: Lanzar una dado y observar su resultado.
2 = {1, 2, 3, 4, 5, 6}
SEGUNDO DADO
PRIMER DADO
1 2 3 4 5 6
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 5)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Debido a que el espacio muestral resultando es un conjunto de pares ordenados se puede
utilizar la simbologa de la teora de conjuntos para representarlo as:
= {(x, y) / x, y = 1, 2, 3, 4, 5, 6}
-
En muchos casos es ms sugerente utilizar un diagrama para encontrar el Espacio
Muestral de un experimento compuesto, ste es llamado Diagrama de rbol.
Ejemplos:
1) Se lanza una moneda tres veces. Hallar el espacio muestral resultante de ste
experimento.
: Se lanza una moneda tres veces y se observan los resultados
El experimento consiste de tres experimentos simples unidos por la Y. Po lo tanto se
puede dividir en tres experimentos que dan espacios muestrales simples as:
= 1 x 2 x 3
1: Lanzar una moneda y observar su resultado.
1 = {cara, sello}
2: Lanzar una moneda y observar su resultado.
2 = {cara, sello}
3: Lanzar una moneda y observar su resultado.
3 = {cara, sello}
Aplicando el diagrama de rbol se tendr:
= {CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}
2) Cul es el espacio muestral en el lanzamiento de una moneda hasta que salga cara.
-
= {C, S, SC, SSC, SSS, SSSC, SSSS }
3) Cul es el espacio muestral en el lanzamiento de dos dados simultneamente.
= {(x, y) / x, y = 1, 2, 3, 4, 5, 6}
4) Los artculos provenientes de una lnea de produccin se clasifican en defectuosos
y no defectuosos se observan los artculos y se anotan su condicin, el proceso
continua hasta observar dos artculos defectuosos o hasta que se observen 3
artculos no defectuosos. Cul es su espacio muestral?
C
S C
S C
S C
S
5 6
D1
1
2
3
4
5 6
D2
1
2
3
4
-
= {DD, DNDD, DNDNDD, DNDNDN, DNDNN, DNNDD, DNNDN, DNNN, NDD, NDNDD,
NDNDN, NDNN, NNDD, NNDN, NNN}
3. El espacio muestral puede ser discreto o continuo
Espacio muestral discreto
Si tiene un nmero finito o infinito numerable de elementos.
Espacio muestral discreto finito: Si el espacio muestral tiene un nmero finito de
elementos. Ejemplo
: Lanzar una dado y observar su resultado.
= {1, 2, 3, 4, 5, 6} Es espacio muestral discreto finito ya que no puede haber valores en
l como 2.5, 3.4 etc.
Espacio muestral discreto infinito: Cuando puede establecerse una correspondencia uno a
uno con el conjunto de los enteros positivos de modo que pueda ser enumerado como 1,
2, 3,4,.. Ejemplo:
: Lanzar una moneda hasta que ocurra cara.
= {C, SC, SSC, SSSC, SSSSC,}
-
Espacio muestral continuo
Un espacio muestral es continuo si tiene un nmero no numerable de elementos. Es decir
todos los elementos posibles en un intervalo. Ejemplo
: Elegir un punto en el intervalo cerrado [0 ,1].
= {X R/ 0 X 1} se puede escoger un nmero infinito de valores entre esos dos
puntos.
EVENTO
Se define como un subconjunto del espacio muestral. Por lo que al espacio muestral
tambin se lo considera como el conjunto universo. Se representa con las letras
maysculas del alfabeto (A, B, C, DZ). El evento A se lo puede representar como AT
Ejemplo:
: Salga par en el lanzamiento de un dado
= {1, 2, 3, 4, 5, 6} A = {2, 4, 6}
Evento elemental
Cuando tiene solamente una posibilidad. Ejemplo
: Que un transistor est encendido
= {encendido, apagado} A = {encendido}
Evento Nulo
No existe ningn elemento en el subconjunto.
A = {0}
SUCESOS
Son los elementos ms bsicos de un espacio muestral o un evento. Se representan con
las letras minsculas x, y, z. Ejemplo:
: Sacar un cuatro en una baraja
A = {4 corazn rojo, 4 corazn negro, 4 trbol, 4 brillos}
Un suceso puede ser: x = {4 corazn negro}
-
PROBABILIDAD
Definicin
La probabilidad de un evento es la razn entre el nmero de casos (sucesos) favorables y
el nmero total de casos (sucesos) posibles, siempre que nada obligue a creer que algunos
de estos sucesos debe tener preferencia a los dems, lo que hace que todos sean
igualmente posibles.
Para determinar la expresin matemtica se considera lo siguiente:
El nmero total de sucesos posibles: N()
El nmero de sucesos del evento A: N(A)
La probabilidad del evento A: P[A]
[ ] ( )
( )
Corolarios:
1. La probabilidad de un evento A cualquiera est comprendido entre 0 y 1.
[ ]
2. P[A] = 0, si A es un evento imposible.
3. P[A] = 1, si A es el evento seguro.
4. Puesto que todos los sucesos de = {1, 2, 2,..., n} son igualmente
probables, se tiene que P[{i}] = 1/n, i = 1, 2, 3,, n.
Y por lo tanto [ ] [{ }]
Ejemplo 1: Probabilidad de sacar un nmero par en un lanzamiento de un dado
: Lanzamiento de un dado
= {1, 2, 3, 4, 5, 6} N() = 6
A: sacar un nmero par
A = {2, 4, 6} N(A) = 3
[ ] ( )
( )
[ ]
Ejemplo 2: Se lanza una moneda tres veces. Calcular la probabilidad que ocurran a lo ms
dos caras.
-
: Lanzar una moneda tres veces
= {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS} N() = 8
A: Ocurre a lo ms dos caras
A = {SSS, SSC, SCS, CSS, CCS, SCS, SCC} N(A) = 7
[ ] ( )
( )
[ ]
Ejemplo 3: Se elige una carta aleatoriamente de una baraja de 52 cartas. Cul es la
probabilidad que sea una carta negra?
: Extraer una carta de 52
= {La baraja completa} N() = 52
A: Obtener una carta negra
A = {13 corazn negro, 13 trbol} N(A) = 26
[ ] ( )
( )
[ ]
No Probabilidad (Q)
La no probabilidad se considera como el evento que no va a ocurrir en un experimento
aleatorio.
Matemticamente se considera como:
[ ] [ ]
Del ejemplo 3: Cul es la probabilidad de que no salga una carta negra
[ ]
[ ]
-
Tendencia
Es la divisin entre la probabilidad para la no probabilidad.
[ ]
[ ]
Tendencias Favorables y en Contra
Tendencia Favorable
[ ]
[ ]
Tendencia En Contra
[ ]
[ ]
Ejemplo: Que tendencia a favor existe que al lanzar un dado para que salga un nmero par
: Lanzamiento de un dado
= {1, 2, 3, 4, 5, 6} N() = 6
A: sacar un nmero par
A = {2, 4, 6} N(A) = 3
[ ] ( )
( )
[ ]
[ ]
[ ]
[ ]
[ ]
-
OPERACIONES CON EVENTOS
SUB EVENTOS
Dados dos eventos A y B se dice que A est contenido en B o que A es sub evento de B, si
todo seceso favorable A, es favorable a B; es decir si ocurre el evento A tambin ocurre el
evento B. Simblicame