estadistica y probabilidades2

Upload: jorge-arias

Post on 01-Mar-2016

30 views

Category:

Documents


0 download

TRANSCRIPT

  • UNIVERSIDAD TECNICA DE AMBATO FACULTAD DE INGENIERIA EN SISTEMAS, ELECTRONICA E INDUSTRIAL

    ESTADISTICA Y PROBABILIDADES

    Nivel: TERCERO

    Carreras: Sistemas, Electrnica e Industrial

    Docente: Ing. LUIS MORALES

  • ESTADISTICA

  • INTRODUCCIN

    QU ES LA ESTADSTICA?

    Es una rama de las matemticas que tiene por objetivo la recopilacin, clasificacin,

    interpretacin o anlisis y presentacin de datos del fenmeno o hecho que se est

    estudiando.

    DEFINICIN.- Es una ciencia cuantitativa que describe los fenmenos colectivos, los

    analiza cientficamente y predice conclusiones o resultados lo ms objetivo posible.

    OTRAS DEFINICIONES

    Es la ciencia de la recopilacin, clasificacin, presentacin e interpretacin de

    datos.

    Es una ciencia incluida en el conjunto de las matemticas, cuyo campo de accin es

    el de recoger, ordenar, clasificar e interpretar los datos proporcionados por la

    investigacin cientfica, permitiendo conocer a travs de ellos con la mayor

    precisin posible, los caracteres de los hechos y fenmenos observados o que se

    produce en las diferentes ciencias.

    OBJETIVOS DE LA ESTADSTICA

    1. Clasificar o reordenar, analizar y presentar grficamente el conjunto de datos

    obtenidos de manera que sea fcil reconocer los hechos ms importantes o

    significativos del fenmeno o problema a analizar.

    2. Mediante el clculo de probabilidades y correlacin estadstica pretende predecir

    las condiciones futuras mediante el conocimiento de las condiciones pasadas y

    presentes. Ejemplo: crecimiento poblacional

    3. Lograr informacin sobre una gran masa de hechos, tomando para ello una

    muestra representativa. Ejemplo: eleccin de autoridades de un pas.

    TIPOS DE ESTADSTICA.

    ESTADSTICA DESCRIPTIVA.- Se ocupa de la presentacin y anlisis de hecho o fenmeno,

    explicando sus diferentes partes, pero sin extraer conclusiones que puedan generalizarse

    a un todo.

    Mtodo de la estadstica descriptiva.

    1. Recoleccin de datos.- Obtener los datos relacionados con el problema motivo de

    estudio para lo cual utiliza tcnicas de la investigacin cientfica.

  • 2. Clasificacin.- Ordenar y tabular datos.

    3. Anlisis.- Utilizar tcnicas estadsticas para buscar aspectos relevantes.

    4. Presentacin.- Mediante tablas o grficos presentar los resultados obtenidos.

    ESTADSTICA INFERENCIAL.- Extrae conclusiones vlidas de una muestra de la poblacin

    investigada que una vez ensayada y analizada, pueden proporcionar ciertas caractersticas

    comunes de la poblacin.

    Mtodo de la estadstica inferencial.

    1. Delimitar el problema o fenmeno motivo de estudio.

    2. Formulacin de hiptesis.- Describir o hacer el enunciado o enunciados que sern

    objetos de comprobacin (hiptesis) para que posteriormente sean admitidos o

    rechazados.

    3. Recoleccin de datos.- Obtener los datos relacionados con el problema motivo de

    estudio para lo cual utiliza tcnicas de la investigacin cientfica.

    4. Clasificacin.- Ordenar y tabular datos.

    5. Anlisis.- Utilizar tcnicas estadsticas para buscar aspectos relevantes.

    6. Aceptacin o rechazo de la hiptesis.- Una vez que se ha aplicado la prueba

    estadstica conveniente, se debe realizar el ensayo de hiptesis, mediante el cual

    se la acepta o se la rechaza

    7. Conclusiones.- Bajo el supuesto de no haber incurrido en fallas se toman las

    decisiones que sean confiables y oportunas para dar solucin al problema.

    INVESTIGACIN ESTADSTICA

    Cuando se realiza una investigacin las caractersticas bsicas que debe tener la misma

    son:

    Validez.- Que sea demostrable.

    Confiabilidad.- Que permita ser aplicable con igual o parecidos resultados.

    Precisin.- Que su exactitud sea satisfactoria en concordancia con el objetivos de la

    investigacin.

    Antes de realizar cualquier investigacin es imprescindible determinar el fenmeno que se

    va a investigar y las caractersticas que interesa para el anlisis es decir clarificar Qu es

    lo que se quiere investigar.

    FENMENO ESTADSTICO

    Es la conformacin de un grupo o colectivo alrededor de ciertas caractersticas que

    permitan ser investigadas en cuanto a su comportamiento.

  • Los fenmenos pueden ser de carcter econmico, social, poltico, deportivo u otros.

    ETAPAS DE LA INVESTIGACIN ESTADISTICA

    Permite sealar con claridad las fases o actividades necesarias en cuanto a una

    investigacin.

    En un proceso de investigacin estadstica se debe seguir cuatro fases fundamentales:

    1. RECOPILACIN DE DATOS

    Esta fase tiene como objetivo recopilar u obtener informacin que se requiere en la

    investigacin estadstica. Los datos pueden recopilarse de fuentes interna y externa.

    Fuente Interna.- Los datos se obtienen dentro de la organizacin o institucin que

    auspicia la investigacin.

    Fuente Externa.- Los datos se obtienen de fuentes ajenas a la organizacin y se los

    puede obtener a travs de datos publicados, encuestas, observacin directa.

    2. CLASIFICACIN DE LOS DATOS

    Los datos recolectados de cualquier fuente deben ser organizados. Los de fuente interna y

    fuente externa mediante datos publicados deben ser relaborados. Mientras los obtenidos

    a travs de encuestas deben ser organizados mediante un proceso que abarca tres etapas.

    2.1 Correccin de datos.- Consiste en la depuracin de datos, descartando respuestas

    vagas, incompletas y errneas.

    2.2 Organizacin de los datos.- Es un proceso de ordenamiento en funcin de la

    similitud de caractersticas y obedeciendo a cuatro aspectos diferenciales:

    TIEMPO, AREAS ESPACIALES, MAGNITUD Y MODALIDADES o CATEGORAS, las

    cuales determinan series cronolgicas, geogrficas, cuantitativas y cualitativas

    respectivamente.

    2.3 Tabulacin.- Resumir los datos clasificados en tablas.

    3. PRESENTACIN DE DATOS

    Es el proceso mediante el cual los datos deben presentarse definitivamente en forma clara

    y adecuada para su respectivo anlisis e interpretacin.

    Los datos se pueden presentar de tres formas: textual, tabular, grfica.

  • 3.1 Presentacin textual.- Es un tipo particular de presentacin que se lo utiliza

    cuando la investigacin abarca pocos datos y se los describe mediante palabras o

    smbolos. Este tipo de presentacin los utiliza usualmente los medios de

    comunicacin impresos.

    3.2 Presentacin tabular.- Se utiliza tablas para presentar la informacin la cual debe

    contener ttulo, encabezado, columna matriz y cuerpo.

    3.3 Presentacin graficativa.- Se presenta los datos mediante grficas como

    histogramas, Diagramas de pastel, polgonos de frecuencia.

    MEDIDAS DE TENDENCIA CENTRAL

    TRMINOS ESTADSTICOS

    VARIABLE: Es una caracterstica cualitativa o cuantitativa que puede tomar diferentes

    valores para cada uno de los elementos de la poblacin. Ejemplo: Estaturas de los

    estudiantes de tercer nivel de la FISEI de la Universidad Tcnica de Ambato.

    VARIABLE DISCRETA: Es una caracterstica cuantitativa que no puede tomar valores

    comprendidos entre dos nmeros enteros consecutivos. Ejemplo: Nmero de presidentes

    constitucionales del Ecuador.

    VARIABE CONTINUA.- Es una caracterstica cuantitativa que puede tomar cualquier valor

    numrico. Ejemplo: Edad de los Presidentes constitucionales del Ecuador.

    POBLACIN: Es el grupo o colectivo que va hacer investigado y que posee caractersticas

    comunes. Ejemplo: Profesores de educacin media de la provincia de Tungurahua.

    Parmetros.- Son los valores numricos que corresponden a las caractersticas de la

    poblacin. Ejemplo: Media aritmtica de la edad de los profesores de educacin media de

    la provincia de Tungurahua.

    MUESTRA: Es una parte de la poblacin de cuyo anlisis se puede obtener caractersticas

    que corresponden a la poblacin. Ejemplo: Profesor de educacin media del cantn

    Ambato.

    Estadstico.- Son los valores numricos que corresponden a las caractersticas de la

    muestra. Ejemplo: Media aritmtica de la edad de los profesores de educacin media del

    cantn Ambato.

  • TAMAO DE LA MUESTRA

    Para calcular el tamao de la muestra se puede recurrir a diferentes frmulas en las cuales

    se toma en cuenta el tamao de la poblacin, el error que se considera aceptable en el

    clculo de la muestra, la expresin que se utilizara en ste mdulo para dicho clculo es la

    siguiente:

    ( )

    Ejemplo: En una poblacin de 10000 alumnos Cul es tamao de la muestra si el

    error mximo admisible es del 5%?

    ( ) ( )

    n = 384.65 z 386 alumnos

    Caractersticas de la muestra:

    - Debe ser representativa.- Es decir que represente en verdad a toda la poblacin

    salvo el margen de error admisible.

    - Tamao adecuado.- De tal modo que los resultados de la investigacin no sean

    dudosos por haber tomado una muestra muy pequea.

    - Que el margen de error admisible est dentro del lmite aceptado por la estadstica

    < = 15%.

    Donde:

    n: Tamao de la muestra

    m: Tamao de la poblacin.

    e: error admisible

  • REDONDEO DE DATOS

    En la actualidad, con el uso de las computadoras, se pueden obtener miles de cifras

    decimales o enteras, pero en la estadstica no se requiere de la precisin absoluta, sino

    ms bien de la aproximacin o redondeo de ciertos valores. Para realizar la aproximacin

    o redondeo se puede utilizar sistemas de redondeo.

    Sistemas de redondeo:

    Sistema convencional

    ste sistema menciona que si el ltimo dgito es menor que 5 se lo suprime y la cantidad

    resultante es la misma:

    Ejemplos:

    7,23 redondeando a la dcima sera 7,2

    10, 284 redondeando a la centsima sera 10,28

    Si el ltimo dgito es mayor o igual que 5, se lo suprime y el dgito anterior es redondeado

    a la cifra inmediata superior.

    Ejemplos:

    8,277 redondeando a la centsima es 8,28

    14,375 redondeando a la centsima es 14,38

    Sistema internacional

    Cuando la cantidad entera de un nmero es impar se aumenta una unidad ms.

    Ejemplo:

    39,5 redondeando a dos cifras enteras 40

    Si la fraccin decimal es exactamente 5 y si le precede una cifra par, no vara el nmero.

    Ejemplo:

    74,5 redondeando a dos cifras enteras 74

  • MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS

    CONCEPTO.- Son los valores ms representativos de un conjunto de datos o valores con

    los cuales se pueden hacer comparaciones y que sirven de base para un sistema

    estadstico. TIPOS

    1. COMPUTACIONALES: Utilizan formulas comprobadas matemticamente o

    cientficamente

    2. NO COMPUTACIONALES O POSICIONALES: Cuando se lo realiza por simple

    observacin o se utilizan frmulas empricas con principios de interpolacin.

    MEDIDAS COMPUTACIONALES

    MEDIA ARITMETICA ( )

    Es la razn de la sumatoria de los valores de la variable para el nmero total de ellas.

    Ejemplo:

    Mediante los siguientes datos hallar la media aritmtica. 10, 8, 6, 5, 10, 7

    Aproximado

    MEDIA ARITMETICA PONDERADA ( )

    Consiste en asignar importancia pesos a cado uno de los valores de la variable:

    Ejemplo: Promedio de calificaciones las materias seguidas en tercero.

  • MEDIA ARITMTICA CON FRECUENCIAS ( )

    Es utilizada cuando los valores de la variable se repiten muchas veces.

    Del ejemplo de la media aritmtica:

    Aproximado

    Propiedades de la media aritmtica:

    1.- La sumatoria de los valores de la variable X menos la media aritmtica es cero o

    aproximadamente cero.

    ( )

    2.- La sumatoria ( ) es mnimo cuando X=

    Materia Importancia Nota

    Fsica 7 9

    Estadstica 1 4.7

    Redes 6 8.5

    Programacin 8 9.1

    Clculo 10 7.4

    Circuitos 10 8.3

  • Desventaja:

    La media aritmtica se ve muy afectada por valores extremos que tengan las variables.

    MEDIA GEOMETRICA ( )

    Se define como la raz ensima del producto de los n valores que puede tomar la variable X.

    Ejemplo: Hallar la media geomtrica de los nmeros 3, 5, 6, 6, 7, 10, 12

    Ventaja:

    Es menos influenciada por valores externos a diferencia de la media aritmtica.

    Desventaja:

    No es aplicable cuando existe valor 0 o cuando en ciertos casos hay nmeros negativos.

    MEDIA ARMNICA ( )

    Es el recproco de la media aritmtica de los recprocos de los valores de la variable X.

    Ejemplo: Una persona viaja de A hasta B con una velocidad media de 30 millas por hora

    (mi/h) y regresa de B hasta A, a una velocidad media de 60 mi/h. Cul es la velocidad

    media en el viaje completo.

  • mi/h

    La media armnica est asociada directamente con series mecnicas donde intervenga el

    tiempo. MEDIDAS POSICIONALES MEDIANA (MED)

    Es el valor ms central de la serie, divide al conjunto de valores en 2 partes iguales. Se la

    puede calcular mediante un promedio o por simple observacin. La mediana es un

    parmetro de tendencia central muy aplicado y que es muy cercano a la media aritmtica

    pero que no se ve influenciado en absoluto por los valores extremos. No se utiliza en

    clculos matemticos muy profundos.

    Ejemplo: encuentre la mediana de los siguientes nmeros: 9.6, 8.0, 7.7, 6.5, 10.0, 9.9

    Para encontrar la mediana se sigue los siguientes pasos.

    1. Ordenar los datos. Puede ser en forma ascendente o descendente.

    10.0 9.9 9.6 8.0 7.7 6.5

    2. Si el nmero de datos es par, se escoge los dos valores ms centrales y se les saca

    un promedio.

    3. En el caso de que el nmero de datos sea impar, se escoge el valor central de los

    datos ordenados. Ejemplo: en los datos 14, 9, 8, 6, 5, 4, 3 la mediana sera 6.

    MODA (MOD)

    Es el valor que ms se repite en una serie estadstica

    Ejemplo: encuentre la moda de los siguientes valores 3, 5, 6, 6, 7, 10, 12.

  • La moda es 6.

    Nota: Cuando existe ms de un nmero que se repite el mismo nmero de veces se dice

    que no existe moda, a su vez se denomina segn el nmero de veces que se repite el valor

    seria bimodal, trimodal, etc. Segn sea el caso.

    Ejemplo: 3, 5, 6, 6, 7, 10,10, 12.

    Se puede decir que la moda es bimodal por el nmero 6 y 10; o a su vez que no existe moda.

    CUANTILES

    Es el nmero de partes que se divide una serie estadstica o un conjunto de valores. Se

    tiene cuatro tipos de cuantiles a saber:

    CUANTILES # DE PARTES QUE DIVIDE

    LA SERIE

    # DE CUANTILES A

    ENCONTRAR

    Cuartiles (Ki) 4 3

    Quintiles (Qi) 5 4

    Deciles (Di) 10 9

    Percentiles (Pri) 100 99

    Para el clculo de los cuantiles en datos no agrupados primeramente se debe ubicar la

    posicin en la serie a travs de frmulas empricas para posteriormente determinar el

    valor correspondiente.

    Las frmulas empricas para encontrar la posicin de los cuantiles es:

    1.- Cuartiles:

    ( )

    2.- Quintiles:

    ( )

    3.-Decil:

  • ( )

    4.-Percentil:

    ( )

    Ejemplo: La estatura en metros de siete estudiantes de ingeniera fueron: 1.83, 1.72, 1.77,

    1.80, 1.71, 1.85, 1.80; determinar el quintil nmero uno, decil nmero 6, cuartil nmero 3,

    percentil nmero 61.

    Para poder calcular los cuantiles es necesario en primer lugar ordenar los valores ya sea

    en forma descendente o ascendente.

    En forma descendente: 1.85 1.83 1.80 1.80 1.77 1.72 1.71

    Cuartil 3

    ( )

    ( )

    Es la posicin que va a tener el valor en la serie

    Para encontrar el valor se procede a contar las posiciones en forma descendente por lo

    tanto el valor de cuartil 3 es V(Q3) = 1.72

    Quintil 1

    ( )

    ( )

    Donde:

    N: Nmero de valores de la variable

    i: Nmero de posicin del cuantil.

  • Cuando la posicin del cuantil no es un nmero entero se procede a interpolar el valor de

    la siguiente forma:

    1. Se observa entre que datos esta contenido el valor dependiendo de la posicin

    calculado, en ste ejemplo la posicin es 1.6 por lo tanto el valor buscado estar

    entre 1.85 y 1.83

    2. Se interpola de la siguiente forma:

    ( ) [ ( )]

    ( )

    Decil 6

    ( )

    ( )

    ( ) [ ( )]

    ( )

    Percentil 61

    ( )

    ( )

    ( ) [ ( )]

    ( )

  • MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS

    CONCEPTO.- Es el grado de alejamiento de los valores de la serie estadstica con respecto

    a una medida de tendencia central.

    La dispersin de los datos intenta dar una idea de cun esparcidos se encuentran stos, es

    de mucha utilidad cuando se realiza un anlisis estadstico en mediciones, en control de

    produccin, en investigacin estadstica y cuando se requiere realizar anlisis de cualquier

    informacin que se investigue.

    Las ms utilizadas son rango, rango semiintercuartil, rango percentil, MAD, desviacin

    tpica o estndar, coeficiente de variacin.

    RANGO (R)

    Es la diferencia entre el valor mximo y el valor mnimo del conjunto de valores de la serie

    estadstica.

    Ejemplo: Cul es el rango del conjunto de datos 2, 3, 3, 5, 5, 5, 8, 10, 12

    RANGO SEMIINTERCUARTIL (RK)

    El rango semiintercuartil es la distancia dividida para dos entre el cuartil tres y el cuartil

    uno.

    ( ) ( )

    RANGO PERCENTIL (RPr)

    Es la distancia que existe entre el percentil noventa y el percentil diez.

    ( ) ( )

    Ejemplo: Para los siguientes datos calcule el rango semiintercuartil y rango percentil. 12,

    6, 7, 3, 15, 10, 18, 5.

    L.max L.min

    R

  • Antes de resolver se debe ordenar los datos en forma descendente o ascendente.

    18 15 12 10 7 6 5 3

    Se procede a calcular las posiciones y valores de los cuartiles y percentiles.

    ( )

    ( )

    ( )

    ( )

    ( )

    ( )

    ( )

    ( )

    ( ) [ ( )]

    ( )

    ( ) [ ( )]

    ( )

    ( )

    ( )

  • Finalmente se calcula los valores de los rangos.

    ( ) ( )

    Recordar que el rango es una distancia por lo tanto no se toma en cuenta el signo.

    DESVIACION MEDIA ABSOLUTA (MAD)

    Permite determinar el promedio de las desviaciones con respecto a una medida de

    tendencia central ya sea esta computacional o posicional.

    Computacional

    | |

    Posicional

    | |

    DESVIACION TPICA O ESTANDAR ()

    Permite calcular el grado de dispersin real de una serie estadstica por que utiliza

    desviaciones cuadrticas para su clculo

    Computacional

    ( )

    Diferencia

    Desviacin

    Promedio

    Media Sin el signo

    Absoluta

  • Posicional

    ( )

    VARIANZA (2)

    La varianza no es ms que la desviacin tpica elevada al cuadrado y es utilizada para el

    clculo inicial de la dispersin pero tiene el inconveniente de que las unidades quedan

    elevadas al cuadrado.

    ( )

    VARIANZA EXPERIMENTAL (2)

    Es una variante de la varianza que se utiliza en el clculo de la incertidumbre

    generalmente presente en las mediciones.

    ( )

    ( )

    COEFICIENTE DE VARIACION (CV)

    Permite determinar en porcentaje el grado de dispersin que existe en los valores de la

    serie estadstica.

    Ejemplo 1: Para el conjunto de datos mostrados calcule todas las medidas de dispersin

    analizadas. 18, 15, 12, 10, 7, 6, 5, 3

    Xi |Xi-X| (Xi-X)2

    18 8.5 72.25

    15 5.5 30.25

    12 2.5 6.25

    10 0.5 0.25

  • Media aritmtica

    Desviacin media absoluta

    | |

    Desviacin Tpica

    ( )

    7 2.5 6.25

    6 3.5 12.25

    5 4.5 20.25

    3 6.5 42.25

    sumatoria 34 190

  • Varianza

    ( )

    Coeficiente de variacin

    DATOS AGRUPADOS

    La agrupacin de datos generalmente responde a necesidades de carcter metodolgico

    debido a que cuando se tienen demasiados valores de las variables investigadas es

    imposible analizarlos sin previamente ordenarlos o agruparlos de alguna manera. Razn

    ms que fundamental para utilizar conceptos como frecuencias, distribucin de

    frecuencias, intervalos, clases que a continuacin se definirn.

    DISTRIBUCION DE FRECUENCIAS

    Organizar los datos en series estadsticas de tipo cuantitativas a travs de clases y

    frecuencias para posteriormente determinar por separado mediante tcnicas de conteo el

    nmero de observaciones pertenecientes a cada una de ellas.

    Tabla de distribucin de frecuencias.- Colocar las clases y frecuencias en tablas

    tabulacin para su posterior anlisis mediante tcnicas estadsticas.

    Clase.- Categoras o niveles que se establece al clasificar o dividir los datos obtenidos en

    una investigacin.

    Frecuencias (f) .- Es el nmero de veces que se repite un mismo valor de la variable. En la

    distribucin de frecuencias se considera la frecuencia de la clase que es el nmero de

    valores que estn contenidos en una clase.

  • Tabla de distribucin de frecuencias

    CLASES f

    0.1355 0.1287 5

    0.1287 0.1219 6

    0.1219 0.1151 10

    0.1151 0.1083 14

    0.1083 0.1015 9

    0.1015 0.0947 5

    0.0947 0.0879 1

    Intervalo de clase.- Son todos los valores que estn comprendidos entre dos lmites

    incluidos ellos. Ejemplo: en el intervalo de 70 a 75 estn incluidos los valores de 70, 71, 72,

    73, 74, 75.

    Lmites de clase.- Son los valores extremos que forman el intervalo, siendo los valores

    ms grande y ms pequeo de la clase respectivamente. Del ejemplo anterior el lmite

    inferior es 70 y el lmite superior es 75.

    Lmites reales de clase.- Son los valores verdaderos que se consideran como lmites

    tomando en cuenta que los valores pueden aproximarse a un nmero determinado de

    cifras significativas. Ejemplo: en los datos anteriores los lmites reales son: 69.5 y 75.5.

    Se considera el limite real inferior (LRi) y lmite real superior (LRs). Para encontrarlos se

    debe considerar el nmero de cifras decimales que tiene los datos y aumentarle y quitarle

    5 a las ltimas cifras segn sea el caso.

    Ejemplo: los lmites de un intervalo son 56.786 y 60.787. Cules sern los lmites

    reales?

    LRi = 56.7855 LRs = 60.7875

    Amplitud o recorrido de la variable Rango (R)

    Se define como la distancia o diferencia que se establece entre el valor mayor y el valor

    menor de la variable en el conjunto de datos recolectados.

    Ancho del intervalo o longitud de clase (i).- Es la diferencia entre los lmites reales

    superior e inferior.

    Frecuencias de

    clase

    Clases

  • Nmero de intervalos (ni).- Constituye un nmero entero que refleja la totalidad de las

    clases. Se puede calcular a travs de las siguientes frmulas.

    Frmula de Sturges

    ( )

    Donde: n = nmero de datos.

    En el caso de que se plantee el ancho del intervalo el nmero de intervalos ser:

    Generalmente se calcula primero el nmero de intervalos y luego el ancho del intervalo

    con la expresin.

    El nmero de intervalos no debe ser menor a 5 ya que las frecuencias

    estaran muy concentradas

    El nmero de intervalos no debe ser mayor que 15 ya que las frecuancias

    estaran muy dispersas.

    NOTA: i tiene que tener

    un decimal ms que los

    que tienen los datos.

    NOTA: (ni) siempre va a

    Ser un valor entero.

  • Frecuencia acumulada (fa).- Es la suma de las frecuencias a partir de la frecuencia del

    ltimo de los intervalos.

    Frecuencia relativa (fr).- Es la relacin que se establece al dividir la frecuencia de cada

    clase para el nmero total de datos.

    Frecuencia porcentual (%f).- Es el producto de la frecuencia relativa por el cien por ciento.

    Marca de clase (Xm).- Es el valor promedio de cada intervalo.

    Ejemplo: Elabore una tabla de distribucin de frecuencias para los siguiente datos

    presentados.

    0.110 0.110 0.126 0.112 0.117 0.113 0.135 0.107 0.122

    0.113 0.098 0.122 0.105 0.103 0.119 0.100 0.117 0.113

    0.124 0.118 0.132 0.108 0.115 0.120 0.107 0.123 0.109

    0.117 0.111 0.112 0.101 0.112 0.111 0.119 0.103 0.100

    0.108 0.120 0.099 0.102 0.129 0.115 0.121 0.130 0.134

    0.118 0.106 0.128 0.094 0.111

    Rango:

    Nmero de intervalos (ni)

  • Ancho del intervalo (i)

    Tabla de distribucin de frecuencias

    Para comenzar a elaborar la tabla se toma el valor mayor de los datos y se lo toma como

    lmite real superior es decir se lo adiciona 5 como ltima cifra decimal es decir: 0.135

    como lmite real superior sera 0.1355.

    Posteriormente para encontrar el lmite real inferior se lo hace restando del lmite real

    superior el ancho del intervalo.

    Este lmite calculado se convierte en el superior del siguiente intervalo y as se procede

    hasta obtener el nmero de intervalos calculados.

    CLASES Xm f fa fr %f

    0.1355 0.1287 0.1321 5 50 0.1000 10.0000

    0.1287 0.1219 0.1253 6 45 0.1200 12.0000

    0.1219 0.1151 0.1185 10 39 0.2000 20.0000

    0.1151 0.1083 0.1117 14 29 0.2800 28.0000

    0.1083 0.1015 0.1049 9 15 0.1800 18.0000

    0.1015 0.0947 0.0981 5 6 0.1000 10.0000

    0.0947 0.0879 0.0913 1 1 0.0200 2.0000

    SUMATORIA

    50

    1.0000 100.0000

    Nota: La primera y la ltima siempre debe tener un valor de frecuencia y no puede ser

    cero.

  • PRESENTACIN GRFICA DE LA DISTRIBUCIN DE FRECUENCIAS

    Para observar mejor los datos agrupados en la distribucin de frecuencias se recurre a la

    presentacin grfica de los mismos utilizando sistemas de referencia adecuados,

    generalmente el primer cuadrante del sistema cartesiano.

    Histograma.- Un histograma es un conjunto de rectngulos que estn juntos unos a otros

    y que tienen el mismo espesor y que corresponde al ancho del intervalo. En el eje X se

    representa las clases y en el eje Y las frecuencias. Ejemplo

    Polgonos de frecuencia.- Es un grfico de trozos de la frecuencia de cada clase con

    relacin a las marcas de clase; se lo puede representar en el mismo grfico del histograma

    simplemente aadiendo un punto ms antes y despus de la ltima y la primera clase.

    El polgono de frecuencias se grafica utilizando las marcas de clase en el eje X y las

    frecuencias en el eje Y. Ejemplo

    02468

    10121416

    46.3 42.1 37.9 33.7 29.5 25.3 21.1

    50.5 46.3 42.1 37.9 33.7 29.5 25.3

    Fre

    cuenc

    ias

    Serie Estadstica

    Histograma

  • Diagrama de sectores pastel.- El diagrama de sectores es una representacin de los

    datos en un circulo para lo cual se utiliza los valores de la frecuencia porcentual (%f)

    distribuidos en los 360 grados que posee dicho circulo. Para lo cual se puede recurrir

    fcilmente a una regla de tres.

    100 % 360 grados

    %f x

    Ejemplo:

    0

    2

    4

    6

    8

    10

    12

    14

    16

    0.1

    32

    1

    0.1

    25

    3

    0.1

    18

    5

    0.1

    11

    7

    0.1

    04

    9

    0.0

    98

    1

    0.0

    91

    3

    POLIGONO DE FRECUENCIAS

    POLIGONO DEFRECUENCIAS

    10.0

    12.0

    20.0

    28.0

    18.0

    10.0

    2.0

    DIAGRAMA DE SECTORES

    1

    2

    3

    4

    5

    6

    7

  • Diagrama de frecuencias acumuladas Ojiva.- El diagrama de frecuencias acumuladas

    permite observar la tendencia de concentracin de los datos segn la longitud de los

    segmentos dibujados.

    Para graficar se lo debe hacer colocando en el eje X las marcas de clase, y en el eje Y las

    frecuencias acumuladas. Ejemplo

    MEDIDAS DE TENDENCIAL CENTRAL PARA DATOS AGRUPADOS

    CONCEPTO.- Son los valores ms representativos de un conjunto de datos o valores

    agrupados en la tabla de distribucin de frecuencias con los cuales se pueden hacer

    comparaciones y que sirven de base para el anlisis de un sistema estadstico.

    TIPOS

    COMPUTACIONALES: Utilizan formulas comprobadas matemticamente o cientficamente

    para su clculo pero que utilizan las frecuencias y marcas de cada clase a diferencia de los

    datos no agrupados.

    NO COMPUTACIONALES O POSICIONALES: Se utilizan frmulas empricas con principios

    de interpolacin y que utilizan las columnas de frecuencia, frecuencia acumulada y lmites

    para su clculo.

    0

    10

    20

    30

    40

    50

    60

    0.1321 0.1253 0.1185 0.1117 0.1049 0.0981 0.0913

    Frecuencia acumulada

    Frecuencia acumulada

  • MEDIDAS COMPUTACIONALES

    MEDIA ARITMETICA ( )

    Es la razn de la sumatoria de los valores de la marca de clase por la frecuencia de cada

    clase para el nmero total de datos.

    MEDIA GEOMETRICA ( )

    Se define como el antilogaritmo de la razn entre la sumatoria del producto de las frecuencias de cada clase y el logaritmo decimal de las marcas de clase para el nmero de datos.

    El antilogaritmo es la operacin contraria al logaritmo.

    (

    )

    MEDIA ARMNICA ( )

    Es el recproco de la media aritmtica de los recprocos de la marca de clase por la

    frecuencia de cada una de las clases.

    Ejemplo: En la oficina de un diario, el tiempo que se tardan en imprimir la primera plana

    fue registrado durante 50 das. A continuacin se presentan los datos.

    Las operaciones de multiplicacin y

    sumas se las realiza rpidamente en la

    misma tabla de distribucin de

    frecuencias

  • DATOS

    20.8 22.8 21.9 22 20.7 20.9 25 22.2 22.8 20.1

    25.3 20.7 22.5 21.2 23.8 23.3 20.9 22.9 23.5 19.5

    23.7 20.3 23.6 19 25.1 25 19.5 24.1 24.2 21.8

    21.3 21.5 23.1 19.9 24.2 24.1 19.8 23.9 22.8 23.9

    19.7 24.2 23.8 20.7 23.8 24.3 21.1 20.9 21.6 22.7

    Determine las medidas de tendencia central computacionales.

    Rango:

    Nmero de intervalos (ni)

    ( )

    ( )

    Ancho del intervalo (i)

    Tabla de distribucin de frecuencias

    DISTRIBUCIN DE FRECUENCIAS CLASES f Xm fa fr %f f*Xm f*log(Xm) f*(1/Xm)

    25.35 24.30 5 24.83 50 0.10 10.00 124.13 6.97 0.20

    24.30 23.25 14 23.78 45 0.28 28.00 332.85 19.27 0.59

    23.25 22.20 8 22.73 31 0.16 16.00 181.80 10.85 0.35

    22.20 21.15 7 21.68 23 0.14 14.00 151.73 9.35 0.32

    21.15 20.10 10 20.63 16 0.20 20.00 206.25 13.14 0.48

    20.10 19.05 5 19.58 6 0.10 10.00 97.88 6.46 0.26

    19.05 18.00 1 18.53 1 0.02 2.00 18.53 1.27 0.05

    SUMATORIA 50

    1.00 100.00 1113.15 67.31 2.26

    Medidas computacionales

    Media aritmtica

  • Media geomtrica

    (

    )

    (

    )

    ( )

    Media Armnica

    MEDIDAS POSICIONALES

    MEDIANA (MED)

    Es el valor ms central de la serie estadstica, divide al conjunto de las clases en 2 partes

    iguales. La mediana es un parmetro de tendencia central muy aplicado y que para su

  • determinacin se utiliza la columna de las frecuencias acumuladas junto con el ancho del

    intervalo.

    Donde:

    : Lmite real inferior de la clase de la mediana.

    : Frecuencia acumulada anterior a la clase de la mediana.

    : Frecuencia de la clase de la mediana.

    : Ancho del intervalo.

    MODA (MOD)

    Es el valor que ms se repite en una serie estadstica, para su clculo se utiliza la columna

    de las frecuencias junto con el ancho del intervalo.

    Donde

    : Lmite real inferior de la clase modal.

    : Ancho del intervalo.

    CUANTILES

    Es el nmero de partes iguales que se divide una serie estadstica, para su clculo se

    determina con la columna de las frecuencias acumuladas y el ancho del intervalo.

    CUARTIL (K)

  • La frmula utilizada para encontrar los cuartiles segn su nmero es:

    Donde:

    : Lmite real inferior de la clase del cuartil.

    : Frecuencia acumulada anterior a la clase del cuartil.

    : Frecuencia de la clase del cuartil.

    : Ancho del intervalo.

    j: Nmero del cuartil.

    QUINTIL (Q)

    La frmula utilizada para encontrar los quintiles segn su nmero es:

    Donde:

    : Lmite real inferior de la clase del quintil.

    : Frecuencia acumulada anterior a la clase del quintil.

    : Frecuencia de la clase del quintil.

    : Ancho del intervalo.

    j: Nmero del quintil.

    DECIL (D)

    La frmula utilizada para encontrar los deciles segn su nmero es:

    Donde:

    : Lmite real inferior de la clase del decil.

    : Frecuencia acumulada anterior a la clase del decil.

    : Frecuencia de la clase del decil.

    : Ancho del intervalo.

    j: Nmero del decil.

  • PERCENTIL (Pr)

    La frmula utilizada para encontrar los percentiles segn su nmero es:

    Donde:

    : Lmite real inferior de la clase del percentil.

    : Frecuencia acumulada anterior a la clase del percentil.

    : Frecuencia de la clase del percentil.

    : Ancho del intervalo.

    j: Nmero del percentil.

    Ejemplo: La tabla adjunta muestra los dimetros en centmetros de una muestra de 60

    bolas de cojinete manufacturados por una fbrica.

    1.738 1.729 1.743 1.740 1.736 1.741 1.735 1.731 1.726 1.737 1.728 1.737

    1.736 1.735 1.724 1.733 1.742 1.736 1.739 1.735 1.745 1.736 1.742 1.740

    1.728 1.738 1.725 1.733 1.734 1.732 1.733 1.730 1.732 1.730 1.739 1.734

    1.738 1.739 1.727 1.735 1.735 1.732 1.735 1.727 1.734 1.732 1.736 1.741

    1.736 1.744 1.732 1.737 1.731 1.746 1.735 1.735 1.729 1.734 1.730 1.740

    Determine la mediana, la moda el cuartil 3, quintil 2, decil 5 y percentil 90. Utilice la raz

    para el clculo del nmero de intervalos

    Rango:

    Nmero de intervalos (ni)

    Ancho del intervalo (i)

  • Medidas posicionales de tendencia central

    CLASES f fa Xm

    1.7465 1.7434 3 60 1.7450

    1.7434 1.7403 5 57 1.7419

    1.7403 1.7372 9 52 1.7388

    1.7372 1.7341 17 43 1.7357

    1.7341 1.7310 14 26 1.7326

    1.7310 1.7279 7 12 1.7295

    1.7279 1.7248 4 5 1.7264

    1.7248 1.7217 1 1 1.7233

    SUMATORIAS 60

    Mediana

    Procedimiento de clculo:

    1. Determine el resultado de

    2. Con el resultado anterior determine en la columna de la frecuencia acumulada en

    que clase queda contenido dicho valor. En este ejemplo est en la clase nmero 4,

    ya que el valor de 30 es mayor que 26 y menor 43.

    3. Se localiza el , , observando en la tabla de distribucin de

    frecuencias. Los valores son:

    4. Se calcula la mediana

    Moda

  • Procedimiento de clculo

    1. En la tabla de distribucin de frecuencia se observa la clase que tiene mayor

    frecuencia; sta se convierte en la frecuencia modal y se obtiene tambin el

    . En ste ejemplo la frecuencia modal es 17 y lmite real inferior de la clase

    modal es 1.7341. En el caso de haber ms de una clase con la misma frecuencia

    no existir moda.

    2. Se localiza la frecuencia premodal que es aquella que est antes de la frecuencia

    modal en ste ejemplo es 14, y de la misma forma la postmodal que es la que est

    despus de la frecuencia modal en ste ejemplo 9. Se comienza a contar desde la

    ltima clase.

    3. Se calcula y

    4. Se calcula la moda.

    Cuantiles

    El procedimiento de clculo es similar al de la mediana ya que hay que recordar que la

    mediana es un cuantil que divide en dos partes iguales a la serie estadstica.

    Cuartil 3.

  • Quintil 2.

    Decil 5

    Percentil 90

    MEDIDAS DE DISPERSION PARA DATOS AGRUPADOS

    CONCEPTO.- Es el grado de alejamiento de los valores de la serie estadstica con respecto

    a una medida de tendencia central.

    RANGO (R)

    Es la diferencia entre el lmite real superior de la primera clase y el lmite real inferior de

    la ltima clase.

  • RANGO SEMIINTERCUARTIL (RK)

    El rango semiintercuartil es la distancia dividida para dos entre el cuartil tres y el cuartil

    uno que se encuentren en la tabla de distribucin de frecuencias.

    RANGO PERCENTIL (RPr)

    Es la distancia que existe entre el percentil noventa y el percentil diez encontrados en la

    tabla de distribucin de frecuencias.

    DESVIACION MEDIA ABSOLUTA (MAD)

    Permite determinar el promedio de las desviaciones con respecto a una medida de

    tendencia central ya sea esta computacional o posicional. Para su clculo se utiliza

    frecuencias y marcas de clase.

    Computacional

    | |

    Posicional

    | |

    DESVIACION TPICA O ESTANDAR ()

    Permite calcular el grado de dispersin real de una serie estadstica por que utiliza

    desviaciones cuadrticas para su clculo. Se determina con las frecuencias y marcas de

    clase.

    Diferencia

    Desviacin

    Promedio

    Media Sin el signo

    Absoluta

    R

  • Computacional

    ( )

    Posicional

    ( )

    VARIANZA (2)

    La varianza no es ms que la desviacin tpica elevada al cuadrado y es utilizada para el

    clculo inicial de la dispersin pero tiene el inconveniente de que las unidades quedan

    elevadas al cuadrado.

    ( )

    COEFICIENTE DE VARIACION (CV)

    Permite determinar en porcentaje el grado de dispersin que existe en los valores de la

    serie estadstica.

    Ejercicio: En el ejemplo anterior calcule las medidas de dispersin.

    Medidas de dispersin para datos agrupados

    CLASES f fa Xm f*|Xm-X| f*(Xm-X)^2

    1.7465 1.7428 4 60 1.7447 0.0392 0.0004

    1.7428 1.7391 7 56 1.7410 0.0427 0.0003

    1.7391 1.7354 15 49 1.7373 0.0361 0.0001

    1.7354 1.7317 20 34 1.7336 0.0259 0.0000

    1.7317 1.7280 9 14 1.7299 0.0450 0.0002

    1.7280 1.7243 4 5 1.7262 0.0348 0.0003

    1.7243 1.7206 1 1 1.7225 0.0124 0.0002

    SUMATORIAS 60

    0.2361 0.0014

  • Rango

    Rango semiintercuartil

    Rango percentil

  • Desviacin media absoluta

    | |

    Desviacin tpica o estndar

    ( )

    Varianza (2)

    ( )

    Coeficiente de variacin

  • RELACIN ENTRE MEDIDAS DE TENDENCIA CENTRAL COMPUTACIONALES Y MEDIDAS DE

    DISPERSIN

    CAMPANA DE GAUSS

    La estadstica nos sirve para encontrar patrones de comportamiento y, as, entender

    mejor un proceso.

    Cuando el dato es una variable continua, es decir, que puede tomar cualquier valor entre

    infinito y menos infinito; y cuando las causas especiales de variacin han sido eliminadas

    del proceso, la distribucin ser parecida a una curva normal o campana de Gauss.

    En este tipo de distribucin se sabe que el 68 % de los datos caern entre +/- 1 desviacin

    estndar (1 Sigma) a cada lado de la Media. A +/- 2 Sigmas el 95 % de los datos.

    Este patrn es el que nos permitir saber rpidamente si los procesos estn controlados o

    fuera de control.

  • CLCULO DE PERCENTILES

    Los percentiles se pueden calcular en funcin de la media aritmtica y la desviacin tpica

    o estndar ( ) de una forma rpida a travs de unas constantes que dependen del nmero

    de percentil.

    La expresin para determinar dichos percentiles es:

    Donde:

    Pr: Percentil

    : Media aritmtica

    Z: Constante segn el percentil elegido.

    : Desviacin tpica o estndar.

    Valores de la constante Z segn el percentil

    Ejemplo de clculo:

  • En un estudio sobre la talla de una poblacin de estudiantes se la media aritmtica fue de

    1750 mm, y la desviacin tpica de 67,07 mm. Calcular los valores de estatura que

    quedaran comprendidos en el 90% de sta poblacin

    Esto significa que se debe analizar los valores comprendidos entre el 5 y 95 % de la

    poblacin por lo cual es necesario calcular el percentil 5 y 95.

    El valor de Z segn la tabla para estos percentiles es de 1.65

    Por lo tanto los valores de estatura que corresponden al 90% de la poblacin est entre

    1639.3 mm y 1860.7 mm.

    Utilidad de los percentiles

    Los percentiles son muy tiles en el diseo y tienen mucha significancia en el

    dimensionamiento. Ejemplo: analice el siguiente grfico.

  • Como dimensionar la estantera para que un porcentaje de la poblacin no tenga ningn

    inconveniente en tomar la caja de la repisa. De una solucin.

    MOMENTOS ESTADSTICOS

    Al igual que las medidas de dispersin y de tendencia central los momentos estadsticos

    permite tambin realizar un anlisis estadstico de los datos que resulten de la

    investigacin estadstica.

    Algunos de los momentos estadsticos son muy tiles en el anlisis de curvas de

    distribucin de frecuencias por ejemplo en la determinacin el sesgo y el curtosis.

    Concepto.- Es un parmetro que permite un anlisis cuantitativo de los datos de una serie

    estadstica.

    Se definen los momentos con respecto a la variable X y con respecto a la media aritmtica.

    a) Con respecto a la variable X

    Su frmula matemtica es:

    Para datos no agrupados

    Para datos agrupados

    El momento de grado 1 con respecto a la variable X es la media aritmtica.

  • b) Con respecto a la media aritmtica

    Su frmula matemtica es:

    Para datos no agrupados

    ( )

    Para datos agrupados

    ( )

    Si r = 1, el momento de grado 1 con respecto a la media aritmtica es cero, si r = 2, el

    momento de grado dos con respecto a la media aritmtica es la varianza.

    Tambin se puede definir un momento con respecto a un valor constante cualquiera.

    Para datos no agrupados

    ( )

    Para datos agrupados

    ( )

    Ejemplo 1:

    Para los valores 5, 8, 7, 3, 2, 1, 9 calcule el momento de grado 1, momento de grado 4,

    momento de grado 3 con respecto a la media aritmtica.

    a) Momento de grado 1

  • Este valor corresponde a la media aritmtica.

    b) Momento de grado 4.

    c) Momento de grado 3 con respecto a la media aritmtica

    ( )

    ( ) ( ) ( ) ( ) ( ) ( ) ( )

    Ejemplo 1:

    Para la siguiente tabla de distribucin de frecuencias calcule el momento estadstico 6 y el

    momento 5 con respecto a la media aritmtica.

    Distribucin de frecuencias

    CLASES f fa Xm f*Xm

    1.7465 1.7434 3 60 1.7450 5.2349

    1.7434 1.7403 5 57 1.7419 8.7093

    1.7403 1.7372 9 52 1.7388 15.6488

    1.7372 1.7341 17 43 1.7357 29.5061

    1.7341 1.7310 14 26 1.7326 24.2557

    1.7310 1.7279 7 12 1.7295 12.1062

    1.7279 1.7248 4 5 1.7264 6.9054

    1.7248 1.7217 1 1 1.7233 1.7233

    SUMATORIAS 60

    104.0894

  • f*Xm^6 f*(Xm-X)^5

    84.6875 0.0000000003

    139.6479 0.0000000001

    248.6940 0.0000000000

    464.7526 0.0000000000

    378.6541 0.0000000000

    187.3036 0.0000000000

    105.8847 -0.0000000002

    26.1872 -0.0000000002

    1635.8117 -0.000000000001

    a) Momento 6

    b) Momento 5 con respecto a la media aritmtica

    ( )

    MOMENTOS ESTADSTICOS ADIMENSIONALES

    Para evitar unidades particulares se utiliza los momentos adimensionales respecto a la

    media aritmtica.

  • Todo momento adimensional se lo obtiene dividiendo para la desviacin tpica elevada al

    exponente del momento.

    ( )

    Para momento adicional 1 su valor ser cero, y para el momento adicional 2 su valor ser

    1.

    Ejemplo: Para los valores 5, 8, 7, 3, 2, 1, 9 calcule el momento adimensional 4.

    La media aritmtica es 5.

    a) Momento de grado 4 con respecto a la media aritmtica

    ( )

    ( ) ( ) ( ) ( ) ( ) ( ) ( )

    Desviacin tpica:

    ( )

    Momento adimensional 4

  • SESGO

    El sesgo es el grado de asimetra que tiene distribucin de frecuencia, es decir, cunto se

    aparta de la simetra. Si la curva del polgono de frecuencias suavizado sin trazos rectos

    de una distribucin tiende a la derecha una cola ms larga que a la izquierda, se dice

    sesgada a la derecha, o de sesgo positivo. Por lo contrario si la distribucin tiene una cola

    ms larga a la izquierda, se dice sesgada a la izquierda, o de sesgo negativo.

    Sesgada a la derecha:

    Sesgada a la izquierda:

    Distribucin normal:

    Coeficiente de Karl Pearson (SK)

    Para una distribucin normal la media aritmtica, la moda, y la mediana tienen el mismo

    valor. Mientras ms diferente sean media aritmtica y la moda, ms asimtrica es la curva

    de distribucin. El coeficiente de Karl Pearson mide el grado de asimetra en unidades de

    desviacin estndar con la siguiente expresin:

    Si la media es mayor que la moda, entonces, SK es positivo. Es decir, el sesgo es positivo.

    Si la media es menor que la moda, SK es negativo, es decir el sesgo es negativo.

    Si la media es igual a la moda, SK=0 y la distribucin es simtrica.

  • Ejemplo: Para un conjunto de datos el valor de la media es 0.2608, el valor de la moda es

    0.258. Por otra parte, el valor de la desviacin estndar es 0.0408. Qu tipo de

    distribucin se tiene.

    Respuesta: Se tiene una distribucin positiva o sesgada a la derecha.

    Coeficiente de Arthur Bowley (SKK)

    Este coeficiente, utiliza para su clculo los cuartiles de orden uno, dos y tres.

    Si SKK es positivo, el sesgo es positivo.

    Si SKK es negativo, el sesgo es negativo.

    Si SKK = 0, la distribucin es simtrica.

    Ejemplo: Calcular el coeficiente de Arthur Bowley para los datos en los cuales el cuartil 3

    tiene un valor de 0.291, el cuartil 2 tiene un valor 0.260 y el cuartil 1 tiene un valor de

    0.232.

    El sesgo es positivo implica que es sesgada a la derecha.

    Momento estadstico adimensional para la determinacin del sesgo

    La expresin ms importante con sustento matemtico para la determinacin del sesgo es

    a travs del momento estadstico adimensional 3.

  • Si es positivo, el sesgo es positivo.

    Si es negativo, el sesgo es negativo.

    Si = 0, la distribucin es simtrica.

    Ejemplo: Para la distribucin de frecuencias presentada a continuacin determine qu

    tipo de curva de distribucin se obtiene.

    Distribucin de frecuencias

    CLASES f fa Xm f*Xm f*(Xm-X)^2 f*(Xm-X)^3

    1.7465 1.7428 4 60 1.7447 6.9786 0.0004 0.000004

    1.7428 1.7391 7 56 1.7410 12.1867 0.0003 0.000002

    1.7391 1.7354 15 49 1.7373 26.0588 0.0001 0.000000

    1.7354 1.7317 20 34 1.7336 34.6710 0.0000 0.000000

    1.7317 1.7280 9 14 1.7299 15.5687 0.0002 -0.000001

    1.7280 1.7243 4 5 1.7262 6.9046 0.0003 -0.000003

    1.7243 1.7206 1 1 1.7225 1.7225 0.0002 -0.000002

    SUMATORIAS 60

    104.0907 0.0014 -0.00000013

    Media aritmtica

    Desviacin tpica

    Momento adimensional 3.

    Momento estadstico 3 con respecto a la media.

  • Esto implica que la curva de distribucin de frecuencias est sesgada a la izquierda.

    CURTOSIS

    La curtosis mide cuan puntiaguda es una distribucin con respecto a la distribucin

    normal. Si tiene un pico alto se dice que es leptocrtica, mientras si es aplastada se dice

    que es platicrtica. La distribucin normal segn ste criterio es mesocrtica.

    Leptocrtica

    Platicrtica

    0

    5

    10

    15

    20

    25

    1.7200 1.7250 1.7300 1.7350 1.7400 1.7450 1.7500

    DISTRIBUCION DE FRECUENCIAS MEDIA ARITMTICA

  • Mesocrtica

    Momento estadstico adimensional para la determinacin de la curtosis

    Una medida del la curtosis utiliza el cuarto momento respecto a la media adimensional y

    viene dada por:

    Una distribucin es mesocrtica cuando = 3

    Una distribucin es leptocrtica cuando > 3

    Una distribucin es platicrtica cuando < 3

    Otra medida de la curtosis se la puede obtener a travs del clculo del rango

    semiintercuartil y el rango percentil.

    Curtosis =

    Ejemplo: En la tabla de distribucin mostrada anteriormente calcule la curtosis.

    f*(Xm-X)^4

    0.00000004

    0.00000001

    0.00000000

    0.00000000

    0.00000001

    0.00000002

    0.00000002

    0.00000010

    Momento estadstico 4 con respecto a la media.

    Suma

  • Esto implica que la curva de distribucin de frecuencias platicrtica.

    TEORIA ELEMENTAL DEL MUESTREO

    La teora del muestreo estudia la relacin entre una poblacin y las muestras tomadas de

    ella. Se utiliza para estimar magnitudes desconocidas de una poblacin, tales como la

    media y la varianza llamados como parmetros de la poblacin, a partir del conocimiento

    de esas magnitudes estadsticos sobre muestras.

    Permite tambin determinar si las diferencias observadas entre dos muestras son debidas

    a variaciones fortuitas o si son realmente significativas. Ejemplo si la seleccin de circuitos

    para el armaje de un microcontrolador es mejor que la seleccin de otro tipo de circuitos

    para armar el mismo microcontrolador.

    ( )

    Caractersticas de la muestra

    - Representativa. Todos los elementos de la poblacin tienen que tener la misma

    oportunidad de ser considerado en la muestra.

    - Tamao adecuado.- De tal modo que los resultados de la investigacin no sean

    dudosos por haber tomado una muestra muy pequea.

    - Que el margen de error admisible est dentro del lmite aceptado por la estadstica

    < = 15%.

    Muestras aleatorias

    Para que las conclusiones del muestreo y de la inferencia estadstica sean vlidas, las

    muestras deben escogerse representativamente de la poblacin. El anlisis de los

    mtodos de muestreo y problemas relacionados se llama diseo del experimento.

    Muestra

    Poblacin

  • Una forma para obtener una muestra representativa es mediante muestreo aleatorio de

    acuerdo con el cual, cada miembro de la poblacin tiene la misma probabilidad de ser

    incluido en la muestra.

    Un mtodo para lograr esto es recurrir a nmeros aleatorios. Ver apndice IX pgina 545

    Estadstica Spiegel Murray segunda edicin

    Muestreo con y sin reposicin

    Si se saca un nmero de una urna, se lo puede volver a ponerlo o no, antes de la siguiente

    extraccin. En el primer caso ese nmero puede salir de nuevo ms veces, mientras que

    en el segundo caso slo puede salir cada nmero una vez. Esos dos tipos de muestreo se

    llaman, respectivamente muestreo con reposicin y muestreo sin reposicin.

    Ejemplo: Seleccionar 10 muestras de 4 estudiantes con reposicin de la siguiente tabla: Altura de 100 estudiantes de los niveles bsicos

    Altura (pulgadas)

    Nmero de estudiantes

    60-62 5

    63-65 18

    66-68 42

    69-71 27

    72-74 8

    Total = 100

    1. Se debe asignar nmeros a los 100 estudiantes comenzando desde el 0.

    Asignacin de nmeros de muestreo

    Altura (pulgadas

    Xm Nmero de estudiantes

    Nmero de

    muestreo

    60-62 61 5 00-04

    63-65 64 18 05 -22

    66-68 67 42 23-64

    69-71 70 27 65-91

    72-74 73 8 92-99

  • 2. Escoger nmeros de la tabla de valores aleatorios y hacer una correspondencia a

    los intervalos en la columna del nmero de muestra en los cuales est contenido

    as, el nmero aleatorio 51 corresponde al intervalo 66 68 pulgadas porque en el

    nmero de muestra est entre 23 y 64 y el valor que toma es el de la marca de

    clase 67.

    Nmeros aleatorios

    # de muestra Nmeros aparecidos en la muestra Altura correspondiente

    1 51,77,27,46 67, 70, 67, 67

    2 40,42,33,12 67, 67, 67,64

    3 90,44,46,62 70, 67, 67, 67

    4 16,28,98,93 64, 67, 73, 73

    5 58,20,41,86 67, 64, 67, 70

    6 19,64,08,70 64, 67, 64, 70

    7 56,24,03,32 64, 67, 61, 67

    8 34,9183,58 67, 70, 70, 67

    9 70,65,68,21 70, 70, 70, 64

    10 96,02,13,87 73, 61, 64, 70

    Distribuciones de muestreo

    Si se considera todas las posibles muestras de tamao (n) en una poblacin dada (con o

    sin reposicin), y para cada una de las muestras se calcula un estadstico (media

    aritmtica, desviacin tpica, etc.) que varan para cada una de ellas, de ste modo se

    obtiene una distribucin del estadstico que se llama distribucin de la muestra.

    Si el estadstico utilizado es la media, se obtiene una distribucin de muestreo de la

    media.

    Distribucin de muestreo de medias

    Si se toman todas las posibles muestras de tamao de n, sin reposicin de una poblacin

    finita de tamao m > n y de ellas se calcula la media y la desviacin tpica de la distribucin

    de muestreo de medias se obtiene que:

  • Donde:

    : Media aritmtica de la muestra.

    : Desviacin tpica de la muestra

    : Desviacin tpica de la poblacin.

    : Media aritmtica de la poblacin.

    Para una poblacin infinita o muestreo con reposicin las relaciones son:

    Ejemplo: Para el problema anterior determine la media a partir de las muestras.

    # de muestra Nmeros aparecidos en la muestra

    Altura

    correspondiente

    1 51,77,27,46 67, 70, 67, 67 67.8

    2 40,42,33,12 67, 67, 67,64 66.3

    3 90,44,46,62 70, 67, 67, 67 67.8

    4 16,28,98,93 64, 67, 73, 73 69.3

    5 58,20,41,86 67, 64, 67, 70 67.0

    6 19,64,08,70 64, 67, 64, 70 66.3

    7 56,24,03,32 64, 67, 61, 67 64.8

    8 34,9183,58 67, 70, 70, 67 68.5

    9 70,65,68,21 70, 70, 70, 64 68.5

    10 96,02,13,87 73, 61, 64, 70 67.0

    Media de muestras 67.3

    Para ste ejemplo a partir de las medias aritmticas de cada una de las muestras se

    determina la media de todas ellas y por lo tanto la media de la poblacin ser:

    Para valores grandes de tamao de la muestra n a partir de (n30), la distribucin de

    muestreo de medias es aproximadamente normal independientemente de la poblacin

    siempre y cuando la media poblacional y la varianza sean finitas y el tamao de la

    poblacin sea al menos el doble que de la muestra.

  • CORRELACION Y REGRESION ESTADISTICA

    Muchos fenmenos en la naturaleza estn asociados a la relacin de las variables que

    rigen su comportamiento de tal modo que existen leyes que los gobiernan como es el caso

    de una velocidad en el movimiento rectilneo uniforme en el cual dicha velocidad depende

    del cambio de posicin en un intervalo de tiempo o la presin atmosfrica que cambia con

    la altura de la localidad en la cual se mide. Existen otros fenmenos en los cuales es de

    inters saber la relacin que existe entre sus variables por ejemplo el consumo de gasolina

    de un auto en funcin del peso y la potencia del motor para lo cual sera conveniente

    encontrar una relacin entre dichas variables. Cmo hacerlo?

    CORRELACION

    Es el grado de relacin que existe entre los datos o las variables en un fenmeno

    estadstico.

    Es el grado de interconexin entre las variables, para las cuales intenta determinar con

    qu precisin describe o explica la relacin a travs de una ecuacin.

    Se dice que los datos estn correlacionados si por su ubicacin grfica, pueden

    definirse como parte de una familia, dependencia funcional o ley matemtica.

    El grado de correlacin se concepta como el nivel de acercamiento o alejamiento

    respectivamente de los datos respecto de una expresin funcional o ley.

    Cuando todos los valores de la variable satisfacen una ecuacin exactamente, se dice que

    las variables estn perfectamente correlacionadas. Ejemplo la circunferencias C y los

    radios r de todos los crculos estn perfectamente correlacionados con la expresin.

    Existe correlacin entre el peso de una persona y su altura?

    Correlacin simple

    Cuando la relacin existe entre solo dos variable se habla de una correlacin simple y

    regresin simple, y se dice que se tiene una variable independiente y otra dependiente,

    Caso contrario se trata de correlaciones y regresiones mltiples.

    REGRESIN

    Es el proceso matemtico que permite encontrar la relacin que existe entre las variables

    de un fenmeno estadstico, o permite determinar la funcin que ms o mejor se ajuste a

    los datos correlacionados.

  • Aplicaciones del anlisis de regresin

    Descripcin cuantitativa de las relaciones existentes entre una variable dada y un

    conjunto de variables.

    Interpolacin entre valores de una funcin.

    Prediccin y pronstico.

    Seleccin entre varios modelos alternativos.

    CORELACION LINEAL

    Si dos variables X e Y que se estn analizando y que se las grafica en un sistema

    coordenado dan como resultado puntos coordenados que parecen estar en una lnea

    recta la correlacin se la llama lineal.

    Correlacin lineal

    Tipos de correlacin

    a. Si la variable Y tiende a incrementarse cuando se incrementa X la correlacin se

    dice que es positiva o correlacin directa.

    b. Si la variable Y disminuye cuando se incrementa X la correlacin es negativa.

    c. Si todos los puntos parecen estar sobre una cierta curva la correlacin es no lineal.

    Correlacin lineal positiva Correlacin lineal negativa Sin correlacin

  • Diagrama de dispersin

    El diagrama de dispersin es un grfico en un sistema coordenado donde se representa los

    puntos coordenados de las variables que se estn analizando y que permiten observar la

    correlacin que existe entre ellas.

    Diagrama de dispersin

    REGRESIN LINEAL

    La regresin lineal consiste en encontrar la ecuacin de una lnea recta para lo cual se

    puede seguir los siguientes pasos.

    1. Definir: Que variable es dependiente y cual independiente.

    2. Dibujar el diagrama de dispersin: Ubicar pares ordenados (solo puntos sin unir).

    3. Observar: Si existe correlacin lineal ya sea positiva o negativa.

    4. Determinar: La ecuacin de la lnea recta.

    Para encontrar la ecuacin de la lnea recta se puede utilizar las herramientas de la

    geometra analtica, en la cual una recta puede quedar defina por dos puntos y se puede

    obtener la ecuacin de una recta:

    Considerando los dos puntos P1 y P2 de coordenadas (X1, Y1) y (X2, Y2) se puede

    determinar la ecuacin:

    (

    ) ( )

    Donde:

    Pendiente de la recta.

    ( )

    O la ecuacin general de la recta:

  • El inconveniente al utilizar las ecuaciones anteriores es que solo se utiliza dos puntos de la

    dispersin por lo cual el grado de correlacin no es tan bueno, para mejorar esto se puede

    utilizar el mtodo de los mnimos cuadrados.

    REGRESIN LINEAL POR EL METODO DE MINIMOS CUADRADOS

    La recta por mnimos cuadrados es aquella lnea que tiene por propiedad que las

    sumatoria de las distancias al cuadrado de cada uno de los puntos de dispersin con

    respecto a la recta es mnimo.

    Recta de mnimos cuadrados

    Para poder encontrar la recta de mnimos cuadrados se debe determinar los coeficientes

    de la ecuacin general de la recta

    Para lo cual se utiliza las siguientes expresiones:

    Que pueden ser expresadas tambin como:

  • Estas expresiones representan un sistema de ecuaciones con incgnitas a y b, que

    puede ser resuelto por cualquiera de los mtodos de resolucin de sistemas de

    ecuaciones.

    Ejemplo:

    En una fbrica se est analizando la relacin que existe entre la fuerza aplicada a una

    banda de transmisin de una mquina y la deformacin que sufre. Los valores arrojados

    por las pruebas fueron.

    Fuerza (N) Deformacin(mm)

    0.5 3.2

    1 4

    1.5 5.6

    2 7.1

    2.5 8.6

    3 20

    1. Dado que la deformacin es consecuencia de la fuerza aplicada a la banda de

    transmisin, sta es la variable dependiente y la fuerza la independiente.

    Y: Deformacin en mm

    X: Fuerza en Newton.

    2. Diagrama de dispersin.

    0

    5

    10

    15

    20

    25

    0 0.5 1 1.5 2 2.5 3 3.5

    DEF

    OR

    MA

    CI

    N (

    mm

    )

    FUERZA (N)

    DIAGRAMA DE DISPERSIN

  • 3. Del diagrama de dispersin se puede concluir que existe una correlacin lineal

    positiva sobre todo en los primeros puntos coordenados por lo cual se procede a

    determinar la ecuacin de la recta que ms se ajuste.

    4. Determinar la ecuacin de la recta

    En un clculo inicial se proceder a encontrar la ecuacin con la expresin:

    (

    ) ( )

    Se tomar los pares ordenados P1 (0.5; 3.2) y el punto P2 (2.5; 8.6)

    (

    ) ( )

    ( )

    Para mejorar el clculo se procede a determinar la recta por mnimos cuadrados:

    Es necesario encontrar la sumatoria de la variable X y tambin su sumatoria al cuadrado,

    la sumatoria de la variable Y, como tambin la sumatoria del producto de X por Y.

    Tabulacin para el mtodo mnimos cuadrados

    Fuerza (N) Alargamiento(mm)

    X Y X^2 X*Y

    0.5 3.2 0.25 1.6

    1 4 1 4

    1.5 5.6 2.25 8.4

    2 7.1 4 14.2

    2.5 8.6 6.25 21.5

    3 20 9 60

    SUMATORIA 10.5 48.5 22.75 109.7

  • 22.75a + 10.5b = 109.7

    10.5a + 6b = 48.5

    Resolviendo para a y b se tiene que

    a = 5.674 X 1.846

    EVALUACIN Y SIGNIFICACIN DE LA CORRELACIN LINEAL

    Cuando se elabora el proceso de correlacin lineal se llega a determinar una ecuacin de

    una lnea recta a travs de la regresin pero queda la incertidumbre de que si la recta

    encontrada es la apropiada o si es posible encontrar otra lnea curva que se ajuste mejor

    a los datos, razn por la cual es necesario realizar la evaluacin de la ecuacin

    encontrada.

    La evaluacin se realiza con los valores de la variable dependiente Y, es decir los valores

    que se encuentran remplazando en la ecuacin, y con ellos se determinan las desviaciones

    medias absolutas para comprobar a travs de valores de tolerancia la bondad de la recta

    de regresin, es decir si a futuro los pronsticos pueden ser o no abalizados.

    y = 5.6743x - 1.8467

    0

    5

    10

    15

    20

    25

    0 0.5 1 1.5 2 2.5 3 3.5

    DEF

    OR

    MA

    CI

    N (

    mm

    )

    FUERZA (N)

    DIAGRAMA DE DISPERSIN

  • Los parmetros de tolerancia son:

    VARIACIN TOTAL (VT)

    Representa la sumatoria de las desviaciones cuadradas de los valores dados de la variable

    independiente Y respecto a su media aritmtica ( ).

    ( )

    DONDE

    : Valores de la variable dependiente.

    : Media aritmtica de los valores de la variable dependiente.

    VARIACIN EXPLICADA (VE)

    Representa la parte de la variacin total que depende de la variable independiente X

    influenciando a la variable dependiente Y. Se calcula como la sumatoria de las

    desviaciones cuadradas de los valores de la variable dependiente pronosticada (Yc)

    respecto a la media aritmtica ( ).

    ( )

    VARIACION NO EXPLICADA (VI)

    Es la variacin residual que refleja el comportamiento de las fluctuaciones de la variable

    independiente X sobre la variable dependiente Y. Se calcula como la sumatoria de las

    desviaciones al cuadrado de los valores de la variable dependiente Y, respecto de los

    valores pronosticados (Yc).

    ( )

    COEFICIENTE DE CORRELACION (CR)

    Expresa el grado de asociacin de las dos variables dependiente e independiente.

    Para que la correlacin se considere aceptable el valor de coeficiente de correlacin debe

    ser mayor que 0.75.

  • ERROR DE ESTIMACIN (m)

    El error de estimacin se debe que al determinar la ecuacin de una lnea se comete un

    error al calcular la pendiente de la misma.

    ( )

    El valor de K depende del nmero de variables en la correlacin, en una correlacin

    simple es de solamente 2.

    Ejemplo: Se desea hacer una correlacin lineal entre la produccin de dixido de uranio

    (kg) de Rusia en el periodo 1989-1993 segn la tabla presentada a continuacin.

    AO Kg(Dixido de Uranio)

    1989 144.6

    1990 129.5

    1991 107.5

    1992 93.5

    1993 80.5

    Para poder trabajar con series cronolgicas estas deben ser transformadas a cuantitativas

    se lo hace fcilmente numerando los aos desde el 0.

    # AO Kg(Dixido de uranio)

    0 1989 144.6

    1 1990 129.5

    2 1991 107.5

    3 1992 93.5

    4 1993 80.5

    1. La produccin de dixido de uranio depende del ao en cuestin por lo tanto

    Y: Kg (Dixido de uranio)

    X: Nmero de ao

  • 2. Diagrama de dispersin.

    3. Del diagrama de dispersin se puede concluir que existe una correlacin lineal

    negativa, por lo cual se procede a determinar la ecuacin de la recta que ms se

    ajuste.

    4. Regresin lineal por el mtodo de los mnimos cuadrados

    Tabulacin datos

    X Y X^2 X*Y

    0 144.6 0 0

    1 129.5 1 129.5

    2 107.5 4 215

    3 93.5 9 280.5

    4 80.5 16 322

    SUMATORIA 10 555.6 30 947

    0

    20

    40

    60

    80

    100

    120

    140

    160

    0 0.5 1 1.5 2 2.5 3 3.5 4 4.5

    DI

    XID

    O D

    E U

    RA

    NIO

    (K

    g)

    # AO

    DIAGRAMA DE SIPERSIN

  • 30a + 10b = 947

    10a + 5b = 555.6

    Resolviendo para a y b se tiene que

    a = -16.42

    b = 143.9

    Por lo cual la ecuacin ser

    La produccin baja con forme transcurre los aos.

    5. Evaluacin de la correlacin lineal.

    Se elabora la tabla para la evaluacin de la correlacin lineal segn los parmetros

    necesarios de clculo.

    y = -16.42x + 143.96 R = 0.9913

    0

    20

    40

    60

    80

    100

    120

    140

    160

    0 0.5 1 1.5 2 2.5 3 3.5 4 4.5

    DI

    XID

    O D

    E U

    RA

    NIO

    (K

    g)

    # AO

    DIAGRAMA DE SIPERSIN Lineal (DIAGRAMA DE SIPERSIN)

  • Evaluacin y significacin de la Correlacin.

    X Y X^2 X*Y Yc (Y-Yc)^2 (Y- )^2 (Yc- )^2 (Xi- )^2

    0 144.6 0 0 143.9 0.49 1120.91 1074.53 4

    1 129.5 1 129.5 127.48 4.08 337.82 267.65 1

    2 107.5 4 215 111.06 12.67 13.10 0.00 0

    3 93.5 9 280.5 94.64 1.30 310.46 271.59 1

    4 80.5 16 322 78.22 5.20 937.58 1082.41 4

    SUMATORIA 10 555.6 30 947

    23.74 2719.89 2696.18 10

    Medias aritmticas de las variables

    Independiente

    Dependiente

    Variacin total (VT)

    ( )

    Variacin explicada (VE)

    ( )

    Variacin no explicada (VI)

    ( )

  • Coeficiente de correlacin (CR)

    El valor del coeficiente es mayor que 0.75 lo que se considera una buena correlacin.

    Error de estimacin (m)

    ( )

    REGRESIONES NO LINEALES

    Muchas ocasiones el clculo del coeficiente de correlacin determina que la regresin

    lineal no sea la que ms se ajusta a los datos de dispersin, por lo cual es necesario

    encontrar lneas que se ajusten de mejor forma a dichos datos, para ello se puede recurrir

    a las mismas ecuaciones que determina el mtodo de mnimos cuadrados.

    LA PARABOLA DE MNIMOS CUADRADOS

    La parbola de mnimos cuadrados se acerca a los puntos de dispersin por medio de la

    ecuacin:

    Las ecuaciones que permiten calcular los valores constantes (a, b, c) son:

  • Ejemplo: La tabla mostrada a continuacin representa la temperatura media anual en

    varios sitios de Pas de acuerdo a su altura del nivel del mar.

    Altura (metros) Temperatura ( C )

    10 32

    200 27

    800 23

    1200 20

    1500 17

    2500 15

    3000 13

    3500 12

    La dispersin resultante es:

    Realice una regresin no lineal con los datos.

    1. Se procede a calcular los coeficientes y las sumatorias para establecer las

    ecuaciones.

    0

    5

    10

    15

    20

    25

    30

    35

    0 500 1000 1500 2000 2500 3000 3500 4000

    DISPERSIN NO LINEAL

    DISPERSIN NO LINEAL

  • Regresin no lineal

    Altura (metros) Temperatura ( C )

    X Y X^2 X^3 X^4 x^2*Y X*Y

    10 32 100 1000 10000 3200 320

    200 27 40000 8000000 1600000000 1080000 5400

    800 23 640000 512000000 4.096E+11 14720000 18400

    1200 20 1440000 1728000000 2.0736E+12 28800000 24000

    1500 17 2250000 3375000000 5.0625E+12 38250000 25500

    2500 15 6250000 1.5625E+10 3.9063E+13 93750000 37500

    3000 13 9000000 2.7E+10 8.1E+13 117000000 39000

    3500 12 12250000 4.2875E+10 1.5006E+14 147000000 42000

    12710 159 31870100 9.1123E+10 2.7767E+14 440603200 192120

    2. Formar el sistema de ecuaciones.

    Resolviendo el sistema de ecuaciones tendramos:

    y = 2x10 -6 X2 - 0.010X + 30.60

  • y = 2E-06x2 - 0.0109x + 30.609

    0

    5

    10

    15

    20

    25

    30

    35

    0 500 1000 1500 2000 2500 3000 3500 4000

    REGRESIN NO LINEAL

    DISPERSIN NO LINEAL Polinmica (DISPERSIN NO LINEAL)

  • PROBABILIDADES

  • TEORA DE PROBABILIDADES

    INTRODUCCIN

    La teora de probabilidades es muy importante en muchos campos de estudio como

    economa, administracin y la INGENIERA no se es indiferente, ya que siempre se

    necesita tomar decisiones ante situaciones de incertidumbre preguntndose por ejemplo

    cunto horas durar un circuito electrnico, el software desarrollado ser aceptado para

    ms del 50% del mercado para el cual fue diseado, para un cierto poltico cuantos

    votantes lo hicieron por l, para un ingeniero industrial sera importante saber cuntos

    horas de funcionamiento tendr una mquina en su rea de produccin antes que se

    dae.

    Todos estos cuestionamientos provienen de fenmenos cuyo resultado no puede ser

    anticipado con certeza, si no que existe cierta probabilidad de que un cierto resultado se

    d, a diferencia de los fenmenos cuyo resultado se determina unvocamente a partir de

    ciertas condiciones, por ejemplo, los resultados de mediciones geomtricas, clculos

    financieros o procesos mecnicos.

    Histricamente se puede decir que las probabilidades surgieron de los juegos de azar en

    los siglos XV y XVI con resolucin de puntuales problemas de juego de dados por personas

    como: Blaise Pascal y Pierre de Fermat.

    Otras personas influyentes fueron Christian Huygens quien public el primer libro de

    probabilidades, James Bernoulli y Abraham de Moivre fueron las personas que ms

    influyeron en el desarrollo de probabilidades.

    Por el Ao de 1812 Pierre de Laplace introdujo gran cantidad de ideas nuevas y tcnicas

    matemticas en su libro, Teora Analtica de Probabilidades con lo cual la probabilidad ya

    no solo estaba destinada a los juegos de azar sino aplicaciones ms all de ella.

    DEFINICIN TERICA

    Las probabilidades constituyen una rama de las matemticas que se ocupa de medir o

    determinar cuantitativamente la posibilidad de que un experimento produzca un

    determinado resultado.

    Es el estudio de las posibilidades de que ocurra o no un evento.

    EXPERIMENTO ALEATORIO, ESPACIO MUESTRAL Y EVENTOS

    EXPERIMENTO ALEATORIO ()

    Los experimentos u operaciones reales o hipotticos pueden dividirse en dos clases:

    determinsticos y no determinsticos.

  • Determinstico.- Si los resultados del experimento estn completamente determinados y

    puede describirse por una frmula matemtica llamado modelo Determinstico. Ejemplos:

    a) Soltar una piedra desde una cierta altura Cada libre de los cuerpos.

    b) Colocar una pelota en el agua Principio de flotacin.

    c) Los cambios de aceleracin que produce una fuerza Segunda ley de Newton

    No Determinstico.- Si los resultados del experimento no pueden predecirse con exactitud

    antes de realizar el experimento. Ejemplos:

    a) Lanzar una moneda y observar el resultado cara o sello.

    b) Lanzar una moneda y observar el nmero que aparece uno, dos, tres, cuatro,

    cinco, seis.

    c) Observar el nmero de autos que pasan por una estacin de servicio en un da

    uno, dos, tres,, n.

    Caractersticas de un experimento no Determinstico:

    Cada experimento puede repetirse indefinidamente sin cambiar esencialmente las

    condiciones.

    Cada experimento es no Determinstico.

    Cada experimento tiene varios resultados posibles que pueden describirse de

    antemano con precisin. En el caso del lanzamiento de la moneda sus

    posibilidades son cara o sello no sabremos cual sale pero si los resultados posible.

    Por lo tanto un experimento aleatorio es aquel que tiene las tres caractersticas

    mencionadas.

    Para denotar un experimento aleatorio se utilizar el smbolo:

    Ejemplos de experimentos aleatorios:

    1: Fabricar artculos, hasta fabricar cinco defectuosos y contar el nmero total de

    artculos fabricados.

    2: Elegir un punto en el intervalo cerrado [0 ,1].

    3: Verificar el estado de un transistor (0 = apagado, 1 = encendido).

    4: Elegir un presidente de un curso de 30 estudiantes.

    5: Extraer un artculo de un lote que contiene artculos defectuosos y no defectuosos.

    ESPACIO MUESTRAL ()

    Es el conjunto de todos los resultados posibles de un experimento aleatorio ().

  • Por lo cual es muy conveniente utilizar notacin de conjuntos y consecuencia de ello

    utilizar algebra de conjuntos.

    Ejemplos:

    1) 1: Lanzar una moneda y observar su resultado.

    1 = {cara, sello}

    2) 2: Lanzar un dado y observar el nmero resultante.

    2 = {1, 2, 3,4, 5, 6}

    3) 3: Fabricar artculos hasta producir 5 defectuosos y contar el total de nmeros de

    artculos producidos.

    3 = {5, 6, 7, 8, 9, 10,}

    4) 4: Contar el nmero de vehculos que llegan a una estacin de servicio a recargar

    gasolina.

    4 = {0, 1, 2, 3, 4,.}

    5) 5: Verificar el estado de un transistor (0 = apagado, 1 = encendido).

    5 = {0, 1}

    6) 6: Elegir un punto en el intervalo cerrado [0 ,1].

    6 = {X R/ 0 X 1}

    7) 7: Elegir un presidente de un curso de 30 estudiantes.

    7 = {A1, A2, A3, A4, A5,, A30} A: Representa a cada uno de los estudiantes

    Clasificacin del Espacio Muestral

    1. El espacio muestral puede ser finito o infinito

    Espacio muestral finito.- Posee un determinado nmero de posibilidades, o se le puede

    considerar como un experimento sin reposicin.

    Ejemplo:

    2: Lanzar un dado y observar el nmero resultante.

    2 = {1, 2, 3,4, 5, 6}

    Espacio muestral infinito.- Posee un nmero indeterminado de posibilidades, o se le

    puede considerar un experimento con reposicin.

  • Ejemplo:

    4: Contar el nmero de vehculos que llegan a una estacin de servicio a recargar

    gasolina.

    4 = {0, 1, 2, 3, 4,.}

    2. El espacio muestral puede ser Simple o compuesto

    Espacio muestral simple.- Es el espacio que resulta de un solo experimento aleatorio

    (experimento simple).

    2: Lanzar un dado y observar el nmero resultante.

    2 = {1, 2, 3,4, 5, 6}

    Espacio muestral compuesto.- Es aquel que resulta de dos o ms experimentos simples

    sucesivos o simultneos.

    1: Lanzar una moneda y un dado a la vez

    Cul ser su espacio muestral?

    Para responder la pregunta anterior se debe incluir el criterio que los espacios muestrales

    compuestos son de dos tipos bsicos aquellos que estn unidos por la letra gramatical O

    y la letra gramatical Y.

    Experimentos unidos por la O excluyente

    Un experimento compuesto , es una O combinacin de los experimentos simples, 1

    y 2, slo si el experimento 1 ocurre y 2 no, o viceversa.

    Ejemplo: Considere el experimento, que consiste en lanzar un dado o una moneda. Hallar

    El espacio muestral para ste experimento.

    : lanzar un dado o una moneda.

    El experimento consiste de dos simple unidos por la O.

    1: Lanzar una moneda y observar su resultado.

    1 = {cara, sello}

    2: Lanzar un dado y observar el nmero resultante.

    2 = {1, 2, 3,4, 5, 6}

    = 1 O 2 Por lo tanto el espacio muestral ser:

    = {cara, sello, 1, 2, 3, 4, 5, 6}

  • Experimentos unidos por la Y

    Un experimento compuesto , es una Y combinacin de los experimentos simples, 1

    y 2, cuando ambos experimentos, 1 Y 2 ocurren.

    Una consecuencia directa del experimento compuesto por la Y combinacin es que su

    espacio muestral resultante es el producto cartesiano de los espacios muestrales de los

    experimentos simples correspondientes. Es decir: = 1 x 2

    Ejemplo: Cul es el espacio muestra de lanzar una moneda y un dado a la vez:

    : Lanzar una moneda y un dado a la vez.

    Experimentos simples:

    1: Lanzar una moneda y observar su resultado.

    1 = {cara, sello}

    2: Lanzar un dado y observar el nmero resultante.

    2 = {1, 2, 3,4, 5, 6}

    = 1 x 2: Por lo tanto el espacio muestral ser:

    = {(C, 1); (C, 2); (C, 3); (C, 4); (C, 5); (C, 6); (S, 1); (S, 2); (S, 3); (S, 4); (S, 5); (S, 6)}

    Cuando se desea determinar un espacio muestral resultado de una Y combinacin de

    dos experimentos aleatorios simples es til usar tablas de doble entrada para encontrar

    dicho espacio muestral.

    Ejemplo: Se lanzan dos monedas simultneamente y se observan las secuencias de caras o

    sellos. Determine su espacio muestral.

    : Se lanzan dos monedas simultneamente y se observan las secuencias de caras o sellos.

    = 1 x 2

    1: Lanzar una moneda y observar su resultado.

    1 = {cara, sello}

    2: Lanzar una moneda y observar su resultado.

    2 = {cara, sello}

  • Tabla de doble entrada

    SEGUNDA MONEDA

    PRIMERA MONEDA

    CARA SELLO

    CARA CARA- CARA CARA - SELLO

    SELLO SELLO - CARA SELLO - SELLO

    = {cara-cara, cara-sello, sello-cara, sello-sello}

    Ejemplo: Se lanzan dos dados simultneamente y se observan los resultados. Determine

    su espacio muestral.

    : Se lanzan dos dados simultneamente y observar los resultados.

    = 1 x 2

    Experimentos simples:

    1: Lanzar una dado y observar su resultado.

    1 = {1, 2, 3, 4, 5, 6}

    2: Lanzar una dado y observar su resultado.

    2 = {1, 2, 3, 4, 5, 6}

    SEGUNDO DADO

    PRIMER DADO

    1 2 3 4 5 6

    1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 5)

    2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)

    3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)

    4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)

    5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)

    6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

    Debido a que el espacio muestral resultando es un conjunto de pares ordenados se puede

    utilizar la simbologa de la teora de conjuntos para representarlo as:

    = {(x, y) / x, y = 1, 2, 3, 4, 5, 6}

  • En muchos casos es ms sugerente utilizar un diagrama para encontrar el Espacio

    Muestral de un experimento compuesto, ste es llamado Diagrama de rbol.

    Ejemplos:

    1) Se lanza una moneda tres veces. Hallar el espacio muestral resultante de ste

    experimento.

    : Se lanza una moneda tres veces y se observan los resultados

    El experimento consiste de tres experimentos simples unidos por la Y. Po lo tanto se

    puede dividir en tres experimentos que dan espacios muestrales simples as:

    = 1 x 2 x 3

    1: Lanzar una moneda y observar su resultado.

    1 = {cara, sello}

    2: Lanzar una moneda y observar su resultado.

    2 = {cara, sello}

    3: Lanzar una moneda y observar su resultado.

    3 = {cara, sello}

    Aplicando el diagrama de rbol se tendr:

    = {CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}

    2) Cul es el espacio muestral en el lanzamiento de una moneda hasta que salga cara.

  • = {C, S, SC, SSC, SSS, SSSC, SSSS }

    3) Cul es el espacio muestral en el lanzamiento de dos dados simultneamente.

    = {(x, y) / x, y = 1, 2, 3, 4, 5, 6}

    4) Los artculos provenientes de una lnea de produccin se clasifican en defectuosos

    y no defectuosos se observan los artculos y se anotan su condicin, el proceso

    continua hasta observar dos artculos defectuosos o hasta que se observen 3

    artculos no defectuosos. Cul es su espacio muestral?

    C

    S C

    S C

    S C

    S

    5 6

    D1

    1

    2

    3

    4

    5 6

    D2

    1

    2

    3

    4

  • = {DD, DNDD, DNDNDD, DNDNDN, DNDNN, DNNDD, DNNDN, DNNN, NDD, NDNDD,

    NDNDN, NDNN, NNDD, NNDN, NNN}

    3. El espacio muestral puede ser discreto o continuo

    Espacio muestral discreto

    Si tiene un nmero finito o infinito numerable de elementos.

    Espacio muestral discreto finito: Si el espacio muestral tiene un nmero finito de

    elementos. Ejemplo

    : Lanzar una dado y observar su resultado.

    = {1, 2, 3, 4, 5, 6} Es espacio muestral discreto finito ya que no puede haber valores en

    l como 2.5, 3.4 etc.

    Espacio muestral discreto infinito: Cuando puede establecerse una correspondencia uno a

    uno con el conjunto de los enteros positivos de modo que pueda ser enumerado como 1,

    2, 3,4,.. Ejemplo:

    : Lanzar una moneda hasta que ocurra cara.

    = {C, SC, SSC, SSSC, SSSSC,}

  • Espacio muestral continuo

    Un espacio muestral es continuo si tiene un nmero no numerable de elementos. Es decir

    todos los elementos posibles en un intervalo. Ejemplo

    : Elegir un punto en el intervalo cerrado [0 ,1].

    = {X R/ 0 X 1} se puede escoger un nmero infinito de valores entre esos dos

    puntos.

    EVENTO

    Se define como un subconjunto del espacio muestral. Por lo que al espacio muestral

    tambin se lo considera como el conjunto universo. Se representa con las letras

    maysculas del alfabeto (A, B, C, DZ). El evento A se lo puede representar como AT

    Ejemplo:

    : Salga par en el lanzamiento de un dado

    = {1, 2, 3, 4, 5, 6} A = {2, 4, 6}

    Evento elemental

    Cuando tiene solamente una posibilidad. Ejemplo

    : Que un transistor est encendido

    = {encendido, apagado} A = {encendido}

    Evento Nulo

    No existe ningn elemento en el subconjunto.

    A = {0}

    SUCESOS

    Son los elementos ms bsicos de un espacio muestral o un evento. Se representan con

    las letras minsculas x, y, z. Ejemplo:

    : Sacar un cuatro en una baraja

    A = {4 corazn rojo, 4 corazn negro, 4 trbol, 4 brillos}

    Un suceso puede ser: x = {4 corazn negro}

  • PROBABILIDAD

    Definicin

    La probabilidad de un evento es la razn entre el nmero de casos (sucesos) favorables y

    el nmero total de casos (sucesos) posibles, siempre que nada obligue a creer que algunos

    de estos sucesos debe tener preferencia a los dems, lo que hace que todos sean

    igualmente posibles.

    Para determinar la expresin matemtica se considera lo siguiente:

    El nmero total de sucesos posibles: N()

    El nmero de sucesos del evento A: N(A)

    La probabilidad del evento A: P[A]

    [ ] ( )

    ( )

    Corolarios:

    1. La probabilidad de un evento A cualquiera est comprendido entre 0 y 1.

    [ ]

    2. P[A] = 0, si A es un evento imposible.

    3. P[A] = 1, si A es el evento seguro.

    4. Puesto que todos los sucesos de = {1, 2, 2,..., n} son igualmente

    probables, se tiene que P[{i}] = 1/n, i = 1, 2, 3,, n.

    Y por lo tanto [ ] [{ }]

    Ejemplo 1: Probabilidad de sacar un nmero par en un lanzamiento de un dado

    : Lanzamiento de un dado

    = {1, 2, 3, 4, 5, 6} N() = 6

    A: sacar un nmero par

    A = {2, 4, 6} N(A) = 3

    [ ] ( )

    ( )

    [ ]

    Ejemplo 2: Se lanza una moneda tres veces. Calcular la probabilidad que ocurran a lo ms

    dos caras.

  • : Lanzar una moneda tres veces

    = {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS} N() = 8

    A: Ocurre a lo ms dos caras

    A = {SSS, SSC, SCS, CSS, CCS, SCS, SCC} N(A) = 7

    [ ] ( )

    ( )

    [ ]

    Ejemplo 3: Se elige una carta aleatoriamente de una baraja de 52 cartas. Cul es la

    probabilidad que sea una carta negra?

    : Extraer una carta de 52

    = {La baraja completa} N() = 52

    A: Obtener una carta negra

    A = {13 corazn negro, 13 trbol} N(A) = 26

    [ ] ( )

    ( )

    [ ]

    No Probabilidad (Q)

    La no probabilidad se considera como el evento que no va a ocurrir en un experimento

    aleatorio.

    Matemticamente se considera como:

    [ ] [ ]

    Del ejemplo 3: Cul es la probabilidad de que no salga una carta negra

    [ ]

    [ ]

  • Tendencia

    Es la divisin entre la probabilidad para la no probabilidad.

    [ ]

    [ ]

    Tendencias Favorables y en Contra

    Tendencia Favorable

    [ ]

    [ ]

    Tendencia En Contra

    [ ]

    [ ]

    Ejemplo: Que tendencia a favor existe que al lanzar un dado para que salga un nmero par

    : Lanzamiento de un dado

    = {1, 2, 3, 4, 5, 6} N() = 6

    A: sacar un nmero par

    A = {2, 4, 6} N(A) = 3

    [ ] ( )

    ( )

    [ ]

    [ ]

    [ ]

    [ ]

    [ ]

  • OPERACIONES CON EVENTOS

    SUB EVENTOS

    Dados dos eventos A y B se dice que A est contenido en B o que A es sub evento de B, si

    todo seceso favorable A, es favorable a B; es decir si ocurre el evento A tambin ocurre el

    evento B. Simblicame