material curso - estadistica aplicada a la ingenieria

Download Material Curso - Estadistica Aplicada a La Ingenieria

If you can't read please download the document

Upload: xmaletof

Post on 17-Nov-2015

36 views

Category:

Documents


9 download

DESCRIPTION

Estadistica

TRANSCRIPT

  • UNIVERSIDAD TECNOLGICA DE CIUDAD JUREZ

    Estadstica Aplicada a la

    Ingeniera

    Septiembre del 2014

    Universidad Tecnolgica de Ciudad Jurez

    Ciudad Jurez, Chihuahua

    CARRERA DE PROCESOS INDUSTRIALES

    Docente:

    Dr. Ivn Juan Carlos Prez Olgun

  • IPIW12 Estadstica Aplicada a la Ingeniera

    2

    Contenido Pgina Caractersticas Generales 4

    Pantallas y men 5

    Men Nuevo 5

    Hoja de Trabajo 6

    Abrir, Guardar e Imprimir Archivos 6

    Cambiar Tipo de Datos 6

    Clculo con Columnas y Renglones 9

    Diagramas 12

    Diagrama de Puntos 13

    Diagrama de Tallo y Hojas 15

    Diagrama de Caja 16

    Histograma 18

    Diagrama de Dispersin 19

    Anlisis de Tendencia 21

    Diagrama de Pareto 22

    Diagrama de Causa Efecto 24

    Estadstica Descriptiva 26

    Estadstica Descriptiva 27

    Medidas de Tendencia Central 27

    Medidas de Dispersin 28

    Regresin y Correlacin 30 Coeficiente de Correlacin 32

    Covarianza 33

    Regresin por Medio de un Ajuste de Lnea 34

    Regresin Lineal Simple 35

    Regresin Lineal Mltiple 37

    Seleccin de Mejor Ecuacin Predictora 38

    Prueba de Hiptesis 45 Grfico de Probabilidad 46

    Prueba de Normalidad 48

    Prueba t de Dos Muestras 51

    Prueba de Dos Proporciones 54

    Grficos de Control 56 Grficos de Control 57

    Grfico de Control X-R (Variables) 58

    Grfico de Control X-S (Variables) 65

    Grfico de Control I-MR (Variables) 72

    Grfico de Control P (Atributos) 77

    Grfico de Control NP (Atributos) 82

    Grfico de Control C (Atributos) 83

    Grfico de Control U (Atributos) 85

  • IPIW12 Estadstica Aplicada a la Ingeniera

    3

    Capacidad de Proceso 90

    Capacidad de Proceso 91

    Analisis de Capacidad para Datos Normales 92

    Analisis de Capaqcidad para Datos no Normales 94

    Estudios de Gage R&R 99 Conceptos Bsicos 100

    Carta de Tendencias de Gage 105

    Estudio de R&R Cruzado 106

    Mtodo de Acuerdo por Atributos 113

    Diseo de Experimentos 118 Diseo de Experimentos 119

    Anlisis de Variables en un Solo Sentido 119

    Diseos Factoriales 123

    Diseos Factoriales 2k

    132

    Diseos de Experimentos 2k-p

    140

    Introduccin al Diseo Robusto 154

    Optimizacin en Dos Pasos 162

    Bibliografa 167

  • IPIW12 Estadstica Aplicada a la Ingeniera

    4

    Caractersticas Generales

    1

  • IPIW12 Estadstica Aplicada a la Ingeniera

    5

    Pantallas y Mens Minitab es un paquete estadstico que incluye funciones de estadstica descriptiva, estadstica inferencial, diseo de experimentos, series de tiempo, grficos de control, estudios de capacidad, pruebas de hiptesis y otras funciones para facilitar los clculos y los anlisis estadsticos.

    A continuacin se muestran las pantallas principales de Minitab:

    Men Nuevo El men nuevo en Minitab provee dos opciones, la primera es Minitab Worksheet la cual mantiene la informacin que actualmente se est procesando como

    Minitab Project, esta opcin borra toda la informacin existente en el proyecto actual (si no se ha grabado) y la reemplaza por un nuevo proyecto. La extensin de los archivos son: MPJ para los proyectos. MTW para las hojas de trabajo. MGF para los grficos (en caso de que se graben por separado).

    Men de comandos e iconos.

    Ventana de Sesin, esta ventana lleva el registro de las

    rdenes y los resultados.

    Direccin de escritura.

    rea de entrada de ttulos de columnas.

    Hoja de trabajo, similar a la hoja de Microsoft Excel.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    6

    Hoja de Trabajo

    Abrir, Guardar e Imprimir Archivos El men file es similar a los encontrados en todos los programas de Windows, en este men se puede grabar la hoja de trabajo o el proyecto, se puede abrir un proyecto u hoja de trabajo, asimismo se puede importar una hoja de trabajo de Microsoft Excel abriendo directamente el archivo de Excel desde la opcin File > Open Worksheet.

    Esta seccin aplica para proyectos donde se

    Esta seccin aplica solamente para hojas de trabajo.

    Cambiar Tipo de Datos En ocasiones es conveniente saber cmo manipular los datos en las hojas de trabajo, ya que al cometer un error e ingresar un valor de texto a una columna numrica, esta columna ya no podr ser usada para los clculos matemticos. Lamentablemente Minitab no ofrece la posibilidad de solo borrar la celda e ingresar el dato numrico, ya que con el error la columna quedo definida como texto, la nica alternativa es utilizar las herramientas para convertir los tipos de datos. Numrico a Texto Como su nombre lo indica este cuadro de dialogo nos permite convertir columnas definidas como numricas a columnas de texto. Los pasos a seguir son:

    1. Ingrese los siguientes datos en la columna C1: 2, 6, 9 , 8, 4, 2, 4, 8, 3 y 4.

    2. Ir al men Data > Change Data Type > Numeric to Text.

    columna con formato de fecha.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    7

    3. En Change numeric columns ingresar la columna de datos a convertir (C1). 4. En Store text columns in ingresar la columna donde los datos a transformar sern almacenados. 5. Posteriormente presione el botn OK y en la columna C2 aparecer la etiqueta C2-T que indica que la columna es ahora de datos de texto.

    Texto a Numrico Como su nombre lo indica este cuadro de dialogo nos permite convertir columnas definidas como texto a columnas numricas. Los pasos a seguir son:

    1. Utilizando los datos resultantes del ejercicio anterior (columna C2).

    2. Ir al men Data > Change Data Type > Text to Numeric.

    3. En Change text columns ingresar la columna de datos a convertir (C2). 4. En Store numeric columns in ingresar la columna donde los datos a transformar sern almacenados. 5. Posteriormente presione el botn OK y en la columna C3 aparecern los datos convertidos y en la etiqueta solamente aparecern el C3 sin T, lo que indica que la columna es ahora de datos numricos.

    Agrupar Columnas Esta herramienta permite agrupar los datos colocados en diferentes columnas en una sola, esta es muy til cuando se quieren hacer clculos estadsticos de diversos grupos de datos sin hacer distincin de variables categricas. 1. Capture los siguientes datos en una hoja de trabajo de Minitab:

    Datos 1 Datos 2 Datos 3 Datos 3

    2 14 21 32

    6 16 29 33

    9 17 27 35

    8 13 26 34

    4 15 25 36

    2 16 24 38

    4 18 28 37

    8 19 26 39

    3 10 21 32

    4 12 23 35

    2. Ir al men Data > Stack > Columns.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    8

    3. Ingrese las columnas que contienen los datos a agrupar en la ventana Stack the following columns. 4. Seleccione la columna donde se agruparan los datos (en este caso C10). 5. Seleccione la columna que contendr las etiquetas asociadas a la variable agrupada (en este caso C11).

    6. Posteriormente presione el botn OK.

    Desagrupar Columnas Esta herramienta permite desagrupar los datos colocados en una sola columna, esta es muy til cuando se quieren hacer clculos estadsticos de una respuesta donde tambin se cuenta con informacin de varias

    1. Utilizando los datos resultantes del ejercicio anterior (columna C10 y C11). 2. Ir al men Data > Unstack Columns.

    3. Ingrese la columna que contienen los datos a desagrupar en la ventana Unstack the data in. 4. Ingrese la columna que contiene las etiquetas categricas de los datos a desagrupar en la ventana Using subscripts in. 5. Seleccione la casilla After last column in use, para que los datos desagrupados sean colocados posterior a la ltima columna utilizada.

    6. Posteriormente presione el botn OK.

    Concatenar Esta herramienta permite unir dos columnas de texto en una sola. Los pasos son:

    1. Capture los siguientes datos en la hoja de trabajo de Minitab: C1 C2

    CODIGO COLOR

    2A3_ VERDE

    2D4_ AZUL

    3F1_ CAFE

    3F2_ ROJO

    3F1_ NEGRO

  • IPIW12 Estadstica Aplicada a la Ingeniera

    9

    4D2_ AMARILLO

    1A5_ AZUL

    1A6_ VERDE

    4D1_ CAF

    4D2_ ROJO

    2. Ir a Data > Concatenate, una vez en el cuadro de dialogo seleccionar las columnas CODIGO y COLOR (las columnas de texto que va a ser unidas).

    3. Seleccionar la columna donde los datos concatenados van a ser guardados (Store results in).

    4. Presione el botn OK y en la columna C12 de la hoja de trabajo aparecer el listado de los datos concatenados.

    Clculos con Columnas y Renglones Uso de Calculadora Minitab ofrece una calculadora cientfica para hacer operaciones entre columnas, para ingresar a esta calculadora es necesario ir a Calc > Calculator.

    Por ejemplo:

    1. Capture los siguientes datos en la hoja de trabajo de Minitab:

    C1 C2 C3

    Datos 1 Datos 2 Datos 3

    5 8 6

    5 2 9

    Columnas que contienen los datos.

    Columnas donde aparecer el resultado.

    Expresin a calcular.

    Iconos de acceso rpido para operaciones matemticas.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    10

    2. Ir a Calc > Calculator, ingrese la celda donde

    se guardara el resultado (para este ejemplo C5).

    3. Ingrese la ecuacin matemtica que va a ser

    utilizada para realizar los clculos (para este ejemplo C1

    2 + C2

    3 - C3).

    4. En caso de que se quiera tener la formula

    asignada a la columna C5 de forma permanente, seleccionar la opcin Assign as a formula, esto ofrecer la oportunidad de modificar datos directamente sobre la tabla y que los clculos se actualicen en tiempo real.

    5. Presionar el botn OK y automticamente en la hoja de trabajo aparecer el resultado en la celda C5.

    Estadsticas de Fila Esta es una forma de realizar clculos predefinidos para las filas seleccionadas, funciona a travs de la ruta Calc > Row Statistics. Los pasos son: 1. Capture los siguientes datos en la hoja de trabajo de Minitab:

    C1 C2 C3

    Datos 1 Datos 2 Datos 3

    5 8 6

    5 2 9

    2. Ir a Calc > Row Statistics, ingrese la respuesta estadstica predefinida que se quiere obtener. 3. Seleccione las variables que van a ser parte del estudio (las columnas que van a ser parte del estudio). 4. Seleccione la columna donde se guardaran los resultados.

    5. Posteriormente presione OK y en la columna C6 aparecer la sumatoria de cada lnea de los valores colocados en la celda C1, C2 y C3.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    11

    Estadsticas de Columna Esta es una forma de realizar clculos predefinidos para las columnas seleccionadas, funciona a travs de la ruta Calc > Column Statistics. Los pasos son: 1. Capture los siguientes datos en la hoja de trabajo de Minitab:

    C1 C2 C3

    Datos 1 Datos 2 Datos 3

    5 8 6

    5 2 9

    2. Ir a Calc > Column Statistics, ingrese la respuesta estadstica predefinida que se quiere obtener. 3. Seleccione la columna de datos que va a ser analizada. 4. Presione el botn OK y en la ventana de sesin aparecer el resultado, para este caso aparecer el valor mnimo colocado en la columna C1.

    Clculos a Travs del Editor de Comandos Con esta herramienta se pueden realizar operaciones matemticas a travs de la lnea de comandos, la cual funciona de forma similar al generador de macros de Microsoft Excel, en este editor se pueden predefinir operaciones, anlisis grficos asociados a columnas, que al ser ejecutado el editor de comandos se realizan todos los clculos matemticos evitando introducir las herramientas de una en una. Los pasos son: Esta es una forma de realizar clculos predefinidos para las columnas seleccionadas, funciona a travs de la ruta Calc > Column Statistics. Los pasos son: 1. Capture los siguientes datos en la hoja de trabajo de Minitab:

    C1 C2 C3

    Datos 1 Datos 2 Datos 3

    5 8 6

    5 2 9

    2. Ir a Edit > Command Line Editor e ingresar la siguiente lnea de comando Let C7 = C1 + C2 + C3.

    3. Presionar el botn Submit Commands y automticamente la columna C7 se actualizara con el resultado de la formula ingresada.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    12

    Diagramas

    2

  • IPIW12 Estadstica Aplicada a la Ingeniera

    13

    Grfico de Puntos El grfico de puntos es una herramienta utilizada para graficar datos continuos cuando el conjunto de datos es pequeo, en este tipo de grfico el eje de las abscisas representa los valores de la variable estudiada y la ordenada la frecuencia de aparicin de un valor en el conjunto estudiado, representando cada punto una aparicin de la variable. Grfico de puntos utilizando Minitab:

    1. Capture los siguientes datos en la hoja de trabajo, utilizando para ello una columna: 5 7 2 6 4 7 8 6 7 5

    4 3 7 3 9 5 2 1 6 3

    4 6 8 4 5 2 1 9 4 8

    2. Seleccione la opcin Graph > Dotplot.

    3. Posteriormente seleccione One Y Simple, debido a que solamente estamos analizando un conjunto de datos.

    4. En la celda Graph variables colocar el nombre de la columna donde se encuentren los datos ingresados, presione el botn OK.

    5. Obtenindose el siguiente grfico de puntos.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    14

    En el caso de dos o ms grupos de datos:

    1. Capture los siguientes datos en la hoja de trabajo: Datos 1 Datos 2 Datos 3

    7 2 2

    4 5 1

    7 2 2

    4 5 1

    6 8 7

    5 4 8

    5 5 3

    6 6 7

    7 2 2

    4 5 1

    6 8 7

    7 2 2

    4 5 1

    6 8 7

    4 3 7

    2. Seleccione la opcin Graph > Dotplot.

    3. Una vez que se despligue el siguiente cuadro de dialogo, seleccione la opcin .

    4. En la celda Graph variables colocar el nombre de las columnas donde se encuentren los datos ingresados, una vez realizado esto presione el botn OK.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    15

    5. Con lo cual se obtiene el siguiente diagrama de puntos.

    Diagrama de Tallo y Hojas Es otra forma de representacin de la informacin, este tipo de diagrama permite obtener de forma simultnea una distribucin de frecuencias de la variable y su representacin grfica. Para construirlo primero se ordenan los dgitos principales a la izquierda de una lnea vertical (formando el tallo), registrndose a la derecha de esta lnea el ltimo dgito para cada dato conforme se revisan las observaciones en el orden en que se registran (formando las hojas). Esta representacin grfica se asemeja a un histograma, sin embargo resulta ms fcil de elaborar y muestra mayor informacin. Diagrama de tallo y hojas utilizando Minitab:

    1. Capture los siguientes datos en la hoja de trabajo, utilizando para ello una columna: 2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21

    3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37

    4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79

    4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31

    8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83

    9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67

    11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28

    12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58

    13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07

    15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47

    16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60

    16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74

    17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78

    2. Seleccione la opcin Graph > Steam and leaf en la celda Graph variables colocar el nombre de la columna donde se encuentren los datos ingresados, indicar en la celda de datos increment el incremento deseado, en este caso igual a 10, posteriormente presione el botn OK.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    16

    3. Siendo los resultados mostrados en la ventana de Session de Minitab presentados a continuacin:

    Diagrama de Caja El diagrama de caja es una representacin grfica que facilita la identificacin de las caractersticas ms notables de un conjunto de datos como el centro, la dispersin, la desviacin de la simetra y la identificacin de las observaciones inusuales. En esta representacin grfica es posible observar los siguientes datos:

    Dato menor.

    Cuartil nmero uno (Q1).

    Cuartil nmero dos o mediana (Q2).

    Cuartil nmero tres (Q3).

    Dato mayor.

    Puntos atpicos. Los puntos atpicos se clasifican en:

    Atpicos; siendo aquellos puntos que se encuentran despus de los bigotes del diagrama de caja pero a menos de tres rangos intercuartlicos del borde de la caja.

    Atpicos extremos; siendo aquellos puntos que se localizan despus de los bigotes pero a ms de tres rangos intercuartlicos del borde de la caja.

    Stem-and-Leaf Display: C1

    Stem- and- leaf of C1 N = 130

    Leaf Unit = 1.0

    6 0 234489

    17 1 12356677889

    21 2 0048

    42 3 001223345566667778899

    (25) 4 0003445555556777788888999

    63 5 0000111234455556689999

    41 6 012223445667799

    26 7 011224466789

    14 8 012235899

    5 9 44446

  • IPIW12 Estadstica Aplicada a la Ingeniera

    16

    Diagrama de caja utilizando Minitab:

    1. Capture los siguientes datos en la hoja de trabajo 7, 8, 9, 9, 11, 12, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, nombrando la columna como Datos A.

    2. Seleccione la opcin Graph > Boxplot.

    3. Debido a que solamente estamos analizando un conjunto de datos se selecciona One Y Simple.

    4. Seleccione la variable Datos A como se muestra en la pantalla y presione el botn OK.

    5. A continuacin se muestra el diagrama de

    caja.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    17

    Si el objetivo es comparar dos o ms conjuntos de datos el procedimiento sera el siguiente:

    1. Capture los siguientes datos en la hoja de trabajo: Datos A: 7, 8, 9, 9, 11, 12, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22. Datos B: 5, 7, 7, 9, 10, 10, 11, 12, 12, 15, 16, 16, 16, 18, 18, 18.

    2. Seleccione la opcin Graph > Boxplot.

    3. Debido a que se analizar ms de una columna de datos se selecciona .

    4. Seleccione las variables Datos A y Datos B como se muestra en la pantalla.

    5. Para realizar una mejor comparacin de las diferencias de las medianas, entre los dos conjuntos de datos, seleccione la opcin Data View.

    6. Y active el despliegue de los datos requeridos, tal como se ejemplifica en la figura, posteriormente presione el botn OK.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    18

    7. Presione el botn OK en la ventana , con lo cual

    se obtiene el siguiente diagrama mltiple de caja.

    Histograma Es un tipo especial de grfico de barras utilizado para comunicar informacin sobre las variaciones de un proceso con variables continuas que se han agrupado en clases (barras). Se recomienda cuando se tiene una cantidad grande de datos (mayor o igual a 50), debido a que su utilizacin nos permite analizar la muestra con mayor facilidad y claridad. Se emplea para ilustrar muestras agrupadas en intervalos y est formado por rectngulos unidos a otros, cuyos vrtices de la base coinciden con los lmites de los intervalos de clase y denominndose el centro de cada intervalo como marca de clase, que representamos en el eje de las abscisas. La altura de cada rectngulo es proporcional a la frecuencia del intervalo respectivo. Los pasos para la construccin de un histograma son:

    1. Recolectar los datos. 2. Determinar el rango de los datos, calculado mediante la diferencia del dato mayor y el dato menor. 3. Determinar el nmero de los intervalos de clases, por lo general el nmero de los intervalos de

    clases vara entre cinco y quince, existen diversas formas de calcular el nmero siendo la ms utilizada la raz cuadrada del total de los datos, donde el entero positivo mayor es el nmero de clases a utilizar obtenindose la longitud de la clase dividiendo el rango entre el numero de clases.

    4. Construir los intervalos de clases, los puntos medios de cada intervalo de clase se le denomina marca de clase.

    5. Graficar el histograma donde el eje de las abscisas ser el intervalo de clase y el eje de las ordenadas la frecuencia de los datos obtenidos por cada clase, esta construccin del histograma se realiza mediante barras.

    6. La unin de los puntos medios de la base superior de cada barra se le conoce como polgono de frecuencias.

    Histograma utilizando Minitab:

    1. Capture los siguientes datos en la hoja de trabajo, nombrando la columna como Datos: 2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21

    3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37

    4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79

    4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31

    8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83

    9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67

    11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28

    12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58

    13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07

    15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47

    16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60

    16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74

    17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78

  • IPIW12 Estadstica Aplicada a la Ingeniera

    19

    2. Seleccione la opcin Graph > Histogram (With Fit), si requerimos que se nos presente un grfico con una lnea que represente una distribucin de probabilidad.

    3. Seleccione la variable Datos como se muestra en la pantalla y presione el botn OK.

    4. Mostrndose el histograma.

    Diagrama de dispersin El diagrama de dispersin es una tcnica estadstica utilizada para estudiar la relacin entre dos variables. Por ejemplo, entre una caracterstica de calidad y un factor que le afecta. La ventaja de utilizar este tipo de diagramas radica en que se tiene una comprensin ms profunda del problema planteado. La relacin entre dos variables se representa mediante una grfica de dos dimensiones en la que cada relacin est dada por un par de puntos (uno para cada variable). La variable del eje horizontal X normalmente es la variable causa, y la variable del eje vertical Y es la variable efecto. La relacin entre dos variables puede ser positiva o negativa. Si es positiva, significa que un aumento en la variable causa X provocar una aumento en la variable efecto Y y si es negativa significa que una disminucin en la variable X provocar una disminucin en la variable Y.

    Diagrama de dispersin utilizando Minitab:

    1. Ingrese los siguiente datos en la hoja de trabajo de Minitab: Servicios (X) Tiempo (Y) Servicios (X) Tiempo (Y) Servicios (X) Tiempo (Y)

    2 9.95 8 27.50 10 34.93

    8 24.45 4 17.08 15 46.59

    11 31.75 11 37.00 15 44.88

    10 35.00 12 41.95 16 54.12

  • IPIW12 Estadstica Aplicada a la Ingeniera

    20

    8 25.02 2 11.66 17 56.63

    4 16.86 4 21.65 6 22.13

    2 14.38 4 17.89 5 21.15

    2 9.60 20 69.00

    9 24.35 1 10.30

    2. Seleccione la opcin Graph> Scatterplot (Simple). Agregue las variables correspondientes y presione el botn OK.

    3. Obtenindose el diagrama de dispersin siguiente.

    4. Tambin es posible obtener un diagrama de dispersin con una recta de regresin, para ello en el punto 2 se selecciona la opcin Graph> Scatterplot (With Regression) o dando clic derecho en el mouse sobre la grfica obtenida en el punto 3 se selecciona Add > Regression Fit y en el cuadro de dialogo seleccionar el tipo de ajuste (Linear, Quadratic o Cubic).

  • IPIW12 Estadstica Aplicada a la Ingeniera

    21

    Anlisis de Tendencias Esta herramienta ajusta un modelo general de tendencias una serie de datos a travs del tiempo, los modelos disponibles para ser ajustados son un modelo lineal, un modelo cuadrtico, un modelo exponencial y un modelo de curva s. Grfico de tendencias utilizando Minitab:

    1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Tendencia.

    2. Acceder a Stat > Time Series > Trend Analysis en Variable seleccionar la columna Trade, Model Type seleccionar Linear y presionar el boton OK.

    3. Con lo cual se obtiene el siguiente grfico de tendencias para un modelo lineal. En caso de que se desee determinar cul modelo se ajusta mejor a una serie de datos ser necesario generar una grfica de tendencia para cada uno de los modelos (Linear, Quadratic, Exponential y S-Curve) y con el ndice MAD (desviacin media absoluta), que mide la exactitud de los valores estimados de la serie de tiempo, se podr realizar esta determinacin.

    Analizando los valores MAD se tiene:

    MAD Lineal = 6.6177

    MAD Cuadrtico = 5.9566

    MAD Exponencial = 6.4618

    MAD Curva S = 6.0789

    Siendo el modelo que mejor se aproxima el que tenga menor MAD, en este caso el modelo cuadrtico.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    22

    Diagrama de Pareto Una de las siete herramientas estadsticas bsicas para la solucin de problemas fue nombrado en honor de Vilfredo Pareto quien al realizar estudios sobre la distribucin de la riqueza descubri que la minora de la poblacin posea la mayor parte de la riqueza y la mayora de la poblacin posea la menor parte de la riqueza. Posteriormente el Dr. Joseph Juran aplic el concepto a la calidad con lo cual se obtuvo lo que hoy se conoce como la regla 80/20; es decir, el 20% de las causas resuelven el 80% del problema y el 80% de las causas resuelven solamente el 20% del problema. El diagrama de Pareto es una grfica de dos dimensiones que se construye listando las causas de un problema en el eje horizontal, empezando por la izquierda para colocar aquellas que tienen un mayor efecto sobre el problema, de manera que vayan disminuyendo en orden de magnitud. El eje vertical se dibuja en ambos lados del diagrama: el lado izquierdo representa la magnitud del efecto provocado por las causas, mientras que el lado derecho refleja el porcentaje acumulado de efecto de las causas, empezando por la de mayor magnitud. Diagrama de Pareto utilizando Minitab:

    1. Capture los siguientes datos en la columna C1 (tipo de defecto), en la columna C2 (frecuencias). En caso de que los datos no estuvieran agrupados solamente puede colocar los defectos en la columna C1.

    Defecto Frecuencias

    Terminal Abierta 5

    Terminal Doblada 1

    Terminal Faltante 15

    Soldadura Faltante 43

    Falla Elctrica 5

    SMD Faltante 7

    2. Seleccione la opcin Stat > Quality Tools > Pareto Chart.

    3. Coloque los defectos y las frecuencias de acuerdo a la imagen siguiente.

    4. En caso de que no quiera que todos los tipos de defectos se muestren es posible combinar los defectos con porcentaje marginal, para esto es necesario colocar el porcentaje acumulado a partir del cual se combinaran las categoras. Esto se hace en Combine remaining defects into one category after this percent si esto no le interesa seleccione la opcin Do not combine y posteriormente presione OK.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    23

    5. El sistema despliega la grfica de Pareto siguiente.

    Tambin es posible realizar un diagrama de Pareto agregndole una variable categrica, a continuacin se presenta el diagrama de Pareto obtenido con el archivo Ejemplo Pareto que puede ser consultado en el material provisto.

    1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Pareto.

    2. Una vez abierto seleccione la opcin: Stat > Quality Tools > Pareto Chart.

    3. Coloque los defectos y la variable de categorizacin conforme a la imagen siguiente:

    4. En caso de que no quiera que todos los tipos de defectos se muestren es posible combinar los defectos con porcentaje marginal, para esto es necesario colocar el porcentaje acumulado a partir del cual se combinaran las categoras. Esto se hace en Combine remaining defects into one category after this percent si esto no le interesa seleccione la opcin Do not combine y posteriormente presione OK.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    24

    5. Desplegndose la grfica de Pareto mostrada a continuacin.

    Diagrama Causa Efecto Tambin conocido como diagrama de Ishikawa o de pescado, este grfico es utilizado para identificar las posibles causas de un problema especfico y su naturaleza grfica permite determinar de manera exacta las posibles causas principales. Para desarrollar este diagrama es necesario seguir los siguientes pasos:

    1. Definir y determinar claramente el problema o el efecto que va a ser analizado. 2. Identificar los factores o causas que originan el efecto, generalmente mediante una lluvia de ideas y

    agrupando estos aquinaria, materiales, mtodos, mano de obra, .

    3. Representacin del diagrama mediante la colocacin de las causas agrupadas por sus caractersticas similares.

    4. Anlisis de las relaciones causa-efecto que se derivan de la construccin del diagrama. Teniendo este diagrama las ventajas de proporcionar una metodologa racional para la solucin de los problemas, permitir sistematizar las posibles causas de un problema, favorecer el trabajo en equipo permitiendo que los trabajadores planteen de forma creativa sus opiniones de forma clara y eficaz.

    Diagrama de causa y efecto utilizando Minitab:

    1. Capture los siguientes datos en una hoja de trabajo de Minitab: MEDIO AMBIENTE MATERIALES MANO DE OBRA METODOS MAQUINARIA

    Polvo Forma Salud Ajuste Mantenimiento

    Vibraciones Dureza Habilidad Velocidad Deformacin

    Humedad Almacn Humor Abrasin

    Temperatura Herramental

    FORMA ALMACEN HABILIDAD HUMOR

    Dimetro Tiempo Seleccin Horas

    Curvatura Ambiente Formacin Moral

    Experiencia Cansancio

    secundarias.

    2. Seleccione la opcin Stat > Quality Tools > Cause and Effect.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    25

    3. En el cuadro de dialogo coloque en la columna Causes las causas principales ingresadas en la hoja de trabajo, en la columna Label el nombre que se desea que aparezca como caracterstica principal.

    4. En caso de existir causas secundarias seleccionar el botn Sub relacionado a la causa principal, dentro de ese cuadro ingresar las causas secundarias y presionar el botn OK.

    5. Si se desea agregar titulo al efecto (Effect) y a la grfica (Title) utilice las celdas correspondientes y posteriormente presionar el botn OK. Con lo cual se obtiene el diagrama de causa efecto siguiente.

    Si se desea cambiar el tamao o el tipo de letra hacer doble clic en los ttulos y seleccionar el tamao o el tipo de letra deseado.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    26

    Estadstica Descriptiva

    3

  • IPIW12 Estadstica Aplicada a la Ingeniera

    27

    Estadstica descriptiva Es una rama de las matemticas que comprende la recopilacin, tabulacin, anlisis e interpretacin de datos cuantitativos y cualitativos, para tomar decisiones que se requieran a fin de que el comportamiento de los datos se mantengan dentro de los parmetros de control establecidos. Algunos conceptos de la estadstica descriptiva son:

    Poblacin (N); es el conjunto de todos los elementos de inters para determinado estudio.

    Parmetro; es una caracterstica numrica de la poblacin, se identifica con letras griegas (media = , desviacin estndar =

    Muestra (n); es una parte de la poblacin, debe ser representativa de la misma.

    Estadstico; es una caracterstica numrica de una muestra, se identifica con letras latinas (media = x , desviacin estndar = s, proporcin = p, coeficiente de correlacin = r)

    La estadstica descriptiva proporciona un criterio para lograr mejoras, debido a que sus tcnicas se pueden usar para describir y comprender la variabilidad. La estadstica inferencial se refiere a la estimacin de parmetros y pruebas de hiptesis acerca de las caractersticas de la poblacin en base a los datos obtenidos con una muestra.

    Medidas de tendencia central Las medidas de tendencia central nos permiten identificar los valores ms representativos de los datos, de acuerdo a la manera de cmo se tienden a concentrar, estas son:

    Media ( x ); es el promedio aritmtico de todos los valores que componen el conjunto de datos. Se calcula mediante la siguiente frmula:

    n

    xix

    n

    xi

    Media acotada (Truncated Mean); para obtener esta medida de tendencia central, determinado porcentaje de los valores ms altos y bajos de un conjunto de datos son eliminados (tomando nmeros enteros), siendo calculada la media con los valores restantes.

    Mediana ( x~ ); Los datos de "n" observaciones son ordenados del ms pequeo al ms grande, si el tamao de la muestra es "non" la mediana es el valor ordenado en la posicin (n+1)/2, cuando el tamao de la muestra es "par" la mediana es el promedio de los dos valores que se encuentran al centro del conjunto de valores. Se puede calcular mediante:

    2

    1~ 22nn

    x

    Moda; es el valor que ms se repite dentro de los datos.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    28

    Medidas de dispersin Son las medidas que describen la variabilidad de los valores al ser contrastados contra ciertos valores centrales.

    Varianza de los datos; es una medida que nos ayuda a comprender la variabilidad de los datos, es decir que tan distanciados estn de la media:

    Para el caso de una poblacin n

    xxi 22 )(

    Para el caso de una muestra 1

    )( 22

    n

    xxis

    Desviacin estndar; es la raz cuadrada de la varianza:

    Para el caso de una poblacin n

    xxi 2)(

    Para el caso de una muestra 1

    )( 2

    n

    xxis

    Rango (R); es la diferencia positiva entre el valor mayor y el valor menor de un conjunto de datos.

    Coeficiente de Variacin (CV); se utiliza para comparar la dispersin de dos conjuntos de datos que tienen unidades diferentes, ya que representa una medida relativa de dispersin.

    )100(x

    sCV

    Cuartiles; los cuartiles dividen al conjunto de observaciones en 4 partes iguales, el primer cuartil es ese valor debajo del cual clasifica el 25% de las observaciones, el tercer cuartil es el valor por debajo del cual se encuentran el 75% de las observaciones, siendo el segundo cuartil la mediana.

    Deciles; los deciles separan un conjunto de datos ordenado en 10 subconjuntos iguales.

    Percentiles; los percentiles separan un conjunto de datos ordenado en 100 partes, la ubicacin de un percentil se calcula mediante:

    100)1(

    PnLp

    Estadstica descriptiva utilizando Minitab:

    1. Capture los siguientes datos en la hoja de trabajo, nombrando la columna como Datos: 2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21

    3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37

    4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79

    4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31

    8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83

    9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67

    11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28

    12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58

    13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07

    15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47

    16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60

    16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74

    17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78

  • IPIW12 Estadstica Aplicada a la Ingeniera

    29

    2. Seleccione Stat > Basic statistics > Display descriptive statistics posteriormente en la celda Variables ingrese el nombre de la columna que contiene los datos.

    3. Presionando el botn Statistics es posible seleccionar las medidas de tendencia central o dispersin requeridas, posteriormente de clic en OK.

    4. Obtenindose los siguientes datos en la ventana de Session.

    Descriptive Statistics: Datos Variable N N* Mean SE Mean StDev Variance CoefVar Minimum Q1

    Datos 130 0 50.05 1.97 22.50 506.47 44.96 2.41 36.13

    Variable Median Q3 Maximum

    Datos 49.34 65.63 96.78

  • IPIW12 Estadstica Aplicada a la Ingeniera

    30

    Regresin y Correlacin

    4

  • IPIW12 Estadstica Aplicada a la Ingeniera

    31

    Correlacin, Regresin Simple y Mltiple La regresin es la tcnica estadstica utilizada para cuantificar la asociacin estadstica entre dos o ms variables, trata de encontrar

    El modelo matemtico de la regresin lineal puede ser expresado como:

    pp XBXBXBBY ...22110

    Donde 0B es la constante y )0(iBi son los parmetros respectivos a cada una de las variables

    independientes y p el nmero de parmetros independientes a ser considerados en el anlisis de regresin. La correlacin indica la fuerza y la direccin de una relacin lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una de las variables varan sistemticamente con respecto a los valores homnimos de la otra. Sin embargo es importante notar que la correlacin entre dos variables no implica, por si misma, ninguna relacin de causalidad. Existen diversos coeficientes que miden el grado de correlacin, adaptados a la naturaleza de los datos. El ms conocido es el coeficiente de correlacin de Pearson (introducido por Francis Galton), que se obtiene dividiendo la covarianza de dos variables por el producto de sus desviaciones estndar.

    Correlacin Positiva

    Evidente

    0

    5

    10

    15

    20

    25

    0 5 10 15 20 25

    X

    Y

    Correlacin Negativa

    Evidente

    0

    5

    10

    15

    20

    25

    0 5 10 15 20 25

    X

    Y

    Correlacin

    Positiva

    0

    5

    10

    15

    20

    25

    0 5 10 15 20 25

    X

    Y

    Correlacin

    Negativa

    0

    5

    10

    15

    20

    25

    0 5 10 15 20 25

    X

    Y

    Sin Correlacin

    10

    15

    20

    25

    5 10 15 20 25

    X

    Y

    0

    5

    0

    Correlacin Positiva

    Evidente

    0

    5

    10

    15

    20

    25

    0 5 10 15 20 25

    X

    Y

    Correlacin Negativa

    Evidente

    0

    5

    10

    15

    20

    25

    0 5 10 15 20 25

    X

    Y

    Correlacin

    Positiva

    0

    5

    10

    15

    20

    25

    0 5 10 15 20 25

    X

    Y

    Correlacin

    Negativa

    0

    5

    10

    15

    20

    25

    0 5 10 15 20 25

    X

    Y

    Sin Correlacin

    10

    15

    20

    25

    5 10 15 20 25

    X

    Y

    0

    5

    0

    Para que un modelo pueda ser considerado

    cuadrado (coeficiente de determinacin) debe de ser mayor o igual al 70%, porcentaje que indica el grado de inclusin de la variabilidad

    en el modelo matemtico.

    http://es.wikipedia.org/wiki/Francis_Galton
  • IPIW12 Estadstica Aplicada a la Ingeniera

    32

    Calculo del coeficiente de correlacin utilizando Minitab: Como se mencion anteriormente la correlacin indica la fuerza y la direccin de una relacin lineal entre dos variables aleatorias. Minitab nos permite realizar una prueba de correlacin de variables para ello es necesario seguir los siguientes pasos: 1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin, de este

    archivo solamente vamos a utilizar las columnas Peso (Weight) y Altura (Height).

    2. Antes de calcular el coeficiente de correlacin se sugiere realizar un diagrama de dispersin para Graph > Scatterplot > Simple con Y = Weight

    y X = Height, obtenindose la siguiente grafica.

    Claramente se observa que se tiene una correlacin positiva, siendo nuestro inters evaluar si el grado de relacin existente es significativa o no lo es.

    3. Seleccione en Stat > Basic Statistics > Correlation las variables Height y Weight, posteriormente seleccione la opcin Display p-values.

    4. Obtenindose los resultados mostrados a continuacin.

    Concluyndose que debido a que el

    valor P < (menor que 0.05) la correlacin si es significativa.

    Correlations: Height, Weight Pearson correlation of Height and Weight = 0.785

    P- Value = 0.000

  • IPIW12 Estadstica Aplicada a la Ingeniera

    33

    Si se desea agregar una variable mas para el anlisis de la correlacin:

    1. Seleccione en Stat > Basic Statistics > Correlation las variables Height, Weight y Pulse1 posteriormente se selecciona la opcin Display p-values.

    2. Obtenindose los siguientes resultados en la ventana de Session.

    Calculo de la covarianza utilizando Minitab: La covarianza mide la relacin existente entre dos variables sin embargo este dato no se encuentra estandarizado como sucede con el coeficiente de correlacin, es decir dividido por la desviacin estndar de las dos variables.

    1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Covarianza.

    2. Seleccionar en Stat > Basic Statistics > Covariance las variables Verbal, Math y GPA, posteriormente presionar el botn OK.

    Correlations: Height, Weight, Pulse1 Height Weight

    Weight 0.785 Correlacin

    0.000 Valor P

    Pulse1 - 0.212 - 0.202 Correlacin

    0.043 0.053 Valor P

    Cell Contents: Pearson correlation

    P- Value

  • IPIW12 Estadstica Aplicada a la Ingeniera

    34

    3. Obtenindose los siguientes resultados en la ventana de Session.

    Regresin por medio de un ajuste de lnea utilizando Minitab:

    1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresion, de este archivo solamente vamos a utilizar las columnas Peso (Weight) y Altura (Height).

    2. Seleccione en Stat > Regression > Fitted Line Plot las variable de respuesta (Y) Weight y la variable predictora (X) Height posteriormente seleccione en el tipo de modelo de regresin la opcin Linear (alternativamente puede seleccionar Quadratic o Cubic), presione OK cuando termine.

    3. Mediante lo cual se obtiene la grafica siguiente.

    Ecuacin de regresin. S = Desviacin estndar de los residuos (valor real estimado por la regresin). R-Sq = Coeficiente de determinacin, que indica el porcentaje de inclusin de la variabilidad en la ecuacin de regresin. R-Sq (Adj) = Coeficiente de determinacin utilizado solamente para regresin mltiple.

    Covariances: Verbal, Math, GPA Verbal Math GPA

    Verbal 5359.6859

    Math 1333.9704 4401.9388

    GPA 13.6995 7.4790 0.3368

  • IPIW12 Estadstica Aplicada a la Ingeniera

    35

    4. Y los siguientes resultados en la ventana de Session.

    Los cuales pueden ser interpretados de la siguiente forma: Debido a que el valor P < 0.05 las variables peso (weight) y altura (height) tienen correlacin significativa. Pero el modelo solamente incluye el 61.6% de la variabilidad presente, por tanto no puede considerarse como una buena ecuacin predictora.

    En el caso que se desee determinar qu modelo matemtico se ajusta ms, es necesario realizar un anlisis de regresin lineal, cuadrtico y cubico y mediante los valores de R-Sq se concluir que el tipo de modelo que incluye en mayor medida la variabilidad (mayor valor de R-Sq). Anlisis de regresin lineal simple utilizando Minitab:

    1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin, de este archivo solamente vamos a utilizar las columnas Peso (Weight) y Altura (Height).

    2. Seleccione en Stat > Regression > Regression las variable de respuesta (Y) Weight y la variable predictora (X) Height.

    3. Para visualizar las grficas de residuales seleccione el botn y en el cuadro de dialogo seleccione la opcin Four in one, presione el botn OK.

    Regression Analysis: Weight versus Height The regression equation is

    Weight = - 204.7 + 5.092 Height

    S = 14.7920 R - Sq = 61.6% R - Sq(adj) = 61.2%

    Analysis of Variance

    Source DF SS MS F P

    Regression 1 31591.6 31591.6 144.38 0.000

    Error 90 19692.2 218.8

    Total 91 51283.9

  • IPIW12 Estadstica Aplicada a la Ingeniera

    36

    4. Mostrndose los siguientes resultados en la ventana de Session y en una grfica de residuales.

    Los cuales pueden ser interpretados de la siguiente forma: Debido a que el valor P < 0.05 las variables peso (weight) y altura (height) tienen correlacin significativa. Sin embargo el modelo solamente incluye el 61.6% de la variabilidad presente, por tanto no puede considerarse como una buena ecuacin predictora. Asimismo en la seccin de observaciones inusuales se muestran datos que es necesario revisar, generalmente estos datos estn acompaados de una letra donde R denota las observaciones con un residual estandarizado demasiado grande y X denota observaciones muy alejadas de la mayora de las observaciones, los cuales pueden sesgar los resultados (es decir tienen demasiada influencia).

    Regression Analysis: Weight versus Height The regression equation is

    Weight = - 205 + 5.09 Height

    Predictor Coef SE Coef T P

    Constant - 204.74 29.16 - 7.02 0.000

    Height 5.0918 0.4237 12.02 0.000

    S = 14.7920 R - Sq = 61.6% R - Sq(adj) = 61.2%

    Analysis of Variance

    Source DF SS MS F P

    Regression 1 31592 31592 144.38 0.000

    Residual Error 90 19692 219

    Total 91 51284

    Unusual Observations

    Obs Height Weight Fit SE Fit Residual St Resid

    9 72.0 195.00 161.87 2.08 33.13 2.26R

    25 61.0 140.00 105.86 3.62 34.14 2.38R

    40 72.0 215.00 161.87 2.08 53.13 3.63R

    84 68.0 110.00 141.50 1.57 - 31.50 - 2.14R

    R denotes an observation with a large standardized residual.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    37

    Anlisis de regresin lineal mltiple utilizando Minitab:

    1. Capture el siguiente ejemplo en la hoja de trabajo de Minitab: Cdigo Algoritmos

    (X1) Base de

    Datos (X2) Programacin

    (X3) PHP (Y)

    1 15 15 13 13

    2 14 13 12 13

    3 16 13 14 13

    4 20 14 16 15

    5 18 18 17 16

    6 16 17 15 15

    7 13 15 11 12

    8 16 14 15 13

    9 15 14 13 13

    10 14 13 10 13

    11 12 12 10 11

    12 16 11 14 14

    13 17 16 15 15

    14 19 14 16 15

    15 13 15 10 15

    2. Seleccione en Stat > Regression > Regression la variable de respuesta (Y) PHP y las v Algoritmos, Base de Datos y Programacin, posteriormente presione el botn en OK.

    3. Obtenindose los resultados siguientes.

    Regression Analysis: PHP (Y) versus Algoritmos (, Base de Dato, ... The regression equation is

    PHP (Y) = 2.55 + 0.583 Algoritmos (X1) + 0.373 Base de Datos (X2)

    - 0.242 Programacin (X3)

    Predictor Coef SE Coef T P

    Constan t 2.551 2.369 1.08 0.305

    Algoritmos (X1) 0.5827 0.2665 2.19 0.051

    Base de Datos (X2) 0.3735 0.1442 2.59 0.025

    Programacin (X3) - 0.2415 0.2704 - 0.89 0.391

    S = 0.861265 R - Sq = 69.7% R - Sq(adj) = 61.4%

    Analysis of Variance

    Source DF SS MS F P

    Regression 3 18.7738 6.2579 8.44 0.003

    Residual Error 11 8.1595 0.7418

    Total 14 26.9333

    Source DF Seq SS

    Algoritmos (X1) 1 13.7704

    Base de Datos (X 2) 1 4.4117

    Programacin (X3) 1 0.5917

    Unusual Observations

    Algoritmos

    Obs (X1) PHP (Y) Fit SE Fit Residual St Resid

    12 16.0 14.000 12.601 0.560 1.399 2.14R

    15 13.0 15.000 13.313 0.508 1 .687 2.42R

    R denotes an observation with a large standardized residual.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    38

    Seleccin de la mejor ecuacin predictora para regresin lineal multiple utilizando Minitab: Cuando el nmero de variables regresoras es considerado grande se tiene la necesidad de determinar cuales de esas variables deben entrar al modelo de regresin y que variables no deben de entrar en el modelo. Intuitivamente puede parecer bueno introducir en el modelo todas las variables regresoras pero este procedimiento no es adecuado porque en el clculo de la varianza del modelo influye el nmero de variables presentes lo que ocasiona que el clculo de R

    2 (R-Sq) aumente al aumentar el nmero de

    regresores. Adems puede haber problemas de multicolinealidad Por tanto, para seleccionar las variables regresoras es posible utilizar procedimientos paso a paso (stepwise), que bajo la hiptesis de que la relacin entre las variables regresoras y la variable respuesta es lineal, permiten elegir el subconjunto de variables regresoras que deben estar en el modelo. Entre estos procedimientos paso a paso se encuentran:

    Eliminacin progresiva (backward stepwise regression); este procedimiento parte del modelo de regresin con todas las variables regresoras y en cada etapa elimina la variable menos influyente segn el contraste individual del valor P (valor t o F en caso de un procedimiento manual) hasta una cierta regla de parada. El procedimiento de eliminacin progresiva tiene la desventaja de necesitar mucha capacidad de clculo si el nmero de variables regresoras es grande y lleva a problemas de multicolinealidad si las variables estn relacionadas. Tiene la ventaja de no eliminar variables significativas.

    Introduccin progresiva (fordward regression); este algoritmo funciona de forma inversa a la eliminacin progresiva, parte del modelo sin ninguna variable regresora y en cada etapa se introduce la ms significativa hasta una cierta regla de parada. Este procedimiento tiene la ventaja de necesitar menos clculo, pero presenta dos graves inconvenientes, el primero, que pueden aparecer errores de especificacin porque las variables introducidas permanecen en el modelo aunque el algoritmo en pasos sucesivos introduzca nuevas variables que aportan la informacin de las primeras. Este algoritmo tambin falla si el contraste conjunto es significativo pero los individuos no lo son, ya que no introduce variables regresoras.

    Regresin paso a paso (stepwise regression); este mtodo es una combinacin de los procedimientos anteriores, comienza como el de introduccin progresiva, pero en cada etapa se plantea si todas las variables introducidas deben de permanecer. El algoritmo se termina cuando ninguna variable entra o sale del modelo.

    Otro mtodo para encontrar el modelo de regresin es el de mejores subconjuntos (best subsets) que analiza todos los posibles subconjuntos que pueden formarse con las variables y mediante la utilizacin de la medida de bondad de ajuste (R

    2 ajustada) se determina cul de estos subconjuntos es ms adecuado,

    sin embargo realizar una exploracin completa resulta costoso en tiempos computacionales por tanto este mtodo hace uso del algoritmo de ramificacin y acotacin (branch-and-bound) para obtener implcitamente todas las posibles regresiones e identificar el mejor subconjunto de un determinado nmero de variables regresoras segn un criterio de ajuste predeterminado.

    1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin.

    2. Seleccione en Stat > Regression > Regression la variable de respuesta (Y) Peso (Weight) y las

  • IPIW12 Estadstica Aplicada a la Ingeniera

    39

    3. Para visualizar las grficas de residuales seleccione el botn y en el cuadro de dialogo seleccione la opcin Four in one, presione el botn OK.

    4. Con lo cual se obtienen los resultados siguientes:

    Cinco de las variables regresoras incluidas en el modelo nos dan valores P mayores a 0.05 lo que es indicativo que el modelo no es un buen modelo en funcin de su sencillez o facilidad de interpretacin. El modelo de regresin lineal mltiple nos muestra un coeficiente de determinacin ajustado de 66.2% lo cual no puede ser considerado como bueno.

    Regression Analysis: Weight versus Pulse1, Pulse2, ...

    The regression equation is

    Weight = - 54.4 + 0.074 Pulse1 - 0.154 Pulse2 - 5.67 Ran - 6.09 Smokes

    - 12.8 Sex + 3.64 Height - 2.86 Activity

    Predictor Coef SE Coef T P

    Constant - 54.44 47.87 - 1.14 0.259

    Pulse1 0.0738 0.1936 0.38 0.704 No significativo (P > 0.05)

    Pulse2 - 0.1542 0.1634 - 0.94 0.348 No significativo (P > 0.05)

    Ran - 5.672 4.511 - 1.26 0.212 No significativo (P > 0.05)

    Smokes - 6.087 3.253 - 1.87 0.065 No significativo (P > 0.05)

    Sex - 12.823 4.543 - 2.82 0.006

    Height 3.6351 0.5808 6.26 0.000

    Activity - 2.861 2.484 - 1.15 0.253 No significativo (P > 0.05)

    S = 13.8107 R - Sq = 68.8% R - Sq(adj) = 66.2%

    Analysis of Variance

    Source DF SS MS F P

    Regression 7 35262.1 5037.4 26.41 0.000

    Residual Error 84 16021.7 190.7

    Total 91 51283.9

    Source DF Seq SS

    Pulse1 1 2097.1

    Pulse2 1 160.0

    Ran 1 7042.0

    Smokes 1 1683.4

    Sex 1 16539.7

    Height 1 7486.8

    Activity 1 253.0

    Unusual Observations

    Obs Pulse1 Weight Fit SE Fit Residual St Resid

    9 62 195.00 163.90 3.25 31.10 2.32R

    25 96 140.00 103.58 6.37 36.42 2.97R

    40 76 215.00 159.11 2.93 55.89 4.14R

    R denotes an observation with a large standardized residual.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    40

    Mtodo de los mejores subconjuntos (best subsets)

    1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin.

    2. Seleccione en Stat > Regression > Best Subsets como variable de respuesta (Y) Peso (Weight), en Free predictors se colocan las variables candidatas a entrar al modelo y en la seccin Predictors in all models se colocan las variables forzadas a entrar en el modelo.

    3. Presionando el botn se despliega el cuadro de dialogo donde es posible acotar el proceso de bsqueda del mejor modelo por medio del mtodo de los mejores subconjuntos. Llenndose la informacin de la siguiente manera:

    En Free Predictor (s) in Each Model se colocan la cantidad minima y mxima de variables a ser anaizada en el proceso de bsqueda.

    En Models of each size to print se coloca el nmero de ecuaciones que apareceran desplegadas en la ventana de Session con 1, 2,

  • IPIW12 Estadstica Aplicada a la Ingeniera

    41

    4. Una vez completada la informacin requerida se presiona OK las veces necesarias, con lo cual se despliega la siguiente informacin en la ventana de Session:

    Si nos centramos en los valores del coeficiente de determinacin ajustado los modelos que tengan mayor valor son los mejores. Sin embargo debido a que tenemos un empate, es posible utilizar el principio de parsimonia (el modelo ms sencillo es el mejor) siendo el mejor modelo el compuesto por tres variables. Ahora bien, en caso de que no se quiera utilizar este principio tambin es posible utilizar el estadstico Cp de Mallows (que incluye el sesgo en el clculo del coeficiente) el cual nos dice que el mejor modelo es el que tiene el menor valor de este estadstico.

    Por tanto para este ejemplo y utilizando el mtodo de los mejores subconjuntos el modelo de regresin lineal mltiple que mejor se ajusta a los datos es:

    Weight = - 82.7 - 6.74 Smokes - 13.5 Sex + 3.75 Height El cul es obtenido mediante el anlisis de regresin lineal mltiple explicado con antelacin. Mtodo de regresin paso a paso (stepwise regression)

    1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin.

    2. Seleccione en Stat > Regression > Stepwise, como variable de respuesta (Y) Peso (Weight), en Predictors se colocan las variables candidatas a entrar al modelo y en la seccin Predictors in all models se colocan las variables forzadas a entrar en el modelo

    Best Subsets Regression: Weight versus Pulse1, Pulse2, ... Response is Weight

    A

    c

    P P S H t

    u u m e i

    l l o i v

    s s R k S g i

    Mallows e e a e e h t

    Vars R - Sq R - Sq(adj) Cp S 1 2 n s x t y

    1 61.6 61.2 15.2 14.792 X

    1 50.2 49.7 45.8 16.842 X

    2 66.1 65.3 5.2 13.981 X X

    2 64.0 63.2 10.7 14.396 X X

    3 67.8 66.7 2.7 13.705 X X X

    3 66.7 65.5 5.6 13.935 X X X

    4 68.1 66.7 3.7 13.705 X X X X

    4 68.0 66.5 4.0 13.733 X X X X

    5 68.4 66.5 5.0 13.733 X X X X X

    5 68.2 66.4 5.4 13.762 X X X X X

    6 68.7 66.5 6.1 13.741 X X X X X X

    6 68.4 66.2 6.9 13.802 X X X X X X

    7 68.8 66.2 8.0 13.811 X X X X X X X

  • IPIW12 Estadstica Aplicada a la Ingeniera

    42

    3. Presionando el botn se despliega el cuadro de dialogo donde es posible seleccionar los criterios de entrada y salida de las variables, seleccionndose la opcin Stepwise.

    4. Una vez completada la informacin requerida se presiona OK las veces necesarias, con lo cual se despliega la siguiente informacin en la ventana de Session:

    Donde se nos muestra las variables que entran en cada paso y la calidad de su ajuste (determinando al mejor modelo con el valor del coeficiente R-Sq ajustado o con el estadstico de Mallows Cp). Resultando que la mejor ecuacin de regresin es:

    Weight = - 82.67 + 3.75 Height - 13.5 Sex - 6.7 Smokes

    La cul es obtenida directamente al observar los resultados de la ventana de Session.

    Introduccin progresiva (fordward regression)

    1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin.

    2. Seleccione en Stat > Regression > Stepwise, como variable de respuesta (Y) Peso (Weight), en Predictors se colocan las variables candidatas a entrar al modelo y en la seccin Predictors in all models se colocan las variables forzadas a entrar en el modelo.

    Stepwise Regression: Weight versus Pulse1, Pulse2, ... Alpha - to - Enter: 0.1 5 Alpha - to - Remove: 0.15

    Response is Weight on 7 predictors, with N = 92

    Step 1 2 3

    Constant - 204.74 - 88.20 - 82.67

    Height 5.09 3.69 3.75

    T- Value 12.02 6.45 6.68

    P- Value 0.000 0.000 0.000

    Sex - 14.7 - 13.5

    T- Value - 3.43 - 3.19

    P- Value 0.001 0.002

    Smokes - 6.7

    T- Value - 2.15

    P- Value 0.034

    S 14.8 14.0 13.7

    R- Sq 61.60 66.08 67.77

    R- Sq(adj) 61.17 65.31 66.67

    Mallows Cp 15.2 5.2 2.7

  • IPIW12 Estadstica Aplicada a la Ingeniera

    43

    3. Presionando el botn Methods se

    despliega el cuadro de dialogo donde es posible seleccionar los criterios de entrada de las variables, seleccionndose la opcin Fordward selection.

    4. Una vez completada la informacin requerida se presiona OK las veces necesarias, con lo cual se despliega la siguiente informacin en la ventana de Session:

    Donde se nos muestra que las variables que entran en cada paso son las que tienen el valor P igual o menor al especificado y la calidad del su ajuste de cada uno de los modelos (determinando al mejor modelo con el valor del coeficiente R-Sq ajustado o con el estadstico de Mallows Cp). Resultando que la mejor ecuacin de regresin es:

    Weight = - 82.67 + 3.75 Height - 13.5 Sex - 6.7 Smokes

    La cul es obtenida directamente al observar los resultados de la ventana de Session. Eliminacin progresiva (backward stepwise regression

    1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin.

    2. Seleccione en Stat > Regression > Stepwise, como variable de respuesta (Y) Peso (Weight), en Predictors se colocan las variables candidatas a entrar al modelo y en la seccin Predictors in all models se colocan las variables forzadas a entrar en el modelo

    Stepwise Regression: Weight versus Pulse1, Pulse2, ... Forward selection. Alpha - to - Enter: 0.25

    Response is Weight on 7 predictors, with N = 92

    Step 1 2 3

    Constant - 204.74 - 88.20 - 82.67

    Height 5.09 3.69 3.75

    T- Value 12.02 6.45 6.68

    P- Value 0.000 0.000 0.000

    Sex - 14.7 - 13.5

    T- Value - 3.43 - 3.19

    P- Value 0.001 0.002

    Smokes - 6.7

    T- Value - 2.15

    P- Value 0.034

    S 14.8 14.0 13.7

    R- Sq 61.60 66.08 67.77

    R- Sq(adj) 61.17 65.31 66.67

    Mallows Cp 15.2 5.2 2.7

  • IPIW12 Estadstica Aplicada a la Ingeniera

    44

    3. Presionando el botn se

    despliega el cuadro de dialogo donde es posible seleccionar los criterios de salida de las variables, seleccionndose la opcin Backward elimination.

    4. Una vez completada la informacin requerida se presiona OK las veces necesarias, con lo cual se despliega la siguiente informacin en la ventana de Session:

    Donde se observa que las variables que salen en cada paso son aquellas que tienen valor P mayor que el especificado, asimismo se nos presenta la calidad del ajuste de cada uno de los modelos (determinando la calidad del modelo con los coeficientes R-Sq (adj) o con el estadstico de Mallows Cp). Resultando que la mejor ecuacin de regresin es:

    Weight = - 82.67 - 6.7 Smokes - 13.5 Sex + 3.75 Height

    La cul es obtenida directamente al observar los resultados de la ventana de Session.

    Stepwise Regression: Weight versus Pulse1, Pulse2, ... Backward elimination. Alpha - to - Remove: 0.1

    Response is Weight on 7 predictors, with N = 92

    Step 1 2 3 4 5

    Constant - 54.44 - 53.57 - 66.46 - 77.73 - 82.67

    Pulse1 0.07

    T- Value 0.38

    P- Value 0.704

    Pulse2 - 0.15 - 0.11

    T- Value - 0.94 - 0.95

    P- Value 0.348 0.347

    Ran - 5.7 - 4.9 - 2.5

    T- Value - 1.26 - 1.23 - 0.81

    P- Value 0.212 0.223 0.421

    Smokes - 6.1 - 6.3 - 6.1 - 6.3 - 6.7

    T- Value - 1.87 - 1.98 - 1.93 - 1.99 - 2.15

    P- Value 0.065 0.051 0.056 0.049 0.034

    Sex - 12.8 - 12.9 - 14.2 - 13.9 - 13.5

    T- Value - 2.82 - 2. 85 - 3.32 - 3.27 - 3.19

    P- Value 0.006 0.006 0.001 0.002 0.002

    Height 3.64 3.63 3.65 3.75 3.75

    T- Value 6.26 6.29 6.32 6.68 6.68

    P- Value 0.000 0.000 0.000 0.000 0.000

    Activity - 2.9 - 2.8 - 2.4 - 2.4

    T- Value - 1.15 - 1.12 - 1.00 - 1.00

    P- Value 0.253 0.266 0.320 0.321

    S 13.8 13.7 13.7 13.7 13.7

    R- Sq 68.76 68.70 68.38 68.13 67.77

    R- Sq(adj) 66.16 66.50 66.54 66.67 66.67

    Mallows Cp 8.0 6.1 5.0 3.7 2.7

  • IPIW12 Estadstica Aplicada a la Ingeniera

    45

    Prueba de Hiptesis

    5

  • IPIW12 Estadstica Aplicada a la Ingeniera

    46

    Grfica de Probabilidad Con mucha frecuencia no se conoce la distribucin de probabilidad de la variable aleatoria en estudio y se desea probar la hiptesis de que esta variable sigue una distribucin de probabilidad particular. Por ejemplo, podra ser de inters probar la hiptesis de que la variable sigue una distribucin normal, una

    La grfica de la probabilidad es un mtodo grfico para determinar s los datos se ajustan a una distribucin hipottica basada en un examen visual subjetivo de los datos; la idea bsica consiste en representar, en un mismo grfico, los datos empricos observados, frente a los datos que se obtendran en una distribucin hipottica terica. Si la distribucin de la variable se ajusta a la distribucin hipottica, los puntos quedarn cerca de una lnea recta. Siendo las hiptesis sujetas a estudio:

    H0: Los datos analizados se comportan en base a una distribucin de probabilidad hipottica.

    H1: No existe evidencia suficiente para concluir que los datos analizados se comportan en base a una distribucin de probabilidad hipottica.

    Y la decisin de la prueba de hiptesis se obtendr utilizando el valor p obtenido si el valor P > se acepta

    H0, si P < se acepta H1, si se da el caso de que P = es recomendable tomar otra muestra de datos o aumentar el tamao de muestra de los datos actuales. Grfica de probabilidad normal utilizando Minitab:

    1. Capture los siguientes datos en la hoja de trabajo en una sola columna nombrndola como Datos: 2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21

    3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37

    4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79

    4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31

    8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83

    9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67

    11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28

    12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58

    13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07

    15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47

    16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60

    16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74

    17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78

    2. Seleccione la opcin Graph > Probability Plot.

    3. Dependiendo de la cantidad de variables a analizar seleccione Single o Multiple.

    4. En el recuadro Graph variables coloque el nombre de la columna donde tiene capturado los datos.

    5. En el botn Distribution seleccione la distribucin Normal y presione OK.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    47

    6. Resultando la siguiente grfica de probabilidad que con base al valor P obtenido 0.399 se concluye que los datos se comportan en base a una distribucin normal para un nivel de confianza del 95%.

    Grfica de probabilidad exponencial utilizando Minitab: Utilizando los mismos datos capturados en el ejemplo de grfica de probabilidad normal.

    1. Seleccione la opcin Graph > Probability Plot.

    2. Dependiendo de la cantidad de variables a analizar seleccione Single o Multiple.

    3. En el recuadro Graph variables coloque el nombre de la columna donde tiene capturado los datos.

    4. En el botn Distribution seleccione la distribucin Exponential y presione OK.

    5. Con lo cual se obtiene la siguiente grfica de probabilidad.

    Debido a que el valor P obtenido es menor que 0.05 (P < ) se rechaza H0 (acepta H1) es decir, que los datos analizados no se comportan en base a una distribucin de probabilidad exponencial.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    48

    Grfica de probabilidad lognormal utilizando Minitab: Utilizando los mismos datos capturados en el ejemplo de grfica de probabilidad normal.

    1. Seleccione la opcin Graph > Probability Plot.

    2. Dependiendo de la cantidad de variables a analizar seleccione Single o Multiple.

    3. En el recuadro Graph variables coloque el nombre de la columna donde tiene capturado los datos.

    4. En el botn Distribution seleccione la distribucin Lognormal y presione OK.

    5. Con lo cual se obtiene la siguiente grfica de probabilidad:

    Debido a que el valor P obtenido es menor que 0.05 (P < ) se rechaza H0 (acepta H1) es decir, que los datos analizados no se comportan en base a una distribucin de probabilidad exponencial. Y de forma global, despus de realizada la prueba de bondad de ajuste, utilizando la grfica de probabilidad, del conjunto de datos contrastada contra la distribucin de probabilidad normal, exponencial y lognormal se concluye que, en base a los valores P obtenidos, la distribucin de probabilidad que mejor se ajusta al comportamiento de los datos analizados es la distribucin normal.

    Prueba de normalidad La prueba de normalidad es una prueba de bondad de ajuste que busca determinar si un conjunto de datos se ajustan a una distribucin de probabilidad normal; realizado esto mediante la evaluacin de las hiptesis de investigacin:

    H0: Los datos analizados se comportan en base a una distribucin normal.

    H1: No existe evidencia suficiente para concluir que los datos analizados se comportan en base a una distribucin normal.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    49

    Siendo el parmetro de aceptacin o rechazo de laH0 0 (es decir se acepta H1). La importancia de verificar la normalidad de las muestras es fundamental en la estadstica debido a que si las muestras son normales se pueden aplicar mtodos paramtricos convencionales para el tratamiento de los datos, en caso contrario es necesario realizar transformaciones que normalicen los datos, o bien utilizar mtodos no paramtricos o mtodos estadsticos avanzados. Minitab nos proporciona tres alternativas para realizar la prueba de normalidad Andreson-Darling, Ryan-Joiner y Kolmogorov-Smirnov las cuales pueden ser utilizadas de forma indistinta, sin embargo es importante comentar que algunos autores sealan que deben de seleccionarse dos de esas pruebas para estar seguros de los resultados, lo cual no es necesario cuando el valor P es cercano a 1, en el caso de

    que el valor P sea cercano al nivel de significancia (P 0.05) en lugar de repetir dos veces la prueba sera ms conveniente realizar un nuevo muestreo. Prueba de normalidad utilizando Minitab

    1. Capture los siguientes datos en la hoja de trabajo en una sola columna nombrndola como Datos: 2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21

    3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37

    4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79

    4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31

    8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83

    9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67

    11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28

    12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58

    13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07

    15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47

    16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60

    16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74

    17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78

    2. Seleccione la opcin Stat > Basic Statistics > Normality Test.

    3. Seleccione la Variable Datos como se muestra en la pantalla.

    4. Seleccione la prueba de Anderson-Darling, Ryan-Joiner o Kolmogorov-Smirnov y presione el botn OK.

    5. A continuacin se muestra la grfica normal, como puede observarse el valor P > 0.05 por tanto los datos son normales.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    50

    Grfica de probabilidad normal utilizando Minitab:

    1. Seleccione la opcin Graph > Probability Plot.

    2. Dependiendo de la cantidad de columnas con datos seleccione Single o Multiple.

    3. En el recuadro Graph variables coloque el nombre de la columna donde se tienen capturados los datos.

    4. En el botn Distribution seleccione la distribucin Normal y presione OK.

    5. Resultando la siguiente grfica de

    probabilidad que con base al valor P obtenido (P = 0.399) se concluye que los datos se comportan en base a una distribucin normal para un nivel de confianza del 95%.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    51

    Prueba t de Dos Muestras Supongamos que se tienen dos poblaciones distribuidas normalmente con medias desconocidas 1 y 2 respectivamente, la prueba t de dos muestras nos permite contrastar las medias de dichas poblaciones entre dos muestras independientes tomadas de ellas, mediante la siguiente prueba de hiptesis:

    H0: 1 = 2.

    H1: 1 2, 1 < 2 o 1 > 2

    Donde la primer muestra es de tamao m con media x y varianza 21s y la segunda muestra es de tamao

    n con media y y varianza 22s .

    En esta prueba se utilizan dos estadsticos distintos dependiendo de la consideracin de varianzas iguales o no, para verificar esto se hace uso de la prueba de Levene para la igualdad de varianzas, siendo esta

    prueba rechazada cuando el valor p < a (con un igual a 0.05).

    El estadstico para varianzas de las poblaciones iguales (22

    1

    2

    1 ) es:

    nmS

    yxt

    p

    11

    )()( 21

    Con 2nm grados de libertad. Asimismo la varianza poblacional 2 se estima por la varianza

    combinada de las varianzas de las dos muestras tomadas, definida por:

    2

    )1()1( 222

    12

    nm

    snsmSP

    Con una frmula para obtener el intervalo de confianza del 100(1- )% para la diferencia de las medias

    poblacionales ( 1 = 2):

    nmStyx pmn

    11)2,2/(

    El estadstico para varianzas de las poblaciones distintas es )( 212

    1:

    n

    s

    m

    s

    yxt

    2

    2

    2

    1

    Con grados de libertad:

    11

    2

    2

    2

    1

    2

    21

    n

    c

    m

    c

    ccdf con

    m

    sc

    2

    11 y

    n

    sc

    2

    22

  • IPIW12 Estadstica Aplicada a la Ingeniera

    52

    Prueba t de dos muestras utilizando Minitab: Una empresa desea evaluar si la resistencia a la traccin de pieles curtidas vara entre dos mtodos de curtido por tanto realiz un muestreo cuyos resultados se muestran en la tabla siguiente:

    Mtodo A Mtodo B 24.30 24.40

    25.60 21.50

    26.70 25.10

    22.70 22.80

    24.80 25.20

    23.80 23.50

    25.90 22.20

    26.40 23.50

    25.80 23.30

    25.40 24.70

    Es posible determinar si la resistencia a la traccin de pieles curtidas entre los dos mtodos son iguales?

    1. Capturar la tabla anterior en dos columnas nombrando las columnas como Mtodo A y Mtodo B respectivamente.

    2. Realizar la prueba de dos varianzas para

    determinar si se tienen varianzas iguales o no para ello se accede a Stat > Basic Statistics > 2 Variances, en la celda Data seleccionar Samples in different columns y en las celdas First y Second colocar los nombres de las columnas donde se tienen ingresados los datos, posteriormente dar clic en OK. En el botn Options es posible cambiar el nivel de confianza (por omisin es del 95%).

    3. Obtenindose los resultados siguientes, mediante los cuales se puede concluir

    que debido a que el valor P > (mayor que 0.05) no puede rechazarse la hiptesis nula de la prueba de varianzas con lo que se comprueba la existencia de varianzas iguales.

    Test and CI for Two Variances: Mtodo A, Mtodo B Method

    Null hypothesis Sigma(Mtodo A) / Sigma(Mtodo B) = 1

    Alternative hypothesis Sigma(Mtodo A) / Sigma(Mtodo B) not = 1

    Signifi cance level Alpha = 0.05

    Statistics

    Variable N StDev Variance

    Mtodo A 10 1.242 1.543

    Mtodo B 10 1.237 1.531

    Ratio of standard deviations = 1.004

    Ratio of variances = 1.008

    95% Confidence Intervals

    CI for

    Distribution CI for StDev Variance

    of Data Ratio Ratio

    Normal (0.500, 2.014) (0.250, 4.058)

    Continuous (0.369, 2.243) (0.136, 5.030)

    Tests

    Test

    Method DF1 DF2 Statistic P - Value

    F Test (normal) 9 9 1.01 0.991

    Levene's Test (any continuous) 1 18 0.00 0.955

  • IPIW12 Estadstica Aplicada a la Ingeniera

    53

    4. Una vez analizadas las varianzas se procede a la comparacin de las medias poblacionales para ello se ingresa a Stat > Basic Statistics > 2 Sample t, seleccionndose la opcin Samples in different columns y colocando en las celdas First y Second el nombre de las columnas contenedoras de los datos. Asimismo se selecciona la opcin Assume equal variances ya que como se demostr anteriormente las dos poblaciones tienen esta caracterstica.

    5. En el botn Options es posible cambiar el nivel de confianza

    (por omisin es del 95%) as como la hiptesis alternativa ( 1

    2, 1 < 2 o 1 > 2)

    6. Con lo cual se obtienen los siguientes resultados en la ventana de Session.

    Como el intervalo de confianza no incluye el valor cero y/o el valor P < (menor que 0.05) se rechaza la hiptesis nula de igualdad de medias, por tanto se acepta la hiptesis alternativa con lo que se afirma que las resistencias de los mtodos de curtido de pieles son diferentes.

    Two-Sample T-Test and CI: Mtodo A, Mtodo B Two- sample T for Mtodo A vs Mtodo B

    N Mean StDev SE Mean

    Mtodo A 10 25.14 1.24 0.39

    Mtodo B 10 23.62 1.24 0.39

    Difference = mu (Mtodo A) - mu (Mtodo B)

    Estimate for difference: 1.520

    95% CI for difference: ( 0.355, 2.685 )

    T- Test of difference = 0 (vs no t =): T - Value = 2.74 P - Value = 0.013 DF = 18

    Both use Pooled StDev = 1.2396

  • IPIW12 Estadstica Aplicada a la Ingeniera

    54

    Prueba de Dos Proporciones El propsito de esta prueba es averiguar si existen diferencias estadsticamente significativas entre dos proporciones sujetas a estudio. Considrense que se toman dos muestras aleatorias de tamao n1 y n2 de dos poblaciones, y sea X1 y X2 el nmero de observaciones que pertenecen a la clase de inters en la muestra 1 y 2 respectivamente. Supngase adems que la aproximacin normal a la binomial se aplica a

    cada poblacin, por lo que los estimadores de las proporciones de poblacin 111 / nXp y 222 / nXp

    tienen distribuciones normales aproximadas. Luego si p1 = p2 = p la variable aleatoria puede ser calculada con:

    21

    21

    11)1(

    nnpp

    ppZ

    Que se distribuye normalmente con N(0,1). Estimndose el parmetro p con:

    21

    21

    nn

    XXp

    Resultando en el estadstico de prueba para la evaluacin de la hiptesis nula p1 = p2:

    21

    210

    11)1(

    nnpp

    ppZ

    . Las hiptesis de investigacin evaluadas son:

    H0: p 1 = p2.

    H1: p 1 2, p 1 < p 2 o p 1 > p 2

    Siendo H0 aceptada cuando el valor p > generalmente con un igual a 0.05, rechazada cuando P < y

    cuando P = es recomendable realizar un nuevo muestreo o colectar un mayor nmero de datos. Prueba de Dos Proporciones utilizando Minitab

    Una empresa ha estado teniendo problemas de calidad al utilizar dos equipo y desea evaluar si las proporciones de los problemas de calidad son iguales o son distintas, el equipo 1 ha tenido 33 eventos en 300 corridas y el equipo 2 ha tenido 22 eventos en 250 corridas.

    1. Seleccione la opcin Stat > Basic Statistics > 2 - Proportions

    2. Debido a que los datos se encuentran sumarizados seleccione la opcin Sumarized data e ingrese los valores de los eventos y corridas en las celdas correspondientes utilizando First para el equipo 1 y Second para el equipo 2.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    55

    3. En el botn Options es posible cambiar el nivel de confianza (por omisin es del 95%) as como la hiptesis alternativa (p1 2, p 1 < p 2 o p 1 > p 2)

    4. Con lo cual se obtienen los siguientes resultados en la ventana de Session.

    Como el intervalo de confianza incluye el valor cero y/o el valor P > (mayor que 0.05) se acepta la hiptesis nula de igualdad de proporciones, con lo que se afirma que las proporciones de los problemas de calidad de los dos equipos son iguales.

    Test and CI for Two Proportions Sample X N Sample p

    1 33 300 0.110000

    2 22 250 0.088000

    Difference = p (1) - p (2)

    Estimate for difference: 0.022

    95% CI for difference: ( - 0.0278678, 0.0718678 )

    Test for difference = 0 (vs not = 0): Z = 0.86 P - Value = 0.387

    Fisher's exact test: P - Value = 0.476

  • IPIW12 Estadstica Aplicada a la Ingeniera

    56

    Grficos de Control

    6

  • IPIW12 Estadstica Aplicada a la Ingeniera

    57

    Grficos de Control Las grficas de control son las herramientas ms poderosas para analizar la variacin en la mayora de los procesos. Han sido difundidas exitosamente en varios pases dentro de una amplia variedad de situaciones para el control del proceso. Estas enfocan la atencin hacia las causas especiales de variacin cuando estas aparecen y reflejan la magnitud de la variacin debida a las causas comunes.

    Las causas comunes o aleatorias se deben a la variacin natural del proceso.

    Las causas especiales o atribuibles son por ejemplo: un mal ajuste de mquina, errores del operador, defectos en materias primas.

    Se dice que un proceso est bajo Control Estadstico cuando presenta causas comunes nicamente. Cuando ocurre esto tenemos un proceso estable y predecible. Cuando existen causas especiales el proceso est fuera de Control Estadstico; las grficas de control detectan la existencia de estas causas en el momento en que se dan, lo cual permite que podamos tomar acciones al momento. Ventajas:

    Es una herramienta simple y efectiva para lograr un control estadstico.

    El operario puede manejar las cartas en su propia rea de trabajo, por lo cual puede dar informacin confiable a la gente cercana a la operacin en el momento en que se deben de tomar ciertas acciones.

    Cuando un proceso est en control estadstico puede predecirse su desempeo respecto a las especificaciones. En consecuencia, tanto el productor como el cliente pueden contar con niveles consistentes de calidad y ambos pueden contar con costos estables para lograr ese nivel de calidad.

    Una vez que un proceso se encuentra en control estadstico, su comportamiento puede ser mejorado posteriormente reduciendo la variacin.

    Al distinguir ente las causas especiales y las causas comunes de variacin, dan una buena indicacin de cundo un problema debe ser corregido localmente y cuando se requiere de una accin en la que deben de participar varios departamentos o niveles de la organizacin.

    Grficos de control por variables y por atributos En Control de Calidad mediante el trmino variable se designa a cualquier caracterstica de calidad

    atributo a las caractersticas de calidad que no son medibles y que presentan diferentes estados tales como conforme y disconforme o defectuoso y no defectuoso. Segn sea el tipo de la caracterstica de calidad a controlar as ser el correspondiente Grfico de Control que, por tanto, se clasifican en Cartas de Control por Variables y Cartas de Control por Atributos. Comparacin de las grficas de control por variables contra atributos Cartas de Control por variables Cartas de control por atributos

    Ventajas significativas Conducen a un mejor procedimiento de control.

    Son potencialmente aplicables a cualquier proceso

    Proporcionan una utilizacin mxima de la informacin disponible de datos.

    Los datos estn a menudo disponibles. Son rpidos y simples de obtener. Son fciles de interpretar.

    Son frecuentemente usados en los informes a la Gerencia.

    Ms econmicas.

    Desventajas significativas No se entienden a menos que se de capacitacin; puede causar confusin entre los lmites de especificacin y los lmites de tolerancia.

    No proporciona informacin detallada del control de caractersticas individuales.

    No reconoce distintos grados de defectos en las unidades de producto.

  • IPIW12 Estadstica Aplicada a la Ingeniera

    58

    Campos de aplicacin de los grficos de control VARIABLES Carta Descripcin Campo de aplicacin

    RX Medias y Rangos Control de caractersticas individuales.

    SX Medias y desviacin estndar. Control de caractersticas individuales.

    I Individuales Control de un proceso con datos variables que no pueden ser muestreados en lotes.

    ATRIBUTOS Carta Descripcin Campo de aplicacin.

    P Proporciones Control de la fraccin global de defectuosos de un proceso.

    NP Nmero de defectuosos Control del nmero de piezas defectuosas

    C Defectos por unidad Control de nmero global de defectos por unidad

    U Promedio de defectos por unidad Control del promedio de defectos por unidad.

    Grficos de control RX (variables) Paso 1: Colectar lo