-
UNIVERSIDAD TECNOLGICA DE CIUDAD JUREZ
Estadstica Aplicada a la
Ingeniera
Septiembre del 2014
Universidad Tecnolgica de Ciudad Jurez
Ciudad Jurez, Chihuahua
CARRERA DE PROCESOS INDUSTRIALES
Docente:
Dr. Ivn Juan Carlos Prez Olgun
-
IPIW12 Estadstica Aplicada a la Ingeniera
2
Contenido Pgina Caractersticas Generales 4
Pantallas y men 5
Men Nuevo 5
Hoja de Trabajo 6
Abrir, Guardar e Imprimir Archivos 6
Cambiar Tipo de Datos 6
Clculo con Columnas y Renglones 9
Diagramas 12
Diagrama de Puntos 13
Diagrama de Tallo y Hojas 15
Diagrama de Caja 16
Histograma 18
Diagrama de Dispersin 19
Anlisis de Tendencia 21
Diagrama de Pareto 22
Diagrama de Causa Efecto 24
Estadstica Descriptiva 26
Estadstica Descriptiva 27
Medidas de Tendencia Central 27
Medidas de Dispersin 28
Regresin y Correlacin 30 Coeficiente de Correlacin 32
Covarianza 33
Regresin por Medio de un Ajuste de Lnea 34
Regresin Lineal Simple 35
Regresin Lineal Mltiple 37
Seleccin de Mejor Ecuacin Predictora 38
Prueba de Hiptesis 45 Grfico de Probabilidad 46
Prueba de Normalidad 48
Prueba t de Dos Muestras 51
Prueba de Dos Proporciones 54
Grficos de Control 56 Grficos de Control 57
Grfico de Control X-R (Variables) 58
Grfico de Control X-S (Variables) 65
Grfico de Control I-MR (Variables) 72
Grfico de Control P (Atributos) 77
Grfico de Control NP (Atributos) 82
Grfico de Control C (Atributos) 83
Grfico de Control U (Atributos) 85
-
IPIW12 Estadstica Aplicada a la Ingeniera
3
Capacidad de Proceso 90
Capacidad de Proceso 91
Analisis de Capacidad para Datos Normales 92
Analisis de Capaqcidad para Datos no Normales 94
Estudios de Gage R&R 99 Conceptos Bsicos 100
Carta de Tendencias de Gage 105
Estudio de R&R Cruzado 106
Mtodo de Acuerdo por Atributos 113
Diseo de Experimentos 118 Diseo de Experimentos 119
Anlisis de Variables en un Solo Sentido 119
Diseos Factoriales 123
Diseos Factoriales 2k
132
Diseos de Experimentos 2k-p
140
Introduccin al Diseo Robusto 154
Optimizacin en Dos Pasos 162
Bibliografa 167
-
IPIW12 Estadstica Aplicada a la Ingeniera
4
Caractersticas Generales
1
-
IPIW12 Estadstica Aplicada a la Ingeniera
5
Pantallas y Mens Minitab es un paquete estadstico que incluye funciones de estadstica descriptiva, estadstica inferencial, diseo de experimentos, series de tiempo, grficos de control, estudios de capacidad, pruebas de hiptesis y otras funciones para facilitar los clculos y los anlisis estadsticos.
A continuacin se muestran las pantallas principales de Minitab:
Men Nuevo El men nuevo en Minitab provee dos opciones, la primera es Minitab Worksheet la cual mantiene la informacin que actualmente se est procesando como
Minitab Project, esta opcin borra toda la informacin existente en el proyecto actual (si no se ha grabado) y la reemplaza por un nuevo proyecto. La extensin de los archivos son: MPJ para los proyectos. MTW para las hojas de trabajo. MGF para los grficos (en caso de que se graben por separado).
Men de comandos e iconos.
Ventana de Sesin, esta ventana lleva el registro de las
rdenes y los resultados.
Direccin de escritura.
rea de entrada de ttulos de columnas.
Hoja de trabajo, similar a la hoja de Microsoft Excel.
-
IPIW12 Estadstica Aplicada a la Ingeniera
6
Hoja de Trabajo
Abrir, Guardar e Imprimir Archivos El men file es similar a los encontrados en todos los programas de Windows, en este men se puede grabar la hoja de trabajo o el proyecto, se puede abrir un proyecto u hoja de trabajo, asimismo se puede importar una hoja de trabajo de Microsoft Excel abriendo directamente el archivo de Excel desde la opcin File > Open Worksheet.
Esta seccin aplica para proyectos donde se
Esta seccin aplica solamente para hojas de trabajo.
Cambiar Tipo de Datos En ocasiones es conveniente saber cmo manipular los datos en las hojas de trabajo, ya que al cometer un error e ingresar un valor de texto a una columna numrica, esta columna ya no podr ser usada para los clculos matemticos. Lamentablemente Minitab no ofrece la posibilidad de solo borrar la celda e ingresar el dato numrico, ya que con el error la columna quedo definida como texto, la nica alternativa es utilizar las herramientas para convertir los tipos de datos. Numrico a Texto Como su nombre lo indica este cuadro de dialogo nos permite convertir columnas definidas como numricas a columnas de texto. Los pasos a seguir son:
1. Ingrese los siguientes datos en la columna C1: 2, 6, 9 , 8, 4, 2, 4, 8, 3 y 4.
2. Ir al men Data > Change Data Type > Numeric to Text.
columna con formato de fecha.
-
IPIW12 Estadstica Aplicada a la Ingeniera
7
3. En Change numeric columns ingresar la columna de datos a convertir (C1). 4. En Store text columns in ingresar la columna donde los datos a transformar sern almacenados. 5. Posteriormente presione el botn OK y en la columna C2 aparecer la etiqueta C2-T que indica que la columna es ahora de datos de texto.
Texto a Numrico Como su nombre lo indica este cuadro de dialogo nos permite convertir columnas definidas como texto a columnas numricas. Los pasos a seguir son:
1. Utilizando los datos resultantes del ejercicio anterior (columna C2).
2. Ir al men Data > Change Data Type > Text to Numeric.
3. En Change text columns ingresar la columna de datos a convertir (C2). 4. En Store numeric columns in ingresar la columna donde los datos a transformar sern almacenados. 5. Posteriormente presione el botn OK y en la columna C3 aparecern los datos convertidos y en la etiqueta solamente aparecern el C3 sin T, lo que indica que la columna es ahora de datos numricos.
Agrupar Columnas Esta herramienta permite agrupar los datos colocados en diferentes columnas en una sola, esta es muy til cuando se quieren hacer clculos estadsticos de diversos grupos de datos sin hacer distincin de variables categricas. 1. Capture los siguientes datos en una hoja de trabajo de Minitab:
Datos 1 Datos 2 Datos 3 Datos 3
2 14 21 32
6 16 29 33
9 17 27 35
8 13 26 34
4 15 25 36
2 16 24 38
4 18 28 37
8 19 26 39
3 10 21 32
4 12 23 35
2. Ir al men Data > Stack > Columns.
-
IPIW12 Estadstica Aplicada a la Ingeniera
8
3. Ingrese las columnas que contienen los datos a agrupar en la ventana Stack the following columns. 4. Seleccione la columna donde se agruparan los datos (en este caso C10). 5. Seleccione la columna que contendr las etiquetas asociadas a la variable agrupada (en este caso C11).
6. Posteriormente presione el botn OK.
Desagrupar Columnas Esta herramienta permite desagrupar los datos colocados en una sola columna, esta es muy til cuando se quieren hacer clculos estadsticos de una respuesta donde tambin se cuenta con informacin de varias
1. Utilizando los datos resultantes del ejercicio anterior (columna C10 y C11). 2. Ir al men Data > Unstack Columns.
3. Ingrese la columna que contienen los datos a desagrupar en la ventana Unstack the data in. 4. Ingrese la columna que contiene las etiquetas categricas de los datos a desagrupar en la ventana Using subscripts in. 5. Seleccione la casilla After last column in use, para que los datos desagrupados sean colocados posterior a la ltima columna utilizada.
6. Posteriormente presione el botn OK.
Concatenar Esta herramienta permite unir dos columnas de texto en una sola. Los pasos son:
1. Capture los siguientes datos en la hoja de trabajo de Minitab: C1 C2
CODIGO COLOR
2A3_ VERDE
2D4_ AZUL
3F1_ CAFE
3F2_ ROJO
3F1_ NEGRO
-
IPIW12 Estadstica Aplicada a la Ingeniera
9
4D2_ AMARILLO
1A5_ AZUL
1A6_ VERDE
4D1_ CAF
4D2_ ROJO
2. Ir a Data > Concatenate, una vez en el cuadro de dialogo seleccionar las columnas CODIGO y COLOR (las columnas de texto que va a ser unidas).
3. Seleccionar la columna donde los datos concatenados van a ser guardados (Store results in).
4. Presione el botn OK y en la columna C12 de la hoja de trabajo aparecer el listado de los datos concatenados.
Clculos con Columnas y Renglones Uso de Calculadora Minitab ofrece una calculadora cientfica para hacer operaciones entre columnas, para ingresar a esta calculadora es necesario ir a Calc > Calculator.
Por ejemplo:
1. Capture los siguientes datos en la hoja de trabajo de Minitab:
C1 C2 C3
Datos 1 Datos 2 Datos 3
5 8 6
5 2 9
Columnas que contienen los datos.
Columnas donde aparecer el resultado.
Expresin a calcular.
Iconos de acceso rpido para operaciones matemticas.
-
IPIW12 Estadstica Aplicada a la Ingeniera
10
2. Ir a Calc > Calculator, ingrese la celda donde
se guardara el resultado (para este ejemplo C5).
3. Ingrese la ecuacin matemtica que va a ser
utilizada para realizar los clculos (para este ejemplo C1
2 + C2
3 - C3).
4. En caso de que se quiera tener la formula
asignada a la columna C5 de forma permanente, seleccionar la opcin Assign as a formula, esto ofrecer la oportunidad de modificar datos directamente sobre la tabla y que los clculos se actualicen en tiempo real.
5. Presionar el botn OK y automticamente en la hoja de trabajo aparecer el resultado en la celda C5.
Estadsticas de Fila Esta es una forma de realizar clculos predefinidos para las filas seleccionadas, funciona a travs de la ruta Calc > Row Statistics. Los pasos son: 1. Capture los siguientes datos en la hoja de trabajo de Minitab:
C1 C2 C3
Datos 1 Datos 2 Datos 3
5 8 6
5 2 9
2. Ir a Calc > Row Statistics, ingrese la respuesta estadstica predefinida que se quiere obtener. 3. Seleccione las variables que van a ser parte del estudio (las columnas que van a ser parte del estudio). 4. Seleccione la columna donde se guardaran los resultados.
5. Posteriormente presione OK y en la columna C6 aparecer la sumatoria de cada lnea de los valores colocados en la celda C1, C2 y C3.
-
IPIW12 Estadstica Aplicada a la Ingeniera
11
Estadsticas de Columna Esta es una forma de realizar clculos predefinidos para las columnas seleccionadas, funciona a travs de la ruta Calc > Column Statistics. Los pasos son: 1. Capture los siguientes datos en la hoja de trabajo de Minitab:
C1 C2 C3
Datos 1 Datos 2 Datos 3
5 8 6
5 2 9
2. Ir a Calc > Column Statistics, ingrese la respuesta estadstica predefinida que se quiere obtener. 3. Seleccione la columna de datos que va a ser analizada. 4. Presione el botn OK y en la ventana de sesin aparecer el resultado, para este caso aparecer el valor mnimo colocado en la columna C1.
Clculos a Travs del Editor de Comandos Con esta herramienta se pueden realizar operaciones matemticas a travs de la lnea de comandos, la cual funciona de forma similar al generador de macros de Microsoft Excel, en este editor se pueden predefinir operaciones, anlisis grficos asociados a columnas, que al ser ejecutado el editor de comandos se realizan todos los clculos matemticos evitando introducir las herramientas de una en una. Los pasos son: Esta es una forma de realizar clculos predefinidos para las columnas seleccionadas, funciona a travs de la ruta Calc > Column Statistics. Los pasos son: 1. Capture los siguientes datos en la hoja de trabajo de Minitab:
C1 C2 C3
Datos 1 Datos 2 Datos 3
5 8 6
5 2 9
2. Ir a Edit > Command Line Editor e ingresar la siguiente lnea de comando Let C7 = C1 + C2 + C3.
3. Presionar el botn Submit Commands y automticamente la columna C7 se actualizara con el resultado de la formula ingresada.
-
IPIW12 Estadstica Aplicada a la Ingeniera
12
Diagramas
2
-
IPIW12 Estadstica Aplicada a la Ingeniera
13
Grfico de Puntos El grfico de puntos es una herramienta utilizada para graficar datos continuos cuando el conjunto de datos es pequeo, en este tipo de grfico el eje de las abscisas representa los valores de la variable estudiada y la ordenada la frecuencia de aparicin de un valor en el conjunto estudiado, representando cada punto una aparicin de la variable. Grfico de puntos utilizando Minitab:
1. Capture los siguientes datos en la hoja de trabajo, utilizando para ello una columna: 5 7 2 6 4 7 8 6 7 5
4 3 7 3 9 5 2 1 6 3
4 6 8 4 5 2 1 9 4 8
2. Seleccione la opcin Graph > Dotplot.
3. Posteriormente seleccione One Y Simple, debido a que solamente estamos analizando un conjunto de datos.
4. En la celda Graph variables colocar el nombre de la columna donde se encuentren los datos ingresados, presione el botn OK.
5. Obtenindose el siguiente grfico de puntos.
-
IPIW12 Estadstica Aplicada a la Ingeniera
14
En el caso de dos o ms grupos de datos:
1. Capture los siguientes datos en la hoja de trabajo: Datos 1 Datos 2 Datos 3
7 2 2
4 5 1
7 2 2
4 5 1
6 8 7
5 4 8
5 5 3
6 6 7
7 2 2
4 5 1
6 8 7
7 2 2
4 5 1
6 8 7
4 3 7
2. Seleccione la opcin Graph > Dotplot.
3. Una vez que se despligue el siguiente cuadro de dialogo, seleccione la opcin .
4. En la celda Graph variables colocar el nombre de las columnas donde se encuentren los datos ingresados, una vez realizado esto presione el botn OK.
-
IPIW12 Estadstica Aplicada a la Ingeniera
15
5. Con lo cual se obtiene el siguiente diagrama de puntos.
Diagrama de Tallo y Hojas Es otra forma de representacin de la informacin, este tipo de diagrama permite obtener de forma simultnea una distribucin de frecuencias de la variable y su representacin grfica. Para construirlo primero se ordenan los dgitos principales a la izquierda de una lnea vertical (formando el tallo), registrndose a la derecha de esta lnea el ltimo dgito para cada dato conforme se revisan las observaciones en el orden en que se registran (formando las hojas). Esta representacin grfica se asemeja a un histograma, sin embargo resulta ms fcil de elaborar y muestra mayor informacin. Diagrama de tallo y hojas utilizando Minitab:
1. Capture los siguientes datos en la hoja de trabajo, utilizando para ello una columna: 2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21
3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37
4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79
4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31
8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83
9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67
11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28
12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58
13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07
15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47
16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60
16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74
17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78
2. Seleccione la opcin Graph > Steam and leaf en la celda Graph variables colocar el nombre de la columna donde se encuentren los datos ingresados, indicar en la celda de datos increment el incremento deseado, en este caso igual a 10, posteriormente presione el botn OK.
-
IPIW12 Estadstica Aplicada a la Ingeniera
16
3. Siendo los resultados mostrados en la ventana de Session de Minitab presentados a continuacin:
Diagrama de Caja El diagrama de caja es una representacin grfica que facilita la identificacin de las caractersticas ms notables de un conjunto de datos como el centro, la dispersin, la desviacin de la simetra y la identificacin de las observaciones inusuales. En esta representacin grfica es posible observar los siguientes datos:
Dato menor.
Cuartil nmero uno (Q1).
Cuartil nmero dos o mediana (Q2).
Cuartil nmero tres (Q3).
Dato mayor.
Puntos atpicos. Los puntos atpicos se clasifican en:
Atpicos; siendo aquellos puntos que se encuentran despus de los bigotes del diagrama de caja pero a menos de tres rangos intercuartlicos del borde de la caja.
Atpicos extremos; siendo aquellos puntos que se localizan despus de los bigotes pero a ms de tres rangos intercuartlicos del borde de la caja.
Stem-and-Leaf Display: C1
Stem- and- leaf of C1 N = 130
Leaf Unit = 1.0
6 0 234489
17 1 12356677889
21 2 0048
42 3 001223345566667778899
(25) 4 0003445555556777788888999
63 5 0000111234455556689999
41 6 012223445667799
26 7 011224466789
14 8 012235899
5 9 44446
-
IPIW12 Estadstica Aplicada a la Ingeniera
16
Diagrama de caja utilizando Minitab:
1. Capture los siguientes datos en la hoja de trabajo 7, 8, 9, 9, 11, 12, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, nombrando la columna como Datos A.
2. Seleccione la opcin Graph > Boxplot.
3. Debido a que solamente estamos analizando un conjunto de datos se selecciona One Y Simple.
4. Seleccione la variable Datos A como se muestra en la pantalla y presione el botn OK.
5. A continuacin se muestra el diagrama de
caja.
-
IPIW12 Estadstica Aplicada a la Ingeniera
17
Si el objetivo es comparar dos o ms conjuntos de datos el procedimiento sera el siguiente:
1. Capture los siguientes datos en la hoja de trabajo: Datos A: 7, 8, 9, 9, 11, 12, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22. Datos B: 5, 7, 7, 9, 10, 10, 11, 12, 12, 15, 16, 16, 16, 18, 18, 18.
2. Seleccione la opcin Graph > Boxplot.
3. Debido a que se analizar ms de una columna de datos se selecciona .
4. Seleccione las variables Datos A y Datos B como se muestra en la pantalla.
5. Para realizar una mejor comparacin de las diferencias de las medianas, entre los dos conjuntos de datos, seleccione la opcin Data View.
6. Y active el despliegue de los datos requeridos, tal como se ejemplifica en la figura, posteriormente presione el botn OK.
-
IPIW12 Estadstica Aplicada a la Ingeniera
18
7. Presione el botn OK en la ventana , con lo cual
se obtiene el siguiente diagrama mltiple de caja.
Histograma Es un tipo especial de grfico de barras utilizado para comunicar informacin sobre las variaciones de un proceso con variables continuas que se han agrupado en clases (barras). Se recomienda cuando se tiene una cantidad grande de datos (mayor o igual a 50), debido a que su utilizacin nos permite analizar la muestra con mayor facilidad y claridad. Se emplea para ilustrar muestras agrupadas en intervalos y est formado por rectngulos unidos a otros, cuyos vrtices de la base coinciden con los lmites de los intervalos de clase y denominndose el centro de cada intervalo como marca de clase, que representamos en el eje de las abscisas. La altura de cada rectngulo es proporcional a la frecuencia del intervalo respectivo. Los pasos para la construccin de un histograma son:
1. Recolectar los datos. 2. Determinar el rango de los datos, calculado mediante la diferencia del dato mayor y el dato menor. 3. Determinar el nmero de los intervalos de clases, por lo general el nmero de los intervalos de
clases vara entre cinco y quince, existen diversas formas de calcular el nmero siendo la ms utilizada la raz cuadrada del total de los datos, donde el entero positivo mayor es el nmero de clases a utilizar obtenindose la longitud de la clase dividiendo el rango entre el numero de clases.
4. Construir los intervalos de clases, los puntos medios de cada intervalo de clase se le denomina marca de clase.
5. Graficar el histograma donde el eje de las abscisas ser el intervalo de clase y el eje de las ordenadas la frecuencia de los datos obtenidos por cada clase, esta construccin del histograma se realiza mediante barras.
6. La unin de los puntos medios de la base superior de cada barra se le conoce como polgono de frecuencias.
Histograma utilizando Minitab:
1. Capture los siguientes datos en la hoja de trabajo, nombrando la columna como Datos: 2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21
3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37
4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79
4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31
8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83
9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67
11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28
12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58
13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07
15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47
16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60
16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74
17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78
-
IPIW12 Estadstica Aplicada a la Ingeniera
19
2. Seleccione la opcin Graph > Histogram (With Fit), si requerimos que se nos presente un grfico con una lnea que represente una distribucin de probabilidad.
3. Seleccione la variable Datos como se muestra en la pantalla y presione el botn OK.
4. Mostrndose el histograma.
Diagrama de dispersin El diagrama de dispersin es una tcnica estadstica utilizada para estudiar la relacin entre dos variables. Por ejemplo, entre una caracterstica de calidad y un factor que le afecta. La ventaja de utilizar este tipo de diagramas radica en que se tiene una comprensin ms profunda del problema planteado. La relacin entre dos variables se representa mediante una grfica de dos dimensiones en la que cada relacin est dada por un par de puntos (uno para cada variable). La variable del eje horizontal X normalmente es la variable causa, y la variable del eje vertical Y es la variable efecto. La relacin entre dos variables puede ser positiva o negativa. Si es positiva, significa que un aumento en la variable causa X provocar una aumento en la variable efecto Y y si es negativa significa que una disminucin en la variable X provocar una disminucin en la variable Y.
Diagrama de dispersin utilizando Minitab:
1. Ingrese los siguiente datos en la hoja de trabajo de Minitab: Servicios (X) Tiempo (Y) Servicios (X) Tiempo (Y) Servicios (X) Tiempo (Y)
2 9.95 8 27.50 10 34.93
8 24.45 4 17.08 15 46.59
11 31.75 11 37.00 15 44.88
10 35.00 12 41.95 16 54.12
-
IPIW12 Estadstica Aplicada a la Ingeniera
20
8 25.02 2 11.66 17 56.63
4 16.86 4 21.65 6 22.13
2 14.38 4 17.89 5 21.15
2 9.60 20 69.00
9 24.35 1 10.30
2. Seleccione la opcin Graph> Scatterplot (Simple). Agregue las variables correspondientes y presione el botn OK.
3. Obtenindose el diagrama de dispersin siguiente.
4. Tambin es posible obtener un diagrama de dispersin con una recta de regresin, para ello en el punto 2 se selecciona la opcin Graph> Scatterplot (With Regression) o dando clic derecho en el mouse sobre la grfica obtenida en el punto 3 se selecciona Add > Regression Fit y en el cuadro de dialogo seleccionar el tipo de ajuste (Linear, Quadratic o Cubic).
-
IPIW12 Estadstica Aplicada a la Ingeniera
21
Anlisis de Tendencias Esta herramienta ajusta un modelo general de tendencias una serie de datos a travs del tiempo, los modelos disponibles para ser ajustados son un modelo lineal, un modelo cuadrtico, un modelo exponencial y un modelo de curva s. Grfico de tendencias utilizando Minitab:
1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Tendencia.
2. Acceder a Stat > Time Series > Trend Analysis en Variable seleccionar la columna Trade, Model Type seleccionar Linear y presionar el boton OK.
3. Con lo cual se obtiene el siguiente grfico de tendencias para un modelo lineal. En caso de que se desee determinar cul modelo se ajusta mejor a una serie de datos ser necesario generar una grfica de tendencia para cada uno de los modelos (Linear, Quadratic, Exponential y S-Curve) y con el ndice MAD (desviacin media absoluta), que mide la exactitud de los valores estimados de la serie de tiempo, se podr realizar esta determinacin.
Analizando los valores MAD se tiene:
MAD Lineal = 6.6177
MAD Cuadrtico = 5.9566
MAD Exponencial = 6.4618
MAD Curva S = 6.0789
Siendo el modelo que mejor se aproxima el que tenga menor MAD, en este caso el modelo cuadrtico.
-
IPIW12 Estadstica Aplicada a la Ingeniera
22
Diagrama de Pareto Una de las siete herramientas estadsticas bsicas para la solucin de problemas fue nombrado en honor de Vilfredo Pareto quien al realizar estudios sobre la distribucin de la riqueza descubri que la minora de la poblacin posea la mayor parte de la riqueza y la mayora de la poblacin posea la menor parte de la riqueza. Posteriormente el Dr. Joseph Juran aplic el concepto a la calidad con lo cual se obtuvo lo que hoy se conoce como la regla 80/20; es decir, el 20% de las causas resuelven el 80% del problema y el 80% de las causas resuelven solamente el 20% del problema. El diagrama de Pareto es una grfica de dos dimensiones que se construye listando las causas de un problema en el eje horizontal, empezando por la izquierda para colocar aquellas que tienen un mayor efecto sobre el problema, de manera que vayan disminuyendo en orden de magnitud. El eje vertical se dibuja en ambos lados del diagrama: el lado izquierdo representa la magnitud del efecto provocado por las causas, mientras que el lado derecho refleja el porcentaje acumulado de efecto de las causas, empezando por la de mayor magnitud. Diagrama de Pareto utilizando Minitab:
1. Capture los siguientes datos en la columna C1 (tipo de defecto), en la columna C2 (frecuencias). En caso de que los datos no estuvieran agrupados solamente puede colocar los defectos en la columna C1.
Defecto Frecuencias
Terminal Abierta 5
Terminal Doblada 1
Terminal Faltante 15
Soldadura Faltante 43
Falla Elctrica 5
SMD Faltante 7
2. Seleccione la opcin Stat > Quality Tools > Pareto Chart.
3. Coloque los defectos y las frecuencias de acuerdo a la imagen siguiente.
4. En caso de que no quiera que todos los tipos de defectos se muestren es posible combinar los defectos con porcentaje marginal, para esto es necesario colocar el porcentaje acumulado a partir del cual se combinaran las categoras. Esto se hace en Combine remaining defects into one category after this percent si esto no le interesa seleccione la opcin Do not combine y posteriormente presione OK.
-
IPIW12 Estadstica Aplicada a la Ingeniera
23
5. El sistema despliega la grfica de Pareto siguiente.
Tambin es posible realizar un diagrama de Pareto agregndole una variable categrica, a continuacin se presenta el diagrama de Pareto obtenido con el archivo Ejemplo Pareto que puede ser consultado en el material provisto.
1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Pareto.
2. Una vez abierto seleccione la opcin: Stat > Quality Tools > Pareto Chart.
3. Coloque los defectos y la variable de categorizacin conforme a la imagen siguiente:
4. En caso de que no quiera que todos los tipos de defectos se muestren es posible combinar los defectos con porcentaje marginal, para esto es necesario colocar el porcentaje acumulado a partir del cual se combinaran las categoras. Esto se hace en Combine remaining defects into one category after this percent si esto no le interesa seleccione la opcin Do not combine y posteriormente presione OK.
-
IPIW12 Estadstica Aplicada a la Ingeniera
24
5. Desplegndose la grfica de Pareto mostrada a continuacin.
Diagrama Causa Efecto Tambin conocido como diagrama de Ishikawa o de pescado, este grfico es utilizado para identificar las posibles causas de un problema especfico y su naturaleza grfica permite determinar de manera exacta las posibles causas principales. Para desarrollar este diagrama es necesario seguir los siguientes pasos:
1. Definir y determinar claramente el problema o el efecto que va a ser analizado. 2. Identificar los factores o causas que originan el efecto, generalmente mediante una lluvia de ideas y
agrupando estos aquinaria, materiales, mtodos, mano de obra, .
3. Representacin del diagrama mediante la colocacin de las causas agrupadas por sus caractersticas similares.
4. Anlisis de las relaciones causa-efecto que se derivan de la construccin del diagrama. Teniendo este diagrama las ventajas de proporcionar una metodologa racional para la solucin de los problemas, permitir sistematizar las posibles causas de un problema, favorecer el trabajo en equipo permitiendo que los trabajadores planteen de forma creativa sus opiniones de forma clara y eficaz.
Diagrama de causa y efecto utilizando Minitab:
1. Capture los siguientes datos en una hoja de trabajo de Minitab: MEDIO AMBIENTE MATERIALES MANO DE OBRA METODOS MAQUINARIA
Polvo Forma Salud Ajuste Mantenimiento
Vibraciones Dureza Habilidad Velocidad Deformacin
Humedad Almacn Humor Abrasin
Temperatura Herramental
FORMA ALMACEN HABILIDAD HUMOR
Dimetro Tiempo Seleccin Horas
Curvatura Ambiente Formacin Moral
Experiencia Cansancio
secundarias.
2. Seleccione la opcin Stat > Quality Tools > Cause and Effect.
-
IPIW12 Estadstica Aplicada a la Ingeniera
25
3. En el cuadro de dialogo coloque en la columna Causes las causas principales ingresadas en la hoja de trabajo, en la columna Label el nombre que se desea que aparezca como caracterstica principal.
4. En caso de existir causas secundarias seleccionar el botn Sub relacionado a la causa principal, dentro de ese cuadro ingresar las causas secundarias y presionar el botn OK.
5. Si se desea agregar titulo al efecto (Effect) y a la grfica (Title) utilice las celdas correspondientes y posteriormente presionar el botn OK. Con lo cual se obtiene el diagrama de causa efecto siguiente.
Si se desea cambiar el tamao o el tipo de letra hacer doble clic en los ttulos y seleccionar el tamao o el tipo de letra deseado.
-
IPIW12 Estadstica Aplicada a la Ingeniera
26
Estadstica Descriptiva
3
-
IPIW12 Estadstica Aplicada a la Ingeniera
27
Estadstica descriptiva Es una rama de las matemticas que comprende la recopilacin, tabulacin, anlisis e interpretacin de datos cuantitativos y cualitativos, para tomar decisiones que se requieran a fin de que el comportamiento de los datos se mantengan dentro de los parmetros de control establecidos. Algunos conceptos de la estadstica descriptiva son:
Poblacin (N); es el conjunto de todos los elementos de inters para determinado estudio.
Parmetro; es una caracterstica numrica de la poblacin, se identifica con letras griegas (media = , desviacin estndar =
Muestra (n); es una parte de la poblacin, debe ser representativa de la misma.
Estadstico; es una caracterstica numrica de una muestra, se identifica con letras latinas (media = x , desviacin estndar = s, proporcin = p, coeficiente de correlacin = r)
La estadstica descriptiva proporciona un criterio para lograr mejoras, debido a que sus tcnicas se pueden usar para describir y comprender la variabilidad. La estadstica inferencial se refiere a la estimacin de parmetros y pruebas de hiptesis acerca de las caractersticas de la poblacin en base a los datos obtenidos con una muestra.
Medidas de tendencia central Las medidas de tendencia central nos permiten identificar los valores ms representativos de los datos, de acuerdo a la manera de cmo se tienden a concentrar, estas son:
Media ( x ); es el promedio aritmtico de todos los valores que componen el conjunto de datos. Se calcula mediante la siguiente frmula:
n
xix
n
xi
Media acotada (Truncated Mean); para obtener esta medida de tendencia central, determinado porcentaje de los valores ms altos y bajos de un conjunto de datos son eliminados (tomando nmeros enteros), siendo calculada la media con los valores restantes.
Mediana ( x~ ); Los datos de "n" observaciones son ordenados del ms pequeo al ms grande, si el tamao de la muestra es "non" la mediana es el valor ordenado en la posicin (n+1)/2, cuando el tamao de la muestra es "par" la mediana es el promedio de los dos valores que se encuentran al centro del conjunto de valores. Se puede calcular mediante:
2
1~ 22nn
x
Moda; es el valor que ms se repite dentro de los datos.
-
IPIW12 Estadstica Aplicada a la Ingeniera
28
Medidas de dispersin Son las medidas que describen la variabilidad de los valores al ser contrastados contra ciertos valores centrales.
Varianza de los datos; es una medida que nos ayuda a comprender la variabilidad de los datos, es decir que tan distanciados estn de la media:
Para el caso de una poblacin n
xxi 22 )(
Para el caso de una muestra 1
)( 22
n
xxis
Desviacin estndar; es la raz cuadrada de la varianza:
Para el caso de una poblacin n
xxi 2)(
Para el caso de una muestra 1
)( 2
n
xxis
Rango (R); es la diferencia positiva entre el valor mayor y el valor menor de un conjunto de datos.
Coeficiente de Variacin (CV); se utiliza para comparar la dispersin de dos conjuntos de datos que tienen unidades diferentes, ya que representa una medida relativa de dispersin.
)100(x
sCV
Cuartiles; los cuartiles dividen al conjunto de observaciones en 4 partes iguales, el primer cuartil es ese valor debajo del cual clasifica el 25% de las observaciones, el tercer cuartil es el valor por debajo del cual se encuentran el 75% de las observaciones, siendo el segundo cuartil la mediana.
Deciles; los deciles separan un conjunto de datos ordenado en 10 subconjuntos iguales.
Percentiles; los percentiles separan un conjunto de datos ordenado en 100 partes, la ubicacin de un percentil se calcula mediante:
100)1(
PnLp
Estadstica descriptiva utilizando Minitab:
1. Capture los siguientes datos en la hoja de trabajo, nombrando la columna como Datos: 2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21
3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37
4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79
4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31
8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83
9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67
11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28
12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58
13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07
15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47
16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60
16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74
17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78
-
IPIW12 Estadstica Aplicada a la Ingeniera
29
2. Seleccione Stat > Basic statistics > Display descriptive statistics posteriormente en la celda Variables ingrese el nombre de la columna que contiene los datos.
3. Presionando el botn Statistics es posible seleccionar las medidas de tendencia central o dispersin requeridas, posteriormente de clic en OK.
4. Obtenindose los siguientes datos en la ventana de Session.
Descriptive Statistics: Datos Variable N N* Mean SE Mean StDev Variance CoefVar Minimum Q1
Datos 130 0 50.05 1.97 22.50 506.47 44.96 2.41 36.13
Variable Median Q3 Maximum
Datos 49.34 65.63 96.78
-
IPIW12 Estadstica Aplicada a la Ingeniera
30
Regresin y Correlacin
4
-
IPIW12 Estadstica Aplicada a la Ingeniera
31
Correlacin, Regresin Simple y Mltiple La regresin es la tcnica estadstica utilizada para cuantificar la asociacin estadstica entre dos o ms variables, trata de encontrar
El modelo matemtico de la regresin lineal puede ser expresado como:
pp XBXBXBBY ...22110
Donde 0B es la constante y )0(iBi son los parmetros respectivos a cada una de las variables
independientes y p el nmero de parmetros independientes a ser considerados en el anlisis de regresin. La correlacin indica la fuerza y la direccin de una relacin lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una de las variables varan sistemticamente con respecto a los valores homnimos de la otra. Sin embargo es importante notar que la correlacin entre dos variables no implica, por si misma, ninguna relacin de causalidad. Existen diversos coeficientes que miden el grado de correlacin, adaptados a la naturaleza de los datos. El ms conocido es el coeficiente de correlacin de Pearson (introducido por Francis Galton), que se obtiene dividiendo la covarianza de dos variables por el producto de sus desviaciones estndar.
Correlacin Positiva
Evidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlacin Negativa
Evidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlacin
Positiva
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlacin
Negativa
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Sin Correlacin
10
15
20
25
5 10 15 20 25
X
Y
0
5
0
Correlacin Positiva
Evidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlacin Negativa
Evidente
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlacin
Positiva
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlacin
Negativa
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Sin Correlacin
10
15
20
25
5 10 15 20 25
X
Y
0
5
0
Para que un modelo pueda ser considerado
cuadrado (coeficiente de determinacin) debe de ser mayor o igual al 70%, porcentaje que indica el grado de inclusin de la variabilidad
en el modelo matemtico.
http://es.wikipedia.org/wiki/Francis_Galton -
IPIW12 Estadstica Aplicada a la Ingeniera
32
Calculo del coeficiente de correlacin utilizando Minitab: Como se mencion anteriormente la correlacin indica la fuerza y la direccin de una relacin lineal entre dos variables aleatorias. Minitab nos permite realizar una prueba de correlacin de variables para ello es necesario seguir los siguientes pasos: 1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin, de este
archivo solamente vamos a utilizar las columnas Peso (Weight) y Altura (Height).
2. Antes de calcular el coeficiente de correlacin se sugiere realizar un diagrama de dispersin para Graph > Scatterplot > Simple con Y = Weight
y X = Height, obtenindose la siguiente grafica.
Claramente se observa que se tiene una correlacin positiva, siendo nuestro inters evaluar si el grado de relacin existente es significativa o no lo es.
3. Seleccione en Stat > Basic Statistics > Correlation las variables Height y Weight, posteriormente seleccione la opcin Display p-values.
4. Obtenindose los resultados mostrados a continuacin.
Concluyndose que debido a que el
valor P < (menor que 0.05) la correlacin si es significativa.
Correlations: Height, Weight Pearson correlation of Height and Weight = 0.785
P- Value = 0.000
-
IPIW12 Estadstica Aplicada a la Ingeniera
33
Si se desea agregar una variable mas para el anlisis de la correlacin:
1. Seleccione en Stat > Basic Statistics > Correlation las variables Height, Weight y Pulse1 posteriormente se selecciona la opcin Display p-values.
2. Obtenindose los siguientes resultados en la ventana de Session.
Calculo de la covarianza utilizando Minitab: La covarianza mide la relacin existente entre dos variables sin embargo este dato no se encuentra estandarizado como sucede con el coeficiente de correlacin, es decir dividido por la desviacin estndar de las dos variables.
1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Covarianza.
2. Seleccionar en Stat > Basic Statistics > Covariance las variables Verbal, Math y GPA, posteriormente presionar el botn OK.
Correlations: Height, Weight, Pulse1 Height Weight
Weight 0.785 Correlacin
0.000 Valor P
Pulse1 - 0.212 - 0.202 Correlacin
0.043 0.053 Valor P
Cell Contents: Pearson correlation
P- Value
-
IPIW12 Estadstica Aplicada a la Ingeniera
34
3. Obtenindose los siguientes resultados en la ventana de Session.
Regresin por medio de un ajuste de lnea utilizando Minitab:
1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresion, de este archivo solamente vamos a utilizar las columnas Peso (Weight) y Altura (Height).
2. Seleccione en Stat > Regression > Fitted Line Plot las variable de respuesta (Y) Weight y la variable predictora (X) Height posteriormente seleccione en el tipo de modelo de regresin la opcin Linear (alternativamente puede seleccionar Quadratic o Cubic), presione OK cuando termine.
3. Mediante lo cual se obtiene la grafica siguiente.
Ecuacin de regresin. S = Desviacin estndar de los residuos (valor real estimado por la regresin). R-Sq = Coeficiente de determinacin, que indica el porcentaje de inclusin de la variabilidad en la ecuacin de regresin. R-Sq (Adj) = Coeficiente de determinacin utilizado solamente para regresin mltiple.
Covariances: Verbal, Math, GPA Verbal Math GPA
Verbal 5359.6859
Math 1333.9704 4401.9388
GPA 13.6995 7.4790 0.3368
-
IPIW12 Estadstica Aplicada a la Ingeniera
35
4. Y los siguientes resultados en la ventana de Session.
Los cuales pueden ser interpretados de la siguiente forma: Debido a que el valor P < 0.05 las variables peso (weight) y altura (height) tienen correlacin significativa. Pero el modelo solamente incluye el 61.6% de la variabilidad presente, por tanto no puede considerarse como una buena ecuacin predictora.
En el caso que se desee determinar qu modelo matemtico se ajusta ms, es necesario realizar un anlisis de regresin lineal, cuadrtico y cubico y mediante los valores de R-Sq se concluir que el tipo de modelo que incluye en mayor medida la variabilidad (mayor valor de R-Sq). Anlisis de regresin lineal simple utilizando Minitab:
1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin, de este archivo solamente vamos a utilizar las columnas Peso (Weight) y Altura (Height).
2. Seleccione en Stat > Regression > Regression las variable de respuesta (Y) Weight y la variable predictora (X) Height.
3. Para visualizar las grficas de residuales seleccione el botn y en el cuadro de dialogo seleccione la opcin Four in one, presione el botn OK.
Regression Analysis: Weight versus Height The regression equation is
Weight = - 204.7 + 5.092 Height
S = 14.7920 R - Sq = 61.6% R - Sq(adj) = 61.2%
Analysis of Variance
Source DF SS MS F P
Regression 1 31591.6 31591.6 144.38 0.000
Error 90 19692.2 218.8
Total 91 51283.9
-
IPIW12 Estadstica Aplicada a la Ingeniera
36
4. Mostrndose los siguientes resultados en la ventana de Session y en una grfica de residuales.
Los cuales pueden ser interpretados de la siguiente forma: Debido a que el valor P < 0.05 las variables peso (weight) y altura (height) tienen correlacin significativa. Sin embargo el modelo solamente incluye el 61.6% de la variabilidad presente, por tanto no puede considerarse como una buena ecuacin predictora. Asimismo en la seccin de observaciones inusuales se muestran datos que es necesario revisar, generalmente estos datos estn acompaados de una letra donde R denota las observaciones con un residual estandarizado demasiado grande y X denota observaciones muy alejadas de la mayora de las observaciones, los cuales pueden sesgar los resultados (es decir tienen demasiada influencia).
Regression Analysis: Weight versus Height The regression equation is
Weight = - 205 + 5.09 Height
Predictor Coef SE Coef T P
Constant - 204.74 29.16 - 7.02 0.000
Height 5.0918 0.4237 12.02 0.000
S = 14.7920 R - Sq = 61.6% R - Sq(adj) = 61.2%
Analysis of Variance
Source DF SS MS F P
Regression 1 31592 31592 144.38 0.000
Residual Error 90 19692 219
Total 91 51284
Unusual Observations
Obs Height Weight Fit SE Fit Residual St Resid
9 72.0 195.00 161.87 2.08 33.13 2.26R
25 61.0 140.00 105.86 3.62 34.14 2.38R
40 72.0 215.00 161.87 2.08 53.13 3.63R
84 68.0 110.00 141.50 1.57 - 31.50 - 2.14R
R denotes an observation with a large standardized residual.
-
IPIW12 Estadstica Aplicada a la Ingeniera
37
Anlisis de regresin lineal mltiple utilizando Minitab:
1. Capture el siguiente ejemplo en la hoja de trabajo de Minitab: Cdigo Algoritmos
(X1) Base de
Datos (X2) Programacin
(X3) PHP (Y)
1 15 15 13 13
2 14 13 12 13
3 16 13 14 13
4 20 14 16 15
5 18 18 17 16
6 16 17 15 15
7 13 15 11 12
8 16 14 15 13
9 15 14 13 13
10 14 13 10 13
11 12 12 10 11
12 16 11 14 14
13 17 16 15 15
14 19 14 16 15
15 13 15 10 15
2. Seleccione en Stat > Regression > Regression la variable de respuesta (Y) PHP y las v Algoritmos, Base de Datos y Programacin, posteriormente presione el botn en OK.
3. Obtenindose los resultados siguientes.
Regression Analysis: PHP (Y) versus Algoritmos (, Base de Dato, ... The regression equation is
PHP (Y) = 2.55 + 0.583 Algoritmos (X1) + 0.373 Base de Datos (X2)
- 0.242 Programacin (X3)
Predictor Coef SE Coef T P
Constan t 2.551 2.369 1.08 0.305
Algoritmos (X1) 0.5827 0.2665 2.19 0.051
Base de Datos (X2) 0.3735 0.1442 2.59 0.025
Programacin (X3) - 0.2415 0.2704 - 0.89 0.391
S = 0.861265 R - Sq = 69.7% R - Sq(adj) = 61.4%
Analysis of Variance
Source DF SS MS F P
Regression 3 18.7738 6.2579 8.44 0.003
Residual Error 11 8.1595 0.7418
Total 14 26.9333
Source DF Seq SS
Algoritmos (X1) 1 13.7704
Base de Datos (X 2) 1 4.4117
Programacin (X3) 1 0.5917
Unusual Observations
Algoritmos
Obs (X1) PHP (Y) Fit SE Fit Residual St Resid
12 16.0 14.000 12.601 0.560 1.399 2.14R
15 13.0 15.000 13.313 0.508 1 .687 2.42R
R denotes an observation with a large standardized residual.
-
IPIW12 Estadstica Aplicada a la Ingeniera
38
Seleccin de la mejor ecuacin predictora para regresin lineal multiple utilizando Minitab: Cuando el nmero de variables regresoras es considerado grande se tiene la necesidad de determinar cuales de esas variables deben entrar al modelo de regresin y que variables no deben de entrar en el modelo. Intuitivamente puede parecer bueno introducir en el modelo todas las variables regresoras pero este procedimiento no es adecuado porque en el clculo de la varianza del modelo influye el nmero de variables presentes lo que ocasiona que el clculo de R
2 (R-Sq) aumente al aumentar el nmero de
regresores. Adems puede haber problemas de multicolinealidad Por tanto, para seleccionar las variables regresoras es posible utilizar procedimientos paso a paso (stepwise), que bajo la hiptesis de que la relacin entre las variables regresoras y la variable respuesta es lineal, permiten elegir el subconjunto de variables regresoras que deben estar en el modelo. Entre estos procedimientos paso a paso se encuentran:
Eliminacin progresiva (backward stepwise regression); este procedimiento parte del modelo de regresin con todas las variables regresoras y en cada etapa elimina la variable menos influyente segn el contraste individual del valor P (valor t o F en caso de un procedimiento manual) hasta una cierta regla de parada. El procedimiento de eliminacin progresiva tiene la desventaja de necesitar mucha capacidad de clculo si el nmero de variables regresoras es grande y lleva a problemas de multicolinealidad si las variables estn relacionadas. Tiene la ventaja de no eliminar variables significativas.
Introduccin progresiva (fordward regression); este algoritmo funciona de forma inversa a la eliminacin progresiva, parte del modelo sin ninguna variable regresora y en cada etapa se introduce la ms significativa hasta una cierta regla de parada. Este procedimiento tiene la ventaja de necesitar menos clculo, pero presenta dos graves inconvenientes, el primero, que pueden aparecer errores de especificacin porque las variables introducidas permanecen en el modelo aunque el algoritmo en pasos sucesivos introduzca nuevas variables que aportan la informacin de las primeras. Este algoritmo tambin falla si el contraste conjunto es significativo pero los individuos no lo son, ya que no introduce variables regresoras.
Regresin paso a paso (stepwise regression); este mtodo es una combinacin de los procedimientos anteriores, comienza como el de introduccin progresiva, pero en cada etapa se plantea si todas las variables introducidas deben de permanecer. El algoritmo se termina cuando ninguna variable entra o sale del modelo.
Otro mtodo para encontrar el modelo de regresin es el de mejores subconjuntos (best subsets) que analiza todos los posibles subconjuntos que pueden formarse con las variables y mediante la utilizacin de la medida de bondad de ajuste (R
2 ajustada) se determina cul de estos subconjuntos es ms adecuado,
sin embargo realizar una exploracin completa resulta costoso en tiempos computacionales por tanto este mtodo hace uso del algoritmo de ramificacin y acotacin (branch-and-bound) para obtener implcitamente todas las posibles regresiones e identificar el mejor subconjunto de un determinado nmero de variables regresoras segn un criterio de ajuste predeterminado.
1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin.
2. Seleccione en Stat > Regression > Regression la variable de respuesta (Y) Peso (Weight) y las
-
IPIW12 Estadstica Aplicada a la Ingeniera
39
3. Para visualizar las grficas de residuales seleccione el botn y en el cuadro de dialogo seleccione la opcin Four in one, presione el botn OK.
4. Con lo cual se obtienen los resultados siguientes:
Cinco de las variables regresoras incluidas en el modelo nos dan valores P mayores a 0.05 lo que es indicativo que el modelo no es un buen modelo en funcin de su sencillez o facilidad de interpretacin. El modelo de regresin lineal mltiple nos muestra un coeficiente de determinacin ajustado de 66.2% lo cual no puede ser considerado como bueno.
Regression Analysis: Weight versus Pulse1, Pulse2, ...
The regression equation is
Weight = - 54.4 + 0.074 Pulse1 - 0.154 Pulse2 - 5.67 Ran - 6.09 Smokes
- 12.8 Sex + 3.64 Height - 2.86 Activity
Predictor Coef SE Coef T P
Constant - 54.44 47.87 - 1.14 0.259
Pulse1 0.0738 0.1936 0.38 0.704 No significativo (P > 0.05)
Pulse2 - 0.1542 0.1634 - 0.94 0.348 No significativo (P > 0.05)
Ran - 5.672 4.511 - 1.26 0.212 No significativo (P > 0.05)
Smokes - 6.087 3.253 - 1.87 0.065 No significativo (P > 0.05)
Sex - 12.823 4.543 - 2.82 0.006
Height 3.6351 0.5808 6.26 0.000
Activity - 2.861 2.484 - 1.15 0.253 No significativo (P > 0.05)
S = 13.8107 R - Sq = 68.8% R - Sq(adj) = 66.2%
Analysis of Variance
Source DF SS MS F P
Regression 7 35262.1 5037.4 26.41 0.000
Residual Error 84 16021.7 190.7
Total 91 51283.9
Source DF Seq SS
Pulse1 1 2097.1
Pulse2 1 160.0
Ran 1 7042.0
Smokes 1 1683.4
Sex 1 16539.7
Height 1 7486.8
Activity 1 253.0
Unusual Observations
Obs Pulse1 Weight Fit SE Fit Residual St Resid
9 62 195.00 163.90 3.25 31.10 2.32R
25 96 140.00 103.58 6.37 36.42 2.97R
40 76 215.00 159.11 2.93 55.89 4.14R
R denotes an observation with a large standardized residual.
-
IPIW12 Estadstica Aplicada a la Ingeniera
40
Mtodo de los mejores subconjuntos (best subsets)
1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin.
2. Seleccione en Stat > Regression > Best Subsets como variable de respuesta (Y) Peso (Weight), en Free predictors se colocan las variables candidatas a entrar al modelo y en la seccin Predictors in all models se colocan las variables forzadas a entrar en el modelo.
3. Presionando el botn se despliega el cuadro de dialogo donde es posible acotar el proceso de bsqueda del mejor modelo por medio del mtodo de los mejores subconjuntos. Llenndose la informacin de la siguiente manera:
En Free Predictor (s) in Each Model se colocan la cantidad minima y mxima de variables a ser anaizada en el proceso de bsqueda.
En Models of each size to print se coloca el nmero de ecuaciones que apareceran desplegadas en la ventana de Session con 1, 2,
-
IPIW12 Estadstica Aplicada a la Ingeniera
41
4. Una vez completada la informacin requerida se presiona OK las veces necesarias, con lo cual se despliega la siguiente informacin en la ventana de Session:
Si nos centramos en los valores del coeficiente de determinacin ajustado los modelos que tengan mayor valor son los mejores. Sin embargo debido a que tenemos un empate, es posible utilizar el principio de parsimonia (el modelo ms sencillo es el mejor) siendo el mejor modelo el compuesto por tres variables. Ahora bien, en caso de que no se quiera utilizar este principio tambin es posible utilizar el estadstico Cp de Mallows (que incluye el sesgo en el clculo del coeficiente) el cual nos dice que el mejor modelo es el que tiene el menor valor de este estadstico.
Por tanto para este ejemplo y utilizando el mtodo de los mejores subconjuntos el modelo de regresin lineal mltiple que mejor se ajusta a los datos es:
Weight = - 82.7 - 6.74 Smokes - 13.5 Sex + 3.75 Height El cul es obtenido mediante el anlisis de regresin lineal mltiple explicado con antelacin. Mtodo de regresin paso a paso (stepwise regression)
1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin.
2. Seleccione en Stat > Regression > Stepwise, como variable de respuesta (Y) Peso (Weight), en Predictors se colocan las variables candidatas a entrar al modelo y en la seccin Predictors in all models se colocan las variables forzadas a entrar en el modelo
Best Subsets Regression: Weight versus Pulse1, Pulse2, ... Response is Weight
A
c
P P S H t
u u m e i
l l o i v
s s R k S g i
Mallows e e a e e h t
Vars R - Sq R - Sq(adj) Cp S 1 2 n s x t y
1 61.6 61.2 15.2 14.792 X
1 50.2 49.7 45.8 16.842 X
2 66.1 65.3 5.2 13.981 X X
2 64.0 63.2 10.7 14.396 X X
3 67.8 66.7 2.7 13.705 X X X
3 66.7 65.5 5.6 13.935 X X X
4 68.1 66.7 3.7 13.705 X X X X
4 68.0 66.5 4.0 13.733 X X X X
5 68.4 66.5 5.0 13.733 X X X X X
5 68.2 66.4 5.4 13.762 X X X X X
6 68.7 66.5 6.1 13.741 X X X X X X
6 68.4 66.2 6.9 13.802 X X X X X X
7 68.8 66.2 8.0 13.811 X X X X X X X
-
IPIW12 Estadstica Aplicada a la Ingeniera
42
3. Presionando el botn se despliega el cuadro de dialogo donde es posible seleccionar los criterios de entrada y salida de las variables, seleccionndose la opcin Stepwise.
4. Una vez completada la informacin requerida se presiona OK las veces necesarias, con lo cual se despliega la siguiente informacin en la ventana de Session:
Donde se nos muestra las variables que entran en cada paso y la calidad de su ajuste (determinando al mejor modelo con el valor del coeficiente R-Sq ajustado o con el estadstico de Mallows Cp). Resultando que la mejor ecuacin de regresin es:
Weight = - 82.67 + 3.75 Height - 13.5 Sex - 6.7 Smokes
La cul es obtenida directamente al observar los resultados de la ventana de Session.
Introduccin progresiva (fordward regression)
1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin.
2. Seleccione en Stat > Regression > Stepwise, como variable de respuesta (Y) Peso (Weight), en Predictors se colocan las variables candidatas a entrar al modelo y en la seccin Predictors in all models se colocan las variables forzadas a entrar en el modelo.
Stepwise Regression: Weight versus Pulse1, Pulse2, ... Alpha - to - Enter: 0.1 5 Alpha - to - Remove: 0.15
Response is Weight on 7 predictors, with N = 92
Step 1 2 3
Constant - 204.74 - 88.20 - 82.67
Height 5.09 3.69 3.75
T- Value 12.02 6.45 6.68
P- Value 0.000 0.000 0.000
Sex - 14.7 - 13.5
T- Value - 3.43 - 3.19
P- Value 0.001 0.002
Smokes - 6.7
T- Value - 2.15
P- Value 0.034
S 14.8 14.0 13.7
R- Sq 61.60 66.08 67.77
R- Sq(adj) 61.17 65.31 66.67
Mallows Cp 15.2 5.2 2.7
-
IPIW12 Estadstica Aplicada a la Ingeniera
43
3. Presionando el botn Methods se
despliega el cuadro de dialogo donde es posible seleccionar los criterios de entrada de las variables, seleccionndose la opcin Fordward selection.
4. Una vez completada la informacin requerida se presiona OK las veces necesarias, con lo cual se despliega la siguiente informacin en la ventana de Session:
Donde se nos muestra que las variables que entran en cada paso son las que tienen el valor P igual o menor al especificado y la calidad del su ajuste de cada uno de los modelos (determinando al mejor modelo con el valor del coeficiente R-Sq ajustado o con el estadstico de Mallows Cp). Resultando que la mejor ecuacin de regresin es:
Weight = - 82.67 + 3.75 Height - 13.5 Sex - 6.7 Smokes
La cul es obtenida directamente al observar los resultados de la ventana de Session. Eliminacin progresiva (backward stepwise regression
1. Abrir en Minitab utilizando la funcin File > Open worksheet el archivo Ejemplo Regresin.
2. Seleccione en Stat > Regression > Stepwise, como variable de respuesta (Y) Peso (Weight), en Predictors se colocan las variables candidatas a entrar al modelo y en la seccin Predictors in all models se colocan las variables forzadas a entrar en el modelo
Stepwise Regression: Weight versus Pulse1, Pulse2, ... Forward selection. Alpha - to - Enter: 0.25
Response is Weight on 7 predictors, with N = 92
Step 1 2 3
Constant - 204.74 - 88.20 - 82.67
Height 5.09 3.69 3.75
T- Value 12.02 6.45 6.68
P- Value 0.000 0.000 0.000
Sex - 14.7 - 13.5
T- Value - 3.43 - 3.19
P- Value 0.001 0.002
Smokes - 6.7
T- Value - 2.15
P- Value 0.034
S 14.8 14.0 13.7
R- Sq 61.60 66.08 67.77
R- Sq(adj) 61.17 65.31 66.67
Mallows Cp 15.2 5.2 2.7
-
IPIW12 Estadstica Aplicada a la Ingeniera
44
3. Presionando el botn se
despliega el cuadro de dialogo donde es posible seleccionar los criterios de salida de las variables, seleccionndose la opcin Backward elimination.
4. Una vez completada la informacin requerida se presiona OK las veces necesarias, con lo cual se despliega la siguiente informacin en la ventana de Session:
Donde se observa que las variables que salen en cada paso son aquellas que tienen valor P mayor que el especificado, asimismo se nos presenta la calidad del ajuste de cada uno de los modelos (determinando la calidad del modelo con los coeficientes R-Sq (adj) o con el estadstico de Mallows Cp). Resultando que la mejor ecuacin de regresin es:
Weight = - 82.67 - 6.7 Smokes - 13.5 Sex + 3.75 Height
La cul es obtenida directamente al observar los resultados de la ventana de Session.
Stepwise Regression: Weight versus Pulse1, Pulse2, ... Backward elimination. Alpha - to - Remove: 0.1
Response is Weight on 7 predictors, with N = 92
Step 1 2 3 4 5
Constant - 54.44 - 53.57 - 66.46 - 77.73 - 82.67
Pulse1 0.07
T- Value 0.38
P- Value 0.704
Pulse2 - 0.15 - 0.11
T- Value - 0.94 - 0.95
P- Value 0.348 0.347
Ran - 5.7 - 4.9 - 2.5
T- Value - 1.26 - 1.23 - 0.81
P- Value 0.212 0.223 0.421
Smokes - 6.1 - 6.3 - 6.1 - 6.3 - 6.7
T- Value - 1.87 - 1.98 - 1.93 - 1.99 - 2.15
P- Value 0.065 0.051 0.056 0.049 0.034
Sex - 12.8 - 12.9 - 14.2 - 13.9 - 13.5
T- Value - 2.82 - 2. 85 - 3.32 - 3.27 - 3.19
P- Value 0.006 0.006 0.001 0.002 0.002
Height 3.64 3.63 3.65 3.75 3.75
T- Value 6.26 6.29 6.32 6.68 6.68
P- Value 0.000 0.000 0.000 0.000 0.000
Activity - 2.9 - 2.8 - 2.4 - 2.4
T- Value - 1.15 - 1.12 - 1.00 - 1.00
P- Value 0.253 0.266 0.320 0.321
S 13.8 13.7 13.7 13.7 13.7
R- Sq 68.76 68.70 68.38 68.13 67.77
R- Sq(adj) 66.16 66.50 66.54 66.67 66.67
Mallows Cp 8.0 6.1 5.0 3.7 2.7
-
IPIW12 Estadstica Aplicada a la Ingeniera
45
Prueba de Hiptesis
5
-
IPIW12 Estadstica Aplicada a la Ingeniera
46
Grfica de Probabilidad Con mucha frecuencia no se conoce la distribucin de probabilidad de la variable aleatoria en estudio y se desea probar la hiptesis de que esta variable sigue una distribucin de probabilidad particular. Por ejemplo, podra ser de inters probar la hiptesis de que la variable sigue una distribucin normal, una
La grfica de la probabilidad es un mtodo grfico para determinar s los datos se ajustan a una distribucin hipottica basada en un examen visual subjetivo de los datos; la idea bsica consiste en representar, en un mismo grfico, los datos empricos observados, frente a los datos que se obtendran en una distribucin hipottica terica. Si la distribucin de la variable se ajusta a la distribucin hipottica, los puntos quedarn cerca de una lnea recta. Siendo las hiptesis sujetas a estudio:
H0: Los datos analizados se comportan en base a una distribucin de probabilidad hipottica.
H1: No existe evidencia suficiente para concluir que los datos analizados se comportan en base a una distribucin de probabilidad hipottica.
Y la decisin de la prueba de hiptesis se obtendr utilizando el valor p obtenido si el valor P > se acepta
H0, si P < se acepta H1, si se da el caso de que P = es recomendable tomar otra muestra de datos o aumentar el tamao de muestra de los datos actuales. Grfica de probabilidad normal utilizando Minitab:
1. Capture los siguientes datos en la hoja de trabajo en una sola columna nombrndola como Datos: 2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21
3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37
4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79
4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31
8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83
9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67
11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28
12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58
13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07
15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47
16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60
16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74
17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78
2. Seleccione la opcin Graph > Probability Plot.
3. Dependiendo de la cantidad de variables a analizar seleccione Single o Multiple.
4. En el recuadro Graph variables coloque el nombre de la columna donde tiene capturado los datos.
5. En el botn Distribution seleccione la distribucin Normal y presione OK.
-
IPIW12 Estadstica Aplicada a la Ingeniera
47
6. Resultando la siguiente grfica de probabilidad que con base al valor P obtenido 0.399 se concluye que los datos se comportan en base a una distribucin normal para un nivel de confianza del 95%.
Grfica de probabilidad exponencial utilizando Minitab: Utilizando los mismos datos capturados en el ejemplo de grfica de probabilidad normal.
1. Seleccione la opcin Graph > Probability Plot.
2. Dependiendo de la cantidad de variables a analizar seleccione Single o Multiple.
3. En el recuadro Graph variables coloque el nombre de la columna donde tiene capturado los datos.
4. En el botn Distribution seleccione la distribucin Exponential y presione OK.
5. Con lo cual se obtiene la siguiente grfica de probabilidad.
Debido a que el valor P obtenido es menor que 0.05 (P < ) se rechaza H0 (acepta H1) es decir, que los datos analizados no se comportan en base a una distribucin de probabilidad exponencial.
-
IPIW12 Estadstica Aplicada a la Ingeniera
48
Grfica de probabilidad lognormal utilizando Minitab: Utilizando los mismos datos capturados en el ejemplo de grfica de probabilidad normal.
1. Seleccione la opcin Graph > Probability Plot.
2. Dependiendo de la cantidad de variables a analizar seleccione Single o Multiple.
3. En el recuadro Graph variables coloque el nombre de la columna donde tiene capturado los datos.
4. En el botn Distribution seleccione la distribucin Lognormal y presione OK.
5. Con lo cual se obtiene la siguiente grfica de probabilidad:
Debido a que el valor P obtenido es menor que 0.05 (P < ) se rechaza H0 (acepta H1) es decir, que los datos analizados no se comportan en base a una distribucin de probabilidad exponencial. Y de forma global, despus de realizada la prueba de bondad de ajuste, utilizando la grfica de probabilidad, del conjunto de datos contrastada contra la distribucin de probabilidad normal, exponencial y lognormal se concluye que, en base a los valores P obtenidos, la distribucin de probabilidad que mejor se ajusta al comportamiento de los datos analizados es la distribucin normal.
Prueba de normalidad La prueba de normalidad es una prueba de bondad de ajuste que busca determinar si un conjunto de datos se ajustan a una distribucin de probabilidad normal; realizado esto mediante la evaluacin de las hiptesis de investigacin:
H0: Los datos analizados se comportan en base a una distribucin normal.
H1: No existe evidencia suficiente para concluir que los datos analizados se comportan en base a una distribucin normal.
-
IPIW12 Estadstica Aplicada a la Ingeniera
49
Siendo el parmetro de aceptacin o rechazo de laH0 0 (es decir se acepta H1). La importancia de verificar la normalidad de las muestras es fundamental en la estadstica debido a que si las muestras son normales se pueden aplicar mtodos paramtricos convencionales para el tratamiento de los datos, en caso contrario es necesario realizar transformaciones que normalicen los datos, o bien utilizar mtodos no paramtricos o mtodos estadsticos avanzados. Minitab nos proporciona tres alternativas para realizar la prueba de normalidad Andreson-Darling, Ryan-Joiner y Kolmogorov-Smirnov las cuales pueden ser utilizadas de forma indistinta, sin embargo es importante comentar que algunos autores sealan que deben de seleccionarse dos de esas pruebas para estar seguros de los resultados, lo cual no es necesario cuando el valor P es cercano a 1, en el caso de
que el valor P sea cercano al nivel de significancia (P 0.05) en lugar de repetir dos veces la prueba sera ms conveniente realizar un nuevo muestreo. Prueba de normalidad utilizando Minitab
1. Capture los siguientes datos en la hoja de trabajo en una sola columna nombrndola como Datos: 2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21
3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37
4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79
4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31
8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83
9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67
11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28
12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58
13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07
15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47
16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60
16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74
17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78
2. Seleccione la opcin Stat > Basic Statistics > Normality Test.
3. Seleccione la Variable Datos como se muestra en la pantalla.
4. Seleccione la prueba de Anderson-Darling, Ryan-Joiner o Kolmogorov-Smirnov y presione el botn OK.
5. A continuacin se muestra la grfica normal, como puede observarse el valor P > 0.05 por tanto los datos son normales.
-
IPIW12 Estadstica Aplicada a la Ingeniera
50
Grfica de probabilidad normal utilizando Minitab:
1. Seleccione la opcin Graph > Probability Plot.
2. Dependiendo de la cantidad de columnas con datos seleccione Single o Multiple.
3. En el recuadro Graph variables coloque el nombre de la columna donde se tienen capturados los datos.
4. En el botn Distribution seleccione la distribucin Normal y presione OK.
5. Resultando la siguiente grfica de
probabilidad que con base al valor P obtenido (P = 0.399) se concluye que los datos se comportan en base a una distribucin normal para un nivel de confianza del 95%.
-
IPIW12 Estadstica Aplicada a la Ingeniera
51
Prueba t de Dos Muestras Supongamos que se tienen dos poblaciones distribuidas normalmente con medias desconocidas 1 y 2 respectivamente, la prueba t de dos muestras nos permite contrastar las medias de dichas poblaciones entre dos muestras independientes tomadas de ellas, mediante la siguiente prueba de hiptesis:
H0: 1 = 2.
H1: 1 2, 1 < 2 o 1 > 2
Donde la primer muestra es de tamao m con media x y varianza 21s y la segunda muestra es de tamao
n con media y y varianza 22s .
En esta prueba se utilizan dos estadsticos distintos dependiendo de la consideracin de varianzas iguales o no, para verificar esto se hace uso de la prueba de Levene para la igualdad de varianzas, siendo esta
prueba rechazada cuando el valor p < a (con un igual a 0.05).
El estadstico para varianzas de las poblaciones iguales (22
1
2
1 ) es:
nmS
yxt
p
11
)()( 21
Con 2nm grados de libertad. Asimismo la varianza poblacional 2 se estima por la varianza
combinada de las varianzas de las dos muestras tomadas, definida por:
2
)1()1( 222
12
nm
snsmSP
Con una frmula para obtener el intervalo de confianza del 100(1- )% para la diferencia de las medias
poblacionales ( 1 = 2):
nmStyx pmn
11)2,2/(
El estadstico para varianzas de las poblaciones distintas es )( 212
1:
n
s
m
s
yxt
2
2
2
1
Con grados de libertad:
11
2
2
2
1
2
21
n
c
m
c
ccdf con
m
sc
2
11 y
n
sc
2
22
-
IPIW12 Estadstica Aplicada a la Ingeniera
52
Prueba t de dos muestras utilizando Minitab: Una empresa desea evaluar si la resistencia a la traccin de pieles curtidas vara entre dos mtodos de curtido por tanto realiz un muestreo cuyos resultados se muestran en la tabla siguiente:
Mtodo A Mtodo B 24.30 24.40
25.60 21.50
26.70 25.10
22.70 22.80
24.80 25.20
23.80 23.50
25.90 22.20
26.40 23.50
25.80 23.30
25.40 24.70
Es posible determinar si la resistencia a la traccin de pieles curtidas entre los dos mtodos son iguales?
1. Capturar la tabla anterior en dos columnas nombrando las columnas como Mtodo A y Mtodo B respectivamente.
2. Realizar la prueba de dos varianzas para
determinar si se tienen varianzas iguales o no para ello se accede a Stat > Basic Statistics > 2 Variances, en la celda Data seleccionar Samples in different columns y en las celdas First y Second colocar los nombres de las columnas donde se tienen ingresados los datos, posteriormente dar clic en OK. En el botn Options es posible cambiar el nivel de confianza (por omisin es del 95%).
3. Obtenindose los resultados siguientes, mediante los cuales se puede concluir
que debido a que el valor P > (mayor que 0.05) no puede rechazarse la hiptesis nula de la prueba de varianzas con lo que se comprueba la existencia de varianzas iguales.
Test and CI for Two Variances: Mtodo A, Mtodo B Method
Null hypothesis Sigma(Mtodo A) / Sigma(Mtodo B) = 1
Alternative hypothesis Sigma(Mtodo A) / Sigma(Mtodo B) not = 1
Signifi cance level Alpha = 0.05
Statistics
Variable N StDev Variance
Mtodo A 10 1.242 1.543
Mtodo B 10 1.237 1.531
Ratio of standard deviations = 1.004
Ratio of variances = 1.008
95% Confidence Intervals
CI for
Distribution CI for StDev Variance
of Data Ratio Ratio
Normal (0.500, 2.014) (0.250, 4.058)
Continuous (0.369, 2.243) (0.136, 5.030)
Tests
Test
Method DF1 DF2 Statistic P - Value
F Test (normal) 9 9 1.01 0.991
Levene's Test (any continuous) 1 18 0.00 0.955
-
IPIW12 Estadstica Aplicada a la Ingeniera
53
4. Una vez analizadas las varianzas se procede a la comparacin de las medias poblacionales para ello se ingresa a Stat > Basic Statistics > 2 Sample t, seleccionndose la opcin Samples in different columns y colocando en las celdas First y Second el nombre de las columnas contenedoras de los datos. Asimismo se selecciona la opcin Assume equal variances ya que como se demostr anteriormente las dos poblaciones tienen esta caracterstica.
5. En el botn Options es posible cambiar el nivel de confianza
(por omisin es del 95%) as como la hiptesis alternativa ( 1
2, 1 < 2 o 1 > 2)
6. Con lo cual se obtienen los siguientes resultados en la ventana de Session.
Como el intervalo de confianza no incluye el valor cero y/o el valor P < (menor que 0.05) se rechaza la hiptesis nula de igualdad de medias, por tanto se acepta la hiptesis alternativa con lo que se afirma que las resistencias de los mtodos de curtido de pieles son diferentes.
Two-Sample T-Test and CI: Mtodo A, Mtodo B Two- sample T for Mtodo A vs Mtodo B
N Mean StDev SE Mean
Mtodo A 10 25.14 1.24 0.39
Mtodo B 10 23.62 1.24 0.39
Difference = mu (Mtodo A) - mu (Mtodo B)
Estimate for difference: 1.520
95% CI for difference: ( 0.355, 2.685 )
T- Test of difference = 0 (vs no t =): T - Value = 2.74 P - Value = 0.013 DF = 18
Both use Pooled StDev = 1.2396
-
IPIW12 Estadstica Aplicada a la Ingeniera
54
Prueba de Dos Proporciones El propsito de esta prueba es averiguar si existen diferencias estadsticamente significativas entre dos proporciones sujetas a estudio. Considrense que se toman dos muestras aleatorias de tamao n1 y n2 de dos poblaciones, y sea X1 y X2 el nmero de observaciones que pertenecen a la clase de inters en la muestra 1 y 2 respectivamente. Supngase adems que la aproximacin normal a la binomial se aplica a
cada poblacin, por lo que los estimadores de las proporciones de poblacin 111 / nXp y 222 / nXp
tienen distribuciones normales aproximadas. Luego si p1 = p2 = p la variable aleatoria puede ser calculada con:
21
21
11)1(
nnpp
ppZ
Que se distribuye normalmente con N(0,1). Estimndose el parmetro p con:
21
21
nn
XXp
Resultando en el estadstico de prueba para la evaluacin de la hiptesis nula p1 = p2:
21
210
11)1(
nnpp
ppZ
. Las hiptesis de investigacin evaluadas son:
H0: p 1 = p2.
H1: p 1 2, p 1 < p 2 o p 1 > p 2
Siendo H0 aceptada cuando el valor p > generalmente con un igual a 0.05, rechazada cuando P < y
cuando P = es recomendable realizar un nuevo muestreo o colectar un mayor nmero de datos. Prueba de Dos Proporciones utilizando Minitab
Una empresa ha estado teniendo problemas de calidad al utilizar dos equipo y desea evaluar si las proporciones de los problemas de calidad son iguales o son distintas, el equipo 1 ha tenido 33 eventos en 300 corridas y el equipo 2 ha tenido 22 eventos en 250 corridas.
1. Seleccione la opcin Stat > Basic Statistics > 2 - Proportions
2. Debido a que los datos se encuentran sumarizados seleccione la opcin Sumarized data e ingrese los valores de los eventos y corridas en las celdas correspondientes utilizando First para el equipo 1 y Second para el equipo 2.
-
IPIW12 Estadstica Aplicada a la Ingeniera
55
3. En el botn Options es posible cambiar el nivel de confianza (por omisin es del 95%) as como la hiptesis alternativa (p1 2, p 1 < p 2 o p 1 > p 2)
4. Con lo cual se obtienen los siguientes resultados en la ventana de Session.
Como el intervalo de confianza incluye el valor cero y/o el valor P > (mayor que 0.05) se acepta la hiptesis nula de igualdad de proporciones, con lo que se afirma que las proporciones de los problemas de calidad de los dos equipos son iguales.
Test and CI for Two Proportions Sample X N Sample p
1 33 300 0.110000
2 22 250 0.088000
Difference = p (1) - p (2)
Estimate for difference: 0.022
95% CI for difference: ( - 0.0278678, 0.0718678 )
Test for difference = 0 (vs not = 0): Z = 0.86 P - Value = 0.387
Fisher's exact test: P - Value = 0.476
-
IPIW12 Estadstica Aplicada a la Ingeniera
56
Grficos de Control
6
-
IPIW12 Estadstica Aplicada a la Ingeniera
57
Grficos de Control Las grficas de control son las herramientas ms poderosas para analizar la variacin en la mayora de los procesos. Han sido difundidas exitosamente en varios pases dentro de una amplia variedad de situaciones para el control del proceso. Estas enfocan la atencin hacia las causas especiales de variacin cuando estas aparecen y reflejan la magnitud de la variacin debida a las causas comunes.
Las causas comunes o aleatorias se deben a la variacin natural del proceso.
Las causas especiales o atribuibles son por ejemplo: un mal ajuste de mquina, errores del operador, defectos en materias primas.
Se dice que un proceso est bajo Control Estadstico cuando presenta causas comunes nicamente. Cuando ocurre esto tenemos un proceso estable y predecible. Cuando existen causas especiales el proceso est fuera de Control Estadstico; las grficas de control detectan la existencia de estas causas en el momento en que se dan, lo cual permite que podamos tomar acciones al momento. Ventajas:
Es una herramienta simple y efectiva para lograr un control estadstico.
El operario puede manejar las cartas en su propia rea de trabajo, por lo cual puede dar informacin confiable a la gente cercana a la operacin en el momento en que se deben de tomar ciertas acciones.
Cuando un proceso est en control estadstico puede predecirse su desempeo respecto a las especificaciones. En consecuencia, tanto el productor como el cliente pueden contar con niveles consistentes de calidad y ambos pueden contar con costos estables para lograr ese nivel de calidad.
Una vez que un proceso se encuentra en control estadstico, su comportamiento puede ser mejorado posteriormente reduciendo la variacin.
Al distinguir ente las causas especiales y las causas comunes de variacin, dan una buena indicacin de cundo un problema debe ser corregido localmente y cuando se requiere de una accin en la que deben de participar varios departamentos o niveles de la organizacin.
Grficos de control por variables y por atributos En Control de Calidad mediante el trmino variable se designa a cualquier caracterstica de calidad
atributo a las caractersticas de calidad que no son medibles y que presentan diferentes estados tales como conforme y disconforme o defectuoso y no defectuoso. Segn sea el tipo de la caracterstica de calidad a controlar as ser el correspondiente Grfico de Control que, por tanto, se clasifican en Cartas de Control por Variables y Cartas de Control por Atributos. Comparacin de las grficas de control por variables contra atributos Cartas de Control por variables Cartas de control por atributos
Ventajas significativas Conducen a un mejor procedimiento de control.
Son potencialmente aplicables a cualquier proceso
Proporcionan una utilizacin mxima de la informacin disponible de datos.
Los datos estn a menudo disponibles. Son rpidos y simples de obtener. Son fciles de interpretar.
Son frecuentemente usados en los informes a la Gerencia.
Ms econmicas.
Desventajas significativas No se entienden a menos que se de capacitacin; puede causar confusin entre los lmites de especificacin y los lmites de tolerancia.
No proporciona informacin detallada del control de caractersticas individuales.
No reconoce distintos grados de defectos en las unidades de producto.
-
IPIW12 Estadstica Aplicada a la Ingeniera
58
Campos de aplicacin de los grficos de control VARIABLES Carta Descripcin Campo de aplicacin
RX Medias y Rangos Control de caractersticas individuales.
SX Medias y desviacin estndar. Control de caractersticas individuales.
I Individuales Control de un proceso con datos variables que no pueden ser muestreados en lotes.
ATRIBUTOS Carta Descripcin Campo de aplicacin.
P Proporciones Control de la fraccin global de defectuosos de un proceso.
NP Nmero de defectuosos Control del nmero de piezas defectuosas
C Defectos por unidad Control de nmero global de defectos por unidad
U Promedio de defectos por unidad Control del promedio de defectos por unidad.
Grficos de control RX (variables) Paso 1: Colectar lo