-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
1/26
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
2/26
Definición Un Diagrama de Dispersión es la forma mas sencilla de definir
si existe o no una relación causa efecto entre dos variables yque tan firme es esta relación, como estatura y peso. Unaaumenta al mismo tiempo con la otra.
El Diagrama de Dispersión es de gran utilidad para la soluciónde problemas de la calidad en un proceso y producto, ya que
nos sirve para comprobar que causas (factores) estáninfluyendo o perturbando la dispersión de una característicade calidad o variable del proceso a controlar.
Tres conceptos especialmente destacables son que eldescubrimiento de las verdaderas relaciones de causa-efecto
es la clave de la resolución eficaz de un problema, que lasrelaciones de causa-efecto casi siempre muestranvariaciones, y que es más fácil ver la relación en un diagramade dispersión que en una simple tabla de números.
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
3/26
Características principales
Impacto visualUn Diagrama de Dispersión muestra la posibilidadde la existencia de correlación entre dos variablesde un vistazo.
ComunicaciónSimplifica el análisis de situaciones numéricascomplejas
Guía en la investigación
El análisis de datos mediante esta herramientaproporciona mayor información que el simpleanálisis matemático de correlación, sugiriendoposibilidades y alternativas de estudio, basadas enla necesidad de conjugar datos y procesos en suutilización.
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
4/26
PROCESOPasos previos a la construcción de un Diagrama de
Dispersión
Paso 1: Elaborar una teoría admisible y relevante sobre lasupuesta relación entre dos variables. Este paso previo esde gran importancia, puesto que el análisis de unDiagrama de Dispersión permite obtener conclusiones
sobre la existencia de una relación entre dos variables,no sobre la naturaleza de dicha relación.
Paso 2: Obtener los pares de datos correspondientes alas dos variables al igual que en cualquier otraherramienta de análisis de datos, éstos son la base de las
conclusiones obtenidas, por tanto cumplirán lassiguientes condiciones:
En cantidad suficiente: Se consideran necesarios al menos 40 paresde datos para construir un Diagrama de Dispersión.
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
5/26
Datos correctamente emparejados: Se estudiarála relación entre ambos.
Datos exactos: Las inexactitudes afectan a susituación en el diagrama desvirtuando suapariencia visual.
Datos representativos: Asegúrese de que cubrentodas las condiciones operativas del proceso Información completa: Anotar las condiciones en
que han sido obtenidos los datos.
Paso 3: Determinar los valores máximo y mínimopara cada una de las variables.
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
6/26
Ejemplo: Tabla de los datos recogidos
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
7/26
Paso 4: Decidir sobre qué eje representará a cada una de las
variables
Si se está estudiando una posible relación causa-efecto, el ejehorizontal representará la supuesta causa.
Paso 5: Trazar y rotular los ejes horizontal y vertical. La construcción de
los ejes afecta al aspecto y a la consiguiente interpretación deldiagrama.a) Los ejes han de ser aproximadamente de la misma longitud,determinando un área cuadrada.
b) La numeración de los ejes ha de ir desde un valor ligeramente
menor que el valor mínimo de cada variable hasta un valorligeramente superior al valor máximo de las mismas. Esto permite quelos puntos abarquen toda el área de registro de los datos.
c) Numerar los ejes a intervalos iguales y con incrementos de lavariable constantes.
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
8/26
d) Los valores crecientes han de ir de abajo a arriba y deizquierda a derecha en los ejes vertical y horizontalrespectivamente.
e) Rotular cada eje con la descripción de la variable
correspondiente y con su unidad de medida.EjemploNúmero de errores
Hora del día
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
9/26
Paso 6: Marcar sobre el diagrama los pares de datos Para cada par de datos localizar la intersección de las
lecturas de los ejes correspondientes y señalarlo con un
punto o símbolo.Si algún punto coincide con otro ya existente, se traza uncírculo concéntrico a este último.Ejemplo:
numero de errores
Hora del dia
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
10/26
Paso 7: Rotular el gráfico
Se rotula el título del gráfico y toda aquella informaciónnecesaria para su correcta comprensión. En general, esconveniente incluir una descripción adicional del objetode las medidas y de las condiciones en que se han
realizado, ya que esta información puede ayudar en lainterpretación del diagrama.
Ejemplo: Número de errores de tecleo según la hora deldía
Número de erroresHora del día
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
11/26
El Diagrama de Dispersión expresa el grado derelación entre dos variables, y dicha relación nonecesariamente significa que una de ellas es la
causa de la otra. El análisis de un Diagrama de Dispersión es un
proceso de cuatro pasos:
Primero: Elaborar una teoría admisible y relevante sobre la
supuesta relación entre dos variables.
Segundo: Recoger datos y construir el Diagrama.
Tercero: Identificar y clasificar la pauta de correlación.
Cuarto: Discutir la teoría original y considerar otrasexplicaciones. La construcción y clasificación del Diagramade Dispersión es la parte central del proceso. No es ni elprincipio ni el final.
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
12/26
Correlación Fuerte
Los puntos se agrupan claramente alrededor de una línea imaginaria quepasa por el centro de la masa de los mismos. Estos casos sugieren que elcontrol de una de las variables lleva al control de la otra. Los datos parecenconfirmar la teoría estudiada, pero hay que analizar la existencia de otrasposibles explicaciones admisibles y relevantes para dicha relación.
Correlación Fuerte, Positiva:El valor de la variable "Y" (eje vertical) aumenta claramente con el valor de lavariable "X" (eje horizontal).
Correlación Fuerte, Negativa:El valor de "Y" disminuye claramente cuando "X“ aumenta.
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
13/26
Correlación Débil
Los puntos no están suficientemente agrupados, como para asegurarque existe la relación. El control de una de las variables nonecesariamente nos llevará al control de la otra.Si lo que se busca es determinar las causas de un problema, sedeben buscar otras variables con una relación mayor o másrelevante sobre el efecto.
Correlación Débil, Positiva:El valor de la variable "Y" (eje vertical) tiende a aumentar cuandoaumenta el valor de la variable "X" (eje horizontal)
Correlación Débil, Negativa:El valor de "Y" tiende a disminuir cuando aumenta el valor de "X".
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
14/26
Correlación complejaEl valor de la variable "Y" parece estar relacionado conel de la variable "X", pero esta relación no es simple olineal. En este caso se estudia la relación másprofundamente (¿Hay alguna ley no lineal que expliqueesta relación ?. ¿ Es esta relación el resultado decomponer varias relaciones ?).
Sin correlación
Para cualquier valor de la variable "X", "Y" puede tenercualquier valor. No aparece ninguna relación especialentre ambas variables. En este caso, nuestra teoría no escorrecta y se deben buscar otros tipos de relaciones.
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
15/26
UTILIZACIÓN El Diagrama de Dispersión es una herramienta útil para
comprobar (aceptar o rechazar) teorías respecto a lasupuesta existencia de una relación entre dos variables.
Utilización en las fases de un proceso de solución deproblemas. Hay tres puntos de dicho proceso en los que
el Diagrama de Dispersión puede ser una herramientaútil:
Durante la fase de diagnóstico, para ensayar teoríassobre las causas e identificar las causas raíz.
Durante la fase de corrección, en el diseño desoluciones.
Para el diseño de un sistema de control que mantengalos resultados de una acción de mejora de la calidad.
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
16/26
COEFICIENTE DE CORRELACIÓN DEPEARSON
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
17/26
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
18/26
0.3 0.8 1
Débil positiva Fuerte positiva
POSITIVA:
-0.3 -0.8 -1
Débil negativa Fuerte negativa
NEGATIVA:
0.3-0.3
NO EXISTE CORRELACIÓN
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
19/26
El valor del índice de correlación varía en el intervalo [-1,1]: Si r = 1, existe una correlación positiva perfecta. El índice
indica una dependencia total entre las dos variablesdenominada relación directa: cuando una de ellas aumenta, laotra también lo hace en proporción constante.
Si 0 < r < 1, existe una correlación positiva. Si r = 0, no existe relación lineal. Pero esto no necesariamente
implica que las variables son independientes: pueden existirtodavía relaciones no lineales entre las dos variables.
Si -1 < r < 0, existe una correlación negativa.
Si r = -1, existe una correlación negativa perfecta. El índiceindica una dependencia total entre las dos variables llamadarelación inversa: cuando una de ellas aumenta, la otradisminuye en proporción constante.
http://es.wikipedia.org/wiki/Independencia_(probabilidad)http://es.wikipedia.org/wiki/Independencia_(probabilidad)http://es.wikipedia.org/wiki/Independencia_(probabilidad)
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
20/26
n
yi xi xiyiSCxiyi
)(
n
xi xiSCxi
2
2 )(
n
yi yiSCyi
2
2 )(
xi yi 2 xi 2 yi xiyi
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
21/26
MÉTODO DE REGRESIÓN LINEAL
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
22/26
DEFINICIÓN
La regresión lineal es un método de extraordinaria importancia
para determinar magnitudes desconocidas experimentalmente.
En síntesis cuando se varía una magnitud controladamente y se
mide como varía la otra, se pueden representar ambas magnitudes
en un sistema rectangular de ejes Y = F (x). De la observación
puede inferirse que la dependencia sea lineal o se aproxime a una
recta.
Empleando en método de la regresión lineal se pueden obtener los
parámetros de la mejor recta que caracteriza al sistema de N
puntos experimentales. La mayoría de las veces estos parámetrosestán relacionados con magnitudes de interés en el fenómeno
estudiado. Este método optimiza y encuentra la recta que menos se
desvía del conjunto de puntos.
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
23/26
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
24/26
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
25/26
Cálculo de la ecuación de regresión lineal (de Y sobre X)
Las fórmulas.... En puntuaciones directas
2 2
XY nXY B
X nX
Pendiente
Ordenada origen A Y BX
-
8/18/2019 Coeficiente de Correlacion y Regresion Lineal
26/26
Cálculo de la ecuación de regresión lineal (de Y sobre X)
X Y XY X2
suj1 120 10 1200 14400
suj2 100 9 900 10000suj3 90 4 360 8100
suj4 110 6 660 12100
4 SUMA SUMA
3120 44600
PROMEDIO PROMEDIO
105 7.25
N
4
2
3120 4 105 7 '250'1544600 4 105
B
7 ' 25 0 '15 105 8 '5 A Y’=-8’5+0’15X
Luego
http://www youtube com/watch?v=XyMcJ5M2qqQ