educ 6390 conf 9
TRANSCRIPT
-
8/3/2019 EDUC 6390 Conf 9
1/20
EDUC 6390: Estadstica aplicada en la educacinJulio E. Rodrguez TorresConferencia 9CorrelacinBosquejoI. Introduccin ...............................................................Error: Reference source not found
A. Organizacin de datos para dos variables ...........Error: Reference source not foundB. Grficas de datos para dos variables ..................Error: Reference source not foundC. Correlacin ..........................................................Error: Reference source not foundD. Correlacin y causalidad .....................................Error: Reference source not found
II. Escalas de medicin .................................................Error: Reference source not found1. Escala nominal................................................Error: Reference source not found2. Escala ordinal..................................................Error: Reference source not found3. Escala intervalar ..............................................Error: Reference source not found4. Escala de razn ..............................................Error: Reference source not found
III. Coeficientes de correlacin para variables cuantitativas v cualitativas.Error: Reference source not foundIV. Pearson r ................................................................Error: Reference source not found
A. Diagramas de dispersin .....................................Error: Reference source not foundB. Cmputo de Pearson r ........................................Error: Reference source not found
1. Puntuaciones estandarizadas .........................Error: Reference source not found2. Frmula con la desviacin de la media ......... ..Error: Reference source not found3. Frmula con las puntuaciones crudas .............Error: Reference source not found4. Frmula con la covarianza ..............................Error: Reference source not found
C. Condiciones para poder utilizar el coeficiente de Pearson rError: Reference source not foundD. Factores que afectan al coeficiente de Pearson rError: Reference source not found
1. Linealidad ........................................................Error: Reference source not found2. Homogeneidad del grupo ................................Error: Reference source not found3. Tamao del grupo ...........................................Error: Reference source not found
E. Interpretacin del coeficiente de Pearson r .........Error: Reference source not found1. En trminos de la escala .................................Error: Reference source not found
2. En trminos de la varianza ..............................Error: Reference source not foundCoeficiente de determinacin ..............................Error: Reference source not found
V. Spearman Rho .........................................................Error: Reference source not foundVI. Coeficiente Punto biserial (rpb).................................Error: Reference source not foundVII. Coeficiente Phi ( ) ................................................Error: Reference source not found
I. Introduccin
A. Organizacin de datos para dos variables
Al trabajar con la organizacin de datos encontramos que cuando los datos que se obtienencorresponden a dos o ms caractersticas de los mismos sujetos se puede crear una tabla donde se
presentan los valores de las dos variables.
Ejemplo:
Las notas (valores numricos) de varios exmenes para cada individuo aparecen en columnasdiferentes. El problema con esta tabla es que se hace sumamente difcil poder apreciar cual es larelacin entre las variables.
http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857196%23_Toc5857196http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857196%23_Toc5857196http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857197%23_Toc5857197http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857197%23_Toc5857197http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857198%23_Toc5857198http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857198%23_Toc5857198http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857199%23_Toc5857199http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857199%23_Toc5857199http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857200%23_Toc5857200http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857200%23_Toc5857200http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857201%23_Toc5857201http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857201%23_Toc5857201http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857202%23_Toc5857202http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857202%23_Toc5857202http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857202%23_Toc5857202http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857203%23_Toc5857203http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857203%23_Toc5857203http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857203%23_Toc5857203http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857204%23_Toc5857204http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857204%23_Toc5857204http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857205%23_Toc5857205http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857205%23_Toc5857205http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857206%23_Toc5857206http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857206%23_Toc5857206http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857207%23_Toc5857207http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857207%23_Toc5857207http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857208%23_Toc5857208http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857208%23_Toc5857208http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857209%23_Toc5857209http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857209%23_Toc5857209http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857210%23_Toc5857210http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857210%23_Toc5857210http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857211%23_Toc5857211http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857211%23_Toc5857211http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857212%23_Toc5857212http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857212%23_Toc5857212http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857213%23_Toc5857213http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857213%23_Toc5857213http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857214%23_Toc5857214http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857215%23_Toc5857215http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857216%23_Toc5857216http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857216%23_Toc5857216http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857217%23_Toc5857217http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857217%23_Toc5857217http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857218%23_Toc5857218http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857218%23_Toc5857218http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857219%23_Toc5857219http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857219%23_Toc5857219http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857220%23_Toc5857220http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857220%23_Toc5857220http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857221%23_Toc5857221http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857221%23_Toc5857221http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857222%23_Toc5857222http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857222%23_Toc5857222http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857223%23_Toc5857223http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857223%23_Toc5857223http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857224%23_Toc5857224http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857224%23_Toc5857224http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857224%23_Toc5857224http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857224%23_Toc5857224http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857224%23_Toc5857224http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857225%23_Toc5857225http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857225%23_Toc5857225http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857196%23_Toc5857196http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857197%23_Toc5857197http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857198%23_Toc5857198http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857199%23_Toc5857199http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857200%23_Toc5857200http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857201%23_Toc5857201http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857202%23_Toc5857202http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857203%23_Toc5857203http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857204%23_Toc5857204http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857205%23_Toc5857205http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857206%23_Toc5857206http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857207%23_Toc5857207http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857208%23_Toc5857208http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857209%23_Toc5857209http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857210%23_Toc5857210http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857211%23_Toc5857211http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857212%23_Toc5857212http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857213%23_Toc5857213http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857214%23_Toc5857214http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857215%23_Toc5857215http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857216%23_Toc5857216http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857217%23_Toc5857217http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857218%23_Toc5857218http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857219%23_Toc5857219http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857220%23_Toc5857220http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857221%23_Toc5857221http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857222%23_Toc5857222http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857223%23_Toc5857223http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857224%23_Toc5857224http://rrpac.upr.clu.edu:9090/~amenend/conf96390.htm#_Toc5857225%23_Toc5857225 -
8/3/2019 EDUC 6390 Conf 9
2/20
B. Grficas de datos para dos variables
Las grficas de datos para dos variables utilizan el plano cartesiano.
2
-
8/3/2019 EDUC 6390 Conf 9
3/20
Una variable puede ser categrica y la otra numrica. En este caso la categrica por lo generalocupa el eje de x.
Si ambas variables son numricas se puede crear un diagrama de dispersin
3
-
8/3/2019 EDUC 6390 Conf 9
4/20
C. Correlacin
Hasta ahora se ha descrito cada variable independientemente utilizando tablas, grficas y medidasde tendencia central y dispersin.
Ahora veremos que es posible describir, no solamente las variables por separado, sino la relacinque existe entre ellas.
Ejemplo: Hinkle p.106 (103) presenta un grupo de estudiantes que obtuvieron una nota en elCollege Board y otra en un examen final. (Tabla 5.1, fig. 5.1)
4
-
8/3/2019 EDUC 6390 Conf 9
5/20
Se quiere saber si los que sacaron notas altas en el CB tambin sacaron notas altas en el examen,etc. Para eso, una de las primeras cosas que se hace es que se grafican los puntos en el planocartesiano donde cada punto corresponde a un estudiante
Los estudios de correlacin tratan de medir el grado de asociacin que existe entre dos variables.Estos estudios sobre la relacin entre variables son muy comunes en las ciencias sociales.
5
Prueba del CB y Examen Final
20
30
40
50
60
70
80
300 400 500 600 700 800
Puntuaciones en el CB
Puntuacionesdelexamenfina
-
8/3/2019 EDUC 6390 Conf 9
6/20
Sin embargo, como hay diferentes escalas para medir las variables veremos que la medida ocoeficiente de correlacin que se utilice va a depender directamente de las escalas de medicin delas variables.
D. Correlacin y causalidad
La correlacin no implica causalidad
Ejemplo:
Existe una correlacin alta entre la talla del zapato y las destrezas de lectura pero es obvio que latalla del zapato no es la causa de las destrezas de lectura. Existe una variable oculta (el crecimientode los nios) que resulta ser una de las causas.
A menudo una tercera variable o una combinacin de variables que no vemos puede ser la causade la correlacin. Por lo tanto siempre es importante asegurarse de que al hablar slo se mencionaasociacin y relacin, jams causa y efecto o dependencia.
II. Escalas de medicin
Hay cuatro formas o escalas bsicas para medir datos (nominal, ordinal, intervalar y de razn). Silas variables son categricas entonces dependiendo del grado de precisin posible en la medicinse utilizan las siguientes dos escalas:
1. Escala nominal
Se utiliza cuando los datos estn clasificados en categoras en las que no hay ninguna idea deordenamiento. No se puede decir que una categora es mejor que otra.
Ejemplo:
colores, religiones, partidos polticos, etc.
Cuando se trabaja con correlaciones hay un tipo de escala nominal sumamente importante. Constade slo dos niveles. Las variables clasificadas en estas dos categoras se llaman dictomas.
Ejemplo:
Sexo, fuma o no fuma, rico o pobre, etc.
Generalmente cuando se codifica, para identificar la presencia del atributo se usa 1 y su ausencia 0.
2. Escala ordinal
Hay orden en este nivel de medicin. Se obtiene mayor informacin sobre la variable. Implica queuna categora es mejor que otra.
Ejemplo:
Escala Likert: Acuerdo total, acuerdo parcial, desacuerdo, etc.
En estos casos no se puede medir la diferencia entre uno y otro, aunque es obvio que uno es mayoro mejor que otro.
6
-
8/3/2019 EDUC 6390 Conf 9
7/20
En muchas ocasiones se usan nmeros para codificar estas respuestas como acuerdo total (5),acuerdo parcial (4). Estos nmeros slo representan orden. En ningn momento se implica que ladiferencia entre acuerdo total y acuerdo parcial es de una unidad.
Tambin se usa mucho la clasificacin en dos categoras aunque la variable en s sea cuantitativa,continua y tenga una distribucin normal.
Esto se debe, en la mayora de los casos, a que no se recogieron los datos ntegros Ejemplo: Nioscon IQ sobre 100 y bajo 100. Hay puntuacin para cada nio, pero slo se recogi si estaba sobreel promedio o no.
Cuando las variables son cuantitativas entonces es posible usar una de las siguientes dos escalas:
3. Escala intervalar
En esta escala la diferencia entre dos medidas es significativa.
Ejemplo:
79 grados es 2 ms que 77 grados de temperatura. La diferencia entre 79 y 77 grados es la misma
que entre 55 y 53 grados.
Sin embargo no hay un cero verdadero. El cero en temperatura Fahrenheit es una temperaturaseleccionada al azar. El cero en centgrados corresponde a otra temperatura muy diferente.
El resultado es que, a pesar que 100 es el doble de 50, en una temperatura de 1000 no hace eldoble de calor que en una de 500.
4. Escala de razn
Tiene un cero real.
Ejemplo:
peso, altura.
Tiene sentido hablar de que una persona pesa el doble de otra.
Nota:
A veces los investigadores convierten una variable cuantitativa a rangos o dicotomas, pero esto nolo hacen sin tener razones muy poderosas para ello, pues en realidad estaran perdiendoinformacin muy valiosa. Generalmente cuando se hace es porque se trabaja con datos ya
recogidos en trminos de rangos o dicotomas.
Lectura
Hinkle Capt. 20 pp. 548-551
III. Coeficientes de correlacin para variables cuantitativas v cualitativas.
En la siguiente tabla aparecen las combinaciones posibles de dos variables y los coeficientes decorrelacin que se pueden utilizar en cada caso.
7
-
8/3/2019 EDUC 6390 Conf 9
8/20
Variable X
Nominal Ordinal Interv/Raz
Nominal a. Phi ( )
b. Coeficiente C
c. Coeficiente V
d. y Y
Rango-biserial Punto-biserial
Var Y Ordinal Rango-biserial a.Tetrachoricb.Spearman
Biserial
Interv/Razn
Punto-biserial Biserial Pearson r
IV. Pearson r
A. Diagramas de dispersin
(scattergram)
Este tipo de diagrama presenta una imagen de la relacin entre dos variables numricas.
En la grfica de la transparencia se observa un patrn que indica una correlacin positiva, puestoque los puntos suben a medida que nos movemos hacia la derecha.
La correlacin negativa ocurre cuando los puntos bajan a medida que nos movemos a la derecha.(Ver pendiente en la recta)
8
-
8/3/2019 EDUC 6390 Conf 9
9/20
La correlacin sera perfecta (1 -1) si los puntos todos formaran una recta. Cuando no hay unatendencia hacia arriba o hacia abajo, la correlacin est cerca de cero.
El coeficiente de correlacin puede tomar valores entre +1 y -1, donde el signo indica direccin de larelacin.
9
-
8/3/2019 EDUC 6390 Conf 9
10/20
Cuando se observan valores como +0.9 -0.9 se dice que la relacin es fuerte. Valores como 0.1indican una correlacin dbil.
La magnitud de la correlacin (si es fuerte o dbil) se mide utilizando el valor absoluto. La direccinse determina con el signo.
B. Cmputo de Pearson r
La idea principal es multiplicar el valor de la variable x por el de la variable y para cada individuo yhallar el promedio.
Pero hay varias frmulas para computar el coeficiente de Pearson.
1. Puntuaciones estandarizadas
Se utiliza la idea de multiplicar las puntuaciones de las dos variables para cada individuo y hallar elpromedio. Slo que se utilizan los valores estandarizados puesto que es la forma de que los valorespara las dos variables sean comparables.
Si se hace a mano es sumamente tedioso y largo pues hay que convertir cada valor de la variable alvalor estandarizado (Hinkle p.110)
10
-
8/3/2019 EDUC 6390 Conf 9
11/20
2. Frmula con la desviacin de la media
En esta frmula por medio de unas manipulaciones matemticas se transforman los valores de z enx y, donde estas variables representan la desviacin de cada puntuacin con respecto al promedio(Hinkle, p.112 )
x = X - X
y = Y - Y
3. Frmula con las puntuaciones crudas
Esta frmula requiere menos cmputos, pues usa las puntuaciones crudas sin necesidad deconvertirlas en desviaciones o puntuaciones estandarizadas. (Hinkle, p.113)
4. Frmula con la covarianza
Esta es la frmula que urtiliza el programa Excel.
La covarianza es otra forma de expresar la relacin entre dos variables.
No se utiliza a menudo, pues no est entre los valores de +1 y -1 como la correlacin. Sin embargo
es til para esta frmula. (Hinkle, p.114)
Por lo tanto
Esto es la covarianza dividida por las desviaciones estndar de X y de Y.
C. Condiciones para poder utilizar el coeficiente de Pearson r
1. Las variables que se correlacionan tienen que ser pareadas para el mismo sujeto. No se puedetomar la variable X de un sujeto y la variable Y de otro.
2. Las variables tienen que ser medidas utilizando la escala intervalar o de razn.
3. La distribucin de ambas variables tiene que ser normal.
11
-
8/3/2019 EDUC 6390 Conf 9
12/20
D. Factores que afectan al coeficiente de Pearson r
1. Linealidad
Si los puntos tienden a caer cerca de una lnea recta, se puede decir que hay una relacin lineal.
Pero puede haber otro tipo de relacin no lineal, como la curvilineal donde los valores de X y Yaumentan al principio, pero luego cuando X aumenta Y disminuye.
(Transp. Fig. 5.3, Hinkle p.115)
Ejemplos:
Relacin entre ansiedad y ejecutoria. Poca ansiedad o mucha ansiedad produce ejecutoria pobre.
Relacin entre la edad y la dependencia de otros es curvilineal tambin pues tanto los jvenescomo los ancianos dependen mucho..
El problema es que si se computa una relacin curvilineal como lineal arroja que no hay relacinpues las oposiciones se cancelan.
12
-
8/3/2019 EDUC 6390 Conf 9
13/20
2. Homogeneidad del grupo
Si el grupo es muy homogneo, quiere decir que la dispersin es poca.
Mientras menos dispersin hay, ms pequeo es el coeficiente de correlacin.
En la transparencia anterior si se reduce el alcance de las puntuaciones de aptitud (se eliminan laspuntuaciones altas y las bajas) se observa que hay menos tendencia hacia una recta. Por lo tantola correlacin se ha reducido considerablemente.
A veces al no tomar el grupo en su totalidad la correlacin parece ser muy pequea cuando enrealidad no lo es.
13
-
8/3/2019 EDUC 6390 Conf 9
14/20
Ejemplo: Si se correlacionan los resultados de las pruebas de Razonamiento Matemtico del CB delos estudiantes con su ndice acadmico de primer ao. La correlacin parece pequea puesto quese han eliminado todos los estudiantes que no fueron admitidos a la universidad.
3. Tamao del grupo
Sin embargo el tamao del grupo no afecta el valor de la correlacin, lo que puede afectar es suprecisin. Con pocos datos no hay seguridad de que siempre pase lo mismo.
E. Interpretacin del coeficiente de Pearson r
1. En trminos de la escala
La escala de r es ordinal. Por lo tanto en los casos en que es r = 0.40; r= 0.60; r= 0.80 Nopodemos decir que para r = 0.80 hay el doble de correlacin que para r = 0.40.
No se puede decir que existe la misma diferencia entre r = 0.40 y r = 0.60 que entre r = 0.60 y r =0.80
Lo ms que se puede decir es que la relacin lineal entre las variables es mayor o menor.
Para determinar si la correlacin es alta o baja, se puede pensar en trminos de la siguiente tabla,pero hay que tener en cuenta de qu se est hablando, pues la interpretacin depende siempre dela situacin. En trminos de admisiones a la universidad es difcil hallar una relacin mayor de 0.50entre el promedio del primer ao de universidad y el promedio de graduacin de escuela superior,por lo tanto en ese caso una correlacin de 0.50 es alta.
Tamao de lacorrelacin
Interpretacin
0.90-1.00 Muy alta
0.70-0.89 Alta
0.50-0.69 Moderada
0.30-0.49 Baja
0.00-0.29 Muy poca
2. En trminos de la varianza
Otro significado y uso de la correlacin tiene que ver con el porciento de la variacin en una variablese relaciona con la variacin en la otra variable.
Ejemplos:
Cunto de la educacin se relaciona con la escuela?
Cunto de las notas del primer ao de universidad est asociada con el ndice de graduacin?
Cunto de la inteligencia se relaciona con la herencia?
14
-
8/3/2019 EDUC 6390 Conf 9
15/20
Definicin
Coeficiente de determinacin
El cuadrado del coeficiente de correlacin se llama el coeficiente de determinacin = r2
El coeficiente de determinacin representa el porciento de la varianza en una variable que estasociado con la otra variable.
donde (Sa)2= varianza en Y asociada con X
(SY)2 = varianza total de Y
Ejemplo:
Hay 75 estudiantes y el coeficiente de correlacin entre sus puntuaciones de aptitud y su ndice
acadmico del primer semestre es r = 0.69.
Por lo tanto (0.69 )2 = 0.48 de la varianza en el ndice acadmico del primer semestre se relacionacon la variacin de la puntuacin en aptitud. El 52% restante de la variacin est asociada con otrosfactores que no son la aptitud.
Esta es una de las razones para decir que un coeficiente de correlacin es alto o bajo. Por ejemploun coeficiente de correlacin de 0.90 implica que un 81% de la varianza de la segunda variable estasociada con la varianza de la primera. Se puede decir que la correlacin es alta.
Sin embargo un coeficiente de correlacin de 0.30 implica slo un 9% de la varianza de la segundavariable. Se puede decir que la correlacin es baja.
Lectura
Hinkle capt. 5 pp.105-126Hinkle capt. 20 pp.548-552
V. Spearman Rho
Se utiliza cuando las dos variables son ordinales. No se encuentra en Excel, as que hay quehacerlo a mano o con SPSS.
El rango ms alto es 1.
Cuando hay empates en las puntuaciones de los sujetos en una variable, se da el promedio de losposibles rangos a cada uno de los empatados.
Ejemplo:
Si hay empates para los rangos 10,11 y 12 (10+11+12)/3 = 11 rango para los tres.
Frmula:
15
-
8/3/2019 EDUC 6390 Conf 9
16/20
donde
n = nmero de rangos pareados
d = diferencia entre los rangos pareados
Ejemplo:
= 0.93
Lectura
Hinkle capt. 5 pp.124-125
VI. Coeficiente Punto biserial (rpb)
Es un caso especial de la correlacin de Pearson cuando una variable se mide en la escalaintervalar o de razn y la otra es nominal y dictoma.
Se utiliza principalmente en los exmenes estandarizados para determinar si un ejercicio debe estaro no en el examen. Si se determina que los buenos estudiantes lo hacen mal y los malos lo hacenbien, el ejercicio no discrimina y debe eliminarse.
As que en todos los exmenes estandarizados se busca la correlacin punto biserial pararelacionar el ejercicio (bien o mal contestado) con la puntuacin de cada estudiante.
16
-
8/3/2019 EDUC 6390 Conf 9
17/20
Frmula:
Donde
x
1 = media de los estudiantes que sacaron 1 en el tem
xo = media de los estudiantes que sacaron 0 en el tem
Y =desviacin estndar de todas las puntuaciones en la prueba
p = proporcin de individuos que sacaron 1 en el tem
q = proporcin de individuos que sacaron 0 en el tem
Ver Hinkle Capt.20 p.552-554 (Transp. Tabla 20.2, p.553(19.2)
Persona Ejercicio (X) Examen (Y)
A 1 10
B 1 12
C 1 16
D 1 10
E 1 11
F 0 7
G 0 6
H 0 11
I 0 8
J 0 5
x1 = media de los estudiantes que sacaron 1 en el tem
= (10+12+16+10+11)/5 = 11.80
xo = media de los estudiantes que sacaron 0 en el tem
= (7+6+11+8+5)/5 = 7.4
Y =desviacin estndar de todas las puntuaciones en la prueba
17
-
8/3/2019 EDUC 6390 Conf 9
18/20
= 3.07 (con calculadora)
p = proporcin de individuos que sacaron 1 en el tem
= 0.5
q = proporcin de individuos que sacaron 0 en el tem
= 0.5
rpb = 0.716
VII. Coeficiente Phi ( )
Es un caso especial de la correlacin de Pearson cuando ambas variables son nominales ydictomas.
La frmula se puede reducir a:
18
-
8/3/2019 EDUC 6390 Conf 9
19/20
cuando se organiza una tabla de contingencia de la siguiente manera:
Variable X
0 1 Total
Variable Y 1 A B A+B
0 C D C+D
Total A+C B+D N
Ejemplo: Hinkle p.555 (514) (Tablas 20.3, 20.5)
Determinar la relacin entre gnero y partido poltico
Persona Gnero Partido
A 1 1
B 1 1
C 1 0
D 1 1
E 1 1
F 0 0
19
-
8/3/2019 EDUC 6390 Conf 9
20/20
G 0 1
H 0 1
I 0 0
J 0 0
1 = MUJER
1 = REPUBLICANO
0 = HOMBRE
0 = DEMOCRATA
Tabla de contingencia
GENERO
0 (masc) 1(fem) Total
PARTIDO 1(rep) A (2) B (4) A+B (6)
0 (dem) C (3) D (1) C+D (4)
Total A+C (5) B+D (5) N (10)
= 0.408
Conclusin: Hay baja relacin positiva entre partido poltico y sexo. Las mujeres se asocian con elpartido republicano y los hombres con el demcrata. Esto sucede porque 0 = demcrata y 0 =hombre ; 1 = republicano y 1 = mujer.
Si la correlacin hubiese sido negativa, entonces podamos decir que las mujeres se asociaban conlos demcratas y los hombres con los republicanos.
Lectura
Hinkle capt. 20 pp.552-556
20