ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL
EL conjunto (X,Y) de valores que pueden tomar dos caracteres diferentes X e Y medidos sobre cada uno de los individuos de una población o muestra, puede venir dado de la siguiente forma:
X\Y 38 39 40 4137 1 3 5 238 1 3 3 339 0 3 3 5
X= nº pie madreY=nº pie hijas a los 14 años
TABLAS DE DOBLE ENTRADA
x f37 1138 1039 11
32
y f38 239 940 1141 10
32
DISTRIBUCIONES MARGINALES
ANÁLISIS DESCRIPTIVO DE LAS VARIABLEShttps://marielmatesblog.wordpress.com/
X(mates) 1 3 5 5 7 8Y(Fca) 2 3 6 5 9 8f 1 1 1 1 1 1
TABLAS DE FRECUENCIAS
N=6
N=32
REPRESENTACIO ́N GRA ́FICA: NUBE DE PUNTOS.
37,5
38
38,5
39
39,5
40
40,5
41
41,5
36,5 37 37,5 38 38,5 39 39,5
NÚ
MER
O P
IE H
IJA
NÚMERO PIE MADRE
https://marielmatesblog.wordpress.com/
No determinista: Conocido el valor de X, el valor de Y no queda perfectamente establecido. Son del tipo: y = f (x) + udonde u es una perturbación desconocida
Lineal: Cuando la función f (x ) es lineal, y la representación gráfica de los datos tiene un aspecto lineal, f(x)=mx+n• Si m > 0 hay relación lineal positiva. • Si m < 0 hay relación lineal negativa.
No lineal: Cuando la función f (x ) no es lineal.
Ausencia de relación: Cuando f (x) = c.
Determinista: Conocido el valorde X, el valor de Y quedaperfectamente establecido. Sondel tipo:
y = f (x)
TIPOS DE RELACIÓN ENTRE X E Yhttp
s://marielm
atesb
log.word
press.com
/
LA COVARIANZA
CovX,Y=∑ (xi−"x)(yi−"y)
n
=∑ xi· yi
n − "x·"y
•Si hay relación lineal positiva, la covarianza será positiva y “grande”. • Si hay relación lineal negativa, la covarianza será negativa y “grande” en valor absoluto. • Si hay no hay relación entre las variables o la relación es marcadamente no lineal, la covarianza será próxima a cero. •La covarianza depende de las unidades de medida de las variables.
COEFICIENTE DE CORRELACIÓN LINEAL
Esta medida no depende de las unidades de medida
rxy=CovX,YSX·SY
EXISTEN DOS FORMAS DE CUANTIFICAR LA RELACIÓN LINEAL ENTRE LAS VARIABLES
-1≤ rxy ≤1 r (x,y) = r (y,x)
rxy ≈1
rxy ≈-1
rxy ≈0
https://marielmatesblog.wordpress.com/
Varianza de X:
sx2=∑(xi−"x)2
n =∑ xi
2
n −!x2,
Desviación típica: sx= sx2
una correlación FUERTE no implica
causalidad.
Sólo porque los movimientos de dos variables sigan caminos similares durante un tiempo no implica que uno haga que ocurra el otro.
• Estatura del padre sobre la estatura del hijo. • Precio de una vivienda en función de su superficie. • Predecir la tasa de paro para cada edad. • Aproximar la calificación obtenida en una materia según el número de horas de estudio semanal.
Un modelo de regresión es un modelo que permite describir cómo influye una variable X sobre otra variable Y . X: Variable independiente o explicativa o exógena Y: Variable dependiente o respuesta o endógena
https://marielmatesblog.wordpress.com/
El modelo de regresión linealsimple
y=m·x+n
m=CovX,Y
sx2, n="y−m· "x
m y n son los coeficientes de regresión: • n : intercepto • m : pendiente
REGRESIÓN
SIEMPRE Y CUANDO EL MODELO SEA ADECUADO (coeficiente de correlación
próximo a 1, nube de puntos de forma lineal, …), podremos usarlo para poder
predecir resultados de la variable dependiente y, conocido un valor de la
variable x
Dado una valor de la variable x, usamos nuestro modelo lineal y=n+m·x,
sustituimos en la función y hallamos el valor de estimación de la variable y, "y.
https://marielmatesblog.wordpress.com/
ESTIMACIÓN
“No toda nube de puntos se ajusta apropiadamente a un modelo de regresión lineal”(a pesar de que la recta de regresión siempre se pueda calcular).CONSEJO: calcular “r”, coeficiente de correlación lineal.
Cuarteto de Anscombe
I II III IV
x y x y x y x y
10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58
8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76
13.0 7.58 13.0 8.74 13.0 12.74 8.0 7.71
9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84
11.0 8.33 11.0 9.26 11.0 7.81 8.0 8.47
14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04
6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25
4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50
12.0 10.84 12.0 9.13 12.0 8.15 8.0 5.56
7.0 4.82 7.0 7.26 7.0 6.42 8.0 7.91
5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89
https://marielm
atesblog.wordpress.com
/
0
5
10
15
0 5 10 15
0
5
10
15
0 5 10 15
0
5
10
15
0 10 200,002,004,006,008,00
10,00
0 5 10 15
0
5
10
15
0 5 10 15
0,00
5,00
10,00
15,00
0 5 10 15
0
5
10
15
0 5 10 15
0
5
10
15
0 10 20
y=3+0,5·x
Datos de Anscombe