estadistica-bidimensional
TRANSCRIPT
5/10/2018 estadistica-bidimensional - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 1/9
Capítulo 2
Variable Estadística
Bidimensional
2.1 Distribución de Frecuencias Bidimensional
Sea una población de n individuos donde estudiamos, simultáneamente, dos variablesX e Y . Sean x1, x2, . . . , xk las modalidades de X e y1, y2, . . . , y p las modalidades de Y .
La distribución de frecuencias bidimensional de estas dos variables se presenta mediante
una tabla de doble entrada
X \Y y1 y2 . . . y j . . . y p ni.
x1 n11 n12 . . . n1 j . . . n1 p n1.
x2 n21 n22 . . . n2 j . . . n2 p n2.
... ... ... . . . ... . . . ... ...
xi ni1 ni2 . . . nij . . . nip ni.
......
... . . .... . . .
......
xk nk1 nk2 . . . nkj . . . nkp nk.
n.j n.1 n.2 . . . n.j . . . n.p n
1
5/10/2018 estadistica-bidimensional - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 2/9
2 Variable Estadística Bidimensional
2.1.1 Frecuencias Absolutas
Se define la frecuencia absoluta correspondiente a la pareja de valores (xi, y j) como
nij = número de individuos que presenta la modalidad xi de X e y j de Y
para i = 1, . . . , k , j = 1, . . . , p.
Claramente, se verifica que
n =k
Xi=1
p
X j=1
nij
2.1.2 Frecuencias Relativas
Se define la frecuencia relativa correspondiente a la pareja de valores (xi, y j) como
f ij =nij
n=
proporción de individuos que presenta
la modalidad xi de X e y j de Y
para i = 1, . . . , k , j = 1, . . . , p.
Claramente, se verifica que
1 =kX
i=1
pX j=1
f ij
2.2 Distribuciones Marginales
Las distribuciones marginales corresponden al estudio, por separado, de cada una de las
dos variables que componen una variable estadística bidimensional. Cada distribución
marginal será, por tanto, una distribución unidimensional y, consecuentemente, se le
podrá aplicar cualquiera de los resultados estudiados en el Capítulo 2.
2.2.1 Distribución Marginal de X
Es la distribución de todas las observaciones de X independientemente de las de Y . Se
obtiene sumando, para cada xi, las frecuencias correspondientes a todos los valores de
5/10/2018 estadistica-bidimensional - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 3/9
Distribuciones Marginales 3
Y , es decir
X ni. f i.
x1 n1. f 1.
x2 n2. f 2....
......
xi ni. f i....
......
xk nk. f k.
n 1
donde, para cada i = 1, . . . , k,
ni. = pX
j=1
nij = ni1 + ni2 + . . . + nip
se denomina Frecuencia Marginal Absoluta de xi, y
f i. =ni.
n
= p
X j=1
f ij
se denomina Frecuencia Marginal Relativa de xi.
Se verifica quekX
i=1
ni. = n,kX
i=1
f i. = 1.
• Media Marginal de X
x =
k
Xi=1 f i.xi =
1
n
k
Xi=1 ni.xi
• Varianza Marginal de X
V ar (X ) =kX
i=1
f i. (xi − x)2 =kX
i=1
f i.x2i − x2
5/10/2018 estadistica-bidimensional - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 4/9
4 Variable Estadística Bidimensional
2.2.2 Distribución Marginal de Y
Es la distribución de todas las observaciones de Y independientemente de las de X , se
obtiene sumando, para cada y j, las frecuencias correspondientes a todos los valores de
X , es decir
Y n.j f .j
y1 n.1 f .1
y2 n.2 f .2...
......
y j n.j f .j...
......
y p n.p f .p
n 1
donde, para cada j = 1, . . . , p,
n.j =kX
i=1
nij = n1 j + n2 j + . . . + nkj
se denomina Frecuencia Marginal Absoluta de y j, y
f .j =n.j
n=
kXi=1
f ij
se denomina Frecuencia Marginal Relativa de y j .
Se verifica que pX
j=1
n.j = n, pX
j=1
f .j = 1.
• Media Marginal de Y
y = pX
j=1
f .jy j = 1n
pX j=1
n.jy j
• Varianza Marginal de Y
V ar (Y ) = pX
j=1
f .j (y j − y)2 = pX
j=1
f .jy2 j − y2
5/10/2018 estadistica-bidimensional - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 5/9
Distribuciones Condicionadas 5
2.3 Distribuciones Condicionadas
Las distribuciones condicionadas corresponden al estudio de una variable cuando la otra
toma presenta, exactamente, un valor concreto. Cada distribución condicionada será,
por tanto, una distribución unidimensional y, consecuentemente, se le podrá aplicar
cualquiera de los resultados estudiados en el Capítulo 2.
2.3.1 Distribución Condicionada de X a Y = y j
Para cada j = 1, . . . , p fi jo, la distribución de X condicionada a Y = y j es la distribuciónde la variable X restringida a los individuos que presentan modalidad y j de Y , es decir
X/Y = y j n ji ( j fi jo) f ji = n ji /n.j
x1 n j1
= n1 j f j1
= n j1
/n.j
x2 n j2
= n2 j f j2
= n j2
/n.j
......
...
xi n ji = nij f ji = n ji /n.j
......
...
xk n jk = nkj f jk = n jk/n.j
n.j 1
Observemos que existen p distribuciones condicionadas de X a Y (una para cada valor
de Y ).
• Media de X condicionada a Y = y j
x j =
k
Xi=1 f
j
i xi =
1
n.j
k
Xi=1 nijxi
• Varianza de X condicionada a Y = y j
V ar j (X ) =kX
i=1
f ji (xi − x j)2 =
kXi=1
f ji x2i − x2 j
5/10/2018 estadistica-bidimensional - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 6/9
6 Variable Estadística Bidimensional
2.3.2 Distribución condicionada de Y a X = xi
Para cada i = 1, . . . , k fi jo, la distribución de Y condicionada a X = xi es la distribución
de la variable Y restringida a los individuos que presentan modalidad xi de X , es decir
Y/X = xi ni j (i fi jo) f i j = ni
j/ni.
y1 ni1
= ni1 f i1
= ni1
/ni.
y2 ni2
= ni2 f i2
= ni2
/ni.
......
...
y j ni j = nij f i j = ni j/ni.
......
...
y p ni p = nip f i p = ni
p/ni.
ni. 1
Observemos que existen k distribuciones condicionadas de Y a X (una para cada valor
de X ).
• Media de Y condicionada a X = xi
yi = pX
j=1
f i jy j =1
ni.
pX j=1
nijy j
• Varianza de Y condicionada a X = xi V ari (Y ) =P p
j=1 f i j (y j − yi)2 =P p
j=1 f i jy2 j − y2i
Se verifican las siguientes relaciones
f ij = f i j · f i. = f ji · f .j
(la demostración queda propuesta).
Observemos que sólo hemos considerado las distribuciones condicionadas de una
variable cuando la otra presenta un valor fi jado. Este estudio se puede generalizar al
caso en que se condiciona, no a un único valor de la variable, sino a todo un conjunto
de valores.
5/10/2018 estadistica-bidimensional - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 7/9
Independencia Estadística de Variables 7
2.4 Independencia Estadística de Variables
• Diremos que X es estadísticamente independiente de Y (o, simplemente, inde-
pendiente de Y ) si todas las distribuciones condicionadas X/Y = y j son iguales
entre sí, para cualquier y j al que se condicione, es decir,
X es independiente de Y ⇔ f ji no depende de j
⇔ f 1i = f 2i = . . . = f pi
En tal caso, las distribuciones condicionadas X/Y = y j coinciden con la marginal
de X , es decir
X es independiente de Y ⇔ f ji = f i. para½
i = 1, . . . , k
j = 1, . . . , p
• Diremos que Y es estadísticamente independiente de X (o, simplemente, inde-
pendiente de X ) si todas las distribuciones condicionadas Y/X = xi son iguales
entre sí, para cualquier xi al que se condicione, es decir,
Y es independiente de X ⇔ f i j no depende de i
⇔ f 1
j = f 2
j = . . . = f k j
En tal caso, las distribuciones condicionadas Y/X = xi coinciden con la marginal
de Y , es decir
Y es independiente de X ⇔ f i j = f .j para½
i = 1, . . . , k
j = 1, . . . , p
• Se puede demostrar que la independencia es recíproca, esto es,
X es independiente de Y ⇔ Y es independiente de X
Esto permite hablar de variables independientes entre sí (diremos, simplemente,que X e Y son independientes ).
• De las definiciones anteriores se deduce que
X es independiente de Y ⇔ nij =ni. · n.j
n⇔ f ij = f i. · f .j
5/10/2018 estadistica-bidimensional - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 8/9
8 Variable Estadística Bidimensional
2.5 Dependencia Funcional de Variables
Cuando dos variables no son estadísticamente independientes, se dice que son estadís-
ticamente dependientes. La dependencia estadística más fuerte es la llamada Depen-
dencia Funcional .
• Se dice que X depende funcionalmente de Y si a cada modalidad y j de Y corre-
sponde una única modalidad de X (en cada columna de la tabla bidimensional
hay un término, y sólo uno, diferente de cero).
• Se dice que Y depende funcionalmente de X si a cada modalidad xi de X corre-sponde una única modalidad de Y (en cada fila de la tabla bidimensional hay un
término, y sólo uno, diferente de cero).
• En general, la dependencia funcional no es recíproca , como muestra el siguiente
ejemplo:
X \Y y1 y2 y3 y4
x1 4 0 7 0
x2 0 6 0 0
x3 0 0 0 9
=⇒
X depende funcionalmente de Y
Y NO depende funcionalmente de X
2.6 Covarianza
Se trata de una característica numérica conjunta bidimensional que indica el sentido en
que crecen o decrecen las variables por término medio. Concretamente, si la covarianza
es positiva, las dos variables varían en el mismo sentido (las dos crecen o las dos
decrecen) y, si es negativa, las variables varían en sentido opuesto (una crece cuando la
otra decrece y viceversa). La covarianza de dos variables, X e Y , se define como
Cov (X, Y ) = σXY =kX
i=1
pX j=1
f ij (xi − x) (y j − y) =1
n
kXi=1
pX j=1
nijxiy j − xy
Se dice que X e Y son incorreladas si su covarianza es nula, esto es
X e Y son incorreladas⇔ Cov (X, Y ) = 0
5/10/2018 estadistica-bidimensional - slidepdf.com
http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 9/9
Representaciones Grá ficas 9
Se tiene la siguiente relación
INDEPENDENCIA=⇒
6⇐=INCORRELACIÓN
es decir, si dos variables son independientes, entonces son incorreladas (demuéstrese),
pero si las variables son incorreladas, no se puede afirmar nada sobre su dependencia o
independencia estadística.
2.7 Representaciones Gráficas
Como las distribuciones condicionadas y marginales son unidimensionales, todos
los gráficos estudiados en el Capítulo 1 son aplicables a dichas distribuciones.
En las distribuciones bidimensionales se suelen emplear los siguientes gráficos:
2.7.1 Diagrama de Dispersión o Nube de Puntos
Consiste en representar los pares de puntos (xi, y j) en el plano junto con su corre-
spondiente frecuencia absoluta conjunta nij.
2.7.2 Estereograma o Histograma Tridimensional
Se trata de un gráfico en tres dimensiones donde un eje corresponde a la vari-
able X , otro a la variable Y y el tercero a las frecuencia absoluta conjunta. Si las
variables son discretas, el estereograma estará compuesto por barras (diagrama de bar-
ras tridimensional); si las variables son continuas, el estereograma estará formado por
paralelepípedos (histograma tridimensional) cuyos respectivos volúmenes son propor-
cionales a las correspondientes frecuencias absolutas conjuntas.