estadistica-bidimensional

9
 Capítulo 2 Variable Estadística Bidimensional 2.1 Dis trib ució n de F recuenc ias Bidimens iona l Sea una población de  n  individuos donde estudiamos, simultáneamente, dos variables X  e  Y  . Sea n  x 1 , x 2 ,...,x k  las modalidades de  X  e  y 1 , y 2,  ...,y  p  las modalidades de  Y  . La distribución de frecuencias bidimensional de estas dos variables se presenta mediante una  tabla de doble entrada X \Y y 1  y 2  . .. y  j  . .. y  p  n i. x 1  n 11  n 12  . .. n 1  j  . .. n 1  p  n 1. x 2  n 21  n 22  . .. n 2  j  . .. n 2  p  n 2. . . .  . . .  . . .  ...  . . .  ...  . . .  . . . x i  n i1  n i2  . .. n ij  . .. n ip  n i. . . .  . . .  . . .  ...  . . .  ...  . . .  . . . x k  n k1  n k2  . .. n kj  . .. n kp  n k. n .j  n .1  n .2  ... n .j  . .. n .p  n 1

Upload: antonio-hernando-maneru

Post on 09-Jul-2015

68 views

Category:

Documents


0 download

TRANSCRIPT

5/10/2018 estadistica-bidimensional - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 1/9

 

Capítulo 2

Variable Estadística

Bidimensional

2.1 Distribución de Frecuencias Bidimensional

Sea una población de n individuos donde estudiamos, simultáneamente, dos variablesX  e Y . Sean x1, x2, . . . , xk las modalidades de X  e y1, y2, . . . , y p las modalidades de Y .

La distribución de frecuencias bidimensional de estas dos variables se presenta mediante

una tabla de doble entrada 

X \Y y1 y2 . . . y j . . . y p ni.

x1 n11 n12 . . . n1 j . . . n1 p n1.

x2 n21 n22 . . . n2 j . . . n2 p n2.

... ... ... . . . ... . . . ... ...

xi ni1 ni2 . . . nij . . . nip ni.

......

... . . .... . . .

......

xk nk1 nk2 . . . nkj . . . nkp nk.

n.j n.1 n.2 . . . n.j . . . n.p n

1

5/10/2018 estadistica-bidimensional - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 2/9

 

2 Variable Estadística Bidimensional 

2.1.1 Frecuencias Absolutas

Se define la frecuencia absoluta correspondiente a la pareja de valores (xi, y j) como

nij = número de individuos que presenta la modalidad xi de X  e y j de Y 

para i = 1, . . . , k , j = 1, . . . , p.

Claramente, se verifica que

n =k

Xi=1

 p

X j=1

nij

2.1.2 Frecuencias Relativas

Se define la frecuencia relativa correspondiente a la pareja de valores (xi, y j) como

f ij =nij

n=

proporción de individuos que presenta

la modalidad xi de X  e y j de Y 

para i = 1, . . . , k , j = 1, . . . , p.

Claramente, se verifica que

1 =kX

i=1

 pX j=1

f ij

2.2 Distribuciones Marginales

Las distribuciones marginales corresponden al estudio, por separado, de cada una de las

dos variables que componen una variable estadística bidimensional. Cada distribución

marginal será, por tanto, una distribución unidimensional y, consecuentemente, se le

podrá aplicar cualquiera de los resultados estudiados en el Capítulo 2.

2.2.1 Distribución Marginal de X 

Es la distribución de todas las observaciones de X  independientemente de las de Y . Se

obtiene sumando, para cada xi, las frecuencias correspondientes a todos los valores de

5/10/2018 estadistica-bidimensional - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 3/9

 

Distribuciones Marginales  3

Y , es decir

X ni. f i.

x1 n1. f 1.

x2 n2. f 2....

......

xi ni. f i....

......

xk nk. f k.

n 1

donde, para cada i = 1, . . . , k,

ni. = pX

 j=1

nij = ni1 + ni2 + . . . + nip

se denomina Frecuencia Marginal Absoluta de xi, y

f i. =ni.

n

= p

X j=1

f ij

se denomina Frecuencia Marginal Relativa de xi.

Se verifica quekX

i=1

ni. = n,kX

i=1

f i. = 1.

• Media Marginal de X 

x =

k

Xi=1 f i.xi =

1

n

k

Xi=1 ni.xi

• Varianza Marginal de X 

V ar (X ) =kX

i=1

f i. (xi − x)2 =kX

i=1

f i.x2i − x2

5/10/2018 estadistica-bidimensional - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 4/9

 

4 Variable Estadística Bidimensional 

2.2.2 Distribución Marginal de Y  

Es la distribución de todas las observaciones de Y  independientemente de las de X , se

obtiene sumando, para cada y j, las frecuencias correspondientes a todos los valores de

X , es decir

Y n.j f .j

y1 n.1 f .1

y2 n.2 f .2...

......

y j n.j f .j...

......

y p n.p f .p

n 1

donde, para cada j = 1, . . . , p,

n.j =kX

i=1

nij = n1 j + n2 j + . . . + nkj

se denomina Frecuencia Marginal Absoluta de y j, y

f .j =n.j

n=

kXi=1

f ij

se denomina Frecuencia Marginal Relativa de y j .

Se verifica que pX

 j=1

n.j = n, pX

 j=1

f .j = 1.

• Media Marginal de Y 

y = pX

 j=1

f .jy j = 1n

 pX j=1

n.jy j

• Varianza Marginal de Y 

V ar (Y ) = pX

 j=1

f .j (y j − y)2 = pX

 j=1

f .jy2 j − y2

5/10/2018 estadistica-bidimensional - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 5/9

 

Distribuciones Condicionadas  5

2.3 Distribuciones Condicionadas

Las distribuciones condicionadas corresponden al estudio de una variable cuando la otra

toma presenta, exactamente, un valor concreto. Cada distribución condicionada será,

por tanto, una distribución unidimensional y, consecuentemente, se le podrá aplicar

cualquiera de los resultados estudiados en el Capítulo 2.

2.3.1 Distribución Condicionada de X  a Y  = y j

Para cada j = 1, . . . , p fi jo, la distribución de X condicionada a Y  = y j es la distribuciónde la variable X  restringida a los individuos que presentan modalidad y j de Y , es decir

X/Y  = y j n ji ( j fi jo) f  ji = n ji /n.j

x1 n j1

= n1 j f  j1

= n j1

/n.j

x2 n j2

= n2 j f  j2

= n j2

/n.j

......

...

xi n ji = nij f  ji = n ji /n.j

......

...

xk n jk = nkj f  jk = n jk/n.j

n.j 1

Observemos que existen p distribuciones condicionadas de X  a Y  (una para cada valor

de Y ).

• Media de X  condicionada a Y  = y j

x j =

k

Xi=1 f 

 j

i xi =

1

n.j

k

Xi=1 nijxi

• Varianza de X  condicionada a Y  = y j

V ar j (X ) =kX

i=1

f  ji (xi − x j)2 =

kXi=1

f  ji x2i − x2 j

5/10/2018 estadistica-bidimensional - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 6/9

 

6 Variable Estadística Bidimensional 

2.3.2 Distribución condicionada de Y   a X = xi

Para cada i = 1, . . . , k fi jo, la distribución de Y  condicionada a X  = xi es la distribución

de la variable Y  restringida a los individuos que presentan modalidad xi de X , es decir

Y/X  = xi ni j (i fi jo) f i j = ni

 j/ni.

y1 ni1

= ni1 f i1

= ni1

/ni.

y2 ni2

= ni2 f i2

= ni2

/ni.

......

...

y j ni j = nij f i j = ni j/ni.

......

...

y p ni p = nip f i p = ni

 p/ni.

ni. 1

Observemos que existen k distribuciones condicionadas de Y  a X  (una para cada valor

de X ).

• Media de Y  condicionada a X  = xi

yi = pX

 j=1

f i jy j =1

ni.

 pX j=1

nijy j

• Varianza de Y  condicionada a X  = xi V ari (Y ) =P p

 j=1 f i j (y j − yi)2 =P p

 j=1 f i jy2 j − y2i

Se verifican las siguientes relaciones

f ij = f i j · f i. = f  ji · f .j

(la demostración queda propuesta).

Observemos que sólo hemos considerado las distribuciones condicionadas de una

variable cuando la otra presenta un valor fi jado. Este estudio se puede generalizar al

caso en que se condiciona, no a un único valor de la variable, sino a todo un conjunto

de valores.

5/10/2018 estadistica-bidimensional - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 7/9

 

Independencia Estadística de Variables  7

2.4 Independencia Estadística de Variables

• Diremos que X  es estadísticamente independiente de  Y  (o, simplemente, inde-

pendiente de  Y ) si todas las distribuciones condicionadas X/Y  = y j son iguales

entre sí, para cualquier y j al que se condicione, es decir,

X  es independiente  de Y  ⇔ f  ji no depende de j

⇔ f 1i = f 2i = . . . = f  pi

En tal caso, las distribuciones condicionadas X/Y  = y j coinciden con la marginal

de X , es decir

X  es independiente  de Y ⇔ f  ji = f i. para½

i = 1, . . . , k

 j = 1, . . . , p

• Diremos que Y  es estadísticamente independiente de  X  (o, simplemente, inde-

pendiente de  X ) si todas las distribuciones condicionadas Y/X  = xi son iguales

entre sí, para cualquier xi al que se condicione, es decir,

Y  es independiente  de X  ⇔ f i j no depende de i

⇔ f 1

 j = f 2

 j = . . . = f k j

En tal caso, las distribuciones condicionadas Y/X  = xi coinciden con la marginal

de Y , es decir

Y  es independiente  de X ⇔ f i j = f .j para½

i = 1, . . . , k

 j = 1, . . . , p

• Se puede demostrar que la independencia es recíproca, esto es,

X  es independiente  de Y  ⇔ Y  es independiente  de X 

Esto permite hablar de variables independientes entre sí (diremos, simplemente,que X  e  Y  son independientes ).

• De las definiciones anteriores se deduce que

X  es independiente  de Y  ⇔ nij =ni. · n.j

n⇔ f ij = f i. · f .j

5/10/2018 estadistica-bidimensional - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 8/9

 

8 Variable Estadística Bidimensional 

2.5 Dependencia Funcional de Variables

Cuando dos variables no son estadísticamente independientes, se dice que son estadís-

ticamente dependientes. La dependencia estadística más fuerte es la llamada Depen-

dencia Funcional .

• Se dice que X  depende funcionalmente de  Y  si a cada modalidad y j de Y  corre-

sponde una única modalidad de X  (en cada columna de la tabla bidimensional

hay un término, y sólo uno, diferente de cero).

• Se dice que Y  depende funcionalmente de  X  si a cada modalidad xi de X  corre-sponde una única modalidad de Y  (en cada fila de la tabla bidimensional hay un

término, y sólo uno, diferente de cero).

• En general, la dependencia funcional no es recíproca , como muestra el siguiente

ejemplo:

X \Y y1 y2 y3 y4

x1 4 0 7 0

x2 0 6 0 0

x3 0 0 0 9

=⇒

X  depende funcionalmente de Y 

Y  NO depende funcionalmente de X 

2.6 Covarianza

Se trata de una característica numérica conjunta bidimensional que indica el sentido en

que crecen o decrecen las variables por término medio. Concretamente, si la covarianza

es positiva, las dos variables varían en el mismo sentido (las dos crecen o las dos

decrecen) y, si es negativa, las variables varían en sentido opuesto (una crece cuando la

otra decrece y viceversa). La covarianza de dos variables, X  e Y , se define como

Cov (X, Y ) = σXY   =kX

i=1

 pX j=1

f ij (xi − x) (y j − y) =1

n

kXi=1

 pX j=1

nijxiy j − xy

Se dice que X  e Y  son incorreladas  si su covarianza es nula, esto es

X  e Y  son incorreladas⇔ Cov (X, Y ) = 0

5/10/2018 estadistica-bidimensional - slidepdf.com

http://slidepdf.com/reader/full/estadistica-bidimensional-559e00c6a850d 9/9

 

Representaciones Grá ficas  9

Se tiene la siguiente relación

INDEPENDENCIA=⇒

6⇐=INCORRELACIÓN

es decir, si dos variables son independientes, entonces son incorreladas (demuéstrese),

pero si las variables son incorreladas, no se puede afirmar nada sobre su dependencia o

independencia estadística.

2.7 Representaciones Gráficas

Como las distribuciones condicionadas y marginales son unidimensionales, todos

los gráficos estudiados en el Capítulo 1 son aplicables a dichas distribuciones.

En las distribuciones bidimensionales se suelen emplear los siguientes gráficos:

2.7.1 Diagrama de Dispersión o Nube de Puntos

Consiste en representar los pares de puntos (xi, y j) en el plano junto con su corre-

spondiente frecuencia absoluta conjunta nij.

2.7.2 Estereograma o Histograma Tridimensional

Se trata de un gráfico en tres dimensiones donde un eje corresponde a la vari-

able X , otro a la variable Y  y el tercero a las frecuencia absoluta conjunta. Si las

variables son discretas, el estereograma estará compuesto por barras (diagrama de bar-

ras tridimensional); si las variables son continuas, el estereograma estará formado por

paralelepípedos (histograma tridimensional) cuyos respectivos volúmenes son propor-

cionales a las correspondientes frecuencias absolutas conjuntas.