8- intervalos de confianza - mate.unlp.edu.ar · parte 2 – intervalos de confianza prof. maría...

30
Parte 2 Intervalos de confianza Prof. María B. Pintarelli 153 9- Intervalos de confianza 9.1 Introducción Se ha visto como construir a partir de una muestra aleatoria un estimador puntual de un parámetro desconocido. En esos casos necesitábamos dar algunas características del estimador, como por ejemplo si era insesgado o su varianza. A veces resulta más conveniente dar un intervalo de valores posibles del parámetro desconocido, de manera tal que dicho intervalo contenga al verdadero parámetro con determinada probabilidad. Específicamente, a partir de una muestra aleatoria se construye un intervalo 2 1 ˆ , ˆ donde los extremos 1 ˆ y 2 ˆ son dos estadísticos, tal que 1 ˆ , ˆ 2 1 P donde es el parámetro desconocido a estimar y es un valor real entre cero y uno dado de antemano. Por ejemplo si 05 . 0 , se quiere construir un intervalo 2 1 ˆ , ˆ tal que 95 . 0 ˆ , ˆ 2 1 P , o escrito de otra forma 95 . 0 ˆ ˆ 2 1 P Esta probabilidad tiene el siguiente significado: como 1 ˆ y 2 ˆ son estadísticos, los valores que ellos toman varían con los valores de la muestra, es decir si n x x x ,..., , 2 1 son los valores medidos de la muestra entonces el estadístico 1 ˆ tomará el valor 1 y el estadístico 2 ˆ tomará el valor 2 . Si medimos nuevamente la muestra obtendremos ahora valores , , 2 ´, 1 ,..., , n x x x y por lo tanto 1 ˆ toma- rá el valor , 1 y el estadístico 2 ˆ tomará el valor , 2 , diferentes en general de los anteriores. Esto significa que si medimos la muestra 100 veces obtendremos 100 valores diferentes para 1 ˆ y 2 ˆ y por lo tanto obtendremos 100 intervalos distintos, de los cuales aproximadamente 5 de ellos no contendrán al verdadero parámetro. Al valor 1 se lo llama nivel de confianza del intervalo. También se suele definir como nivel de confianza al % 100 1 La construcción repetida de un intervalo de confianza para se ilustra en la siguiente figura

Upload: dinhdiep

Post on 02-Nov-2018

243 views

Category:

Documents


2 download

TRANSCRIPT

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

153

9- Intervalos de confianza

9.1 – Introducción

Se ha visto como construir a partir de una muestra aleatoria un estimador puntual de un parámetro

desconocido. En esos casos necesitábamos dar algunas características del estimador, como por

ejemplo si era insesgado o su varianza.

A veces resulta más conveniente dar un intervalo de valores posibles del parámetro desconocido,

de manera tal que dicho intervalo contenga al verdadero parámetro con determinada probabilidad.

Específicamente, a partir de una muestra aleatoria se construye un intervalo 21ˆ,ˆ donde los

extremos 1 y 2 son dos estadísticos, tal que 1ˆ,ˆ21P donde es el parámetro

desconocido a estimar y es un valor real entre cero y uno dado de antemano. Por ejemplo si

05.0 , se quiere construir un intervalo 21ˆ,ˆ tal que 95.0ˆ,ˆ

21 P , o escrito de otra

forma 95.0ˆˆ21 P

Esta probabilidad tiene el siguiente significado: como 1 y 2 son estadísticos, los valores que

ellos toman varían con los valores de la muestra, es decir si nxxx ,...,, 21 son los valores medidos de

la muestra entonces el estadístico 1 tomará el valor 1 y el estadístico 2 tomará el valor 2 . Si

medimos nuevamente la muestra obtendremos ahora valores ,,

2

,

1 ,...,, nxxx y por lo tanto 1 toma-

rá el valor ,

1 y el estadístico 2 tomará el valor ,

2 , diferentes en general de los anteriores. Esto

significa que si medimos la muestra 100 veces obtendremos 100 valores diferentes para 1 y 2

y por lo tanto obtendremos 100 intervalos distintos, de los cuales aproximadamente 5 de ellos no

contendrán al verdadero parámetro.

Al valor 1 se lo llama nivel de confianza del intervalo. También se suele definir como nivel de

confianza al %1001

La construcción repetida de un intervalo de confianza para se ilustra en la siguiente figura

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

154

9.2 – Intervalo de confianza para la media de una distribución normal, varianza conocida.

El método general para construir intervalos de confianza es el siguiente llamado método del pivo-

te:

Supongamos el siguiente caso particular, sea nXXX ,...,, 21 una muestra aleatoria de tamaño n de

una v.a. X donde ),(~ 2NX , 2 conocido, se quiere construir un intervalo de confianza para

de nivel 1 . Supongamos 05.0 .

1- tomamos un estimador puntual de , sabemos que X es un estimador con buenas propie-

dades.

2- a partir de X construimos el estadístico

n

XZ

. Notar que Z (pivote) contiene al ver-

dadero parámetro y que bajo las condiciones dadas )1,0(~ NZ

3- como conocemos la distribución de Z, podemos plantear: hallar un número z tal que

95.0 zZzP

Por la simetría de la distribución normal estándar podemos escribir

95.012 zzzzZzP 975.0 z 96.1z

Por lo tanto 95.096.196.196.196.1

n

XPZP

Despejamos :

95.096.196.196.196.1

96.196.196.196.1

nX

nXPX

nX

nP

nX

nP

n

XP

Entonces

95.096.1;96.196.196.1

nX

nXP

nX

nXP

Es decir el intervalo de confianza para es

nX

nX

96.1;96.1 y tiene nivel de confian-

za 0.95 o 95%.

Aquí n

X

96.1ˆ1 y

nX

96.1ˆ

2

Repetimos el procedimiento anterior y construimos un intervalo de confianza para con nivel de

confianza 1

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

155

1-Partimos de la esperanza muestral

n

iXn

X11

1 para una muestra aleatoria nX,...,X,X 21 de

tamaño n. Sabemos que es un estimador insesgado y consistente de μ .

2-Construimos el estadístico

N~n/σ

μXZ

(0,1)

La variable aleatoria Z cumple las condiciones necesarias de un pivote

Para construir un intervalo de confianza al nivel de confianza 1-α partiendo del pivote Z, comen-

zamos por plantear la ecuación

zZzP 1-α ,

donde la incógnita es el número real z.

Si reemplazamos la v.a. Z por su expresión tenemos:

n

σzXμ

n

σzXP

n

σzμX

n

σzPz

n/σ

μXzP 1-α

Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)

llegamos a:

n

σzXμ

n

σzXP 1-α

Evidentemente, si definimos

nzX

nzX

2

1

ˆ

ˆ

, hemos construido dos estadísticos 1 y 2 tales que 21ˆˆ P 1-α ,

es decir hemos construido el intervalo de confianza bilateral deseado 21ˆ,ˆ . Todos los elemen-

tos que forman los estadísticos 1 y 2 son conocidos ya que el número z verifica la ecuación

anterior, es decir (ver figura):

z

2

z 2

z

2

2

2

zz

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

156

zzzZzP =1-α donde z es la Fda para la v.a. N~Z (0,1)

Recordando que zz 1 , esta ecuación queda:

zz = 12 z =1-α , o bien (ver figura anterior),

2

z o de otra forma 2

)(

zZP .

Al valor de z que verifica esta ecuación se lo suele indicar 2

z . En consecuencia, el intervalo de

confianza bilateral al nivel de significación 1-α queda:

nzX

nzX

22

21 ,ˆ,ˆ

En consecuencia:

Ejemplo:

Un ingeniero civil analiza la resistencia a la compresión del concreto. La resistencia está distribui-

da aproximadamente de manera normal, con varianza 1000 (psi)2. Al tomar una muestra aleatoria

de 12 especímenes, se tiene que 3250x psi.

a) Construya un intervalo de confianza del 95% para la resistencia a la compresión promedio.

b) Construya un intervalo de confianza del 99% para la resistencia a la compresión promedio.

Compare el ancho de este intervalo de confianza con el ancho encontrado en el inciso a).

Solución:

La v. a. de interés es Xi: “resistencia a la compresión del concreto en un espécimen i”

Tenemos una muestra de 12n especímenes.

Asumimos que ),(~ 2NX i para 12,...,3,2,1i con 10002

a) Queremos un intervalo de confianza para de nivel 95%. Por lo tanto 05.0

El intervalo a utilizar es

nzX

nzX

22

, .

Buscamos en la tabla de la normal estándar el valor de 96.1025.0

2

zz

Reemplazando:

89227.3267,10773.3232

12

100096.13250,

12

100096.13250

b) repetimos lo anterior pero ahora 01.0

Si nXXX ,...,, 21 una muestra aleatoria de tamaño n de una v.a. X donde ),(~ 2NX , 2

conocido, un intervalo de confianza para de nivel 1 es

nzX

nzX

22

, (8.1)

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

157

El intervalo a utilizar es

nzX

nzX

22

, .

Buscamos en la tabla de la normal estándar el valor de 58.2005.0

2

zz

Reemplazando:

55207.3273,44793.3226

12

100058.23250,

12

100058.23250

La longitud del intervalo encontrado en a) es: 35.78454

La longitud del intervalo encontrado en b) es: 47.10414

Notar que la seguridad de que el verdadero parámetro se encuentre en el intervalo hallado es ma-

yor en el intervalo b) que en el a), pero la longitud del intervalo b) es mayor que la del intervalo a).

Al aumentar el nivel de confianza se perdió precisión en la estimación, ya que a menor longitud

hay mayor precisión en la estimación.

En general la longitud del intervalo es n

zL

2

2

Notar que:

a) si n y están fijos, a medida que disminuye tenemos que 2

z aumenta, por lo tanto L

aumenta.

b) si y están fijos, entonces a medida que n aumenta tenemos que L disminuye.

Podemos plantearnos la siguiente pregunta relacionada con el ejemplo anterior: ¿qué tamaño n de

muestra se necesita para que el intervalo tenga nivel de confianza 95% y longitud la mitad de la

longitud del intervalo hallado en a)?

Solución: el intervalo hallado en a) tiene longitud 35.78454, y queremos que el nuevo intervalo

tenga longitud 17.89227 aproximadamente. Planteamos:

89227.171000

96.1289227.172 2/ nn

zL

Despejando n :

4889227.17

100096.12

2

nn

O sea, hay que tomar por lo menos 84 especímenes para que el intervalo tenga la longitud pedida.

En general, si queremos hallar n tal que ln

zL

2

2 , donde l es un valor dado, entonces

despejando n

2

2

2

l

z

n

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

158

Si estimamos puntualmente al parámetro con X estamos cometiendo un error en la estimación

menor o igual a n

zL

22 , que se conoce como precisión del estimador

Ejemplo: Se estima que el tiempo de reacción a un estímulo de cierto dispositivo electrónico está

distribuido normalmente con desviación estándar de 0.05 segundos. ¿Cuál es el número de medi-

ciones temporales que deberá hacerse para que la confianza de que el error de la estimación de la

esperanza no exceda de 0.01 sea del 95%?

Nos piden calcular n tal que 01.02

2

n

zL

con 05.0 .

Por lo tanto

2

025.001.0

05.0

zn .

Además 025,0z =1.96. Entonces 04965961010

050 2

2

9750 ...

.zn .

.

O sea hay que tomar por lo menos 97 mediciones temporales.

Ejemplo:

Supongamos que X representa la duración de una pieza de equipo y que se probaron 100 de esas

piezas dando una duración promedio de 501.2 horas. Se sabe que la desviación estándar poblacio-

nal es σ =4 horas. Se desea tener un intervalo del 95% de confianza para la esperanza poblacional

μXE .

Solución:

En este caso, si bien no conocemos cuál es la distribución de X tenemos que el tamaño de la mues-

tra es 30100 n (muestra grande) por lo tanto el intervalo buscado es

nzX

nzX

22

,

Puesto que 1-α =0.95 025.02

05.095.01

De la tabla de la normal estandarizada obtenemos 025,0z =1.96. Entonces reemplazando:

100

496.1,

100

496.1 XX

Para el valor particular x =501.2 tenemos el intervalo

Para muestras tomadas de una población normal, o para muestras de tamaño 30n , de una

población cualquiera, el intervalo de confianza dado anteriormente en (8.1), proporciona buenos

resultados.

En el caso de que la población de la que se extrae la muestra no sea normal pero 30n , el ni-

vel de confianza del intervalo (8.1) es aproximadamente 1 .

Pero para muestras pequeñas tomadas de poblaciones que no son normales no se puede garanti-

zar que el nivel de confianza sea 1 si se utiliza (8.1).

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

159

0.502,4.500

10

496.12.501,

10

496.12.501

496.1,

100

496.1

nxx .

Al establecer que

05024500 .,. es un intervalo al 95% de confianza de μ estamos diciendo que

la probabilidad de que el intervalo

05024500 .,. contenga a μ es 0.95. O, en otras palabras, la

probabilidad de que la muestra aleatoria nX,...,X,X 21 tome valores tales que el intervalo aleato-

rio

100

496.1,

100

496.1 XX defina un intervalo numérico que contenga al parámetro fijo

desconocido μ es 0.95.

9.3 - Intervalo de confianza para la media de una distribución normal, varianza desconocida

Nuevamente como se trata de encontrar un intervalo de confianza para μ nos basamos en la espe-

ranza muestral

n

iXn

X11

1 que sabemos es un buen estimador de μ . Pero ahora no podemos

usar como pivote a

n/σ

μXZ

porque desconocemos σ y una condición para ser pivote es que, excepto por el parámetro a esti-

mar ( en este caso μ ), todos los parámetros que aparecen en él deben ser conocidos. Entonces pro-

ponemos como pivote una variable aleatoria definida en forma parecida a Z pero reemplazando σ

por un estimador adecuado.

Ya vimos que la varianza muestral definida

2

11

2

1

1

n

i XXn

S ,

donde X es la esperanza muestral, es un estimador insesgado de la varianza poblacional XV , es

decir, 22 σXVSE n . Entonces estimamos σ con S y proponemos como pivote a la va-

riable aleatoria

n/S

μXT

.

Pero para poder usar a T como pivote debemos conocer su distribución.

Se puede probar que la distribución de T es una distribución llamada Student con parámetro n-1.

Nota: Una v.a. continua tiene distribución Student con k grados de libertad, si su f.d.p. es de la

forma

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

160

x

k

xk

k

k

xfk

1

1

2

2

1

)(

2

1

2

Notación: ktT ~

La gráfica de la f.d.p. de la distribución Student tiene forma de campana como la normal, pero

tiende a cero más lentamente. Se puede probar que cuando k la fdp de la Student tiende a la

fdp de la )1 ,0(N .

En la figura siguiente se grafica f(x) para diferentes valores de k

1k

6k

- - - - - k

Anotaremos kt , al cuantil de la Student con k grados de libertad que deja bajo la fdp a derecha un

área de , y a su izquierda un área de 1 .

Luego, para construir el intervalo de confianza buscado a partir del pivote T procedemos como en

los casos anteriores:

Comenzamos por plantear la ecuación

tTtP 1-α ,

donde la incógnita es el número real t.

Si reemplazamos la v.a. T por su expresión, tenemos sucesivamente (multiplicando por n/S y

restando X ):

n

StXμ

n

StXP

n

StμX

n

StPt

n/S

μXtP 1-α

Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)

llegamos a:

-3 -2 -1 1 2 3

0.1

0.2

0.3

0.4

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

161

n

StXμ

n

StXP 1-α

Evidentemente, si definimos

n

StX

n

StX

2

1

ˆ

ˆ

, hemos construido dos estadísticos 1 y 2 tales que 21ˆˆ P 1-α ,

veamos quien es el número t que verifica la ecuación, es decir (ver figura):

tFtFtTtP =1-α donde tF es la Fda para la v.a. T 1nt .

Por la simetría de la distribución t de Student se deduce fácilmente de la figura anterior que

tFtF 1 , entonces:

tFtF = 12 tF =1-α , o bien (ver figura anterior),

2

tF .

Al valor de t que verifica esta ecuación se lo suele indicar 1,

2n

t . En consecuencia, el intervalo de

confianza bilateral al nivel de significación 1-α queda:

n

StX

n

StX

nn 1,2

1,2

, con 2

11,

2

ntF .

En consecuencia:

Si nXXX ,...,, 21 una muestra aleatoria de tamaño n de una v.a. X donde ),(~ 2NX , 2 desconocido, un intervalo de confianza para de nivel 1 es

n

StX

n

StX

22

, (8.2)

2

t 2

t

libertad de grados 4k

2

2

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

162

Ejemplo:

Se hicieron 10 mediciones sobre la resistencia de cierto tipo de alambre que dieron valores

1021 x,...,x,x tales que

10

1

481010

1

i

i .xx ohms y

10

2

9

1

!i

i xxS = 1.36 ohms. Supóngase

que X~N(,σ2).

Se desea obtener un intervalo de confianza para la esperanza poblacional μ al 90 %.

Tenemos que 9001 .α 10.α 05.02/

De la Tabla de la t de Student tenemos que 8331.19,05.0 t . Entonces el intervalo de confianza

buscado es:

10

36.18331.148.10,

10

36.18331.148.10,

1,2

1,2 n

StX

n

StX

nn

Esto es: 27.11 ,69.9 .

9.4 – Intervalo de confianza para la diferencia de dos medias, varianzas conocidas

Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas:

2

222

2

111

σ,μN~X

σ,μN~X y suponemos que las varianzas 2

1σ y 2

2σ son conocidas.

Sean además

111211 nX,...,X,X una muestra aleatoria de tamaño 1n de 1X

222221 nX,...,X,X una muestra aleatoria de tamaño 2n de 2X .

Deseamos construir un intervalo al nivel de confianza α1 para la diferencia de esperanzas

21 μμ .

Ya sabemos cuál es la distribución del promedio de variables aleatorias normales independientes:

Si σ2 es desconocido y el tamaño de la muestra grande, entonces se puede probar que al reem-

plazar por S, el estadístico

10,Nn/S

μXZ

aproximadamente

y puedo construir el intervalo para como antes:

n

SzX

n

SzX

22

, , pero su nivel es aproximadamente 1

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

163

2

1

1 2

2

222

2

2

1 1

2

111

1

1

1

1

n

i

i

n

i

i

n

σ,μN~X

nX

n

σ,μN~X

nX

Consideremos ahora la diferencia 21 XXY . Si 1X y 2X tienen distribución normal y son in-

dependientes, su diferencia también es normal, con esperanza igual a la diferencia de las esperan-

zas y la varianza es la suma de las varianzas:

2

2

2

1

2

12121 ,N~

nnXX

.

Por lo tanto

1,0N~

2

2

2

1

2

1

2121

nn

XXZ

, es decir, tiene distribución normal estandarizada.

La v.a. Z cumple con toda las condiciones para servir de pivote y construiremos nuestro intervalo

en forma análoga a cómo hicimos en los casos anteriores:

Comenzamos por plantear la ecuación

zZzP 1-α ,

donde la incógnita es el número real z.

Reemplazamos la v.a. Z por su expresión y tenemos sucesivamente (multiplicando por

nn 2

2

2

1

2

1

y restando XX 21 ):

12

2

2

1

2

12121

2

2

2

1

2

121

2

2

2

1

2

12121

2

2

2

1

2

1

2

2

2

1

2

1

2121

nnzXX

nnzXXP

nnzXX

nnzPz

nn

XXzP

Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)

llegamos a:

1

2

2

2

1

2

12121

2

2

2

1

2

121

nnzXX

nnzXXP

Evidentemente, si definimos

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

164

ˆ

2

22

1

21

212

2

22

1

21

211

nnzXX

nnzXX

habremos construido dos estadísticos 1 y 2 tales que 2211ˆˆ P 1-α , es decir

habremos construido el intervalo de confianza bilateral deseado 21 A,A . Todos los elementos que

forman los estadísticos 1 y 2 son conocidos ya que el número z verifica la ecuación anterior,

es decir:

zzzZzP =1-α donde z es la Fda para la v.a. N~Z (0,1)

o bien, según vimos:

2

z que anotamos 2

z

En consecuencia, el intervalo de confianza bilateral al nivel de significación 1-α queda:

2

2

2

1

2

1

2

21

2

2

2

1

2

1

2

21 ,nn

zXXnn

zXX

Por lo tanto

Ejemplo:

Se utilizan dos máquinas para llenar botellas de plástico con detergente para máquinas lavaplatos.

Se sabe que las desviaciones estándar de volumen de llenado son 10.01 onzas de líquido y

15.02 onzas de líquido para las dos máquinas respectivamente. Se toman dos muestras aleato-

rias, 121 n botellas de la máquina 1 y 102 n botellas de la máquina 2. Los volúmenes prome-

dio de llenado son 87.301 x onzas de líquido y 68.302 x onzas de líquido.

Asumiendo que ambas muestras provienen de distribuciones normales

Construya un intervalo de confianza de nivel 90% para la diferencia entre las medias del volumen

de llenado.

Solución:

Como 90.01 entonces 10.0

Si 1X y 2X son dos variables aleatorias independientes normalmente distribuidas:

2

111 ,N~ X , 2

222 ,N~ X y suponemos que las varianzas 2

1σ y 2

2σ son conocidas. Un

intervalo de confianza para la diferencia 21 de nivel 1 es

2

2

2

1

2

1

2

21

2

2

2

1

2

1

2

21 ,nn

zXXnn

zXX

(8.3)

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

165

Por lo tanto 65.105.0

2

zz

El intervalo será

10

15.0

12

10.065.168.3087.30;

10

15.0

12

10.065.168.3087.30

2222

O sea

281620.0;09837.0

Si se conocen las desviaciones estándar y los tamaños de las muestras son iguales (es decir

nnn 21 ), entonces puede determinarse el tamaño requerido de la muestra de manera tal que la

longitud del intervalo sea menor que l

2

2

2

1

2

2

2

2

2

1

2

2

2

l

z

nlnn

zL

Ejemplo:

De una muestra de 150 lámparas del fabricante A se obtuvo una vida media de 1400 hs y una des-

viación típica de 120 hs. Mientras que de una muestra de 100 lámparas del fabricante B se obtuvo

una vida media de 1200 hs. y una desviación típica de 80 hs.

Halla los límites de confianza del 95% para la diferencia las vidas medias de las poblaciones A y

B.

Solución:

Para muestras tomadas de dos poblaciones normales, o para muestras de tamaño 301 n y

302 n , de dos poblaciones cualesquiera, el intervalo de confianza dado anteriormente en

(8.3), proporciona buenos resultados.

En el caso de que la población de la que se extrae la muestra no sea normal pero 301 n y

302 n , el nivel de confianza del intervalo (8.3) es aproximadamente 1 .

Si 1 y 2 son desconocidos, 301 n y 302 n , entonces se puede probar que al reemplazar

1 por S1 y 2 por S2, el estadístico

menteaproximadaN

nS

nS

XX )1,0(

2

2

2

1

2

1

2121)(

.

y puedo construir el intervalo para 21 como antes:

n

S

n

SzXX

n

S

n

SzXX

2

22

1

21

221

2

22

1

21

221 , , (8.4)

pero su nivel es aproximadamente 1

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

166

Sean las variables aleatorias:

:1X “duración en horas de una lámpara del fabricante A”

:2X “duración en horas de una lámpara del fabricante B”

No se dice cuál es la distribución de estas variables, pero como 1501 n y 1002 n

podemos usar el intervalo dado en (8.4)

Tenemos que 14001 x , 12002 x , 1201 s y 802 s .

Además 95.01 1.96z z 0.025

2

Entonces el intervalo es

7922.224;2077.175

100

80

150

12096.112001400;100

80

150

12096.1120014002222

Observación: como este intervalo no contiene al cero, podemos inferir que hay diferencia entre las

medias con probabilidad 0.95, es más, podemos inferir que la media del tiempo de duración de las

lámparas del fabricante A es mayor que la media del tiempo de duración de las lámparas del fabri-

cante B con probabilidad 0.95 .

9.5 – Intervalo de confianza para la diferencia de dos medias, varianzas desconocidas

Nuevamente supongamos que tenemos dos variables aleatorias independientes normalmente dis-

tribuidas:

2

222

2

111

σ,μN~X

σ,μN~X y suponemos que las varianzas 2

1σ y 2

2σ son desconocidas .

Sean además

111211 nX,...,X,X una muestra aleatoria de tamaño 1n de 1X

222221 nX,...,X,X una muestra aleatoria de tamaño 2n de 2X .

Pero ahora 1n o 2n no son mayores que 30

Supongamos que es razonable suponer que las varianzas desconocidas son iguales, es decir

21

Deseamos construir un intervalo al nivel de confianza α1 para la diferencia de esperanzas

21 μμ

Sean 1X y 2X las medias muestrales y 2

1S y 2

2S las varianzas muestrales. Como 2

1S y 2

2S son

los estimadores de la varianza común 2 , entonces construimos un estimador combinado de 2 .

Este estimador es

2

11

21

2

22

2

112

nn

SnSnS p

Se puede comprobar que es un estimador insesgado de 2 .

Se puede probar que el estadístico

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

167

21

2121

11

nnS

XXT

p

tiene distribución Student con 221 nn grados de libertad

Por lo tanto se plantea la ecuación

1

2,2

2,2

2121 nnnntTtP

o

1

11 2,2

21

2121

2,2

2121 nn

p

nnt

nnS

XXtP

Despejamos 21 y queda la expresión

111

2 11

2 21

, 2

2121

21

2, 2

212121 nn

St nnXXnn

St nnXXP pp

Entonces

Ejemplo:

Se piensa que la concentración del ingrediente activo de un detergente líquido para ropa, es afecta-

da por el tipo de catalizador utilizado en el proceso de fabricación. Se realizan 10 observaciones

con cada catalizador, y se obtienen los datos siguientes:

Catalizador 1: 57.9, 66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0

Catalizador 2: 66.4, 71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 68.8

a) Encuentre un intervalo de confianza del 95% para la diferencia entre las medias de las concen-

traciones activas para los dos catalizadores. Asumir que ambas muestras fueron extraídas de po-

blaciones normales con varianzas iguales.

b) ¿Existe alguna evidencia que indique que las concentraciones activas medias dependen del cata-

lizador utilizado?

Solución:

Sean las variables aleatorias

Si 1X y 2X son dos variables aleatorias independientes normalmente distribuidas:

2

111 ,N~ X , 2

222 ,N~ X y suponemos que las varianzas 2

1σ y 2

2σ son desconocidas

e iguales, es decir 21

Un intervalo de confianza para la diferencia 21 de nivel 1 es

nn

St nnXXnn

St nnXX pp

21

2,2/21

21

2,2/21

11;

112121

(8.5)

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

168

:1X “ concentración del ingrediente activo con catalizador 1”

:2X “ concentración del ingrediente activo con catalizador 2”

Asumimos que ambas variables tienen distribución normal con varianzas iguales

Estamos e3n las condiciones para usar (8.5)

Tenemos que 22.651 x , 42.682 x , 444.31 s , 224.22 s , 1021 nn

Calculamos

4036.821010

224.29444.39

2

11 22

21

2

22

2

112

nn

SnSnS p

Por lo tanto 89890.24036.8 pS

Buscamos en la tabla de la Student 060.218,025.02,

221

ttnn

Entonces el intervalo es

52935.0;8706.5

10

1

10

189890.2060.242.6822.65;

10

1

10

189890.2060.242.6822.65

b) Existe alguna evidencia que indique que las concentraciones activas medias dependen del cata-

lizador utilizado, pues el 0 no pertenece al intervalo.

En muchas ocasiones no es razonable suponer que las varianzas son iguales. Si no podemos ga-

rantizar que las varianzas son iguales, para construir un intervalo de confianza de nivel 1 para

21 utilizamos es estadístico

nS

nS

XXT

2

2

2

1

2

1

2121*)(

Se puede probar que *T tiene aproximadamente una distribución Student con grados de liber-

tad donde

1

22

1

1

21

22

21

2

2

2

1

2

21

2

n

n

S

n

n

S

n

S

n

S

si no es entero, se toma el entero más próximo a

Por lo tanto planteamos la ecuación

1

,2

*

,2

tTtP

Y despejando 21 el intervalo es

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

169

2

2

2

1

2

1

,2

21

2

2

2

1

2

1

,2

21 ,n

S

n

StXX

n

S

n

StXX

Entonces

Ejemplo:

Una muestra de 6 soldaduras de un tipo tenía promedio de prueba final de resistencia de 83.2 ksi y

desviación estándar de 5.2. Y una muestra de 10 soldaduras de otro tipo tenía resistencia promedio

de 71.3 ksi y desviación estándar de 3.1. supongamos que ambos conjuntos de soldaduras son

muestras aleatorias de poblaciones normales. Se desea encontrar un intervalo de confianza de 95%

para la diferencia entre las medias de las resistencias de los dos tipos de soldaduras.

Solución:

Ambos tamaños muestrales son pequeños y las muestras provienen de poblaciones normales. No

podemos asumir igualdad de varianzas. Entonces aplicamos (8.6)

Tenemos que 2.831 x , 3.712 x , 2.51 s , 1.32 s , 10;6 21 nn

Como 95.01 entonces 025.02

Además

718.7

9

101.3

5

62.5

10

1.3

6

2.5

11

22

222

2

2

2

2

2

1

2

1

1

1

2

2

2

21

2

1

n

nS

n

nS

nSnS

Entonces buscamos en la tabla de la Student 365.27,025.0 t

Por lo tanto el intervalo es

Si 1X y 2X son dos variables aleatorias independientes normalmente distribuidas:

2

111 ,N~ X , 2

222 ,N~ X y suponemos que las varianzas 2

1σ y 2

2σ son desconocidas

y distintas

Un intervalo de confianza para la diferencia 21 de nivel aproximadamente 1 es

2

2

2

1

2

1

,2

21

2

2

2

1

2

1

,2

21 ,n

S

n

StXX

n

S

n

StXX

(8.6)

Donde

1

22

1

1

21

22

21

2

2

2

1

2

21

2

n

n

S

n

n

S

n

S

n

S

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

170

43.17,37.610

1.3

6

2.5365.23.712.83;

10

1.3

6

2.5365.23.712.83

,

2222

2

2

2

1

2

1

,2

21

2

2

2

1

2

1

,2

21n

S

n

StXX

n

S

n

StXX

9.6 – Intervalo de confianza para 21 para datos pareados

Hasta ahora se obtuvieron intervalos de confianza para la diferencia de medias donde se tomaban

dos muestras aleatorias independientes de dos poblaciones de interés. En ese caso se tomaban 1n

observaciones de una población y 2n observaciones de la otra población.

En muchas situaciones experimentales, existen solo n unidades experimentales diferentes y los

datos están recopilados por pares, esto es cada unidad experimental está formada por dos observa-

ciones.

Por ejemplo, supongamos que se mide el tiempo en segundos que un individuo tarda en hacer una

maniobra de estacionamiento con dos automóviles diferentes en cuanto al tamaño de la llanta y la

relación de vueltas del volante. Notar que cada individuo es la unidad experimental y de esa unidad

experimental se toman dos observaciones que no serán independientes. Se desea obtener un inter-

valo de confianza para la diferencia entre el tiempo medio para estacionar los dos automóviles.

En general, supongamos que tenemos los siguientes datos nn XXXXXX 2122122111 ,;...;,;,1

.

Las variables aleatorias 1X y 2X tienen medias 1 y 2 respectivamente.

Sea jjj XXD 21 con nj ,...,2,1 .

Entonces

212121 jjjjj XEXEXXEDE

y

21

2

2

2

1212121 ,2,2 XXCovXXCovXVXVXXVDV jjjjjjj

Estimamos 21 jDE con

21

1

21

1

11XXXX

nD

nD

n

j

jj

n

j

j

En lugar de tratar de estimar la covarianza, estimamos la jDV con

n

j

jD DDn

S1

22

1

1

Anotamos 21 D y jD DV2

Asumimos que 2,N~ DDjD con nj ,...,2,1

Las variables aleatorias en pares diferentes son independientes, no lo son dentro de un mismo par.

Para construir el intervalo de confianza notar que

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

171

1/

n

D

D tnS

DT

entonces al plantear la ecuación tTtP 1-α , deducimos que 1,

2

n

tt

Por lo tanto el intervalo de confianza para 21 D de nivel 1 se obtendrá al sustituir T

en la ecuación anterior y despejar 21 D

El intervalo resultante es

n

StD

n

StD D

n

D

n 1,2

1,2

;

Entonces

Ejemplo:

Consideramos el ejemplo planteado al comienzo. Deseamos un intervalo de nivel 0.90

Sean las variables aleatorias

jX 1 : “tiempo en segundos que tarda el individuo j en estacionar automóvil 1” con nj ,...,2,1

jX 2 : “tiempo en segundos que tarda el individuo j en estacionar automóvil 2” con nj ,...,2,1

Medimos estas variables de manera que tenemos las siguientes observaciones

Automóvil 1 Automóvil 2 diferencia

sujeto (observación jx1 ) (observación jx2 ) jD

1 37.0 17.8 19.2

2 25.8 20.2 5.6

3 16.2 16.8 -0.6

4 24.2 41.4 -17.2

5 22.0 21.4 0.6

6 33.4 38.4 -5.0

7 23.8 16.8 7.0

8 58.2 32.2 26.0

9 33.6 27.8 5.8

10 24.4 23.2 1.2

11 23.4 29.6 -6.2

12 21.2 20.6 0.6

13 36.2 32.2 4.0

14 29.8 53.8 -24.0

A partir de la columna de diferencias observadas se calcula 21.1D y 68.12DS

Cuando las observaciones se dan de a pares nn XXXXXX 2122122111 ,;...;,;,1

, y las diferen-

cias

jjj XXD 21 son tales que 2,N~ DDjD para nj ,...,2,1 , un intervalo de confianza

de nivel 1 para 21 D es

n

StD

n

StD D

n

D

n 1,2

1,2

; (8.7)

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

172

Además 771.113,05.01,

2

ttn

, entonces el intervalo para la diferencia 21 D de nivel 0.90

es

21.7;79.4

14

68.12771.121.1;

14

68.12771.121.1

9.7 – Intervalo de confianza para la varianza de una distribución normal

Supongamos que se quiere hallar un intervalo de confianza para la varianza 2 de una distribu-

ción normal.

Sea nX,...,X,X 21 una muestra aleatoria de una v.a. X, donde ),(~ 2NX .

Tomamos como estimador puntual de 2 a 2

11

2

1

1

n

i XXn

S

Luego a partir de este estimador puntual construimos el estadístico

2

21

SnX

Este estadístico contiene al parámetro desconocido a estimar 2 y tiene una distribución conocida,

se puede probar que X tiene una distribución llamada ji-cuadrado con n-1 grados de libertad

Observación: Si X es una v.a. continua se dice que tiene distribución ji-cuadrado con k grados de

libertad si su f.d.p. es

0

22

1)( 2

12

2

xexk

xfxk

k

Notación: X~2

k

La distribución ji-cuadrdo es asimétrica. En la figura siguiente se grafica la densidad para diferen-

tes valores de k

10 20 30 40 50 60

0.02

0.04

0.06

0.08

0.1

0.12

30

15

2

k

k

k

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

173

Anotaremos k,2 al cuantil de la ji-cuadrado con k grados de libertad que deja bajo la fdp a dere-

cha un área de , y a su izquierda un área de 1 .

Propiedades:

1- Se puede probar que si nXXX ,...,, 21 son variables aleatorias independientes con distribución

)1,0(N entonces 22

2

2

1 ... nXXXZ tiene distribución ji-cuadrado con n grados de libertad.

2- Si nXXX ,...,, 21 son variables aleatorias independientes tal que iX tiene distribución ji-

cuadrado con ik grados de libertad, entonces nXXXZ ...21 tiene distribución ji-cuadrado

con k grados de libertad donde nkkkk ...21

3- Si 2~ kX entonces para k grande

1,12~2 kNX aproximadamente.

Para desarrollar el intervalo de confianza planteamos hallar dos números a y b tales que

1bXaP es decir

1

12

2

bSn

aP

Se puede probar que la mejor elección de a y b es: 2

1,2

1

na y 2

1,2

nb

Por lo tanto

1

1 2

1,2

2

22

1,2

1 nn

SnP

y despejando 2 se llega a

111

2

1,2

1

22

2

1,2

2

nn

SnSnP

Entonces

2

1

2

1,2

1 n 2

1,2

n

2

5k

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

174

Observación: un intervalo de confianza para de nivel 1 , es

2

1,2

1

2

2

1,2

2 1 ;

1

nn

SnSn

Ejemplo:

Un fabricante de detergente líquido está interesado en la uniformidad de la máquina utilizada para

llenar las botellas. De manera específica, es deseable que la desviación estándar del proceso de

llenado sea menor que 0.15 onzas de líquido; de otro modo, existe un porcentaje mayor del desea-

ble de botellas con un contenido menor de detergente. Supongamos que la distribución del volu-

men de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se ob-

tiene una varianza muestral 0153.02 S . Hallar un intervalo de confianza de nivel 0.95 para la

verdadera varianza del volumen de llenado.

Solución:

La v.a. de interés es X: “ volumen de llenado de una botella”

Se asume que ),(~ 2NX con desconocido.

Estamos en las condiciones para aplicar (8.8)

Tenemos que 95.01 05.0 91.82

19,975.0

2

1,2

1

n y 85.322

19,025.0

2

1,2

n

Además 0153.02 S

Por lo tanto el intervalo es

.03260 ;00884.091.8

0153.0120 ;

85.32

0153.01201 ;

12

1,2

1

2

2

1,2

2

nn

SnSn

Y un intervalo para es 1805.0 ;09.00326.0 ;00884.0

Por lo tanto con un nivel de 0.95 los datos no apoyan la afirmación que 15.0

9.8 – Intervalo de confianza para el cociente de varianzas de dos distribuciones normales

Supongamos que se tienen dos poblaciones normales e independientes con varianzas desconocidas 2

1 y 2

2 respectivamente. Se desea encontrar un intervalo de nivel 1 para el cociente de las

dos varianzas 2

2

2

1

.

Si nX,...,X,X 21 es una muestra aleatoria de una v.a. X, donde ),(~ 2NX , un intervalo de

confianza para 2 de nivel 1 es

2

1,2

1

2

2

1,2

2 1 ;

1

nn

SnSn

(8.8)

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

175

Se toma una muestra aleatoria de tamaño 1n de una de las poblaciones y una muestra de tamaño

2n de la otra población. Sean 2

1S y 2

2S las dos varianzas muestrales.

Consideramos el estadístico

21

21

22

22

S

S

F

Notar que F contiene al parámetro de interés 2

2

2

1

, pues

22

21

21

22

S

SF

Se puede probar que F tiene una distribución llamada Fisher con 12 n y 11 n grados de libertad.

Observación:

Sea X una variable aleatoria continua, se dice que tiene distribución Fisher con u grados de libertad

en el numerador y v grados de libertad en el denominador si su fdp es de la forma

x

xv

uvu

xv

uvu

xfvu

uu

0

122

2)(

2

12

2

En particular si W e Y son variables aleatorias independientes ji-cuadrado con u y v grados de liber-

tad respectivamente, entonces el cociente

vY

uW

F

Tiene una distribución Fisher con u grados de libertad en el numerador y v grados de libertad en el

denominador.

Notación: vuFF ,~

La gráfica de una distribución Fisher es similar a la de una ji-cuadrado, es asimétrica. Anotamos

vuf ,, al cuantil que deja a su derecha un área de bajo la curva de densidad.

20 ;15 vu

vuf ,,

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

176

1 ,1 , 122

nnf

Existe la siguiente relación entre los cuantiles de una vuF , y de una uvF ,

uv

vuf

f,,

,,1

1

Planteamos la siguiente ecuación 1bFaP y se pede probar que la mejor elección de

1,1,2

1 12

nnfa y a y b es :

1,1,2

12

nnfb

Entonces

1

1,1,2

2

1

2

1

2

2

2

2

1,1,2

1 1212 nnnnf

S

SfP

Despejando el cociente 2

2

2

1

queda :

1

1,1,2

2

2

2

1

2

2

2

1

1,1,2

12

2

2

1

1212 nnnnf

S

Sf

S

SP

Por lo tanto

Ejemplo:

Una compañía fabrica propulsores para uso en motores de turbina. Una de las operaciones consiste

en esmerilar el terminado de una superficie particular con una aleación de titanio. Pueden emplear-

20 ;15 vu 2

2

1,1,2

1 12 nnf

Si se tienen dos poblaciones normales e independientes con varianzas desconocidas 2

1 y 2

2

respectivamente, entonces un intervalo de nivel 1 para el cociente de las dos varianzas

2

2

2

1

es

1,1,2

2

2

2

1

1,1,2

12

2

2

1

1212

;nnnn

fS

Sf

S

S (8.9)

1 ,1 , 122

nnf

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

177

se dos procesos de esmerilado, y ambos pueden producir partes que tienen la misma rugosidad

superficial promedio. Interesaría seleccionar el proceso que tenga la menor variabilidad en la rugo-

sidad de la superficie. Para esto se toma una muestra de 12 partes del primer proceso, la cual tiene

una desviación estándar muestral 1.51 S micropulgadas, y una muestra aleatoria de 15 partes del

segundo proceso, la cual tiene una desviación estándar muestral 7.42 S micropulgadas. Se desea

encontrar un intervalo de confianza de nivel 90% para el cociente de las dos varianzas.

Suponer que los dos procesos son independientes y que la rugosidad de la superficie está distribui-

da de manera normal.

Solución:

Estamos en las condiciones para aplicar (8.9)

Buscamos en la tabla de la Fisher 39.058.2

11

14,11,05.0

11,14,95.01,1,

21 12

f

ffnn

y 74.211,14,05.01,1,

212

ffnn

Entonces el intervalo es

23.3 ;46.0 2.747.4

1.5 ;39.0

7.4

1.52

2

2

2

Como este intervalo incluye al 1, no podemos afirmar que las desviaciones estándar de los dos

procesos sean diferentes con una confianza de 90%.

9.9 – Intervalo de confianza para una proporción

Sea una población de tamaño N (eventualmente puede ser infinito) de cuyos individuos nos intere-

sa cierta propiedad A. Supongamos que la probabilidad de que un individuo de la población verifi-

que A es APp .El significado del parámetro p es, en consecuencia, el de proporción de indivi-

duos de la población que verifican la propiedad A. Podemos definir una variable

aleatoria iX que mide a los individuos de la población la ocurrencia o no de la propiedad A .

La variable aleatoria tendrá la distribución:

,100

11

pXPp

pXPp

xp

i

i

es decir, Xi es una v.a. que toma sólo dos valores: 1 (si el individuo verifica A) con probabilidad p

y 0 (cuando no verifica A) con probabilidad 1-p. Esto es equivalente a decir que Xi tiene una distri-

bución binomial con parámetros 1 y p: Xi ~ B(1,p).

Supongamos que consideramos una muestra aleatoria nXXX ...,, 21 de tamaño n . Si formamos

el estadístico X nXXX ...21 , es evidente que esta v.a. mide el número de individuos de la

muestra de tamaño n que verifican la propiedad A. Por lo tanto por su significado X es una v.a.

cuya distribución es binomial con parámetros n y p: X~B(n,p). De acuerdo con esto, la variable

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

178

aleatoria P definida: n

XP representa la proporción de individuos de la muestra que verifican la

propiedad A.

Observemos que siendo Xi ~ B(1,p) es pXE i . Y, dado que X~B(n,p), también es

pnpn

XEnn

XEPE

11, es decir P es un estimador insesgado de p . Esto es de espe-

rar pues

n

i

iXnn

XP

1

1ˆ .

Pero además, es fácil ver que P es estimador consistente de p . En efecto, tenemos que pPE ,

pero también es

n

pppnp

nn

XVPV

11

12

.

Deseamos construir un intervalo de confianza de p. Es razonable basarnos en el estimador insesga-

do P . Consideramos como pivote a la variable aleatoria

n

pp

pPZ

1 cuya distribución es, para n suficientemente grande, aproximadamente N(0,1). En

efecto:

Siendo n

X

n

X

n

XP n ...ˆ 21 , es

n

i

i pn

XEPE

1

ˆ y

n

i

i

n

pp

n

XVPV

1

Por lo tanto:

1,0~

1

ˆN

n

pp

pPZ

granden

,

El pivote puede ponerse en una forma más conveniente si tenemos en cuenta que, según vimos

recién, P es estimador consistente de p y en consecuencia, en el denominador reemplazamos el

parámetro desconocido p por su estimador P , y se puede probar que :

n

PP

pPZ

ˆ1ˆ

ˆN(0,1). aproximadamente si n es grande

Partiendo de este pivote podemos seguir los mismos pasos de los casos anteriores para llegar al

siguiente intervalo de confianza al nivel α1 de p:

n

PPzP

n

PPzP

ˆ1ˆˆ,

ˆ1ˆˆ

22

con 2

12

z .

Entonces

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

179

Observaciones:

1- Este procedimiento depende de la aproximación normal a la distribución binomial. Por lo tanto

el intervalo (8.10) se puede utilizar si 10ˆ Pn y 10)ˆ1( Pn , es decir, la muestra debe contener

un mínimo de diez éxitos y diez fracasos.

2- La longitud del intervalo es

n

PPzL

ˆ1ˆ2

2

, pero esta expresión está en función de P

Si nos interesa hallar un valor de n de manera tal que la longitud L sea menor que un valor deter-

minado, podemos hacer dos cosas:

a) tomar una muestra preliminar, con ella estimar p con P y de la expresión anterior despejar n, lo

que lleva a

PP

l

z

nln

PPzL ˆ1ˆ

2

ˆ1ˆ

2

2

2

2

b) si no tomamos una muestra preliminar, entonces acotamos 5.015.0ˆ1ˆ PP , entonces

2

2

22

5.015.0

2ˆ1ˆ

2

l

z

nln

zn

PPzL

Ejemplo:

Un fabricante de componentes compra un lote de dispositivos de segunda mano y desea saber la

proporción de la población que están fallados. Con ese fin experimenta con 140 dispositivos elegi-

dos al azar y encuentra que 35 de ellos están fallados.

a) Calcular un intervalo de confianza del 99% para la proporción poblacional p.

b) ¿De qué tamaño deberá extraerse la muestra a fin de que la proporción muestral no difiera de la

proporción poblacional en más de 0.03 con un 95% de confianza?

Solución:

a) El tamaño de la muestra es 140n (muestra grande)

La proporción muestral es 25.0140

35ˆ P

El nivel de confianza es 9901 .α 010.α 00502

.α .

Si P es la proporción de observaciones de una muestra aleatoria de tamaño n que verifican una

propiedad de interés, entonces un intervalo de confianza para la proporción p de la población

que cumple dicha propiedad de nivel aproximadamente 1 es

n

PPzP

n

PPzP

ˆ1ˆˆ ,

ˆ1ˆˆ

22

(8.10)

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

180

De la tabla de la normal estandarizada vemos que 58.2005.0 z . Entonces el intervalo buscado es:

34441.0 ,15558.0

140

25.0125.058.225.0 ,

140

25.0125.058.225.0

b) Buscamos el tamaño n de la muestra tal que con un 95% de confianza la proporción muestral P

esté a una distancia 0.03 de la proporción poblacional p, es decir buscamos n tal que

03.02

L , por lo tanto como 05.0 025.0

2

si tomamos la muestra anterior como pre-

liminar :

3333.80025.0125.003.02

96.12ˆ1ˆ

22

2

2

PPl

z

n

Por lo tanto hay que tomar una muestra de tamaño por lo menos 801. Como ya se tomó una mues-

tra de tamaño 140, hay que tomar otra adicional de tamaño 661140801

Supongamos que no tomamos una muestra inicial, entonces directamente planteamos

1111.106703.02

96.12

2

2

l

z

n

Entonces hay que tomar una muestra de tamaño 1068 por lo menos.

9.10 – Intervalo de confianza para la diferencia entre dos proporciones

Supongamos que existen dos proporciones de interés 1p y 2p y es necesario obtener un intervalo

de confianza de nivel 1 para la diferencia 21 pp .

Supongamos que se toman dos muestras independientes de tamaños 1n y 2n respectivamente de

dos poblaciones.

Sean las variables aleatorias

:1X “número de observaciones en la primera muestra que tienen la propiedad de interés”

:2X “número de observaciones en la segunda muestra que tienen la propiedad de interés”

Entonces 1X y 2X son variables aleatorias independientes y X1~B(n1,p1) ; X2~B(n2,p2)

Además 1

11ˆ

n

XP y

2

22

ˆn

XP son estimadores puntuales de 1p y 2p respectivamente.

Vemos que 2121ˆˆ ppPPE y

2

22

1

1121

11ˆˆn

pp

n

ppPPV

Aplicando la aproximación normal a la binomial podemos decir que

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

181

)1,0(

11

ˆˆ

2

22

1

11

2121 N

n

pp

n

pp

ppPPZ

, y como en el caso de intervalo para una proporción estima-

mos

2

22

1

11 11

n

pp

n

pp

con

2

22

1

11ˆ1ˆˆ1ˆ

n

PP

n

PP

y entonces

)1,0(

ˆ1ˆˆ1ˆ

ˆˆ

2

22

1

11

2121 N

n

PP

n

PP

ppPPZ

aproximadamente.

Planteamos la ecuación zzzZzP =1-α , lo que lleva a

2

zz , y con una deducción análoga a las anteriores se llega al intervalo

2

22

1

11

2

21

2

22

1

11

2

21

ˆ1ˆˆ1ˆˆˆ ;

ˆ1ˆˆ1ˆˆˆ

n

PP

n

PPzPP

n

PP

n

PPzPP

Entonces

Ejemplo:

Se lleva a cabo un estudio para determinar la efectividad de una nueva vacuna contra la gripe. Se

administra la vacuna a una muestra aleatoria de 3000 sujetos, y de ese grupo 13 contraen gripe.

Como grupo de control se seleccionan al azar 2500 sujetos, a los cuales no se les administra la va-

cuna, y de ese grupo 170 contraen gripe. Construya un intervalo de confianza de nivel 0.95 para la

diferencia entre las verdaderas proporciones de individuos que contraen gripe.

Solución:

Sean las variables aleatorias

:1X “número de personas que contraen gripe del grupo que recibió la vacuna”

:2X “número de personas que contraen gripe del grupo que no recibió la vacuna”

Entonces X1~B(n1,p1) ; X2~B(n2,p2) donde 30001 n ; 25002 n

Además 3000

13ˆ1 P ;

2500

170ˆ2 P

Y 96.195.01 025.0

2

zz

Entonces

Si 1P y 2P son las proporciones muestrales de una observación de dos muestras aleatorias inde-

pendientes de tamaños 1n y 2n respectivamente que verifican la propiedad de interés, entonces

un intervalo de confianza de nivel 1 aproximadamente es

2

22

1

11

2

21

2

22

1

11

2

21

ˆ1ˆˆ1ˆˆˆ ;

ˆ1ˆˆ1ˆˆˆ

n

PP

n

PPzPP

n

PP

n

PPzPP (8.11)

Parte 2 – Intervalos de confianza Prof. María B. Pintarelli

182

0535222.0;0738112.02500

2500

1701

2500

170

3000

3000

131

3000

13

96.12500

170

3000

13

;2500

2500

1701

2500

170

3000

3000

131

3000

13

96.12500

170

3000

13

ˆ1ˆˆ1ˆˆˆ ;

ˆ1ˆˆ1ˆˆˆ

2

22

1

11

2

21

2

22

1

11

2

21n

PP

n

PPzPP

n

PP

n

PPzPP