Estadística2011
Clase 2
Maestría en FinanzasUniversidad del CEMA
Profesor: Alberto Landro
Asistente: Julián R. Siri
Clase 2
4. La distribución exponencial
Estocástica5. La distribución normal
1. La distribución de Bernoulli
2. La distribución binomial
3. La distribución de Poisson
6. La distribución chi-cuadrado
7. La distribución t de Student
8. La distribución F
• En los denominados experimentos de Bernoulli sólo son posibles dos
resultados: éxito o fracaso. Podemos definir una variable aleatoria discreta
X tal que:
• Si la probabilidad de éxito es p y la de fracaso 1-p, la función de
probabilidades es:
1
0
éxito
fracaso
1
1 0,1xxf X p p x
1. La distribución de Bernoulli
• Una variable aleatoria X sigue una distribución de Bernoulli si su función
de densidad de probabilidades (de ahora en adelante, FDP) es:
• Para tal variable, la esperanza matemática y la varianza son:
Donde q = (1-p).
0 1
1
p X p
p X p
var
E X p
X pq
1. La distribución de Bernoulli
• Esta distribución es la generalización de la distribución de Bernoulli. Si X
representa el número de éxitos en n intentos independientes, entonces se
dice que X sigue una distribución binomial cuya FDP es:
Donde x es el número de éxitos y
El interés está en determinar la probabilidad de obtener exactamente X = x
éxitos durante los n ensayos. La distribución binomial consta de dos
parámetros, n y p.
1n xx
nf X p p
x
!
! !
n n
x x n x
2. La distribución binomial
La función de distribución acumulativa es:
Dado los momentos absolutos y centrados, definimos la esperanza, la
varianza, el coeficiente de asimetría y la kurtosis:
0
; , 1x
n ii
i
np X x F x n p p p
i
22 2
3
3
4
4
1 2
1 63
m X E X np
X E X E X npq
X q p pAs X
X npq npq
X pqK X
X npq
2. La distribución binomial
Aquí la variable aleatoria representa el número de eventos independientes
que ocurren a una velocidad constante. Ofrece, además, una
aproximación excelente a la función de probabilidad binomial cuando p es
pequeño y n grande.
Sea X una variable aleatoria que representa el número de eventos aleatorios
independientes que ocurren a una rapidez constante sobre el tiempo o el
espacio. Se dice entonces que X tiene una distribución de Poisson con
FDP:
El único parámetro de la distribución es lambda, el número promedio de
ocurrencias del evento aleatorio por unidad de tiempo.
0; 0
; !
0 para cualquier otro valor
xex
f X x
3. La distribución de Poisson
La función de distribución acumulativa es:
Dado los momentos absolutos y centrados, definimos la esperanza, la
varianza, el coeficiente de asimetría y la kurtosis:
0
;!
ix
i
ep X x F x
i
22 2 2 2
3
3 3/ 2
24
4 2
1
3 13 3
m X E X
X E X E X
XAs X
X
XK X
X
3. La distribución de Poisson
La distribución de Poisson también es una forma límite de la distribución
binomial cuando n tiende a infinito y p tiende a cero (de manera que no
permanece constante).
Sea X una v.a. con distribución binomial y función de probabilidad:
Si para n=1,2,… la relación es cierta para alguna constante ,
entonces:
!
; , 1 0,1,2,...,! !
n xxnp x n p p p x n
n x x
0
lim ; , , 0,1,2,...!
x
np
ep x n p x
x
p n 0
3. La distribución de Poisson
Esta distribución tiene su origen en el proceso de Poisson. Como
mencionamos antes, la distribución de Poisson se refiere a un espacio
continuo dentro del cual se producen una cantidad discreta de eventos
aleatorios cada uno de ellos con una probabilidad de ocurrencia p. Si
introducimos una nueva variable T(x), a la que definimos como el
intervalo de tiempo (o de espacio) entre ciertas ocurrencias de un
suceso de Poisson, entonces esa variable tiene una distribución
exponencial.
El esquema de Poisson responde a: ¿cuál es la probabilidad que se
produzcan “x” ocurrencias en cierto espacio o tiempo continuo, en el que
el promedio de ocurrencias es λ?
El esquema exponencial, en cambio, responde a: ¿cuál es el lapso de tiempo
que hay que esperar (o el espacio a recorrer) para que se produzcan “x”
ocurrencias, siendo λ el promedio de ocurrencias?
4. La distribución exponencial
Definiendo,
Nos proponemos determinar la probabilidad de que cierto evento aleatorio no
suceda en ese lapso de tiempo (o espacio), es evidente que lo que
pretendemos calcular es P(X>x):
Si definimos ahora a , este nuevo parámetro, al ser la inversa de λ,
puede interpretarse como “el tiempo (o espacio) promedio entre
ocurrencias de Poisson”. Reemplazando en la expresión anterior,
Nos indica la probabilidad de que no existan ocurrencias hasta el momento x.
tiempo transcurrido (o espacio recorrido) entre dos sucesos
tiempo que transcure hasta el primer evento
T X
t x
0!
x xxP X x e e
1
xP X x e
4. La distribución exponencial
Si ahora nos preguntamos por la variable tiempo (o espacio) entre dos
eventos (a la que definimos como X), dicha probabilidad será la contraria
a la expresada con anterioridad:
Y la FDP no será más que la derivada de la anterior,
Sus características más importantes serán:
1 xT X P X x e
1
E X
2 2X
1 xt x t X e
4. La distribución exponencial
La distribución normal o Gaussiana es la piedra angular en la aplicación de la
inferencia estadística en el análisis de datos, dado que las distribuciones
de muchas estadísticas muestrales tienden hacia dicha distribución
conforme crece el tamaño de la muestra.
Se dice que una variable aleatoria X está normalmente distribuida si su FDP
tiene la siguiente forma:
Donde son parámetros reales que denotan el valor esperado y el
desvío estándar de distribución, respectivamente.
y 0
21
21
2
x
Xf x e x
5. La distribución normal
Propiedades:
1. El punto medio de la curva normal es la media de la distribución.
2. La distribución es simétrica alrededor de su media.
3. La probabilidad de que el valor de la variable se encuentre dentro del rango de un
desvío standard (SD) por sobre o por debajo de la media es de 68,3%. Alrededor
de 95,5% del área de la distribución se encuentra entre , y por último más
del 99,7% del área se encuentra entre , como se aprecia en la figura.2
3
5. La distribución normal
Propiedades:
4. Sean y , y supóngase que son independientes,
entonces considerando su combinación lineal de la siguiente manera:
Puede mostrarse que:
Corolario: Una combinación lineal de variables aleatorias independientes
normalmente distribuidas es normalmente distribuida.
5. Teorema central del límite. Sean , n variables aleatorias
independientes, las cuales tienen la misma FDP con . Si ,
entonces, a medida que n aumenta indefinidamente,
Y este resultado se cumple sin importar la forma de la FDP.
2
1 1 1,X N 2
2 2 2,X N
1 2Y aX bX
2 2 2 2
1 2 1 2,Y N a b a b
1,..., nX X
iX X n2 y
2
,nX N
n
5. La distribución normal
La distribución de probabilidades de la variable Z, , que no depende de
los parámetros :
Define la “forma estandarizada” de la distribución Normal. De esta manera podemos
trabajar con las tablas de probabilidades, dado que la media de la nueva variable
aleatoria estandarizada es cero, mientras que la varianza es la unidad.
y m
X mZ
2 21
2
Z
Zf z e Z
0,1Z N
5. La distribución normal
Por último, dado los momentos absolutos y centrados, definimos nuevamente la
esperanza matemática, la varianza, el coeficiente de asimetría y la kurtosis:
2
2
3
3
44
242
0
33 3 0
m X E X
X
XAs X
X
XK X
X
5. La distribución normal
La probabilidad de que una variable aleatoria normalmente distribuida X sea menor o
igual a un valor específico, x está dada por la función de distribución acumulativa
Pero la integral anterior no puede evaluarse en forma cerrada. Por lo tanto se puede
tabular la función de distribución acumulativa como una función de , lo que
requeriría una tabla para cada par de valores. Como existe un número infinito de
valor de , se utiliza la ya mencionada “forma estandarizada” de la
distribución normal:
Así, para y
y
y
21
21; ,
2
tx
P X x F x e dt
21
21
2
zz
P X x P Z x e dz
,z x P X x P Z z
; , ;0,1X ZF x F z
5. La distribución normal
Sean variables aleatorias estandarizadas independientes, se dice que la
cantidad
Sigue la distribución con v grados de libertad.
Sus propiedades son:
1. Es una distribución asimétrica, donde el grado de asimetría esta dado por los
grados de libertad. Cuando los g. de l. son pocos la distribución está altamente
sesgada hacia la izquierda, y a medida que aumentan la distribución se hace cada
vez más simétrica. De hecho, disponiendo de más de 100 variables aleatorias
independientes, la variable puede ser tratada como una variable
normal estandarizada.
2. La media de la distribución chi-cuadrado es v y la varianza es 2v.
3. Si son dos variables chi-cuadrado independientes con grados de
libertad, entonces la suma de ambas es también una variable aleatoria chi-
cuadrado con grados de libertad.
1,..., kZ Z
2
1
k
i
i
Z Z
2
22 2 1k
1 2 y Z Z 1 2 y v v
1 2v v
6. La distribución chi-cuadrado
Sean es una variable normal estandarizada, y otra variable sigue la
distribución chi-cuadrado y están distribuidas de manera independiente, entonces
la variable definida como
Sigue la distribución t de Student con v grados de libertad.
Sus propiedades son:
1. Al igual que la distribución normal, es simétrica, pero más plana (platocúrtica). Sin
embargo, a medida que aumentan los grados de libertad, la distribución t se
aproxima a la normal.
2. La media de la distribución t es cero, mientras que la varianza es .
1Z
1
2
1
2
v
Zt
Z v
Z vt
Z
2v v
2Z
7. La distribución t de Student
Si son variables chi-cuadrado distribuidas en forma independiente con
grados de libertad, respectivamente
Sigue la distribución F (de Fisher) con grados de libertad.
Se tienen las siguientes propiedades:
1. Esta distribución está sesgada a la derecha, pero a medida que aumentan ,
la distribución F se acerca a la distribución normal.
2. El valor de la media de esta distribución es , el cual está definido para
y su varianza es
definida para .
3. El cuadrado de una variable aleatoria con distribución sigue una distribución
1 2 y Z Z
1 2
1 1,
2 2
k k
Z kF F
Z k
2
2 1 2
2
1 2 2
2 2
2 4
k k k
k k k
2 4k
2 2k 2 2 2k k
1 2 y k k
1 2 y k k
1 2 y k k
8. La distribución F
Me pueden escribir a:
Las presentaciones estarán colgadas en:
www.cema.edu.ar/u/jrs06
FIN