estadisticos
TRANSCRIPT
MEDIDAS DE POSICION
CUANTILES O SEPARATRICES ( Q , D, P )
DE TENDENCIA CENTRAL : MODA, MEDIANA , MEDIA
MEDIDAS DE DISPERSION: AMPLITUD TOTAL, VARIANZA y DESVIACION TIPICA SEMIRRECORRIDO INTERCUARTILICO COEFICIENTE DE VARIACION
MEDIDAS DE FORMA : COEFICIENTE DE ASIMETRIA
MEDIDAS DE APUNTAMIENTO : COEFICIENTE DE CURTOSIS
• Conocer y calcular las diferentes medidas de localización (tendencia central y posición)
• Conocer y calcular las diferentes medidas de dispersión
• Identificar y comparar métodos numéricos para resumir datos
• Saber seleccionar las medidas de resumen más adecuadas a diferentes tipos de datos
OBJETIVOS DE LA CLASE
ESTADÍSTICOS Características medibles de una MUESTRA,
usadas para estimar parámetros poblacionales. Representadas por letras latinas. VARIABLE para la población, fija para la muestra
dada.
MEDIDAS DE RESUMEN DE DATOS NUMERICOS PARÁMETROS
Características medibles de una POBLACIÓN. Representadas por letras griegas. VALOR FIJO para una población dada.
P
m1 ,
21
1
s
xp1 ,
m2 , p2 ,
22
2
s
x
MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMÉTICAMEDIA ARITMÉTICA
MEDIANAMEDIANA
MODAMODA
CUANTILES o SEPARATRICESCUANTILES o SEPARATRICES
Medidas de Localización
centro
ó
Es el cociente entre la suma de los valores de la variable, y el tamaño de la población o de la muestra (número de observaciones)
Media Aritmética o Esperanza de x
1
N
ii
x
N
n
ii
xx
n
1
k
i ii
x f
N
1 1
1
k k
i ii ii i
k
ii
x f x fx
n f
POBLACIÓN MUESTRA
AGRUPARDATOS SIN
DATOSAGRUPADOS
CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA
• Calculada para datos en escala de Intervalo y Razón
• Única para un conjunto dado de datos
• Centro de gravedad de los datos
• Sensible a todos los valores del conjunto de datos, sobre todo a los valores extremos
• La suma de desvíos de los datos con respecto a la media es 0
• Útil para comparar poblaciones
• No se puede calcular con clases abiertas
Es el valor de la variable que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales
MEDIANA ( P50, Q2)
Mn es 5Si el número de observaciones es IMPAR 1, 2, 4, 5, 6, 6, 8
Si el número de observaciones es PAR 1, 2, 4, 4, 5, 6, 6, 8 Mn es (4+5)/2 = 4,5
Se puede calcular con clases con extremos abiertos
Características
Calculada para datos en escala Ordinal, Intervalo y Proporción (razón)
Única para un conjunto dado de datos
Fácil de determinar en datos no agrupados
No es influenciada por valores extremos
1, 2, 4, 5, 6, 6, 800. La media es 117,7
La mediana es 5
CALCULO de la MEDIANA
iMn x
i2 a
nFMn L h
f
1) Ordenar los valores de menor a mayor
2) Determinar la posición i
3) Hallar el valor de x en la posición i
DATOSSIN AGRUPAR: 5.0)1( ni
DATOSAGRUPADOS:
1) Determinar la posición (igual que para datos sin agrupar)
3) Realizar la interpolación para hallar el valor de la Mn
2) Determinar la clase que contiene la Mediana
Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00
Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00
CALCULO de la MEDIANA para datos agrupados
1) Determinar la posición 185.0)135(
2) clase que contiene la Mediana 375Li
3) Realizar la interpolación para hallar el valor de la Mn
i2 a
nFMn L h
f
5.3825.73751512
10235
375
MnExtensión del intervalo h = 390-375
0,00,10,20,30,40,50,60,70,80,91,0
330 345 360 375 390 405 420 435
FrEJEMPLO - Método grafico para hallar la Mediana
Distribución de frecuencias relativas acumuladas de los pesos de novillos. FV. 2002
0,00,10,20,30,40,50,60,70,80,91,0
330 345 360 375 390 405 420 435
Mn (P50)
Características• Útil para medidas nominales y ordinales• No se afecta por valores extremos• Se puede utilizar con clases abiertas• Puede no existir o no ser única
MODA
Definición : Valor de la variable con mayor frecuencia
datos sin agrupar
297 314 333 350 388 412 421 455 455 455466 466 502 502 542 587 601 621 629
Mo = 455
Extensión del intervalo h = 390-375
23.38423.93751558
8375
Mo
Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00
Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00
CALCULO de la MODA para datos agrupados
1) Determinar la clase que contiene la Moda
2) Realizar la interpolación para hallar el valor de la Mo
375Li
hLiMo21
1
= 12 – 4 = 8 = 12 – 7 = 5
12
x
h
LiLimite inferior de la clase modal
Diferencia entre la frecuencia de la clase modal y la clase anterior
Diferencia entre la frecuencia de la clase modal y la clase siguiente
Extensión del intervalo
Mo
forma grafica de determinar la moda
Medidas de DispersiónMedida de información respecto a la cantidad de Medida de información respecto a la cantidad de VARIABILIDADVARIABILIDAD presente en un conjunto de datos.presente en un conjunto de datos.
dispersión
AMPLITUD TOTAL
VARIANZA y DESVIACIÓN TÍPICA
SEMIRECORRIDO INTERCUARTÍLICO
COEFICIENTE DE VARIACIÓN
A
2 2
Q
CV
Varianza
población muestra
AGRUPARDATOS SIN
DATOSAGRUPADOS
1
22
n
xxfs
1
22
n
xxs n
x
22
nxf
2
2
1-nxx 2
2s
la varianza es una media de cuadrados de los desvios (MC)
suma de cuadrados de los desvios (SC)
grados de libertad (GL)
La división por n-1 asegura que la varianza muestral sea una estimación centrada de la varianza poblacional
Es sensible a valores extremos (alejados de la media).
Sus unidades son el cuadrado de las de la variable
DESVIACIÓN TÍPICA Es la raíz cuadrada de la varianza 2ˆˆ SS Tiene las misma dimensionalidad (unidades) que la variable.
Es el cociente entre la desviación típica y la media.– Mide la desviación típica en forma de
“qué tamaño tiene con respecto a la media”
Es frecuente indicarla en porcentajes• Si la media es 80 y la desviación típica 20 entonces
CV =20/80 = 0,25 = 25% (variabilidad relativa)
Es adimensional. Interesante para comparar la variabilidad de diferentes variables.– Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan
más dispersión en peso que en altura.
No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente– Por ejemplo 0ºC ≠ 0ºF
xsCVˆ
Coeficiente de variación
Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00
Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00
SEMIRRECORRIDO INTERCUARTILICO
22257513 PPQQ
Q
1) Determinar la posición para cada Percentil
2) La clase que contiene P25 360Li
3) Realizar la interpolación
925.0)135( Para el P25
Para el P752775.0)135(
2) La clase que contiene P75 390Li
hf
FarnLirP
.
11.399157
2275.0353903
Q
31.370154
625.0353602
Q
4,142
31.37011.399
Q
Qué medidas de tendencia central y dispersión utilizar
forman DUOSMedia - Varianza ydesviación típica
Mediana - Semirrecorrido intercuartílico
Moda -Amplitud total
Datos numéricos – distribuciones simétricas o asimétricas con muchas observaciones
Datos ordinales o numéricos distribución asimétrica y con pocas observaciones-
Datos nominales Distribuciones bimodales
Según teoría de momentos
Según el método de las separatrices
Según el método de los extremos
MEDIDAS DE RESUMEN medidas de tendencia central medidas de posición medidas de dispersión
medidas de asimetría (sesgo)
asimetría positiva asimetría negativa
distribución simétrica
FORMA DE LADISTRIBUCION
•Es nulo cuando la distribución es simétrica
Coeficiente de asimetría
sMnxasˆ
3
as = + as = -
TIPOS DE CURVAS
• SIMÉTRICA– las observaciones equidistan del máximo central con la misma
frecuencia. Coinciden Media, Moda y Mediana
• ASIMÉTRICA– la cola más larga determina la dirección del sesgo.
Se separan la Media, Mediana y Moda
• BIMODAL MULTIMODAL
medidas de asimetría medidas de apuntamieno o curtosis
Distrib. leptocurtica Distrib. platicurtica
en azul la distribución normal (de referencia) distribución mesocurtica
FORMA DE LADISTRIBUCION
Exceso de frecuencias Exceso de
frecuencias