estadisticos

23
MEDIDAS DE POSICION CUANTILES O SEPARATRICES ( Q , D, P ) DE TENDENCIA CENTRAL : MODA, MEDIANA , MEDIA MEDIDAS DE DISPERSION: AMPLITUD TOTAL, VARIANZA y DESVIACION TIPICA SEMIRRECORRIDO INTERCUARTILICO COEFICIENTE DE VARIACION

Upload: psicologia-y-educacion-integral-ac

Post on 13-Apr-2017

1.212 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Estadisticos

MEDIDAS DE POSICION

CUANTILES O SEPARATRICES ( Q , D, P )

DE TENDENCIA CENTRAL : MODA, MEDIANA , MEDIA

MEDIDAS DE DISPERSION: AMPLITUD TOTAL, VARIANZA y DESVIACION TIPICA SEMIRRECORRIDO INTERCUARTILICO COEFICIENTE DE VARIACION

MEDIDAS DE FORMA : COEFICIENTE DE ASIMETRIA

MEDIDAS DE APUNTAMIENTO : COEFICIENTE DE CURTOSIS

Page 2: Estadisticos

• Conocer y calcular las diferentes medidas de localización (tendencia central y posición)

• Conocer y calcular las diferentes medidas de dispersión

• Identificar y comparar métodos numéricos para resumir datos

• Saber seleccionar las medidas de resumen más adecuadas a diferentes tipos de datos

OBJETIVOS DE LA CLASE

Page 3: Estadisticos

ESTADÍSTICOS Características medibles de una MUESTRA,

usadas para estimar parámetros poblacionales. Representadas por letras latinas. VARIABLE para la población, fija para la muestra

dada.

MEDIDAS DE RESUMEN DE DATOS NUMERICOS PARÁMETROS

Características medibles de una POBLACIÓN. Representadas por letras griegas. VALOR FIJO para una población dada.

P

m1 ,

21

1

s

xp1 ,

m2 , p2 ,

22

2

s

x

Page 4: Estadisticos

MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRAL

MEDIA ARITMÉTICAMEDIA ARITMÉTICA

MEDIANAMEDIANA

MODAMODA

CUANTILES o SEPARATRICESCUANTILES o SEPARATRICES

Medidas de Localización

centro

ó

Page 5: Estadisticos

Es el cociente entre la suma de los valores de la variable, y el tamaño de la población o de la muestra (número de observaciones)

Media Aritmética o Esperanza de x

1

N

ii

x

N

n

ii

xx

n

1

k

i ii

x f

N

1 1

1

k k

i ii ii i

k

ii

x f x fx

n f

POBLACIÓN MUESTRA

AGRUPARDATOS SIN

DATOSAGRUPADOS

Page 6: Estadisticos

CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA

• Calculada para datos en escala de Intervalo y Razón

• Única para un conjunto dado de datos

• Centro de gravedad de los datos

• Sensible a todos los valores del conjunto de datos, sobre todo a los valores extremos

• La suma de desvíos de los datos con respecto a la media es 0

• Útil para comparar poblaciones

• No se puede calcular con clases abiertas

Page 7: Estadisticos

Es el valor de la variable que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales

MEDIANA ( P50, Q2)

Mn es 5Si el número de observaciones es IMPAR 1, 2, 4, 5, 6, 6, 8

Si el número de observaciones es PAR 1, 2, 4, 4, 5, 6, 6, 8 Mn es (4+5)/2 = 4,5

Page 8: Estadisticos

Se puede calcular con clases con extremos abiertos

Características

Calculada para datos en escala Ordinal, Intervalo y Proporción (razón)

Única para un conjunto dado de datos

Fácil de determinar en datos no agrupados

No es influenciada por valores extremos

1, 2, 4, 5, 6, 6, 800. La media es 117,7

La mediana es 5

Page 9: Estadisticos

CALCULO de la MEDIANA

iMn x

i2 a

nFMn L h

f

1) Ordenar los valores de menor a mayor

2) Determinar la posición i

3) Hallar el valor de x en la posición i

DATOSSIN AGRUPAR: 5.0)1( ni

DATOSAGRUPADOS:

1) Determinar la posición (igual que para datos sin agrupar)

3) Realizar la interpolación para hallar el valor de la Mn

2) Determinar la clase que contiene la Mediana

Page 10: Estadisticos

Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00

Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00

CALCULO de la MEDIANA para datos agrupados

1) Determinar la posición 185.0)135(

2) clase que contiene la Mediana 375Li

3) Realizar la interpolación para hallar el valor de la Mn

i2 a

nFMn L h

f

5.3825.73751512

10235

375

MnExtensión del intervalo h = 390-375

Page 11: Estadisticos

0,00,10,20,30,40,50,60,70,80,91,0

330 345 360 375 390 405 420 435

FrEJEMPLO - Método grafico para hallar la Mediana

Distribución de frecuencias relativas acumuladas de los pesos de novillos. FV. 2002

0,00,10,20,30,40,50,60,70,80,91,0

330 345 360 375 390 405 420 435

Mn (P50)

Page 12: Estadisticos

Características• Útil para medidas nominales y ordinales• No se afecta por valores extremos• Se puede utilizar con clases abiertas• Puede no existir o no ser única

MODA

Definición : Valor de la variable con mayor frecuencia

datos sin agrupar

297 314 333 350 388 412 421 455 455 455466 466 502 502 542 587 601 621 629

Mo = 455

Page 13: Estadisticos

Extensión del intervalo h = 390-375

23.38423.93751558

8375

Mo

Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00

Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00

CALCULO de la MODA para datos agrupados

1) Determinar la clase que contiene la Moda

2) Realizar la interpolación para hallar el valor de la Mo

375Li

hLiMo21

1

= 12 – 4 = 8 = 12 – 7 = 5

Page 14: Estadisticos

12

x

h

LiLimite inferior de la clase modal

Diferencia entre la frecuencia de la clase modal y la clase anterior

Diferencia entre la frecuencia de la clase modal y la clase siguiente

Extensión del intervalo

Mo

forma grafica de determinar la moda

Page 15: Estadisticos

Medidas de DispersiónMedida de información respecto a la cantidad de Medida de información respecto a la cantidad de VARIABILIDADVARIABILIDAD presente en un conjunto de datos.presente en un conjunto de datos.

dispersión

AMPLITUD TOTAL

VARIANZA y DESVIACIÓN TÍPICA

SEMIRECORRIDO INTERCUARTÍLICO

COEFICIENTE DE VARIACIÓN

A

2 2

Q

CV

Page 16: Estadisticos

Varianza

población muestra

AGRUPARDATOS SIN

DATOSAGRUPADOS

1

22

n

xxfs

1

22

n

xxs n

x

22

nxf

2

2

Page 17: Estadisticos

1-nxx 2

2s

la varianza es una media de cuadrados de los desvios (MC)

suma de cuadrados de los desvios (SC)

grados de libertad (GL)

La división por n-1 asegura que la varianza muestral sea una estimación centrada de la varianza poblacional

Es sensible a valores extremos (alejados de la media).

Sus unidades son el cuadrado de las de la variable

DESVIACIÓN TÍPICA Es la raíz cuadrada de la varianza 2ˆˆ SS Tiene las misma dimensionalidad (unidades) que la variable.

Page 18: Estadisticos

Es el cociente entre la desviación típica y la media.– Mide la desviación típica en forma de

“qué tamaño tiene con respecto a la media”

Es frecuente indicarla en porcentajes• Si la media es 80 y la desviación típica 20 entonces

CV =20/80 = 0,25 = 25% (variabilidad relativa)

Es adimensional. Interesante para comparar la variabilidad de diferentes variables.– Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan

más dispersión en peso que en altura.

No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente– Por ejemplo 0ºC ≠ 0ºF

xsCVˆ

Coeficiente de variación

Page 19: Estadisticos

Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00

Clases Xi f F fr Fr330-345 337 3 3 0,09 0,09345-360 352 3 6 0,09 0,18360-375 367 4 10 0,11 0,29375-390 382 12 22 0,34 0,63390-405 397 7 29 0,20 0,83405-420 412 4 33 0,11 0,94420-435 427 2 35 0,06 1,00TOTAL 35 1,00

SEMIRRECORRIDO INTERCUARTILICO

22257513 PPQQ

Q

1) Determinar la posición para cada Percentil

2) La clase que contiene P25 360Li

3) Realizar la interpolación

925.0)135( Para el P25

Para el P752775.0)135(

2) La clase que contiene P75 390Li

hf

FarnLirP

.

11.399157

2275.0353903

Q

31.370154

625.0353602

Q

4,142

31.37011.399

Q

Page 20: Estadisticos

Qué medidas de tendencia central y dispersión utilizar

forman DUOSMedia - Varianza ydesviación típica

Mediana - Semirrecorrido intercuartílico

Moda -Amplitud total

Datos numéricos – distribuciones simétricas o asimétricas con muchas observaciones

Datos ordinales o numéricos distribución asimétrica y con pocas observaciones-

Datos nominales  Distribuciones bimodales

Según teoría de momentos

Según el método de las separatrices

Según el método de los extremos

Page 21: Estadisticos

MEDIDAS DE RESUMEN medidas de tendencia central medidas de posición medidas de dispersión

medidas de asimetría (sesgo)

asimetría positiva asimetría negativa

distribución simétrica

FORMA DE LADISTRIBUCION

•Es nulo cuando la distribución es simétrica

Coeficiente de asimetría

sMnxasˆ

3

as = + as = -

Page 22: Estadisticos

TIPOS DE CURVAS

• SIMÉTRICA– las observaciones equidistan del máximo central con la misma

frecuencia. Coinciden Media, Moda y Mediana

• ASIMÉTRICA– la cola más larga determina la dirección del sesgo.

Se separan la Media, Mediana y Moda

• BIMODAL MULTIMODAL

Page 23: Estadisticos

medidas de asimetría medidas de apuntamieno o curtosis

Distrib. leptocurtica Distrib. platicurtica

en azul la distribución normal (de referencia) distribución mesocurtica

FORMA DE LADISTRIBUCION

Exceso de frecuencias Exceso de

frecuencias