estadistica tema 3.ppt [modo de compatibilidad]personales.unican.es/rasillad/tema 3.3 estadisticos...

78
Estadísticos Estadísticos TEMA 3.3

Upload: nguyennguyet

Post on 11-Oct-2018

225 views

Category:

Documents


0 download

TRANSCRIPT

EstadísticosEstadísticos

TEMA 3.3

EstadísticosEstadísticos� Definición

◦ Número obtenido a partir del análisis de una variable estadística.

◦ Procedimiento de cálculo bien definido: aplicación de fórmula aritméticaaplicación de fórmula aritmética

◦ Cuantifica uno o varios aspectos de la información (confirmación de tabla o gráfico)

◦ Si calculados a partir de muestras se denominan estadísticos.

◦ Si calculados a partir de una población,reciben el nombre de parámetros.

EstadísticosEstadísticos� Tipos

◦ De tendencia central o centralidad◦ De dispersión◦ De forma

EstadísticosEstadísticos� De tendencia central

◦ Indican en torno a qué valor (centro) se distribuyen los datos.� Media

� Aritmética (ponderada)� Aritmética (ponderada)� Geométrica� Armónica

� Moda � Mediana

EstadísticosEstadísticos� De tendencia central

◦ Media aritmética� El parámetro media se re presenta por µ. � El estadístico media se denota como

� Valor obtenido al sumar todos los datos y

X

� Valor obtenido al sumar todos los datos y dividir el resultado entre el número total de elementos.

N

x

X

n

i

i∑== 1

N

xxxxX n++++

=...321

EstadísticosEstadísticos� De tendencia central

◦ Media aritmética

� Ejemplo: peso (kg) � 84, 91, 72, 68, 87 y 78 kg. El peso medio es

EstadísticosEstadísticos� De tendencia central

◦ Media aritmética� Para variables discretas agrupadas

nxnxnxnxX nn++++

=...332211

N

nx

X

i

n

i

i∑== 1

NX nn= 332211

xi ni xi · ni

27 1 27

28 2 56

29 6 174

30 7 210

31 8 248

32 3 96

33 3 99

34 1 34

31 944

45,3031

944==X

EstadísticosEstadísticos� De tendencia central

◦ Media aritmética� Variables continuas agrupadas

nx i

n

i∑nxnxnxnx ++++ ...

Li-1, Li xi ni xi · ni

[10, 20) 15 1 15

[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

[60,70) 65 4 260

[70, 80) 75 2 150

42 1820

N

nx

X

i

i

i∑== 1

N

nxnxnxnxX nn++++

=...332211

33,4342

1820==X

EstadísticosEstadísticos� De tendencia central

◦ Media aritmética� Observaciones

� Sólo para variables cuantitativas.� Independiente de la amplitud de los intervalos� Sensible a valores extremos � La suma de las desviaciones de todas las puntuaciones

respecto a la media es igual a cero.� Influencia de un cambio de origen: si a todos los valores

de una muestra se le suma/resta una constante c, la media de la nueva muestra es igual a la media de la muestra inicial más /menos) la constante.

� Influencia de un cambio de escala: si todos los valores de una muestra son multiplicados/divididos) por una constante c, la media de la nueva muestra es igual a la media de la muestra inicial multiplicada/dividida por c.

EstadísticosEstadísticos� De tendencia central

◦ Media aritmética ponderada� Cuando no todos los elementos tienen la misma importancia

o presentan variaciones acumulativas

� Para promediar porcentajes, tasas, números índices etc.� Para promediar porcentajes, tasas, números índices etc.

� CÁLCULO � multiplicar cada uno de los números por un valor específico (“peso” o ponderación � representan el número de veces que el valor de la variable es más importante que el de otra).

∑=

=

=

k

i

i

k

i

ii

w

xww

x

1

1

EstadísticosEstadísticos� De tendencia central

◦ Media aritmética ponderada� Ventajas:

� Intervienen todos los valores de la distribución.� Los valores extremos tienen menor influencia que en la � Los valores extremos tienen menor influencia que en la

media aritmética.

◦ Inconvenientes� Cálculo complicado.

EstadísticosEstadísticos� De tendencia central

◦ Media geométrica� Raíz N-ésima del producto de los valores

nnxxxG ×××= ...21

� Usada cuando los datos no varían linealmente � su valor depende de varios factores a la vez.

� CÁLCULO: temperaturas de un proceso químico

n21

44 796827758613911812413 ..x.x.x. =

EstadísticosEstadísticos� De tendencia central

◦ Media armónica� Datos: 3.1, 2.8, 2.84, 3.05, 3.09,

==n

H1

∑∑==

==n

i

n

i

xi/

n

xi/n/

H

11

111

1

=++++

=093105318421821131

5

./././././H

9703268331

5

3236032790352103571032260

5.

......==

++++=

EstadísticosEstadísticos� De tendencia central

◦ Moda� Valor más frecuente

� El que más se repite� En el caso de variables continuas � clase modal� En el caso de variables continuas � clase modal

� Se representa por Mo� Ej: distribución 2, 3, 3, 4, 4, 4, 5, 5 � Mo = 4

EstadísticosEstadísticos� De tendencia central

◦ Moda� Casos particulares

� Si todas las puntuaciones tienen la misma frecuencia � no hay moda.� Ej: 2, 2, 3, 3, 6, 6, 9, 9

� Si dos puntuaciones adyacentes comparten la misma frecuencia máxima � promedio de las dos puntuaciones adyacentes.� Ej: 0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

EstadísticosEstadísticos� De tendencia central

◦ Moda� Si dos o más puntuaciones no adyacentes tienen la

misma frecuencia (máxima) � distribución bimodal o multimodalmultimodal� Ej: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9� Ojo, puede ser resultado de mezcla de

poblaciones/muestras

� Inconvenientes� Parámetro poco representativo, salvo cuando es clara, por

que no intervienen todos los valores de la distribución� Única medida de posición central que puede obtenerse en

las variables de tipo cualitativo

EstadísticosEstadísticos� De tendencia central

◦ Moda� Variables cualitativas (nominales y ordinales)

y cuantitativas discretas� Valor o valores con la máxima frecuencia� Valor o valores con la máxima frecuencia

xi ni

27 1

28 2

29 6

30 7

31 8

32 3

33 3

34 1

31

EstadísticosEstadísticos� De tendencia central

◦ Moda� Variables continuas (datos agrupados)

Caso A� intervalos con la misma amplitud

ii ann

LMo •−

+= −1

� Li-1 � límite inferior de la clase modal.� ni � número de casos de la clase modal.� ni-1 � número de casos de la clase inmediatamente inferior a la

modal� ni-+1 � número de casos de la inmediatamente posterior a la modal� ai � amplitud de cada clase

� Alternativa:

i

iiii

ii

i annnn

nnLMo •

−+−

−+=

+−

−)()( 11

1

1

i

ii

i

i ann

nLMo •

++=

+−

+

−)( 11

1

1

EstadísticosEstadísticos� De tendencia central

◦ Moda� Variables continuas (datos agrupados)

Caso A� intervalos con la misma amplitud.

Primer paso � ¿clase modal? � [66,69)

Li-1, Li ni

[60, 63) 5

[63, 66) 18

[66, 69) 42

[69, 72) 27

[72, 75) 8

100

EstadísticosEstadísticos� De tendencia central

◦ Moda� Caso B ���� intervalos tienen amplitudes distintas.

� 1º paso � buscar clase modal� 2º paso � cálculo altura� 2º paso � cálculo altura

� 3º paso � aplicar fórmula

� Alternativa:

i

iiii

ii

i ahhhh

hhLMo •

−+−

−+=

+−

−)()( 11

1

1

i

ii

i

i ahh

hLMo •

++=

+−

+

−)( 11

1

1

i

i

ia

nh =

EstadísticosEstadísticos� De tendencia central

◦ Moda� Los intervalos tienen amplitudes distintas.

� Calificaciones (suspenso, aprobado, notable y sobresaliente) de un grupo de 50 alumnos.

Li-1, Li ni hi

[0, 5) 15 15/5=3

[5, 7) 20 20/2=10

[7, 9) 12 12/2=6

[9, 10) 3 3/1=3

50

EstadísticosEstadísticos� De tendencia central

◦ Mediana� No ligada al valor numérico de las observaciones

sino a su posición relativa dentro de los datos �posición central cuando están ordenados de posición central cuando están ordenados de menor a mayor

� Separa una distribución en dos partes iguales �valor que deja un 50 % de los datos a su izquierda y el otro 50 % a su derecha.

� Estadístico Me� Sólo variables cuantitativas

EstadísticosEstadísticos� De tendencia central

◦ La mediana� Cálculo

� A partir de los datos ordenados de menor a mayor.� El procedimiento depende del formato de los datos� El procedimiento depende del formato de los datos

(variables discretas o continuas)

EstadísticosEstadísticos� De tendencia central

◦ La mediana� Cálculo (datos originales)

� Número impar de individuos: puntuación central de la misma

N� � 2, 3, 4, 4, 5, 5, 5, 6, 6

� Siendo N = número de individuos de la serie

� Número par de individuos: promedio de las dos puntuaciones centrales� Me = promedio de N/2 y N/2+1 � 7, 8, 9, 10, 11, 12

Me= 9,5

5,02

+=N

Me

EstadísticosEstadísticos� De tendencia central

◦ La mediana� Cálculo para distribuciones discretas

� Buscar primer valor de Ni (frecuencia absoluta acumulada) que iguale o supere a

� CASO 1: coincide con un valor de las frecuencias acumuladas � media entre la observación que presenta dicha frecuencia absoluta acumulada y la siguiente.

� CASO 2: no coinciden con ningún valor de la columna de las frecuencias acumuladas � primera observación cuya frecuencia acumulada supera N/2

xi ni Ni

27 1 1

EstadísticosEstadísticos� De tendencia central

◦ La mediana� Cálculo para distribuciones discretas

31N27 1 1

28 2 3

29 6 9

30 7 16

31 8 24

32 3 27

33 3 30

34 1 31

31

El primer valor de Ni que supera 16.5 es 24

Me = 31

5,162

31

2==

N

EstadísticosEstadísticos� De tendencia central

◦ La mediana� Cálculo para datos agrupados (continuas)

� Buscar el intervalo mediano� Primer valor de Ni que iguale o supere a i

� Aplicar la fórmula

� Li-1 límite inferior del intervalo mediano� Ni-1 frecuencia acumulada anterior al intervalo mediano� ai amplitud de la clase.

� La mediana es independiente de las amplitudes de los intervalos

i

i

i

i an

NN

LMe •

+=−

1

12

EstadísticosEstadísticos� De tendencia central

◦ La mediana� Cálculo para datos agrupados

(continuas)Li-1, Li ni Ni 100Li-1, Li ni Ni

[60, 63) 5 5

[63, 66) 18 23

[66, 69) 42 65

[69, 72) 27 92

[72, 75) 8 100

100

Primer valor de Ni que iguale o supere 50 = 65

Intervalo mediano: [66, 69)

502

100==Intervalo mediano

93.673*42

2350662

1

1 =−

+=•

+=−

− i

i

i

i an

NN

LMe

EstadísticosEstadísticos� De dispersión

◦ Informan sobre cuánto se alejan del centro todos los valores de la distribución.� Rango o recorrido� Rango o recorrido� Desviación respecto a la media� Desviación media� Varianza� Desviación típica

EstadísticosEstadísticos� De dispersión

◦ Rango o recorrido: � Diferencia entre el mayor y el menor de los

datos� Cálculo sencillo� Cálculo sencillo� Sólo tiene en cuenta los valores extremos (cuanto

mayor sea la diferencia mayor el rango) pero no necesariamente supone incremento de la dispersión

EstadísticosEstadísticos� De dispersión

◦ La desviación respecto a la media� Diferencia entre cada individuo de la variable

estadística y la media aritmética de toda la distribución.

xxD −=distribución.�

◦ La desviación media (absoluta)� Media aritmética de los valores absolutos de

las desviaciones respecto a la media.

xxD ii −=

N

xx

D

n

i

i

x

∑=

= 1

N

xxxxxxxxD

n

x

−++−+−+−=

...321

EstadísticosEstadísticos� De dispersión

◦ La desviación media� Cálculo de la desviación media de la

distribución 9, 3, 8, 8, 9, 8, 9, 18

EstadísticosEstadísticos� De dispersión

◦ La desviación media� Distribución discreta

xi ni xi · ni |xi-X| |xi-X|* ni

27 1 27 3,55 3,55

28 2 56 2,55 4,9

29 6 174 1,55 8,7

30 7 210 0,55 3,2

31 8 248 0,55 4,4

32 3 96 1,55 4,6

33 3 99 2,55 7,6

34 1 34 3,55 3,55

31 ∑ 944 ∑ 40,5

30,131

5,40==xD

45,3031

944==X

EstadísticosEstadísticos� De dispersión

◦ La desviación media� Distribución continua con datos agrupados

nxxnxxnxxnxxD

nn

x

−++−+−+−=

...332211

Li-1, Li xi ni xi · ni |xi - X| |xi - X| . ni

[10, 15) 12,5 3 37,5 9,286 27,858

[15, 20) 17,5 5 87,5 4,286 21,43

[20, 25) 22,5 7 157,5 0,714 4,998

[25, 30) 27,5 4 110 5,714 22,856

[30, 35) 32,5 2 65 10,174 21,428

21 457,5 98,57

N

nxx

D

i

n

i

i

x

∑=

= 1

NDx =

EstadísticosEstadísticos� De dispersión

◦ La varianza� Media aritmética del cuadrado de las

desviaciones respecto a la media� s2 (muestra); σ2 (población)� s2 (muestra); σ2 (población)

� En forma resumida

∑=

−=n

i

i xN

xS

1

22

2222

2

2

12 ...x

N

xxxS n −

+++=

N

xx

S

n

i

i∑=

= 1

2

2

)(

N

xxxxxxS b

22

2

2

12 )(...)()( −++−+−=

EstadísticosEstadísticos� De dispersión

◦ La varianza� Cálculo:

� Datos = 9, 3, 8, 8, 9, 8, 9, 18

=2

S

EstadísticosEstadísticos� De dispersión

◦ La varianza� Datos agrupados

nxx i

n

i∑ −2)(

nxxnxxnxx222 )(...)()( −++−+−

∑=

−=n

i

ii xN

nxS

1

22

222

2

2

21

2

12 ...x

N

nxnxnxS nn −

+++=

N

nxx

Si

i

i∑=

= 12

)(

N

nxxnxxnxxS nb

2

2

2

21

2

12 )(...)()( −++−+−=

En forma resumida

xi ni xi · ni xi2 · ni

27 1 27 729

EstadísticosEstadísticos� De dispersión

◦ La varianza� Variable discreta (fórmula sencilla)

∑ −=n

ii xnx

S2

2227 1 27 729

28 2 56 1568

29 6 174 5046

30 7 210 6300

31 8 248 7688

32 3 96 3072

33 3 99 3267

34 1 34 1156

31 944 28826

45,3031

944==X

67,2)45,30(31

28826 22=−=S

∑=

−=i

ii xN

nxS

1

22

EstadísticosEstadísticos� De dispersión

◦ La varianza� Variables continuas (fórmula sencilla)

Li-1, Li xi ni xi · ni xi2 · ni

∑ −=n

ii xnx

S2

22

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60) 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1820 88050218,94)33,43(42

88050 22=−=S

∑=

−=i

ii xN

nxS

1

2

EstadísticosEstadísticos� De dispersión

◦ La varianza� Datos agrupados (fórmula compleja)

Li-1, Li xi ni xi · ni xi – X (xi – X)2 (xi – X)2 * ni

[10, 20) 15 1 15 -28,33 802,8 802,78[10, 20) 15 1 15 -28,33 802,8 802,78

[20, 30) 25 8 200 -18,33 336,1 2688,89

[30,40) 35 10 350 -8,33 69,4 694,44

[40, 50) 45 9 405 1,67 2,8 25,0

[50, 60) 55 8 440 11,67 136,1 1088,89

[60,70) 65 4 260 21,67 469,4 1877,78

[70, 80) 75 2 150 31,67 1002,8 2005,56

42 1 820 9183,33

3,4342

1820==X 65,218

42

33,91832==S

N

nxx

Si

n

i

i∑=

= 1

2

2

)(

EstadísticosEstadísticos� De dispersión

◦ La varianza� Propiedades

� Siempre un valor positivo o cero (desviaciones elevadas al cuadrado). Si a todos los individuos de la variable � Si a todos los individuos de la variable � se les suma un número � la varianza no varía� se multiplican por un número � la varianza queda

multiplicada por el cuadrado de dicho número� Si tenemos varias distribuciones con la misma media y

conocemos sus respectivas varianzas se puede calcular la varianza total.� Si tienen el mismo tamaño:

� Si tienen distinto tamaño

EstadísticosEstadísticos� De dispersión

◦ La varianza� Observaciones

� Muy sensible a valores atípicos� No expresada en las mismas unidades que los � No expresada en las mismas unidades que los

datos originales (desviaciones elevadas al cuadrado).

EstadísticosEstadísticos� De dispersión

◦ La desviación típica (tipo o estándar)� Raíz cuadrada de la varianza� s (muestra); σ (población)

n

� Simplificando

� En muestras pequeñas N≤30 se suele sustituir el denominados por N-1

∑=

−=n

i

i xN

xS

1

22

222

2

2

1 ...x

N

xxxS n −

+++=

N

xx

S

n

i

i∑=

= 1

2)(

N

xxxxxxS b

22

2

2

1 )(...)()( −++−+−=

EstadísticosEstadísticos� De dispersión

◦ La desviación típica� Cálculo distribución:� 9, 3, 8, 8, 9, 8, 9, 18

=S

EstadísticosEstadísticos� De dispersión

◦ La desviación típica� Para distribuciones continuas

nxx i

n

i∑ −2)(

∑=

−=n

i

ii xN

nxS

1

22

22

2

2

21

2

1 ...x

N

nxnxnxS nn −

+++=

N

nxx

Si

i

i∑=

= 1

)(

N

nxxnxxnxxS nb

2

2

2

21

2

1 )(...)()( −++−+−=

EstadísticosEstadísticos� De dispersión

◦ La desviación típica� Cálculo para datos agrupados (fórmula sencilla)

L , L x n x · n x 2 · n∑ −=n

i xx

S2

2

Li-1, Li xi ni xi · ni xi2 · ni

[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60) 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050

( ) 14,79733,4342

88050 2=−=S

∑=

−=i

xN

S1

EstadísticosEstadísticos� De dispersión

◦ La desviación típica� Propiedades

� Siempre un valor positivo o cero� Si todos los valores de la variable

� se les suma un número la desviación típica no varía.

� se multiplican por un número la desviación típica queda multiplicada por dicho número.

� Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total.� Si tienen el mismo tamaño

� Si tienen distinto tamaño

EstadísticosEstadísticos� De dispersión

◦ La desviación típica� Observaciones

� Parámetro de dispersión absoluta: � Cuanto más altos los valores de partida, más � Cuanto más altos los valores de partida, más

alta la desviación típica� Cuanta más pequeña mayor será la

concentración de datos alrededor de la media.� Muy sensible a las puntuaciones extremas.

EstadísticosEstadísticos� De dispersión

◦ El coeficiente de variación� Relación entre la desviación típica y la media� Se expresa en porcentajes

S

� Permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas

� A mayor coeficiente de variación mayor dispersión

100•=x

SCV

EstadísticosEstadísticos� Puntuaciones

◦ Puntuaciones típicas� Resultado de dividir la desviación respecto a

la media entre la desviación típica (tipificación)(tipificación)

� Se utilizan para comparar las puntuaciones obtenidas en distintas distribuciones (parámetro de dispersión relativa

� Se representa por ZS

xxZ i −

=

EstadísticosEstadísticos� Puntuaciones

◦ Puntuaciones típicas� Observaciones

� La media aritmética de las puntuaciones típicas es 0

� La desviación típica de las puntuaciones típicas es 1

� Adimensionales � independientes de las unidades utilizadas

EstadísticosEstadísticos� Puntuaciones

◦ Puntuaciones típicas

Xi (xi – X¯) zi

3 1,65 -0,64

28,47

30==X

4 0,08 -0,24

5 0,51 0,14

1 10,79 -1,44

2 5,22 -1,04

6 2,93 0,54

9 22,22 1,74

30

64,051,2

28,43−=

−=

−=

S

xxZ i

51,27

23,44==S

Para xi = 3 (primer caso)

EstadísticosEstadísticos� De posición (estructura)

◦ Dividen un conjunto de datos en grupos con el mismo número de individuos

◦ Son:� Cuartiles: dividen la serie de datos en cuatro � Cuartiles: dividen la serie de datos en cuatro

partes iguales� Deciles: dividen la serie de datos en diez

partes iguales� Percentiles: dividen la serie de datos en cien

partes iguales

EstadísticosEstadísticos� De posición (estructura)

◦ Los cuartiles� Tres valores que dividen un conjunto de

datos ordenados en cuatro partes iguales.� 1C, 2C y 3C � valores correspondientes al 25%, � 1C, 2C y 3C � valores correspondientes al 25%,

al 50% y al 75% de los datos.� 2C = mediana.

EstadísticosEstadísticos� De posición (estructura)

◦ Obtención cuartiles� Ordenar los datos de menor a mayor � Buscar el lugar que ocupa cada cuartil

� Número impar de datos� 2, 5, 3, 6, 7, 4, 9

� Número par de datos� 2, 5, 3, 4, 6, 7, 1, 9

EstadísticosEstadísticos� De posición (estructura)

◦ Cálculo de cuartiles para datos agrupados

� Buscar la clase donde Ni =>

Nk •

� Li-1 límite inferior de la clase seleccionada� Ni-1 frecuencia acumulada anterior a la clase seleccionada� ni frecuencia absoluta de la clase seleccionada� ai amplitud de la clase

i

i

i

ik an

NNk

LC •

−•

+=−

1

14

EstadísticosEstadísticos� De posición (estructura)

◦ Cálculo de los cuartiles para datosagrupados� Ejemplo

i

a

NNk

LC •

−•

+=−1

4

� 1C

� 2C

� 3C

Li-1, Li ni Ni

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

i

i

ik an

LC •+=−1

4

EstadísticosEstadísticos� De posición (estructura)

◦ Deciles� Nueve valores que dividen la serie de datos

en diez partes iguales� Equivalen a los valores correspondientes al � Equivalen a los valores correspondientes al

10%, al 20%... al 90% de los datos.� D5 coincide con la mediana

i

i

i

ik an

NNk

LD •

−•

+=−

1

1

10

EstadísticosEstadísticos� De posición (estructura)

◦ Deciles

L , L n N

i

i

i

ik an

NNk

LD •

−•

+=−

1

1

10

Li-1, Li ni Ni

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

EstadísticosEstadísticos� De posición (estructura)

◦ Gráfico de caja y bigotes• Proporciona: idea intuitiva de la simetría de la distribución de los datosDetecta valores atípicos

• Necesitamos saber � valores mínimo y máximo, cuartiles 1C (25% de los datos), 2C o mediana (el 50% de los datos) y 3C (75% de los datos)

• Rango Inter Cuartílico (RIC): (3C-1C)

• Ls ���� Límites superior 3C+1.5*RIC

• Lm ���� Límite inferior 1C-1.5*RIC

• Atípicos: < 1C-3*RIC y > 3C+3*RIC

EstadísticosEstadísticos� De posición (estructura)

◦ Desviación cuartílica

L , L n NLi-1, Li ni Ni

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

25,112

25,6875,90

2

13=

−=

−=

CCDC

EstadísticosEstadísticos� De posición (estructura)

◦ Desviación percentílica

L , L n NLi-1, Li ni Ni

[50, 60) 8 8

[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58

[100, 110) 5 63

[110, 120) 2 65

65

37,162

12,58101

2

19

9010 =−

=−

=−

DDDP

EstadísticosEstadísticos� De forma

◦ Simetría de los datos respecto al valor central� Asimetría negativa: la cola de la distribución se

alarga para valores inferiores a la media.� Simétrica: mismo número de elementos a izquierda � Simétrica: mismo número de elementos a izquierda

y derecha de la media (coinciden la media, la mediana y la moda)� campana de Gauss (normal).

� Asimetría positiva: la cola de la distribución se alarga para valores superiores a la media.

EstadísticosEstadísticos�De forma

◦ Coeficientes de asimetría o de sesgo

◦ Coeficiente de asimetría de Pearson: mide la diferencia entre la media y la moda respecto a la dispersión del conjunto

� Para distribuciones unimodales y poco asimétricas. � Para distribuciones unimodales y poco asimétricas.

S

MoXAs

−=

S

MeXAs

)(3 −∗=

As = 0 As < 0 As > 0

MoX =X XMoMo

EstadísticosEstadísticos� De forma

◦ Coeficientes de asimetría o de sesgo � Coeficiente de asimetría de Fisher� Evalúa la proximidad de los datos a su media

x� cuanto mayor sea el numerador, mayor x� cuanto mayor sea el numerador, mayor asimetría

N

nXx

Sg

k

i

ii∑=

⋅= 1

3

31

)(1

EstadísticosEstadísticos� De forma

� Coeficientes de asimetría o de sesgo � Coeficiente de secgo cuartílico (Bowley-Yule)� Toma como referencia los cuartiles

( )

13

1223 )(

QQ

QQQQSC

−−−=

EstadísticosEstadísticos� De forma

◦ Coeficientes de asimetría o de sesgo ◦ Coeficiente de Bowley-Yule� Si <0 asimetría negativa: la distancia de la mediana al

primer cuartil es menor que al tercero.

� Si =0 distribución simétrica: el primer y tercer cuartil� Si =0 distribución simétrica: el primer y tercer cuartilestán a la misma distancia de la mediana.

� Si >0 asimetría positiva, ya que la distancia de la mediana al tercer cuartil es mayor que al primero.

EstadísticosEstadísticos� De forma

◦ Coeficiente de apuntamiento o curtosis� Mide cuán escarpada o achatada está una curva o

distribución.

� Indica la cantidad de datos cercanos a la media, de � Indica la cantidad de datos cercanos a la media, de manera que a mayor grado de curtosis, más escarpada (o apuntada) será la forma de la curva.

EstadísticosEstadísticos� De forma

� Coeficiente de apuntamiento o curtosis

N

nXx

Ap

k

i

ii∑=

⋅= 1

4

4

)(1

NSAp ⋅=

4

Mesocúrtica Ap=3 Leptocúrtica Ap > 3 Platicúrtica Ap < 3

EstadísticosEstadísticos� De forma

Li-1, Li xi ni xi · ni xi · X (xi · )2ni (xi · )3ni (xi · )4ni

[0, 10) 5 2 10 -27,25 1540,13 -42738,47 1185992,51

X X X

1185992,51

[10,20) 15 5 75 -17,75 1575,31 27961,80 496321,9

[20,30) 25 9 225 -7,75 540,56 -4189,36 32467,5

[30,40) 35 12 420 2,25 60,75 136,69 307,5

[40,50) 45 8 360 12,25 1200,50 14706,13 180150,0

[50,60) 55 4 220 22,25 1980,25 44060,56 980347,5

40 1310 6897,50 -15968,25 2875587

EstadísticosEstadísticos� De forma

75,3240

1310==X 13,13

40

50,6897)(

1

2

==

=

∑=

N

nxx

S

i

n

i

i

41,240

2875587

13,13

1)(

14

1

4

4=⋅=

⋅=

∑=

N

nXx

SAp

k

i

ii

17,040

25,15968

13,13

1)(

13

1

3

31 −=−

⋅=

⋅=

∑=

N

nXx

Sg

k

i

ii

EstadísticosEstadísticos� De concentración

◦ Cuantifican el grado de igualdad en el reparto de los valores de una variable

◦ Indicadores del grado de distribución de la variablela variable� Índice de Gini� Curva de Lorenz

EstadísticosEstadísticos� De concentración

◦ Índice de Gini: ingresos per cápita

EstadísticosEstadísticos� De concentración

◦ Índice de Gini

(((( ))))∑∑∑∑

−−−−

−−−−1k

ii qp(((( ))))

∑∑∑∑

∑∑∑∑

−−−−

====

====

−−−−

====1

1

1

k

i

i

i

ii

G

p

qp

I

EstadísticosEstadísticos� De concentración

◦ Índice de Gini

Li-1 - Li xi ni Ni pi = (Ni/∑ni) *

100

ui= xini Ui qi = (Ui/∑ui) *

100

pi - qi

(0 – 50] 25 23 23 8,85 575 575 1,48 7,37

(50 – 100] 75 72 95 36,54 5400 5975 15,38 21,16

(100 – 150] 125 62 157 60,38 7750 13725 35,33 25,06

(150 – 200] 175 48 205 78,85 8400 22125 56,95 21,90

(200 – 250] 225 19 224 86,15 4275 26400 67,95 18,20

(250 – 300] 275 8 232 89,23 2200 28600 73,62 15,61

(300 – 350] 325 14 246 94,62 4550 33150 85,33 9,29

(350 – 400] 375 7 253 97,31 2625 35775 92,08 5,22

(400 – 450] 425 5 258 99,23 2125 37900 97,55 1,68

(450 – 500] 475 2 260 100,00 950 38850 100,00 0,00

260 651,15 38850 125,48

EstadísticosEstadísticos� De concentración

◦ Índice de Gini

(((( ))))

193,048,125

1

1 ========

−−−−

====

∑∑∑∑−−−−

====

k

i

ii qp

I

◦ Número entre 0 y 1 � 0 = igualdad máxima = dispersión� 1 = desigualdad máxima= concentración

193,015,651

48,125

1

1

1 ============

∑∑∑∑−−−−

====

====

k

i

i

iG

p

I

EstadísticosEstadísticos� De concentración

◦ Curva de Lorenz� Representación gráfica de pi en % (abscisa)

y qi en % (ordenada)� Cuanto más cerca de la diagonal, menor � Cuanto más cerca de la diagonal, menor

concentración/más homogeneidad en la distribución.

� Cuanto más cerca de los ejes (parte inferior), mayor concentración/menor homogeneidad

EstadísticosEstadísticos� De concentración

◦ Curva de Lorenz

100,0

120,0

0,0

20,0

40,0

60,0

80,0

100,0

0,0 10,0 20,0 30,0 40,0 50,0 60,0 70,0 80,0 90,0 100,0

110,0

pi %

q i

%