estadistica tema 3.ppt [modo de compatibilidad]personales.unican.es/rasillad/tema 3.3 estadisticos...
TRANSCRIPT
EstadísticosEstadísticos� Definición
◦ Número obtenido a partir del análisis de una variable estadística.
◦ Procedimiento de cálculo bien definido: aplicación de fórmula aritméticaaplicación de fórmula aritmética
◦ Cuantifica uno o varios aspectos de la información (confirmación de tabla o gráfico)
◦ Si calculados a partir de muestras se denominan estadísticos.
◦ Si calculados a partir de una población,reciben el nombre de parámetros.
EstadísticosEstadísticos� De tendencia central
◦ Indican en torno a qué valor (centro) se distribuyen los datos.� Media
� Aritmética (ponderada)� Aritmética (ponderada)� Geométrica� Armónica
� Moda � Mediana
EstadísticosEstadísticos� De tendencia central
◦ Media aritmética� El parámetro media se re presenta por µ. � El estadístico media se denota como
� Valor obtenido al sumar todos los datos y
X
� Valor obtenido al sumar todos los datos y dividir el resultado entre el número total de elementos.
N
x
X
n
i
i∑== 1
N
xxxxX n++++
=...321
EstadísticosEstadísticos� De tendencia central
◦ Media aritmética
� Ejemplo: peso (kg) � 84, 91, 72, 68, 87 y 78 kg. El peso medio es
EstadísticosEstadísticos� De tendencia central
◦ Media aritmética� Para variables discretas agrupadas
nxnxnxnxX nn++++
=...332211
N
nx
X
i
n
i
i∑== 1
NX nn= 332211
xi ni xi · ni
27 1 27
28 2 56
29 6 174
30 7 210
31 8 248
32 3 96
33 3 99
34 1 34
31 944
45,3031
944==X
EstadísticosEstadísticos� De tendencia central
◦ Media aritmética� Variables continuas agrupadas
nx i
n
i∑nxnxnxnx ++++ ...
Li-1, Li xi ni xi · ni
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1820
N
nx
X
i
i
i∑== 1
N
nxnxnxnxX nn++++
=...332211
33,4342
1820==X
EstadísticosEstadísticos� De tendencia central
◦ Media aritmética� Observaciones
� Sólo para variables cuantitativas.� Independiente de la amplitud de los intervalos� Sensible a valores extremos � La suma de las desviaciones de todas las puntuaciones
respecto a la media es igual a cero.� Influencia de un cambio de origen: si a todos los valores
de una muestra se le suma/resta una constante c, la media de la nueva muestra es igual a la media de la muestra inicial más /menos) la constante.
� Influencia de un cambio de escala: si todos los valores de una muestra son multiplicados/divididos) por una constante c, la media de la nueva muestra es igual a la media de la muestra inicial multiplicada/dividida por c.
EstadísticosEstadísticos� De tendencia central
◦ Media aritmética ponderada� Cuando no todos los elementos tienen la misma importancia
o presentan variaciones acumulativas
� Para promediar porcentajes, tasas, números índices etc.� Para promediar porcentajes, tasas, números índices etc.
� CÁLCULO � multiplicar cada uno de los números por un valor específico (“peso” o ponderación � representan el número de veces que el valor de la variable es más importante que el de otra).
∑
∑=
=
=
k
i
i
k
i
ii
w
xww
x
1
1
EstadísticosEstadísticos� De tendencia central
◦ Media aritmética ponderada� Ventajas:
� Intervienen todos los valores de la distribución.� Los valores extremos tienen menor influencia que en la � Los valores extremos tienen menor influencia que en la
media aritmética.
◦ Inconvenientes� Cálculo complicado.
EstadísticosEstadísticos� De tendencia central
◦ Media geométrica� Raíz N-ésima del producto de los valores
nnxxxG ×××= ...21
� Usada cuando los datos no varían linealmente � su valor depende de varios factores a la vez.
� CÁLCULO: temperaturas de un proceso químico
n21
44 796827758613911812413 ..x.x.x. =
EstadísticosEstadísticos� De tendencia central
◦ Media armónica� Datos: 3.1, 2.8, 2.84, 3.05, 3.09,
==n
H1
∑∑==
==n
i
n
i
xi/
n
xi/n/
H
11
111
1
=++++
=093105318421821131
5
./././././H
9703268331
5
3236032790352103571032260
5.
......==
++++=
EstadísticosEstadísticos� De tendencia central
◦ Moda� Valor más frecuente
� El que más se repite� En el caso de variables continuas � clase modal� En el caso de variables continuas � clase modal
� Se representa por Mo� Ej: distribución 2, 3, 3, 4, 4, 4, 5, 5 � Mo = 4
EstadísticosEstadísticos� De tendencia central
◦ Moda� Casos particulares
� Si todas las puntuaciones tienen la misma frecuencia � no hay moda.� Ej: 2, 2, 3, 3, 6, 6, 9, 9
� Si dos puntuaciones adyacentes comparten la misma frecuencia máxima � promedio de las dos puntuaciones adyacentes.� Ej: 0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
EstadísticosEstadísticos� De tendencia central
◦ Moda� Si dos o más puntuaciones no adyacentes tienen la
misma frecuencia (máxima) � distribución bimodal o multimodalmultimodal� Ej: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9� Ojo, puede ser resultado de mezcla de
poblaciones/muestras
� Inconvenientes� Parámetro poco representativo, salvo cuando es clara, por
que no intervienen todos los valores de la distribución� Única medida de posición central que puede obtenerse en
las variables de tipo cualitativo
EstadísticosEstadísticos� De tendencia central
◦ Moda� Variables cualitativas (nominales y ordinales)
y cuantitativas discretas� Valor o valores con la máxima frecuencia� Valor o valores con la máxima frecuencia
xi ni
27 1
28 2
29 6
30 7
31 8
32 3
33 3
34 1
31
EstadísticosEstadísticos� De tendencia central
◦ Moda� Variables continuas (datos agrupados)
Caso A� intervalos con la misma amplitud
ii ann
LMo •−
+= −1
� Li-1 � límite inferior de la clase modal.� ni � número de casos de la clase modal.� ni-1 � número de casos de la clase inmediatamente inferior a la
modal� ni-+1 � número de casos de la inmediatamente posterior a la modal� ai � amplitud de cada clase
� Alternativa:
i
iiii
ii
i annnn
nnLMo •
−+−
−+=
+−
−
−)()( 11
1
1
i
ii
i
i ann
nLMo •
++=
+−
+
−)( 11
1
1
EstadísticosEstadísticos� De tendencia central
◦ Moda� Variables continuas (datos agrupados)
Caso A� intervalos con la misma amplitud.
Primer paso � ¿clase modal? � [66,69)
Li-1, Li ni
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100
EstadísticosEstadísticos� De tendencia central
◦ Moda� Caso B ���� intervalos tienen amplitudes distintas.
� 1º paso � buscar clase modal� 2º paso � cálculo altura� 2º paso � cálculo altura
� 3º paso � aplicar fórmula
� Alternativa:
i
iiii
ii
i ahhhh
hhLMo •
−+−
−+=
+−
−
−)()( 11
1
1
i
ii
i
i ahh
hLMo •
++=
+−
+
−)( 11
1
1
i
i
ia
nh =
EstadísticosEstadísticos� De tendencia central
◦ Moda� Los intervalos tienen amplitudes distintas.
� Calificaciones (suspenso, aprobado, notable y sobresaliente) de un grupo de 50 alumnos.
Li-1, Li ni hi
[0, 5) 15 15/5=3
[5, 7) 20 20/2=10
[7, 9) 12 12/2=6
[9, 10) 3 3/1=3
50
EstadísticosEstadísticos� De tendencia central
◦ Mediana� No ligada al valor numérico de las observaciones
sino a su posición relativa dentro de los datos �posición central cuando están ordenados de posición central cuando están ordenados de menor a mayor
� Separa una distribución en dos partes iguales �valor que deja un 50 % de los datos a su izquierda y el otro 50 % a su derecha.
� Estadístico Me� Sólo variables cuantitativas
EstadísticosEstadísticos� De tendencia central
◦ La mediana� Cálculo
� A partir de los datos ordenados de menor a mayor.� El procedimiento depende del formato de los datos� El procedimiento depende del formato de los datos
(variables discretas o continuas)
EstadísticosEstadísticos� De tendencia central
◦ La mediana� Cálculo (datos originales)
� Número impar de individuos: puntuación central de la misma
N� � 2, 3, 4, 4, 5, 5, 5, 6, 6
� Siendo N = número de individuos de la serie
� Número par de individuos: promedio de las dos puntuaciones centrales� Me = promedio de N/2 y N/2+1 � 7, 8, 9, 10, 11, 12
Me= 9,5
5,02
+=N
Me
EstadísticosEstadísticos� De tendencia central
◦ La mediana� Cálculo para distribuciones discretas
� Buscar primer valor de Ni (frecuencia absoluta acumulada) que iguale o supere a
� CASO 1: coincide con un valor de las frecuencias acumuladas � media entre la observación que presenta dicha frecuencia absoluta acumulada y la siguiente.
� CASO 2: no coinciden con ningún valor de la columna de las frecuencias acumuladas � primera observación cuya frecuencia acumulada supera N/2
xi ni Ni
27 1 1
EstadísticosEstadísticos� De tendencia central
◦ La mediana� Cálculo para distribuciones discretas
31N27 1 1
28 2 3
29 6 9
30 7 16
31 8 24
32 3 27
33 3 30
34 1 31
31
El primer valor de Ni que supera 16.5 es 24
Me = 31
5,162
31
2==
N
EstadísticosEstadísticos� De tendencia central
◦ La mediana� Cálculo para datos agrupados (continuas)
� Buscar el intervalo mediano� Primer valor de Ni que iguale o supere a i
� Aplicar la fórmula
� Li-1 límite inferior del intervalo mediano� Ni-1 frecuencia acumulada anterior al intervalo mediano� ai amplitud de la clase.
� La mediana es independiente de las amplitudes de los intervalos
i
i
i
i an
NN
LMe •
−
+=−
−
1
12
EstadísticosEstadísticos� De tendencia central
◦ La mediana� Cálculo para datos agrupados
(continuas)Li-1, Li ni Ni 100Li-1, Li ni Ni
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100
Primer valor de Ni que iguale o supere 50 = 65
Intervalo mediano: [66, 69)
502
100==Intervalo mediano
93.673*42
2350662
1
1 =−
+=•
−
+=−
− i
i
i
i an
NN
LMe
EstadísticosEstadísticos� De dispersión
◦ Informan sobre cuánto se alejan del centro todos los valores de la distribución.� Rango o recorrido� Rango o recorrido� Desviación respecto a la media� Desviación media� Varianza� Desviación típica
EstadísticosEstadísticos� De dispersión
◦ Rango o recorrido: � Diferencia entre el mayor y el menor de los
datos� Cálculo sencillo� Cálculo sencillo� Sólo tiene en cuenta los valores extremos (cuanto
mayor sea la diferencia mayor el rango) pero no necesariamente supone incremento de la dispersión
EstadísticosEstadísticos� De dispersión
◦ La desviación respecto a la media� Diferencia entre cada individuo de la variable
estadística y la media aritmética de toda la distribución.
xxD −=distribución.�
◦ La desviación media (absoluta)� Media aritmética de los valores absolutos de
las desviaciones respecto a la media.
xxD ii −=
N
xx
D
n
i
i
x
∑=
−
= 1
N
xxxxxxxxD
n
x
−++−+−+−=
...321
EstadísticosEstadísticos� De dispersión
◦ La desviación media� Cálculo de la desviación media de la
distribución 9, 3, 8, 8, 9, 8, 9, 18
EstadísticosEstadísticos� De dispersión
◦ La desviación media� Distribución discreta
xi ni xi · ni |xi-X| |xi-X|* ni
27 1 27 3,55 3,55
28 2 56 2,55 4,9
29 6 174 1,55 8,7
30 7 210 0,55 3,2
31 8 248 0,55 4,4
32 3 96 1,55 4,6
33 3 99 2,55 7,6
34 1 34 3,55 3,55
31 ∑ 944 ∑ 40,5
30,131
5,40==xD
45,3031
944==X
EstadísticosEstadísticos� De dispersión
◦ La desviación media� Distribución continua con datos agrupados
nxxnxxnxxnxxD
nn
x
−++−+−+−=
...332211
Li-1, Li xi ni xi · ni |xi - X| |xi - X| . ni
[10, 15) 12,5 3 37,5 9,286 27,858
[15, 20) 17,5 5 87,5 4,286 21,43
[20, 25) 22,5 7 157,5 0,714 4,998
[25, 30) 27,5 4 110 5,714 22,856
[30, 35) 32,5 2 65 10,174 21,428
21 457,5 98,57
N
nxx
D
i
n
i
i
x
∑=
−
= 1
NDx =
EstadísticosEstadísticos� De dispersión
◦ La varianza� Media aritmética del cuadrado de las
desviaciones respecto a la media� s2 (muestra); σ2 (población)� s2 (muestra); σ2 (población)
� En forma resumida
∑=
−=n
i
i xN
xS
1
22
2222
2
2
12 ...x
N
xxxS n −
+++=
N
xx
S
n
i
i∑=
−
= 1
2
2
)(
N
xxxxxxS b
22
2
2
12 )(...)()( −++−+−=
EstadísticosEstadísticos� De dispersión
◦ La varianza� Cálculo:
� Datos = 9, 3, 8, 8, 9, 8, 9, 18
=2
S
EstadísticosEstadísticos� De dispersión
◦ La varianza� Datos agrupados
nxx i
n
i∑ −2)(
nxxnxxnxx222 )(...)()( −++−+−
∑=
−=n
i
ii xN
nxS
1
22
222
2
2
21
2
12 ...x
N
nxnxnxS nn −
+++=
N
nxx
Si
i
i∑=
−
= 12
)(
N
nxxnxxnxxS nb
2
2
2
21
2
12 )(...)()( −++−+−=
En forma resumida
xi ni xi · ni xi2 · ni
27 1 27 729
EstadísticosEstadísticos� De dispersión
◦ La varianza� Variable discreta (fórmula sencilla)
∑ −=n
ii xnx
S2
2227 1 27 729
28 2 56 1568
29 6 174 5046
30 7 210 6300
31 8 248 7688
32 3 96 3072
33 3 99 3267
34 1 34 1156
31 944 28826
45,3031
944==X
67,2)45,30(31
28826 22=−=S
∑=
−=i
ii xN
nxS
1
22
EstadísticosEstadísticos� De dispersión
◦ La varianza� Variables continuas (fórmula sencilla)
Li-1, Li xi ni xi · ni xi2 · ni
∑ −=n
ii xnx
S2
22
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60) 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1820 88050218,94)33,43(42
88050 22=−=S
∑=
−=i
ii xN
nxS
1
2
EstadísticosEstadísticos� De dispersión
◦ La varianza� Datos agrupados (fórmula compleja)
Li-1, Li xi ni xi · ni xi – X (xi – X)2 (xi – X)2 * ni
[10, 20) 15 1 15 -28,33 802,8 802,78[10, 20) 15 1 15 -28,33 802,8 802,78
[20, 30) 25 8 200 -18,33 336,1 2688,89
[30,40) 35 10 350 -8,33 69,4 694,44
[40, 50) 45 9 405 1,67 2,8 25,0
[50, 60) 55 8 440 11,67 136,1 1088,89
[60,70) 65 4 260 21,67 469,4 1877,78
[70, 80) 75 2 150 31,67 1002,8 2005,56
42 1 820 9183,33
3,4342
1820==X 65,218
42
33,91832==S
N
nxx
Si
n
i
i∑=
−
= 1
2
2
)(
EstadísticosEstadísticos� De dispersión
◦ La varianza� Propiedades
� Siempre un valor positivo o cero (desviaciones elevadas al cuadrado). Si a todos los individuos de la variable � Si a todos los individuos de la variable � se les suma un número � la varianza no varía� se multiplican por un número � la varianza queda
multiplicada por el cuadrado de dicho número� Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas varianzas se puede calcular la varianza total.� Si tienen el mismo tamaño:
� Si tienen distinto tamaño
EstadísticosEstadísticos� De dispersión
◦ La varianza� Observaciones
� Muy sensible a valores atípicos� No expresada en las mismas unidades que los � No expresada en las mismas unidades que los
datos originales (desviaciones elevadas al cuadrado).
EstadísticosEstadísticos� De dispersión
◦ La desviación típica (tipo o estándar)� Raíz cuadrada de la varianza� s (muestra); σ (población)
n
∑
� Simplificando
� En muestras pequeñas N≤30 se suele sustituir el denominados por N-1
∑=
−=n
i
i xN
xS
1
22
222
2
2
1 ...x
N
xxxS n −
+++=
N
xx
S
n
i
i∑=
−
= 1
2)(
N
xxxxxxS b
22
2
2
1 )(...)()( −++−+−=
EstadísticosEstadísticos� De dispersión
◦ La desviación típica� Cálculo distribución:� 9, 3, 8, 8, 9, 8, 9, 18
=S
EstadísticosEstadísticos� De dispersión
◦ La desviación típica� Para distribuciones continuas
nxx i
n
i∑ −2)(
∑=
−=n
i
ii xN
nxS
1
22
22
2
2
21
2
1 ...x
N
nxnxnxS nn −
+++=
N
nxx
Si
i
i∑=
−
= 1
)(
N
nxxnxxnxxS nb
2
2
2
21
2
1 )(...)()( −++−+−=
EstadísticosEstadísticos� De dispersión
◦ La desviación típica� Cálculo para datos agrupados (fórmula sencilla)
L , L x n x · n x 2 · n∑ −=n
i xx
S2
2
Li-1, Li xi ni xi · ni xi2 · ni
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60) 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
( ) 14,79733,4342
88050 2=−=S
∑=
−=i
xN
S1
EstadísticosEstadísticos� De dispersión
◦ La desviación típica� Propiedades
� Siempre un valor positivo o cero� Si todos los valores de la variable
� se les suma un número la desviación típica no varía.
� se multiplican por un número la desviación típica queda multiplicada por dicho número.
� Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total.� Si tienen el mismo tamaño
� Si tienen distinto tamaño
EstadísticosEstadísticos� De dispersión
◦ La desviación típica� Observaciones
� Parámetro de dispersión absoluta: � Cuanto más altos los valores de partida, más � Cuanto más altos los valores de partida, más
alta la desviación típica� Cuanta más pequeña mayor será la
concentración de datos alrededor de la media.� Muy sensible a las puntuaciones extremas.
EstadísticosEstadísticos� De dispersión
◦ El coeficiente de variación� Relación entre la desviación típica y la media� Se expresa en porcentajes
S
� Permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas
� A mayor coeficiente de variación mayor dispersión
100•=x
SCV
EstadísticosEstadísticos� Puntuaciones
◦ Puntuaciones típicas� Resultado de dividir la desviación respecto a
la media entre la desviación típica (tipificación)(tipificación)
� Se utilizan para comparar las puntuaciones obtenidas en distintas distribuciones (parámetro de dispersión relativa
� Se representa por ZS
xxZ i −
=
EstadísticosEstadísticos� Puntuaciones
◦ Puntuaciones típicas� Observaciones
� La media aritmética de las puntuaciones típicas es 0
� La desviación típica de las puntuaciones típicas es 1
� Adimensionales � independientes de las unidades utilizadas
EstadísticosEstadísticos� Puntuaciones
◦ Puntuaciones típicas
Xi (xi – X¯) zi
3 1,65 -0,64
28,47
30==X
4 0,08 -0,24
5 0,51 0,14
1 10,79 -1,44
2 5,22 -1,04
6 2,93 0,54
9 22,22 1,74
30
64,051,2
28,43−=
−=
−=
S
xxZ i
51,27
23,44==S
Para xi = 3 (primer caso)
EstadísticosEstadísticos� De posición (estructura)
◦ Dividen un conjunto de datos en grupos con el mismo número de individuos
◦ Son:� Cuartiles: dividen la serie de datos en cuatro � Cuartiles: dividen la serie de datos en cuatro
partes iguales� Deciles: dividen la serie de datos en diez
partes iguales� Percentiles: dividen la serie de datos en cien
partes iguales
EstadísticosEstadísticos� De posición (estructura)
◦ Los cuartiles� Tres valores que dividen un conjunto de
datos ordenados en cuatro partes iguales.� 1C, 2C y 3C � valores correspondientes al 25%, � 1C, 2C y 3C � valores correspondientes al 25%,
al 50% y al 75% de los datos.� 2C = mediana.
EstadísticosEstadísticos� De posición (estructura)
◦ Obtención cuartiles� Ordenar los datos de menor a mayor � Buscar el lugar que ocupa cada cuartil
� Número impar de datos� 2, 5, 3, 6, 7, 4, 9
�
� Número par de datos� 2, 5, 3, 4, 6, 7, 1, 9
EstadísticosEstadísticos� De posición (estructura)
◦ Cálculo de cuartiles para datos agrupados
� Buscar la clase donde Ni =>
Nk •
� Li-1 límite inferior de la clase seleccionada� Ni-1 frecuencia acumulada anterior a la clase seleccionada� ni frecuencia absoluta de la clase seleccionada� ai amplitud de la clase
i
i
i
ik an
NNk
LC •
−•
+=−
−
1
14
EstadísticosEstadísticos� De posición (estructura)
◦ Cálculo de los cuartiles para datosagrupados� Ejemplo
i
a
NNk
LC •
−•
+=−1
4
� 1C
� 2C
� 3C
Li-1, Li ni Ni
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
i
i
ik an
LC •+=−1
4
EstadísticosEstadísticos� De posición (estructura)
◦ Deciles� Nueve valores que dividen la serie de datos
en diez partes iguales� Equivalen a los valores correspondientes al � Equivalen a los valores correspondientes al
10%, al 20%... al 90% de los datos.� D5 coincide con la mediana
i
i
i
ik an
NNk
LD •
−•
+=−
−
1
1
10
EstadísticosEstadísticos� De posición (estructura)
◦ Deciles
L , L n N
i
i
i
ik an
NNk
LD •
−•
+=−
−
1
1
10
Li-1, Li ni Ni
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
EstadísticosEstadísticos� De posición (estructura)
◦ Gráfico de caja y bigotes• Proporciona: idea intuitiva de la simetría de la distribución de los datosDetecta valores atípicos
• Necesitamos saber � valores mínimo y máximo, cuartiles 1C (25% de los datos), 2C o mediana (el 50% de los datos) y 3C (75% de los datos)
• Rango Inter Cuartílico (RIC): (3C-1C)
• Ls ���� Límites superior 3C+1.5*RIC
• Lm ���� Límite inferior 1C-1.5*RIC
• Atípicos: < 1C-3*RIC y > 3C+3*RIC
EstadísticosEstadísticos� De posición (estructura)
◦ Desviación cuartílica
L , L n NLi-1, Li ni Ni
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
25,112
25,6875,90
2
13=
−=
−=
CCDC
EstadísticosEstadísticos� De posición (estructura)
◦ Desviación percentílica
L , L n NLi-1, Li ni Ni
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
37,162
12,58101
2
19
9010 =−
=−
=−
DDDP
EstadísticosEstadísticos� De forma
◦ Simetría de los datos respecto al valor central� Asimetría negativa: la cola de la distribución se
alarga para valores inferiores a la media.� Simétrica: mismo número de elementos a izquierda � Simétrica: mismo número de elementos a izquierda
y derecha de la media (coinciden la media, la mediana y la moda)� campana de Gauss (normal).
� Asimetría positiva: la cola de la distribución se alarga para valores superiores a la media.
EstadísticosEstadísticos�De forma
◦ Coeficientes de asimetría o de sesgo
◦ Coeficiente de asimetría de Pearson: mide la diferencia entre la media y la moda respecto a la dispersión del conjunto
� Para distribuciones unimodales y poco asimétricas. � Para distribuciones unimodales y poco asimétricas.
S
MoXAs
−=
S
MeXAs
)(3 −∗=
As = 0 As < 0 As > 0
MoX =X XMoMo
EstadísticosEstadísticos� De forma
◦ Coeficientes de asimetría o de sesgo � Coeficiente de asimetría de Fisher� Evalúa la proximidad de los datos a su media
x� cuanto mayor sea el numerador, mayor x� cuanto mayor sea el numerador, mayor asimetría
N
nXx
Sg
k
i
ii∑=
−
⋅= 1
3
31
)(1
EstadísticosEstadísticos� De forma
� Coeficientes de asimetría o de sesgo � Coeficiente de secgo cuartílico (Bowley-Yule)� Toma como referencia los cuartiles
( )
13
1223 )(
QQQQSC
−
−−−=
EstadísticosEstadísticos� De forma
◦ Coeficientes de asimetría o de sesgo ◦ Coeficiente de Bowley-Yule� Si <0 asimetría negativa: la distancia de la mediana al
primer cuartil es menor que al tercero.
� Si =0 distribución simétrica: el primer y tercer cuartil� Si =0 distribución simétrica: el primer y tercer cuartilestán a la misma distancia de la mediana.
� Si >0 asimetría positiva, ya que la distancia de la mediana al tercer cuartil es mayor que al primero.
EstadísticosEstadísticos� De forma
◦ Coeficiente de apuntamiento o curtosis� Mide cuán escarpada o achatada está una curva o
distribución.
� Indica la cantidad de datos cercanos a la media, de � Indica la cantidad de datos cercanos a la media, de manera que a mayor grado de curtosis, más escarpada (o apuntada) será la forma de la curva.
EstadísticosEstadísticos� De forma
� Coeficiente de apuntamiento o curtosis
N
nXx
Ap
k
i
ii∑=
−
⋅= 1
4
4
)(1
NSAp ⋅=
4
Mesocúrtica Ap=3 Leptocúrtica Ap > 3 Platicúrtica Ap < 3
EstadísticosEstadísticos� De forma
Li-1, Li xi ni xi · ni xi · X (xi · )2ni (xi · )3ni (xi · )4ni
[0, 10) 5 2 10 -27,25 1540,13 -42738,47 1185992,51
X X X
1185992,51
[10,20) 15 5 75 -17,75 1575,31 27961,80 496321,9
[20,30) 25 9 225 -7,75 540,56 -4189,36 32467,5
[30,40) 35 12 420 2,25 60,75 136,69 307,5
[40,50) 45 8 360 12,25 1200,50 14706,13 180150,0
[50,60) 55 4 220 22,25 1980,25 44060,56 980347,5
40 1310 6897,50 -15968,25 2875587
EstadísticosEstadísticos� De forma
75,3240
1310==X 13,13
40
50,6897)(
1
2
==
−
=
∑=
N
nxx
S
i
n
i
i
41,240
2875587
13,13
1)(
14
1
4
4=⋅=
−
⋅=
∑=
N
nXx
SAp
k
i
ii
17,040
25,15968
13,13
1)(
13
1
3
31 −=−
⋅=
−
⋅=
∑=
N
nXx
Sg
k
i
ii
EstadísticosEstadísticos� De concentración
◦ Cuantifican el grado de igualdad en el reparto de los valores de una variable
◦ Indicadores del grado de distribución de la variablela variable� Índice de Gini� Curva de Lorenz
EstadísticosEstadísticos� De concentración
◦ Índice de Gini
(((( ))))∑∑∑∑
−−−−
−−−−1k
ii qp(((( ))))
∑∑∑∑
∑∑∑∑
−−−−
====
====
−−−−
====1
1
1
k
i
i
i
ii
G
p
qp
I
EstadísticosEstadísticos� De concentración
◦ Índice de Gini
Li-1 - Li xi ni Ni pi = (Ni/∑ni) *
100
ui= xini Ui qi = (Ui/∑ui) *
100
pi - qi
(0 – 50] 25 23 23 8,85 575 575 1,48 7,37
(50 – 100] 75 72 95 36,54 5400 5975 15,38 21,16
(100 – 150] 125 62 157 60,38 7750 13725 35,33 25,06
(150 – 200] 175 48 205 78,85 8400 22125 56,95 21,90
(200 – 250] 225 19 224 86,15 4275 26400 67,95 18,20
(250 – 300] 275 8 232 89,23 2200 28600 73,62 15,61
(300 – 350] 325 14 246 94,62 4550 33150 85,33 9,29
(350 – 400] 375 7 253 97,31 2625 35775 92,08 5,22
(400 – 450] 425 5 258 99,23 2125 37900 97,55 1,68
(450 – 500] 475 2 260 100,00 950 38850 100,00 0,00
260 651,15 38850 125,48
EstadísticosEstadísticos� De concentración
◦ Índice de Gini
(((( ))))
193,048,125
1
1 ========
−−−−
====
∑∑∑∑−−−−
====
k
i
ii qp
I
◦ Número entre 0 y 1 � 0 = igualdad máxima = dispersión� 1 = desigualdad máxima= concentración
193,015,651
48,125
1
1
1 ============
∑∑∑∑−−−−
====
====
k
i
i
iG
p
I
EstadísticosEstadísticos� De concentración
◦ Curva de Lorenz� Representación gráfica de pi en % (abscisa)
y qi en % (ordenada)� Cuanto más cerca de la diagonal, menor � Cuanto más cerca de la diagonal, menor
concentración/más homogeneidad en la distribución.
� Cuanto más cerca de los ejes (parte inferior), mayor concentración/menor homogeneidad