calculo de indicadores

Upload: fran-salinas

Post on 13-Oct-2015

37 views

Category:

Documents


0 download

TRANSCRIPT

  • ESTADISTICA DESCRIPTIVA UNIVARIADACALCULO E INTERPRETACION DE INDICADORES:

    MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE POSICIONMEDIDAS DE DISPERSINMEDIDAS DE FORMA

  • MEDIDAS DE TENDENCIA CENTRAL

    Describen el centro de un conjunto de datos. Estos son: la media ( promedio), la mediana, la moda, la media recortada, la media geomtrica, la media armnica.

  • MEDIDAS DE POSICIONDescriben el conjunto de datos, a travs de puntos que representan porcentajes de acumulacin. Estos son: Los cuartiles, los deciles, los percentiles Y QUINTILES

  • MEDIDAS DE DISPERSIN

    Describen la variacin de un conjunto de datos de una variable cuantitativa. Estos son: la varianza, la desviacin estndar, el rango, la desviacin media, el rango percentil, el rango semintercuartil, y el coeficiente de variacin.

  • MEDIDAS DE FORMADescriben la forma que puede tener una distribucin de datos, estos indicadores son: el ndice de simetra que mide la simetra o asimetra en la distribucin, y el ndice de curtosis que mide el achatamiento de la curva.

  • 1.- MEDIDAS EN DATOS DE UNA VARIABLE CUALITATIVA EN ESCALA NOMINAL

    MEDIDAS DE TENDENCIA CENTRAL

    MODA: La moda es el dato que se presenta con mayor frecuencia en el conjunto de datos.

    Ejemplo: Genero: M, F,M,M,M,F

    MODA = M Interpretacin: En los 6 sujetos el genero ms frecuente es masculino

  • Moda desde una tabla de frecuenciaLa moda corresponde a la clase que presenta la mayor frecuencia absoluta o relativa porcentual. Por ejemplo:

    MODA = FEMENINO

    En los 6 sujetos el genero de mayor frecuencia es femenino.

    GENEROnifi%FEMENINO466.7MASCULINO233.3TOTAL6100

  • OBSERVACIONES1.- En un conjunto de datos es posible hallar distribuciones bimodales o multimodales, es decir en donde existen 2 o ms modas.2.- En un conjunto de datos es posible no hallar moda, estas distribuciones se conocen como amodales.

  • TASA DE VARIACION Sirve para medir el grado de significacin del dato modal con respecto a los otros datos. donde nmodal= frecuencia absoluta modal donde 0 < V < 1

    INTERPRETACIONSi V 0 entonces la moda es altamente significativa para los datosSi V 1 entonces la moda es poco significativa para los datos

  • 2.- MEDIDAS EN DATOS DE UNA VARIABLE CUALITATIVA EN ESCALA ORDINAL

    MEDIDAS DE TENDENCIA CENTRAL

    MODA: La moda es el dato que se presenta con mayor frecuencia en el conjunto de datos.

    MEDIANA: Esta medida de tendencia central es la que describe el punto central de una distribucin de datos ordenados ( de menor a mayor ), tal que desde el dato menor hasta el dato mediano existe 50% de la informacin.

  • MEDIDAS DE TENDENCIA CENTRAL: LA MEDIANA

    En una tabla de frecuencia, la mediana corresponde a la clase la cual se ubica en la primera clase cuya frecuencia relativa porcentual acumulada (Fi% ) sea igual o superior a 50%. MED = Bueno El 50% de los sujetos est calificado de a lo ms bueno

    Calificacionesni fi% Ni Fi%Insuficiente215,42 15,4Suficiente323,15 38,5 Bueno323,18 61,6Muy Bueno538,513 100Total13100

  • 2.- MEDIDAS EN DATOS DE UNA VARIABLE CUALITATIVA EN ESCALA ORDINAL MEDIDAS DE POSICION:

    1.- LOS CUARTILES 2.- LOS DECILES3.- LOS PERCENTILES4.- Los Quintiles

  • MEDIDAS DE POSICION:1.-LOS CUARTILESEstas medidas describen cuatro posiciones en un conjunto dedatos ordenados de menor a mayor.Se anotan: MINIMO Q1 Q2 Q3 Q4

    Tal que entre estas posiciones existe un 25% de la informacin,Y acumuladamente describen:

    CUARTIL 1 (Q1) entrega el dato que deja a lo ms el 25% de la informacin.CUARTIL 2 (Q2) entrega el dato que deja a lo ms el 50% de la informacin.CUARTIL 3 (Q3) entrega el dato que deja a lo ms el 75% de la informacin.CUARTIL 4 (Q4) entrega el dato que deja a lo ms el 100% de la informacin.

  • MEDIDAS DE POSICION:2.-LOS DECILESEstas medidas describen diez posiciones en un conjunto dedatos ordenados de menor a mayor.Se anotan: MINIMO D1 D2 D3 D4 D5 D6 D7 D8 D9 D10

    Tal que entre estas posiciones existe un 10% de la informacin,Y acumuladamente describen:

    DECIL 1 (D1) entrega el dato que deja a lo ms el 10% de la informacin.DECIL 2 (D2) entrega el dato que deja a lo ms el 20% de la informacin.. HASTA

    DECIL 10 (D10) entrega el dato que deja a lo ms el 100% de la informacin.

  • MEDIDAS DE POSICION:3.-LOS QUINTILESEstas medidas describen 5 posiciones en un conjunto de Datos ordenados de menor a mayor.Se anotan: MINIMO Q1 Q2 Q3 Q4 Q5

    Tal que entre estas posiciones existe un 20% de la informacin, y acumuladamente describen: quintil 1 (q1) entrega el dato que deja a lo ms el 20% de la informacin.Hasta el quintil 5 (q5) acumula el 100%

  • MEDIDAS DE POSICION:4.-LOS PERCENTILESEstas medidas describen cien posiciones en un conjunto dedatos ordenados de menor a mayor.Se anotan: MINIMO P1 P2 ..P21 ..P83 ..P99 P100

    Tal que entre estas posiciones existe un 1% de la informacin,Y acumuladamente describen:

    PERCENTIL 1 (P1) entrega el dato que deja a lo ms el 1% de la informacin.PERCENTIL 2 (P2) entrega el dato que deja a lo ms el 2% de la informacin.. HASTAPERCENTIL 73 (P73) entrega el dato que deja a lo ms el 73% de la informacin..HASTAPERCENTIL 100 (P10) entrega el dato que deja a lo ms el 100% de la informacin.

  • MEDIDAS DE POSICION:EJEMPLOCuartil 1=Q1=Suficiente. El 25% de los sujetos es calificado de a lo ms Suficiente.

    Decil 7=D7=Bueno. El 70% de los sujetos es calificado de a lo ms Bueno.

    Percentil 88=P 88=Muy Bueno. El 88% de los sujetos es calificado de a lo ms Muy Bueno.Quintil 4 ( 80%)=BUENO El 80% de los sujetos est calificado de a lo ms Bueno

    Calcular: el cuartil 1, el decil 7, y el percentil 88El quintil 4

    Calificacionesni fi% Ni Fi%Insuficiente2202 20Suficiente3305 50 Bueno3308 80Muy Bueno22010 100Total10100

  • OBSERVACIONExisten las siguientes equivalencias entre las tres medidas de posicin:Cuartil1= P25 quintil 1 = p20 Cuartil2= P50 quintil 2= p40Cuartil3= P75 quintil 3= p60Cuartil4= P100 quintil 4= p80 quintil 5= p100D1=P10D2=P20 D9=P90 D10 =P100

  • 3.- MEDIDAS EN DATOS DE UNA VARIABLE CUANTITATIVA (DISCRETA Y CONTINUA)MEDIDAS DE TENDENCIA CENTRAL1.- LA MEDIA O PROMEDIO ARITMETICO: La media es una medida de tendencia central la cual usa toda la informacin, a travs de una sumatoria de datos y estos divididos por el total de informacin.

  • MEDIDAS DE TENDENCIA CENTRAL1.- LA MEDIAPARA UNA LISTA DE DATOS: Sea Y1, Y2, Yn un conjunto de datos de una variable cuantitativa.

    Donde Yi representa a los datos i = 1,2,,nPor ejemplo: Sean las siguientes notas: 3,5 3,6 4,1 4,6Cul es la media de estas notas? Media = 3,95 La nota promedio es de 3,95.

  • MEDIDAS DE TENDENCIA CENTRAL1.- LA MEDIAPARA UNA TABLA DE FRECUENCIA:

    Sean X1,X2, ., Xk Clases de la tablaSean n1, n2, .,nk frecuencias absolutas.

    Ejemplo: Sea la tabla de frecuencia: Xi=peso(Kg.); ni= niosXi ni 2 3 media = (2*3+3*2+4*2)/7 = 20/7=2,863 2 La media del peso de los 7 nios es de 2,86 kg. 2Total 7

  • OBSERVACIONES DE LA MEDIA1.- Esta medida calculada a travs de tabla de frecuencia es un calculo aproximado, as como todas las medidas descriptivas que se calculen desde tablas de frecuencia con intervalos de clase.

    2.- Por el hecho de usar toda la informacin, el promedio es una medida que puede ser afectada por datos atpicos.

  • PROPIEDADES DEL PROMEDIO

    Sean Y1, Y2, , Yn un conjunto de datos de una variable cuantitativa. Sea c una constante conocida.

    1.- Si sumamos la constante c a cada dato: ( Y1+c; Y2+c;;Yn+c). El promedio de estos datos transformados es.

  • PROPIEDADES DEL PROMEDIO

    Sean Y1, Y2, , Yn un conjunto de datos de una variable cuantitativa. Sea c una constante conocida.2.-Si multiplicamos la constante c a cada dato: ( Y1*c; Y2*c; ;Yn*c).El promedio de estos datos transformados es

  • MEDIDAS DE TENDENCIA CENTRAL2.- LA MEDIANALa mediana es una medida de tendencia central la cual ubica el dato central en un conjunto de datos ordenados de menor a mayor.

    PARA UNA LISTA DE DATOS: Sea Y1, Y2, ,Yn un conjunto de datos de una variable cuantitativa. Se deben ordenar los n datos de menor a mayor, tal que: Si n es par la mediana se encuentra en el promedio de los dos datos centrales

    Por ejemplo: 4,5,7,8,13,16

    La mediana = (7+8)/2 =7,5 El 50% de los datos es de a lo mas el dato 7,5

  • MEDIDAS DE TENDENCIA CENTRAL2.- LA MEDIANASi n es impar la mediana se encuentra en el dato central,

    Por ejemplo: 2,3,5,8,9,12,14

    La mediana = 8 El 50% de los datos es de a lo ms al dato 8.

  • MEDIDAS DE TENDENCIA CENTRAL2.- LA MEDIANAPARA UNA TABLA DE FRECUENCIATabla 1 : Cuando las clases pertenecen a un subconjunto de nmeros Naturales ( X1,X2, ,Xk).Med = Xmed, donde la clase Xmed se encuentra en la primera clase cuya Fi% sea mayor o igual al 50%.

  • MEDIDAS DE TENDENCIA CENTRAL2.- LA MEDIANAPARA UNA TABLA DE FRECUENCIATabla 2 : Cuando las clases estn formadas con intervalos reales ( LRIi - LRSi).

    DondeLRImed = lmite real inferior de la clase mediana, la cual se encuentra donde sea mayor o igual 50% acumulado ( Fi%).n= total de datosNi-1 = frecuencia absoluta acumulada anterior a la clase medianaA = amplitud de la clase mediana ( LRSmed LRImed )ni= frecuencia absoluta de la clase mediana.

  • MEDIDAS DE TENDENCIA CENTRAL3.- LA MODALa moda es el dato que presenta la mayor frecuencia.

    PARA UNA LISTA DE DATOS: Sea Y1, Y2, ,Yn un conjunto de datos de una variable cuantitativa. La moda se encuentra en el dato de mayor frecuencia o de mayor repeticin en el conjunto de datos.

  • MEDIDAS DE TENDENCIA CENTRAL3.- LA MODAPARA UNA TABLA DE FRECUENCIA:Tabla 1 : Cuando las clases pertenecen a un subconjunto de nmeros naturales ( X1,X2, ,Xk).Mod = Xmod, donde la clase Xmod se encuentra en la clase cuya frecuencia absoluta o relativa sea ms alta.

  • MEDIDAS DE TENDENCIA CENTRAL3.- LA MODATabla 2 : Cuando las clases estn formadas con intervalos reales ( LRIi - LRSi)

    DondeLRImod = lmite real inferior de la clase modal, la cual se encuentra donde sea la mayor frecuencia absoluta.nm= frecuencia absoluta de la clase modalnm-1 = frecuencia absoluta anterior a la clase modal nm+1 = frecuencia absoluta posterior a la clase modal A = amplitud de la clase modal ( LRSmod LRImod )

  • MEDIDAS DE POSICION1.- LOS CUARTILESEstas medidas describen cuatro posiciones en un conjunto de datos ordenados de menor a mayor.Para una lista de datos. Estos se ordenan de menor a mayor, para luego ubicar un cuartil a travs de: Qp = Y ( (n*p)/4)

    Donde p= 1,2,3,4 y n= total de datos.Para una tabla con intervalos de clase. Se aplica la siguiente formula para encontrar un dato cuartil

    DondeLRI cuartil = Limite real inferior de la clase cuartilNi-1 = Frecuencia absoluta acumulada anterior a la clase cuartilA = amplitud de la clase cuartil = LRScuartil- LRI cuartilni = Frecuencia absoluta de la clase cuartil

  • MEDIDAS DE POSICION2.- LOS DECILESEstas medidas describen diez posiciones en un conjunto de datos ordenados de menor a mayor.Para una lista de datos. Estos se ordenan de menor a mayor, para luego ubicar un decil a travs de: Dp = Y ( (n*p)/10)

    Donde p= 1,2,.9,10 y n= total de datos.Para una tabla con intervalos de clase. Se aplica la siguiente formula para encontrar un dato decil

    DondeLRI decil = Limite real inferior de la clase decilNi-1 = Frecuencia absoluta acumulada anterior a la clase decilA = amplitud de la clase decil = LRSdecil- LRI decilni = Frecuencia absoluta de la clase decil

  • MEDIDAS DE POSICION3.- LOS PERCENTILESEstas medidas describen cien posiciones en un conjunto de datosordenados de menor a mayor.Para una lista de datos. Estos se ordenan de menor a mayor,para luego ubicar un percentil a travs de: Pp = Y ( (n*p)/100)

    Donde p= 1,2,.99,100 y n= total de datos.Para una tabla con intervalos de clase. Se aplica la siguienteformula para encontrar un dato percentil

    DondeLRI percentil = Limite real inferior de la clase percentilNi-1 = Frecuencia absoluta acumulada anterior a la clase percentilA = amplitud de la clase decil = LRSpercentil- LRI percentilni = Frecuencia absoluta de la clase percentil

  • LOS PERCENTILESObservacin:Es posible calcular el porcentaje p% aproximado de datos hasta un percentil determinado, desde una tabla de frecuencia, a travs de:

  • MEDIDAS DE VARIABILIDADLas medidas de variabilidad de un conjunto de datos de una variable cuantitativa, entrega informacin acerca de la dispersin o variacin, a travs de las diferencias aritmticas entre los datos o entre los datos y una medida. Estas medidas de variacin pueden decir si los datos son similares o muy diferentes.

  • 1.- VARIANZA La varianza entrega informacin acerca de la dispersin o variacin de los datos, a travs del promedio del cuadrado de las diferencias entre los datos y el promedio de todos los datos.

  • 1.- VARIANZAPARA UNA LISTA DE DATOS: Sea Y1,Y2, ,Yn un conjunto de datos de una variable cuantitativa. Caso Poblacional:

  • 1.- VARIANZAPARA UNA LISTA DE DATOS: Sea Y1,Y2, ,Yn un conjunto de datos de una variable cuantitativa. Caso Muestral:

  • 1.- VARIANZAPARA UNA TABLA DE FRECUENCIA: Sean X1, X2, , Xk marcas de clase. Sean n1, n2, , nk frecuencias absolutas.

    Caso poblacional

  • 1.- VARIANZAPARA UNA TABLA DE FRECUENCIA: Sean X1, X2, , Xk marcas de clase. Sean n1, n2, , nk frecuencias absolutas.

    Caso Muestral

  • Observaciones de la varianzaLa varianza es siempre 0 Cuando la varianza es igual a cero, esto indica que los datos son todos iguales. Por tanto, si la varianza se acerca a cero entonces los datos son muy similares con respecto al promedio de estos datos. La interpretacin de la varianza se debe hacer considerando el cuadrado de las unidades de medicin que presentan los datos.

  • PROPIEDADES DE LA VARIANZA

    Sean Y1, Y2, , Yn un conjunto de datos de una variable cuantitativa. Sea c una constante conocida.1.- Si sumamos la constante c a cada dato: ( Y1+c; Y2+c; ;Yn+c). La varianza de estos datos transformados no sufren cambio. 2.- Si multiplicamos la constante c a cada dato: ( Y1*c; Y2*c; ;Yn*c). La varianza de estos datos transformados es S2(yi*c) = c2*S2

  • 2.- LA DESVIACION ESTANDAR Esta medida de variabilidad est relacionada con la varianza, pero se usa ms a menudo ya que esta medida se interpreta considerando las mismas unidades de medicin que presentan los datos. PARA UNA LISTA DE DATOS: Sea Y1,Y2, ,Yn un conjunto de datos de una variable cuantitativa.

    Caso poblacional: Se aplica la raz cuadrada al resultado de la varianza.

  • 2.- LA DESVIACION ESTANDARPARA UNA LISTA DE DATOS: Sea Y1,Y2, ,Yn un conjunto de datos de una variable cuantitativa Caso muestral: Se aplica la raz cuadrada al resultado de la varianza.

  • 2.- LA DESVIACION ESTANDARPARA UNA TABLA DE FRECUENCIA: Sean X1, X2, , Xk marcas de clase. Sean n1, n2, , nk frecuencias absolutas.

    Caso Poblacional

  • 2.- LA DESVIACION ESTANDARPARA UNA TABLA DE FRECUENCIA: Sean X1, X2, , Xk marcas de clase. Sean n1, n2, , nk frecuencias absolutas.

    Caso Muestral

  • Observaciones de la desviacin estndar1.- Esta medida de variabilidad puede aplicarse las propiedades mencionadas para la varianza, considerando la aplicacin de la raz cuadrada positiva.

    2.- La interpretacin de la desviacin estndar se hace considerando las mismas unidades de medicin que presentan los datos.

  • 3.- LA DESVIACION MEDIAEsta medida de variabilidad se basa en la diferencia absoluta entre cada dato y el promedio de estos datos. Por tanto, es una medida alternativa a la desviacin estndar. PARA UNA LISTA DE DATOS: Sea Y1,Y2, ,Yn un conjunto de datos de una variable cuantitativa.

  • 3.- LA DESVIACION MEDIAPARA UNA TABLA DE FRECUENCIA: Sean X1, X2, , Xk marcas de clase. Sean n1, n2, , nk frecuencias absolutas.

  • 4.- DESVIACIONES CUANTILICASEstas medidas permiten observar la variabilidad de los datos, a travs de la diferencia entre puntos de la distribucin de datos, y tienen la ventaja de recortar porcentajes de datos que pueden ser atpicos. a.- RANGO= MAX MINb.- RANGO INTERPERCENTIL = P90 P10c.- RANGO INTERCUARTIL = Q3 Q1d.- RANGO SEMINTECUARTIL=(Q3 Q1)/2

  • 5.- EL COEFICIENTE DE VARIACIONEsta medida de variabilidad entrega un ndice de variacin, el cual esta representado por la desviacin estndar con respecto al promedio de los datos.

    CV =DESVIACION ESTANDAR / MEDIA

    Este coeficiente puede explicar la variabilidad de los datos, a travs de un porcentaje, y es til cuando se trata de comparar la homogeneidad de las observaciones en diferentes poblaciones o muestras, las cuales pueden inclusive estar medidas en diferentes unidades de medicin ( litros. Metros, Segundos, etc. ). Por tanto, si el coeficiente de variacin se acerca a 0 entonces los datos son muy homogneos.

  • Ejemplo:Peso( Toneladas) rocas: 4,1 4,2 4,2 4,1 4,0Densidad de las rocas: 2,4 4,6 5,8 6,7 5,0 3,1Obtener el coeficiente de variacin en ambos grupos de datos. O. Qu tipo de datos presenta mayor homogeneidad?.