apuntes estadistica descriptiva

Upload: moloscura

Post on 19-Jul-2015

171 views

Category:

Documents


1 download

DESCRIPTION

APUNTES DE ESTADISTICA DESCRIPTIVA

TRANSCRIPT

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    1/33

    Apuntes de Estadistica Descriptiva

    Asignatura: Complementos de MatematicasProfesor: Dr. Manuel J.Galan Moreno

    E.T.S.A.

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    2/33

    , .Apuntes de Estadistica Descriptiva

    ESTADISTICA DESCRIPTIVAINTRODUCCION.FENOMENOS DETERMINISTAS Y FENOMENOS ALEATORIOS.FENOMENO DETERMINISTA.

    Se denomina fenomeno determinista a toda experiencia que, al ser repetida en condiciones que nosotrosconsideramos similares, produce siempre el mismo resultado, dentro de unos Iimites razonables de precision.

    La mayorfa de los fenomenos macroscopicos estudiados por las ciencias de la naturaleza y de la vida.FENOMENO ALEATORIO.

    Las experiencias que, al ser repetidas en condiciones que estimamos similares, nos llevan a resultados diferentesconstituyen los llamadosfenomenos aleatorios. Ellanzamiento de un dado. El mimero de usuarios que acuden a un banco en un determinado intervalo horario. Las consecuencias de la administracion de una medicacion.CARACTERIZACION DE LOS FENOMENOS ALEATORIOS. Se pueden repetir en condiciones esencialmente analogas. Existe un conjunto que contiene todos los resultados posibles (Universo 0espacio muestral). Antes de realizar el experimento no se puede predecir el resultado exacto. La frecuencia relativa de cada resultado tiende a estabilizarse al repetir indefinidamente el experimento.l PORQUE EXISTEN FENOMENOS ALEATORIOS ? Imposibilidad de controlar todos los factores y condiciones iniciales que influyen en el resultado del

    experimento. Existencia de un mimero indeterminado de variables que pueden afectar al resultado Complejidad 0desconocimiento de las leyes que rigen el fenomeno,

    CONCEPTO DE ESTADISTICA.Es el conjunto de procedimientos que nos permiten estudiar los fenomenos aleatorios.La palabra Estadfstica se utiliza tambien como sinonimo de dato 0 resultado de la elaboraci6n de un conjunto de

    datos mediante tecnicas estadisticas.OBJETO MATERIAL DE LA ESTADISTICA.

    Los fen6menos aleatorios.OBJETO FORMAL: EL METODO ESTADISTICO.

    Prescinde de 10 individual y de los razonamientos de tipo causal, para considerar regularidades 0 propiedadesaplicables a un conjunto de datos e inferir propiedades sobre la totalidad del fen6meno estudiado.IMPORTANCIA DEL METODO ESTADISTICO.Permite la induccion incompleta. Es decir, permite la obtenci6n de conclusiones acerca de un conjunto sin necesidadde estudiar todos y cada uno de los elementos que 10componen.

    El metoda estadfstico permite abordar el estudio de fen6menos abarcan casi todas las areas del conocimiento y, altener un caracter generico, puede incorporarse como parte del metodo del resto de las ciencias.

    EL METODO CIENTIFICO Y EL METODO ESTADISTICO.ETA PAS DEL METODO CIENTIFICO. Observaci6n de un fen6meno. Planteamiento de hip6tesis que expliquen el fen6meno observado. Deduccion, a partir de las hip6tesis propuestas, de consecuencias que puedan ser verificadas mediante

    experimentos. Verificaci6n experimental de las consecuencias. Resoluci6n sobre la idoneidad de las hip6tesis segun los resultados de la experimentaci6n.

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    3/33

    ETAPAS DEL METODO ESTADisTICO. Definicion de OBJETIVOS. Definicion de UNIVERSO y MUESTRA. Definicion de TERMINOS y UNIDADES de medida. Determinacion de los DATOS necesarios. Recoleccion de los datos. Elaboracion de los datos. Descripcion, analisis e interpretacion de los datos.

    Apuntes de Estadistica Descriptiva

    CONCEPTO DE POBLACION Y MUESTRA.POBLACION 0 UNIVERSO.

    Conjunto de elementos que poseen una caractenstica 0 propiedad comun, y que constituyen la totalidad de losindividuos de interes para nuestro estudio.MUESTRA.

    Cualquier subconjunto de la poblacion sobre el que se realizan los estudios para obtener conclusiones acerca de lascaracterfsticas de la poblacion.INDIVIDUO.

    Cada uno de los elementos de la muestra 0 de la poblacion . No tienen por que ser objetos ffsicos. V gr: ellanzamiento de un dado.

    Al realizar un estudio estadfstico, no solo es necesario definir la poblacion de referencia y la muestra que se va autilizar, tambien hay que especificar que caracteristicas aleatorias de los individuos vamos a tener en cuenta. Porejemplo: intencion de voto, resultado de un tratamiento, puntuacion de un dado, ...

    Las caracteristicas aleatorias suelen corresponder a variables numericas y si no es asi, siempre pueden codificarsenumericamente, Una caracterfstica aleatoria definida numericamente es 1 0 que denominamos variable aleatoria.

    FASES 0 NIVELES DEL METODO ESTADisTICO.ESTADisTICA DESCRIPTIV A.Recopilacion y analisis de los datos. Pueden ser datos referentes a toda la poblacion 0 solo a una muestra, pero eneste ultimo caso no se pretende sacar conclusiones acerca de la poblacion a la que pertenece la muestra.TEORiA DE LA PROBABILIDAD.

    Es la teoria maternatica en la que se basa la posibilidad de realizar inferencias acerca de las propiedades de lapoblacion partiendo de la informacion contenida en la muestra.

    Historicamente se desarrollaron por separado la Estadfstica Descriptiva, que es la parte mas antigua (hasta lascivilizaciones mas primitivas realizaban censos 0 recuentos de poblacion), y la teorfa de la probabilidad, que surgiocomo un divertimento mate matico aplicable al estudio de los juegos de azar. Fue a finales del siglo pasado cuando seaprovecho el fmpetu que alcanzo el formalismo matematico para combinar ambas, obteniendo la posibilidad de realizarinferencias sobre toda una poblacion a partir del estudio de una muestra.ESTADisTICA INFERENCIAL OINDUCTIVA.Utiliza la informacion que se desprende del analisis de una muestra para realizar una estimacion de las propiedadesde la poblacion de la que se extrajo.

    ORGANIZACION DE DATOSESCALAS DE MEDIDA.MEDIDA.

    Medida es la asignacion de mimeros a los objetos 0 sucesos segun ciertas reglas. Los fenomenos se presentan endistintas modalidades. Realizar una medida sobre un fenomeno equivale a asociar un valor numerico -y solo uno- a cadauna de las distintas modalidades en las que se puede presentar.ESCALA DE MEDIDA.

    Es una regia 0patron que permite asociar, de forma biunivoca, modalidades y mimeros,2

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    4/33

    Apuntes de Estadistica DescriptivaDe acuerdo con las relaciones que pueden establecerse entre las distintas modalidades que presenta un fen6meno,

    tenemos los distintos tipos de escalas de medida que aparecen en el cuadro de la pagina siguiente.ESCALAS NUMERICAS.ESCALA NUMERICA DISCRETA 0DISCONTINUA.

    Es aquella en la que entre dos valores de la rnisma no siempre podemos situar otro. Vgr.: Numero de intervencionesquinirgicas en un dia.Con mayor rigor, es aquella que puede relacionarse mediante una aplicaci6n biyectiva con el conjunto de los

    mimeros Naturales 0 con un subconjunto de este.ESCALA NUMERICA CONTINUA.

    Es aquella en la que, dados dos valores cualesquiera, siempre podemos encontrar otro intermedio entre ellos. Vgr.:El peso, la estatura ...

    Con rigor, es aquella que puede ponerse en correspondencia biumvoca con el conjunto de los mimeros Reales.Tabla 1:Tipos de escalas de medida

    Escala Operaciones Requisitos Estadisticos Ejemplo.posibles validos

    Nominal Verificar la igualdad Posibilidad de Frecuencia, Moda. Estado civil, Sexo,de dos modalidades. permutar nacionalidad.modalidades.

    Ordinal Verificar si una Mantenirniento del Mediana, cuantiles. Gravedad de unamodalidad es mayor orden. lesi6n.que otra.

    De intervalo Comparar las Unidad constante. Media aritmetica, Temperatura.diferencias entre dos desviaci6n tipica.modalidades.

    De razon Establecer razones Existencia de cero Media geometrica, Peso, altura ...entre modalidades. absoluto. coef. de variaci6n.

    TABLAS Y GRAFICOS ESTADISTICOS:La organizaci6n de los datos recogidos en un trabajo estadfstico es imprescindible para su aprovecharniento y mejor

    comprensi6n. La forma id6nea de realizar este proceso es a traves de tablas y graficos. Para ella es preciso tener encuenta las siguientes recomendaciones:1. Graficos y tablas deberan estar rotulados de forma clara, de modo que se expliquen por sf solos. Si se utilizan

    c6digos 0 abreviaturas deben explicarse a pie de pagina. Todas las filas y columnas de las tablas estaranencabezadas, y los ejes de los graficos rotulados.

    2. Siempre que tenga sentido, las filas y column as de una tabla deberan estar totalizadas.3. Las unidades de medida han de estar claramente definidas.4. Se deben evitar las tablas 0 graficos excesivamente complejos. Es preferible realizar varias tablas simples antes

    que una compleja.

    DISTRIBUCION DE FRECUENCIAS.FRECUENCIA ABSOLUTA.

    La frecuencia absoluta de una modalidad es el niimero de veces que se repite esa modalidad como resultado de unexperimento.FRECUENCIA RELATIV A.

    Es la frecuencia absoluta partida por el rnimero total de observaciones.FRECUENCIA ACUMULADA (Absoluta 0 relativa).

    IguaJ que en cada uno de los anteriores casos pero sumando, no s610, los resultados de la modalidad de que se trate,sino tambien los de todas las precedentes. No es valido para datos de escalas nominales, ya que en ellas no existe elorden.

    3

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    5/33

    , .

    DISTRIBUCION DE FRECUENCIAS. Apuntes de Estadistica Descriptiva

    Es una disposicion organizada de los datos recogidos en un estudio. Contiene un listado de las distintas modalidadesdel fenomeno considerado, con la frecuencia absoluta, relativa y acumulada de cada una. Cuando el mimero demodalidades es demasiado grande (esto ocurre siempre con las escalas continuas) se agrupan en clases.

    DISTRIBUCION DE FRECUENCIAS: REGLAS PRACTICAS.1. Las clases han de ser excluyentes.

    2. Los limites de cada clase deben tener mas precision que las medidas realizadas.

    3. Aunque no tiene que ser necesariamente asi, es conveniente que la amplitud de los intervalos sea constante.

    4. Todos los datos de una clase quedan representados por la marca de clase, que es el valor medio de intervaloque forma la clase. De esta manera, todos los calculos se realizan como si en lugar de tener N valoresdistintos en una clase, tuvieramos Nveces la marc a de clase.

    MODELOS DE TABLAS ESTADisTICAS.Modelo de tabla para variables cuantitativas discretas.

    Variable. Frecuenciaabsoluta.

    Frecuencia absolutaacumulada.

    Frecuencia relativa. Frecuencia relativaacumulada.

    Xl nl nl f1= nUN FI = f1X2 n2 nl + n2 f2 = n2IN F2= f1 + f2

    Xi N i fl = ni/N tfjFi= j=!

    Xn Nn f1=nnlN tfjFn= j=! = IN

    4

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    6/33

    Apuntes de Estadistica Descriptiva

    Modelo de tabla para variables cuantitativas continuas.Clases 0 Marca de clase Frecuencia Frecuencia absoluta Frecuencia Frecuencia relativaintervalos absoluta. acumulada. relativa. acumulada.[ao,al) Xl=(ao+al)/2 nl nl fl = n/N Fl = fl[al,a2) X2=(al+a2)/2 n2 nl + n2 f2 =n/N F2= fl + f2

    [aj_l,aj) Xj=(aj_l+aj)/2 N i fl = n/N i1 L n j L f ji=j=) i= :

    nFn= L f j = 1

    j;JN

    VARIABLES CUANTITATIVAS CONTINUAS: NORMAS PARA LA ELABORACIONDETABLAS.

    1 Obtener e1 rango 0 amplitud de los datos. Es la diferencia entre el valor maximo y el valor mmimo.2 Determinar el mimero de intervalos. Pueden tomarse tantos intervalos como se quiera, pero es aconsejable

    que sea en torno a 10.3 Calcular la amplitud de los intervalos, que es igual al rango dividido por el mimero de intervalos.4 Determinar ellimite superior del ultimo intervalo y ellimite inferior del primero.5 Calcular la marca de clase de cada intervalo, que no es otra cosa que el punto medio del intervalo.

    REPRESENTACION GRAFICA DE DATOS ESTADisTICOS.La representacion grafica de datos tiene la ventaja de que es capaz de ofrecer de forma inmediata una perspectiva

    global de los resultados de un estudio.A continuacion aparecen algunos de los formatos mas utilizados

    . .0.r! . . . . .o lI SlI S .r!t {)~Q) Q)III :: s. g oQ)1 -1Q) r ..'t101Z

    Histograma de frecuencias

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Categorias 0:inte:t:Vabs.

    5

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    7/33

    .. . ,

    Apuntes de Estadistica Descriptiva

    C D lI Ss : : O M0 t)Q) O M s ::'tl o Q)lI S :: t01 t t)z (J)(J) 1 -1III r z ..Q0

    Histograma de frecuencias acumuladas

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Categoms 0:inte:tVaJos.

    Poligono de frecuencias350300

    N2 de observaciones(Frecuencia)

    Categorias 0 intervalos.

    Poligono de frecuencias acumuladas

    250

    150

    200

    N2 de observaciones(Frecuencia)

    Categorias 0 intervalos.

    ANALISIS DE DISTRIBUCIONES DE FRECUENCIASUNIDIMENSIONALES.INTRODUCCION.DEFINICION.

    Una serie de datos decimos que es unidimensional cuando se refiere solamente a una variable.6

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    8/33

    , .OBJETO DEL ANALISIS. Apuntes de Estadistica Descriptiva

    Reducir una serie de datos a unos pocos coeficientes que contengan la mayor parte de la informacion relevante, conel fin de descubrir regularidades estadisticas en el colectivo analizado.COEFICIENTES MAS IMPORTANTES:MEDIDAS DE POSICION 0CENTRALlZACION:

    Tratan de identificar el valor mas representativo de la distribucion. Es decir, si tenemos que comparar el salario delos espafioles con el de los franceses, no tendrfa sentido estudiar individuo a individuo, sino que seria mas practicerepresentar el salario de los espaiioles por un determinado valor y el de los franceses por otro, y comparar esos dos. Elvalor que se elija para representar el salario de todos los espafioles sera una medida de posicion que, en funcion denuestros intereses, puede ser la media, la mediana, la moda, etc.MEDIDAS DE DISPERSION:Determinan el grado de alejamiento de los datos respecto a una medida de posicion que, generalmente, suele ser lamedia aritmetica. Nos dan una idea acerca de 10 agrupados que estan los datos, y por 10 tanto rniden lahomogeneidad de estos.

    MEDIDAS DE FORMA:Miden el grado de deformacion respecto a una curva patron tdistribucion Normal).

    NOTACION.Xj = Valor asociado a la modalidad i.Cuando las modalidades se agrupan en clases, denota Ia marca de clase.O J = Frecuencia absoluta de la modalidad i.I Numero de modalidades 0de clases ..N =Niimero total de observaciones:

    MOMENTOS.CONCEPTO Y UTILIDAD.

    Es un artificio que nos permite unificar el tratamiento matematico de los principales coeficientes de la EstadisticaDescriptiva.MOMENTO DE ORDEN P RESPECTO DE UN PUNTO x;

    1 Iapx o = I,n; (X; x o YN ;=1MOMENTO ORDINARIO DE ORDEN P.

    Es un momento en el que X o O.1 I-.=-I,niX;PN i=1

    MOMENTO CENTRAL DE ORDEN P.Es un momento en el que X o =media aritmetica.

    1 ~ ( _ ) Pmp =-Ltn; Xi-XN ;=17

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    9/33

    MEDIDAS DE POSICION.MEDIAS.MEDIA GENERALIZADA DE ORDEN P.

    1 IM = P ia = p "" n .XPp \fup N f : t I IPropiedad: Xp

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    10/33

    Apuntes de Estadistica DescriptivaLa media aritmetica ponderada es muy util cuando se considera que los distintos valores promediados tienen una

    importancia desigual.La relaci6n sobre las distintas medias realizadas sobre una misma serie de datos es la siguiente:H

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    11/33

    , ,

    Apuntes de Estadistica DescriptivaPor ejemplo, si la duracion media de las intervenciones en un quir6fano de urgencias es de 100 minutos, con una

    desviacion tipica de 8', entonces podemos decir que tendran una duracion entre 76' y 124' mas del 89% de lasintervenciones, ya que hemos tornado un intervalo de 3s en tomo a la media y, por 10 tanto, 1 - 11 32 = 1 1/9--- 0.889

    Una cuesti6n diferente es la de comparar la dispersion de dos series de medidas referentes a variables distintas 0incluso a una misma variable pero con valores medios diferentes. Por ejemplo: estudiamos el tiempo que tardan enrealizar una complicada intervenci6n quinirgica diversos equipos medicos encontramos que su promedio es de 210' conuna desviaci6n tfpica de 17'; por otro lado, estudiamos el tiempo promedio en la realizaci6n de una primera visita deconsultas extemas y constatamos que es de 14' con un desviaci6n tfpica de 6'. En un primer analisis, podrfamos pensarque la dispersi6n en los tiempos medidos es mayor en el primer caso, sin embargo, no es asf, pues, a pesar de que ladesviacion tfpica es mayor, tiene menos importancia una variacion de 17' frente a un total de 210', que una variaci6n de6' frente a un total de 14'. Por 10 t anto podrfamos concluir que la actuaci6n de estos equipos es mas homogenea en suactuaci6n quinirgica que en consulta.

    EI coeficiente de variacion nos habrfa llevado a este resultado directamente, ya que precisamente calcula laimportancia relativa de la desviaci6n tfpica respecto de la media. Asf, en el primer caso C.V.= 0.08 (8% expresado enporcentaje) mientras que en el segundo C.V.=0.43 (43%).Es frecuente que, en lugar de la desviacion tipica, se utilice ladenominada Desviacion Standard, que se calcula a partir de aquella mediante la relaci6n:

    O'=s iii=VN- i 1 ~ 2-2--L.Jnx. -XN-l ;=1 I IEn estadfstica Inferencial se utiliza apreferentemente a s, ya que, como mas tarde veremos, el valor de oes el mejorestimador de la desviaci6n tfpica poblacional partiendo de la muestra.

    MEDIDAS RESISTENTES DE DISPERSION.Son las que, igual que la mediana, no se yen afectadas por los datos extremos. La mas resistente en este caso es el

    rango intercuartilico, y algo menos, la desviacion media.

    ANALISIS DE LA FORMA.COEFICIENTES DE SIMETRIA-ASIMETRIA.

    A) gl = ~S3x-MB)--s

    INTERPRETACION:gl > 0 ===> Curva asimetrica positiva.gl = 0 ===> Curva simetrica,gl < 0 ===> Curva asimetrica negativa.

    COEFICIENTE DE APUNTAMIENTO 0 CURTOSIS.m__ 4

    2 - iINTERPRETACION:g 1 > 1 ===> Leptociirtica.

    g 1 = 1 ===> Mesocurtica.g 1 < 1 ===> Platiciirtica.

    SIGNIFICADO:Leptocurtica: Mas apuntada que la normal.Mesociirtica: Simula a la normal.Platiciirtica: Mas achatada que la normal.Los graficos de las paginas siguientes aclaran un poco estos conceptos.

    10

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    12/33

    Apuntes de Estadistica DescriptivaSimetria

    .,/ .\\

    I \J \

    ., \/,, \;_;.- '..

    SimetricaAsimetricaAsimetrica negativa

    Curtosis

    . . . . . . . . . . .

    Me s o cu rticaLeptocurticaPlaticu rtica

    - _ .TRANSFORMACIONES.CONCEPTO.

    A veces los datos que nos interesan no son exactamente los que hemos recogido, sino otros que se derivan de estes atraves de una transformaci6n; otras veces, una transformaci6n puede simplificar los datos, haciendo mas c6modo sumanejo.EFECTOS DE UNA TRANSFORMACION LINEAL y = a + bx

    Media: y = a +bxMediana:Desviaci6n Tipica:Medidas de forma:

    My=a+bMxsy=lb l sxNo varian.TRANSFORMACIONES NO LINEALES y = f(x)

    Mediana: M y = f( M x)'EI resto s610 puede calcularse, en general, de forma aproximada:Media: y "" I(x )Desviaci6n Tfpica: Sy "" J' (x )

    11

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    13/33

    Apuntes de Estadistica DescriptivaANALISIS DE DISTRIBUCIONES DE FRECUENCIASMULTIDIMENSIONALES.DEFINICION.

    Una serie de datos decimos que es MULTIDIMENSIONAL cuando para cada individuo recogemos informaci6nacerca de mas de una variable.TABULACION. DISTRIBUCION CONJUNTA. DISTRIBUCIONESMARGINALES Y CONDICIONADAS.DISTRIBUCION BIDIMENSIONAL: X, Y.

    Si solamente estudiamos 2 variables X, Y, podemos representar los datos en una tabla de doble entrada, de modoque, en la cabecera de las filas ponemos las modalidades de una de las variables y en la cabecera de las columnas las dela otra. En las celdillas que se forman se anota el mimero de observaciones que presentan a la vez las caracteristicas de lafila y la columna en la que se encuentran. A esta estructura se le denomina distribuci6n conjunta 0, en el caso devariables cualitativas, tabla de contingencia.

    En la siguiente pagina aparece un modelo general para tablas de una distribuci6n bivariable.Distribucion conjunta defrecuencias para dos variables.

    XX l X ? ... X li

    YI nll nI2 ... nln nL nIjj=iY Y2 n2I n22 ... n2n nL n2j

    j=)

    ...Ym nmI nm2 ... nmn nL nmjj=i

    Las distribuciones que aparecen en el margen inferior y en el derecho son, en realidad, las distribucionesunivariables de X y de Y consideradas por separado, y se denominan distribuciones marginales.

    Se denomina distribucion condicionada de, por ejemplo, Y para X = x a la distribucion que aparece en la columna i.EJEMPLO:Hemos recogido el rnimero promedio de clientes que acuden al banco teniendo en cuenta 2 variables:X = Resultado del negocio: Ingreso en efectivo, otras operaciones.y = Dfa de la semana: Lunes-Jueves(L),Viemes (V), Sabados (S).La distribucion conjunta es la siguiente: Resultado

    II!&reso OtrasLunes-Juev, 30 157 187Viemes 61 228 289Sabados 57 187 244

    148 572 720

    Distribucion marginal de XFrecuencia Frecuencia relativa

    IngresoOtrasTotal

    148572720

    0.2060.7941

    12

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    14/33

    ,Apuntes de Estadistica DescriptivaDistribucion marginal de Y

    Frecuencia Frecuencia relativaLVS

    187289244

    0.2600.4010.339

    Total 720

    Distribuci6n marginal de Y para X=IngresoFrecuencia Frecuencia relativa

    LVS

    30615 7

    0.2030.4120.385

    Total 148

    DISTRIBUCIONES CON MAS DE 2 VARIABLES: X1, X2, ... , Xm.Los conceptos son similares a los presentados en el caso de dos variables, pero con la diferencia de que no esposible tabular los datos de la misma forma, ya que la unica posibilidad es detallar los resultados para cada individuo:

    Distribucion conjunta de frecuencias para m variables.IVariableIndividuo Xl Xz Xj Xm1 xJJ X12 xlj x]m2 xZI Xn xZ i x2m

    xi] X iZ x., Xjro11n xu 1 Xu? x v ; xpm

    La estructura resultante es una matriz de n filas por m columnas, denominada matriz de datos.

    VECTOR DE MEDIAS.Si consideramos cada una de las variables por separado (DISTRIBUCI6N MARGINAL), podemos tratarla como

    una distribuci6n univariable, calculando su media. Con el resultado obtenido, podemos construir un vector de dimensi6nm, que se denomina VECTOR DE MEDIAS Yque contiene la media de cada variable:

    X = [ X I ' X 2 , ... , X n]MATRIZ DE VARIANZAS Y COVARIANZAS. COEFICIENTES DECORRELACION.VARIANZA.

    Igual que sucede con la media, podemos calcular la varianza de cada variable por separado, denotando S? lavarianza de Xi'COVARIANZA.

    Se define la covarianza entre dos variables X e Y como:nL ( X ; - : X ) ( Y i - y )S = -,i~=l,-- _

    xynN6tese que Sxx= Sx2 .

    La covarianza no tiene porque ser necesariamente positiva, cosa que sf sucede con la varianza.13

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    15/33

    , r

    Apuntes de Estadistica DescriptivaSIGNIFICADO DE LA COYARIANZA:La covarianza expresa el grado de variaci6n conjunta de dos variables.En este sentido puede suceder que:COY ARIANZA > 0 ===> Cuando aumenta una de ellas, tambien aumenta la otra.COYARIANZA Cuando aumenta una, la otra disminuyeCOVARIANZA = 0 ===> No hay relacion entre los aumentos de una y otra.Estas relaciones pueden ser de mayor 0 menor intensidad, segun la magnitud de la COY ARIANZA. El mayor

    inconveniente de la covarianza es que su magnitud no s610 depende del grado de variaci6n conjunta de las variables,sino tambien de la dispersion de cada variable. Para eliminar la influencia de este ultimo factor, se utiliza el denominadocoeficiente de correlaci6n.COEFICIENTE DE CORRELACION:

    Sr=~SxSyEs un coeficiente adimensional cuyo valor es siempre mayor 0 igual que -1 y menor 0 igual que 1.Si Irl=1 ===> La variacion conjunta es maxima, de modo que existe una relacion lineal perfecta entre las variables

    que puede expresarse mediante una ecuacion del tipo Y = a + bX, por 10que podemos prescindir de una de elIas.VARIANZA GENERALIZADA: MATRIZ DE VARIANZAS Y COYARIANZAS.Dada una distribucion multidimensional con m variables, se define la varianza generalizada:

    SI2 1 S t2 S t3 s ;S~I S~ 2 S~ 3 s :

    S= S ;I S;2 S;3 S;n

    S;'I S;'2 S ;'3 s :S es una matriz simetrica semidefinida positiva.

    CORRELACION Y REGRESION ENTRE DOS VARIABLES.CORRELACION.

    Decimos que existe una asociacion, concordancia 0 correlacion entre 2 variables cuando cierta 0 ciertasmodalidades de una de elIas estan ligadas a cierta 0 ciertas modalidades de la otra. Tambien podrfamos decir que, en talcaso, la modificacion, en deterrninado sentido, de una de las variables tiende a asociarse con modificaciones en la otra.CORRELACION Y CAUSALIDAD:

    La correlaci6n entre variables no implica una relacion causal, sino solamente una variaci6n conjunta. Existennumerosos ejemplos que ilustran esta idea. Vgr: G.M. Jenkins encontro un coeficiente de correlacion r= 0.995 entre elmimero de nacirnientos y el mimero de ciguefias en Baviera.

    En muchas ocasiones la correlacion se debe al influjo de una tercera variable. Vgr.: Existe una correlacion positivaentre el mimero de telefonos y el mimero de accidentes de trafico, Esto no significa que la abundancia de telefonosorigine mas accidentes de trafico. Lo que sucede es que el mimero de telefonos esta relacionado con un mayor nivel devida, y a su vez, este implica una mayor abundancia de automoviles, que es la que realmente esta relacionada con elmimero de accidentes.VARIABLES CUANTITATIVAS.COEFICIENTE DE CORRELACION LINEAL DE PEARSON.DEFINICION:

    PROPIEDADES :a) -1 ~ rxy ~ 114

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    16/33

    Apuntes de Estadistica Descriptiva

    c) Es invariable bajo transformaciones lineales: X'=a+bX}, d = = = > r x' . = r x yy =c+ y yINTERPRETACION:Los valores extremos no plantean duda:a) l ' x y l = l ? Hay una relacion lineal perfecta, por 10 que podemos calcular exactamente que valor de la segundavariable se asocia con cada uno de los de la primera, 0 viceversa.b) ' x y = 0?No existe ninguna relacion entre las variables.La interpretacion de otros valores es muy relativa y depende de cada estudio. En general suele aceptarse la siguienteclasificacion:o : : ; I r x y i

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    17/33

    Apuntes de Estadistica DescriptivaLA RAZON DE CORRELACION DE Y SOBRE X: llyx .Suponemos que hemos realizado un estudio sobre N individuos midiendo, para cada uno de ellos los valores de dosvariables: X e Y. Agrupamos las distintas modalidades de X en m clases, de modo que a cada clase Ie correspondanvarios valores de Y, tal y como se expresa en la siguiente tabla:

    XIndividuo Clase 1 Clase 2 Clasej Clase mYu Y 12 Y l j Y 1m2 Y 21 Y 22 Y 2j Y 2m

    Y il Y i2 Y i j Y imY Y Y . . Y

    mPor supuesto N = Lnj

    j=tEl mimero de valores de Y que le corresponden a la clase j es nj Y la media de estos sera:_ 1 nYj =-~)~jnj r=I

    _ 1 m njLa media de todos los valores de Y es: Y = - L L Y ; jN j=1 i=1Si queremos asociar a cada clase de X un valor de Y, tenemos dos posibilidades:

    1. Asociar ala clase j el valor ~ . Para evaluar el error cometido podemos calcular la sumade los errores cometidos al sustituir cada puntuacion Yij por Y , esto es:t ( Y ; j - ~ )i=1Como esta suma seria cero, hacemos la suma de los mismos terminos al cuadrado, de forma que todos los terminossean positivos:

    r= IA este tipo de suma se Ie denomina suma de errores cuadraticos.2. Asociar a todas las clases el valor f.En este caso, la suma de errores cuadraticos sera:E2 = i: t ( Y ; j -ft

    j=i i=1Estas dos sumas estan relacionadas de la siguiente manera:

    E2 = i: t ( Y ; jj=1 i=1

    Con 10 quem _ 2

    Es decir, el termino Ln j ( Y j - Y ) representa la diferencia entre el error cometido al actuar segun la opcion 2 Yj=1

    el error cometido al actuar segiin la opcion 1.

    16

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    18/33

    Apuntes de Estadistica Descriptivatnj(~-ft

    1 1 2 _ . . , :1 , - = . ; . .1 _'IXY - m njL L ( Y ; j f ) 2

    j=1 ;=1representa la proporci6n de error que se elimina al tener la opci6n 1 en lugar de la opci6n 2.A 1 1 =ge Ie denomina Razon de Correlacion.Por 1 0 tanto, el cociente:

    PROPIEDADES1. Al tratarse de una proporci6n 0 : : s ; 11yx : : s ; 1.2. Para unos mismos datos rxy : : s ; 11yx .3. Como rxy mide la relaci6n lineal entre X e Y y 11yx mide la relaci6n tanto lineal como no lineal,

    entonces 11yx - rxy mide el alejamiento de linealidad en la relaci6n entre X e Y.4. 11yx: l= 11xy.5. 11yx varia segun el mimero de clases que tenemos. Si tomamos una sola clase ~ 11yx = 0; sitomamos tantas clases como modalidades tenemos de Y ~ 11yx =1.

    VARIABLES ORDINALES.SIGNIFICADO DE LA RELACION ENTRE 2 VARIABLES ORDINALES.

    La relaci6n entre 2 variables ordinales mide el grado de acuerdo entre 2 ordenaciones diferentes de una misma seriede valores. Vgr.: Solicitamos ados jefes de servicio que establezcan un orden de prioridades entre 5 medidas deactuaci6n propuestas por la Direcci6n de un hospital. En tal caso tendremos dos variables:

    X = orden asignado por el jefe de servicio mimero 1.Y = orden asignado por el jefe de servicio numero 2.

    Propuesta X YABCDE

    COEFICIENTE DE SPEARMAN: r..Si llamamos di = xi - Yi ' es decir la diferencia entre el orden que ocupa el sujeto i en la ordenaci6n X con el queocupa en la ordenaci6n Y, entonces:

    n6 L d ; 21 " , = 1- ( ;= ~ )n n -1En realidad rs = rxy' tratando los ordenes como si fueran mimeros: 1_= 1,2-= 2 ...

    PROPIEDADES:Son las mismas que las de rxy ya que en realidad rs es un caso particular de rxy'COEFICIENTE DE CORRELACION 't DE KENDALL.

    Dados dos sujetos, si el orden que tienen entre si en la ordenaci6n X es distinto del que tienen en la Y decimos quese da una inversi6n. Vgr.: En el caso anterior, se da una inversi6n entre los elementos 1 y 2, ya que para X el2 esta antesque el 1 y para Y el 1 esta antes que el 2; Sin embargo no hay inversi6n entre 1 y 3, ya que tanto X como Y consideranque la propuesta 1 es prioritaria sobre la 3.Si denominamos:

    17

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    19/33

    Apuntes de Estadistica DescriptivaP =mimero de no inversiones.Q =mimero de inversiones.Se define: P QT=--P+QN6tese que P + Q = n(n - 1)/2De acuerdo con la definici6n -1 :::;T :::; 1.

    COEFICIENTE DE CORRELACION Y DE GOODMAN Y KRUSKAL.Tanto rs como T son utiles cuando no hay empates entre las ordenaciones. En caso de que si los haya, es mucho

    mas apropiado el coeficiente y.En este supuesto, al analizar la situaci6n relativa de 2 elementos hay 3 resultados posibles:No inversi6n: Idem al caso anterior.Inversi6n: Idem al caso anterior.Empate: Si tienen el mismo orden de preferencias en Y en X 0en ambos.Si denominamos, respectivamente, P, Q, S al mimero de pares que se encuentran en cada una de las situaciones

    anteriores, se define:P Q P-QY= P+Q - P+Q = P+Q

    En realidad el calculo es similar a T, pero descartando del total los pares empatados.Tambien en este caso -1 :::;y :::;1.

    VARIABLES NOMINALES.CONCEPTOS PREVIOS.

    Decimos que una variable nominal es DICOT6MICA cuando s610 tiene 2 modalidades. Vgr.: Sexo, nacionalidad.A veces interesa tratar variables que no son dicot6micas como si 10 fueran. Para ella basta con agrupar todas las

    modalidades en dos clases. En este caso diremos que la variable esta dicotomizada.La tabulaci6n general de una variable dicot6mica queda recogida en la siguiente tabla de contingencia:I Variable X II Variable Y

    la+c Ib+d In=a+b+c+d

    RELACION ENTRE VARIABLES DICOTOMICAS.COEFICIENTE Q DE YULE.

    a bSi no hay relaci6n entre X e Y => - = - -7 ad = be -7 ad be = O .c dCuanto mayor sea ad - be mayor sera la relaci6n. Para evitar que esta diferencia pueda crecer ilimitadamente

    formamos el cociente:Q= ad-be

    ad+beNuevamente se verifica -1 :::;Q :::; 1

    COEFICIENTE DE CORRELACION c p oSe obtiene al calcular r x y para dos variables dicot6micas, y vale:

    cb+ad~=-r================) (a + b ) ( c + d ) ( a + e ) ( b + d )

    18

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    20/33

    Apuntes de Estadistica DescriptivaRELACION ENTRE VARIABLES NOMINALES NO DICOTOMICAS.

    En este caso la tabla de contingencia sera del tipoX

    y X X. XY1 n l l n12 n I} n Im n1.Y2 n2 I n2 2 n2 j n 2m n2.Yi n il n i2 n ij n im nI.Yu nul n u2 n.; nnw nu

    n n nNOTA: La notaci6n n i. y n.} es muy cormin para denotar las frecuencias marginales de X e Y.

    COEFICIENTE X2.No debe confundirse con la distribuci6n X 2 , aunque cuando n es muy grande sus distribuciones se aproximan

    bastante.Su calculo se basa en la comparaci6n de frecuencias te6ricas (las que cabe esperar supuesto que no exista ningunarelaci6n entre las variables) y frecuencias experimentales (las realmente obtenidas).

    Asi, para la celda ij tenemos:Frecuencia experimental: Jij=ni/NSi no hubiese relaci6n entre las variables, entonces ni/n.j=ni.IN 0 10 que es 10 rnismo, n i/n i. = n ./NA partir de cualquiera de ellas, llegamos a la conclusi6n de que, para que no haya relaci6n entre las variables, debe

    verificarse: n ..= n ,n INIJ .J I.De esta forma definimos laFrecuencia Te6rica: Fi j=n.j 'ni/NCon estas premisas, podemos defmir:

    n m ( F _ F ) 2 n m 2x 2 =L L J ij ij =L L nij - Ni=1 j=1 F;j i=1 j=1 F;jUn inconveniente de este coeficiente es que no esta acotado. Es decir, puede tener cualquier valor mayor que 0, y

    este valor sera tanto mayor cuanto mas crezca N. Para evitarlo definimos el coeficiente de contingencia C.

    De este modo 0

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    21/33

    Apuntes de Estadistica Descriptivax = Media de los valores de X que tienen la modalidad 2 de Y.Otros coeficientes son el coeficiente de correlaci6n biserial fb y el coeficiente de correlaci6n tetrac6rica.

    COEFICIENTE DE CORREIA CION BISERIAL PUNTUAL fbp .Se utiliza cuando tenemos una variable X continua y otra Y dicot6mica. Para calcularlo asignamos a una de las

    modalidade~ de es~ ultima el valor 0 y a otra ell, y aplicamos la definici6n de r x y . EI valor obtenido sera:X Xr-> p q ; p q

    p syp = proporci6n de personas que tienen la modalidad 1 de las dos posibles que tiene Y.q = Proporci6n de personas que tienen la modalidad 2 de las dos posibles que tiene Y.Xp = Media de los valores de X que tienen la modalidad 1 de Y.Xq = Media de los valores de X que tienen la modalidad 2 de Y.Otros coeficientes son el coeficiente de correlaci6n biserial fb y el coeficiente de correlaci6n tetrac6rica.

    REGRESION LINEAL.CONCEPTO.

    La simple constataci6n de la existencia de una asociaci6n entre variables no permite realizar predicciones sobre losvalores que adoptara una variable al asignar valores a la otra.

    Para ella es necesario establecer una relaci6n funcional entre los mismos, encontrando una ecuaci6n que las ligue.EI termino regresi6n debe ser interpretado en este contexto como predicci6n, pron6stico 0 estimaci6n.

    La relaci6n funcional mas simple, desde el punto de vista del analisis matematico, es la relaci6n lineal. Es deciraquella que viene dada por la ecuaci6n del tipo : Y = a + bX, que corresponde a la ecuaci6n de una recta en dosdimensiones.CRITERIO DE MINIMOS CUADRADOS.

    Dadas dos variables cuantitativas X, Y, vamos a tratar de encontrar una ecuaci6n del tipo Y=a+bX que nos permitaaproximar los valores de Ya partir de los de X.

    Existen infinitas soluciones capaces de satisfacer la condici6n expresada en el parrafo anterior, por 1 0 que esnecesario afiadir una restricci6n adicional para que la soluci6n quede perfectamente determinada. Con esta finalidad,exigimos tambien que el error cometido al realizar la predicci6n de Y sea mfnimo.

    Si llamamos Yi al valor de la variable Y que tiene asociado el valor Xi de la variable X, e Y' al valor que resulta desustituir en la ecuaci6n Y = a + bX, el valor de Xi, es decir: Y'= a + bXi ' entonces el error cometido en la predicci6nsera: ei = Y - Y'= Y - a - bXi .Para evaluar el error total no podemos sumar ei simplemente, ya que obtendrfamos un valor lejano a la realidad alacumular desviaciones positivas y negativas.

    Para evitar este inconveniente sumamos ej2 , es decir, tomamos la suma de errores cuadraticos:

    ;=1 ;=1EI criterio de minimos cuadrados consiste en tomar la suma de errores cuadraticos como medida del error. Esto

    significa que debemos buscar los valores a y b que hacen que la suma de errores cuadraticos sea minima.ECUACIONES DE REGRESION LINEAL.

    Traduciendo el criterio anterior a terminos matematicos nos queda:d n 2 d n 2-:LJY;-a-bX;) =0 y -L(~-a-bX;) =0d a ;=1 db ;=1Operando Uegamos a: y a=Y-bX

    Luego la recta sera: - S ( -)y-y= s x ; X-Xx

    20

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    22/33

    Apuntes de Estadistica DescriptivaDel mismo modo podrfamos habemos planteado la ecuaci6n de regresi6n de X sobre Y.En este caso, si suponemos que X = a' + b'Y, tenemos: I Sxyb=-S2x y a' = X b'YN6tese que el coeficiente de correlaci6n lineal rx y es la media geometric a de los coeficientes b y b':r ~ s" ~ s ;, ~ ~s"" ; ~ . J b i lxy 2 2SxSy SxSy s, -,En general, los valores que obtenemos al sustituir en la ecuaci6n de regresi6n los Xi no coinciden exactamente con

    los valores Yi que estan asociados en la distribuci6n original. Para diferenciarlos, llamaremos Yi'= a + bXi'Queda asf definida una nueva variable Y' cuyos estadfsticos principales son:V' = V Y S2 , = S2 = b2S2 = ( S xy J2 S 2 = S ! = S xy S = bS = r2 S2Y a+bX x S2 x S2 S2 xy xy xy yx x x

    2 S ; ,La ultima relaci6n nos conduce tambien a: r = -xy S2ycuyo significado comprenderemos mas tarde.

    BONDAD DEL AJUSTE. COEFICIENTE DE DETERMINACION.La definicion de Y' nos lleva de forma inmediata a considerar otra variable mas: la diferencia entre Ye Y', es decir,

    la diferencia entre el valor experimental y el valor estimado. La denotaremos e = Y - Y' Yrepresenta el error cometido encada predicci6n.

    Sus principales caracteristicas son:J) e= V-V' = 02) Set = 3) Se =S; - S ; ,De 1) se desprende que Lei = 0, por 10 que, tal y como habiamos anticipado, no podemos tomar Lei como medida

    de la bondad del ajuste.La suma de errores cuadraticos Le ; no presenta este inconveniente, pero si el de depender del mimero deobservaciones. Para evitar esta dependencia tomamos el error cuadratico media (ECM), que se calcula:

    '" e 2ECM = _L .,;_ i ~ 0NEl ECM 0 su rafz cuadrada, que se denomina error de regresion, son inversamente proporcionales a la bondad del

    ajuste: cuanto mayor es ECM peor sera el ajuste de los datos a una recta, mientras que cuanto mas se aproxime acero,mas perfecta sera la relacion lineal entre las variables.

    De 3) se deduce una relaci6n fundamental:Es decir la varianza de Y tiene dos componentes: una debida a la relaci6n lineal entre las variables y que esta

    contenida en el termino S;,; y otra que es la varianza residual (S;) y que contiene la variabilidad que no es capaz deexplicar el modelo lineal.

    Como e = 0, entonces S; = ECM, y de ahf que el ECM sea un error estimado de la bondad del ajuste, ya queequivale a la varianza residual. Cuanto mayor sea la varianza residual, mayor sera la parte de la variabilidad de Y que esincapaz de explicarse por la relacion lineal entre X e Y. Esto puede deberse a que no existe ninguna relaci6n entre lasvariables 0 a que esta no sea lineal.

    Las iiltimas consideraciones acerca de la relacion S ; = S ; , - S ; nos lleva a una interpretaci6n del coeficiente decorrelaci6n r x y como una medida de la rafz cuadrada de la proporci6n de la varianza de Y que es capaz de explicar elmodelo. En efecto, recordemos que:

    2 S ; ,r; =-2S y

    21

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    23/33

    Apuntes de Estadistica Descriptivapor 10 que, teniendo en cuenta el significado atribuido s; y S ; queda clara la interpretaci6n realizada de rxy'Como la proporci6n es mas directa al tomar (rxy)2 que al tomar rxy , definimos el coeficiente de determinacion R

    como:R2 = r2 = S ; ,

    xy S2y

    L6gicamente 0 :::;R :::;1, ya que S ; : : 2 : S ; , De esta forma, podemos decir que si hemos encontrado un valor derxy = 0.9, entonces, aproximadamente el 81% de la variaci6n de Ypuede explicarse por su relaci6n lineal con X.REGRESION NO LINEAL.REG RES IO N DE LA MEDIA.

    Un valor de rxy bajo no excluye una fuerte asociaci6n entre las variables, ni tampoco la posibilidad de encontraruna relaci6n funcional que permita predecir los valores de una de elias conociendo los de la otra.

    Al estudiar una distribuci6n bivariable podemos encontrar que cada valor X tiene asociados varios valores de Y:(Yn,Y2i '''''Ynii), bien de forma natural, 0 bien porque, intencionadamente hemos agrupado las modalidades de X en clases,tal y como se explic6 al hablar de la raz6n de correlaci6n de Pearson. Bajo estas circunstancias, existe un criterio paraasociar a cada Xiun valor Y' b de modo que la varianza residual sea la menor posible. Este procedimiento consiste enasociar a cada Xi la media de los valores de Y que tiene asociados.

    Utilizando la notaci6n usada al hablar de llyx ' podemos decir que establecemos como modelo de regresi6n larelaci6n funcional:

    1 nr: = J (X .) = Y =-~ r.J J J n.L,;1jj i = '

    La proporci6n de la varianza de Y que queda explicada por el modelo de regresi6n viene dada por (llyx)2 y yadijimos que era siempre mayor 0 igual que rx y - A este modelo se le denomina regresion de la media.

    Podemos preguntamos porque si la regresi6n de la media es la que produce un mejor ajuste, no se utiliza siempre,olvidandonos de los demas modelos. La respuesta es que la relaci6n Y ; = J (Xj ) no siempre es analitica, es decir, nosiempre puede expresarse mediante una ecuaci6n. De hecho, la regresi6n de la media, por si sola no aporta ningunprocedimiento para determinar la funci6n analftica que mas se aproxima a J (Xj ) .

    Podemos establecer una estrategia 6ptima para buscar la relaci6n funcional mas adecuada entre dos variables:1.- Determinar (llyx)2. Si tiene un valor bajo, es mejor no probar con ningtin modelo, ya que cualquiera de ellosnos dara un coeficiente de determinaci6n todavia menor.2.- Determinar R2 . Si hay poca diferencia entre R2 y (llyx)2, entonces el modelo lineal es satisfactorio. Si ladiferencia es grande, es necesario buscar un modelo no lineal. Esta busqueda puede facilitarse si se tiene en cuentael diagrama de dispersion de los datos, ya que la forma en que se distribuyen los puntos en el plano puedesugerimos la curva mas apropiada. Una vez elegido el modelo no lineal mas conveniente es preciso volver a evaluarel ajuste, hasta conseguir un coeficiente de determinaci6n 10 mas aproximado po sible a (llyx)2.

    MODELOS DERIV ADOS DEL LINEAL." 2FUNC IO N PO LINO MICA : Y = a o +a ,X +a 2X + ... +a nX n

    Puede resolverse aplicando el criterio de mfn imos cuadrados de forma similar a la ecuaci6n lineal.Tambien puede resolverse como un caso multilineal con Xi=Xi .

    FUNC IO N PO TENC IAL: Y = aX bPodemos tomar logaritmos con 10 que: 19(Y) = 19(a) + blg(X) .Entonces, Construimos las variables: Y'=lg(Y) yX'=lg(X) Y buscamos la regresi6n lineal entre elias: Y' = a' + b'X'.Una vez determinadas a' y b', podemos calcular a y b teniendo en cuenta que: a'

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    24/33

    Apuntes de Estadistica DescriptivaFUNCION EXPONENCIAL: Y = ab"

    Operando como en el caso anterior: Ig(Y) = 19(a) + Klg(b). Haciendo, en este caso, Y'=lg(Y) calculamos a' y b' dea' b'modo que Y'=a' + b'X, Una vez calculados despejamos a y b mediante la relaci6n: a=lO y b+LO

    FUNCION LOGARiTMICA: Y = a+blg(X)Basta con hacer el cambio X'=lg(X) y tratarlo como una ecuaci6n lineal.MODELOS NO DERIV ABLES DEL LINEAL.

    Son ecuaciones que no pueden reducirse al modelo lineal de forma analftica. Esto obliga a que el tratamientomatematico sea diferente, utilizando metodos distintos al de mfnimos cuadrados.

    Los modelos de este tipo mas utilizados son los que consideran una relaci6n funcional de este tipo:1. Y = a+bcx

    c2.Y=---::-1+ be-ax

    EL PROBLEMA DE LA PREDICCION.La biisqueda de un modelo de regresi6n que se ajuste a los datos estudiados tiene, segun dijimos al comienzo, una

    clara justificaci6n: poder realizar predicciones fiables sobre los valores que adoptara la variable explicada (Y ) cuando lavariable explicativa (X) tome un valor determinado. Sin embargo, hay que hacer dos importantes aclaraciones:

    1. La construcci6n del modelo la realizamos basandonos en un grupo de datos que en ningun caso constituye latotalidad de la poblaci6n (si fuera asi no tendrfa sentido la predicci6n ), sino s610 una muestra de esta,

    Por tanto se tratara de una estimaci6n del modelo real, y la fiabilidad 0 grado de aproximaci6n a este modelo,dependera de la metodologfa empleada en el tratamiento de los datos.

    2. Toda predicci6n supone un proceso inferencial que, en consecuencia, tendra asociada una determinada precisi6no fiabilidad. Esta depende de la seguridad 0 margen de confianza con el que estimemos los parametres del modelo, esdecir, a y b.

    En particular, por tratarse de un modele lineal, es muy importante la incertidumbre con la que estimemos el valor deb, ya que esta se multiplica por el valor de X, y por 10 tanto, cuanto mayor sea X, mayor sera el error cometido en lapredicci6n.

    Esto se traduce en la practica en que cuando la predicci6n se realiza sobre datos que se encuentran en el mismorango que los estudiados (interpolaci6n), obtenemos valores mas fiables que cuando se trata de datos que exceden eserango (extrapolaci6n).

    Aunque es problema de la Estadfstica Inferencial, un modele de regresi6n no esta completo si no se especifica juntoa los parametres encontrados, cual es su margen de confianza. Este margen se mide con la desviaci6n tfpica y, aunqueno 10deduzcamos, vale para b:

    Se _ 1 S ,f (Xi -X ) 2 - . . )N-2 Sxi=1

    Siendo:N = mimero de pares de datos.

    i=1N

    23

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    25/33

    Apuntes de Estadistica DescriptivaCoeficientes de correlaci6n.

    ICorrelacion entre variables cuantitativas

    Razon de Correlacion

    ICorrelacion entre variables cualitativas:Variables ordinales. Ir, =1

    Spearman

    IGoodman y Kruskall PY = P+Q

    Q P-Q II

    P+Q P+QP-Q1=--P+Q

    IVariables nominales dicotomicas.Q= ad be

    ad+be IIb+ad~=-r=================~( a +b)( e+ d) ( a + e)(b+ d)ICoeficiente de contingencia:

    IX 2 ~ t . t , (/,j ~ : J ~t . t , ~ -N II--

    I o d ic ot om i c asIChi CuadradoCorrelacion entre variables cualitativas y cuantitativas. x -r b = p qmp s y

    24

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    26/33

    Apuntes de Probabilidad

    Asignatura: Complementos de MatematicasProfesor: Dr. Manuel J. Galan Moreno

    E.T.S.A.

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    27/33

    CONCEPTOS FUNDAMENTALES DEL CA.LCULO DE PROBABILIDADES.

    I. CONCEPTOS PREVIOS.1. SUCESOS.1. SUCESO ELEMENTAL.Se denomina Suceso Elemental de un experimento aleatorio a cad a uno de los posiblesresultados de dicho experimento que no pueden descomponerse en resultados mas simples.AI realizar un experimento aleatorio siempre ocurre uno de los sucesos elementales. AIocurrir un suceso elemental, quedan excluidos todos los demas,Por ejemplo, si consideramos el experimento aleatorio: resultado de sacar una carta de unbaraja y los sucesos:S] = Sacar as de oras.S2= Sacar un as.S610 el S] es elemental, ya que S2 puede descomponerse en sacar el as de oros, el as decopas, el de espadas 0 el de bastos.2. SUCESO.Un suceso de un experimento aleatorio es cualquier composici6n de los sucesos elementalesde dicho experimento. Vgr.: EI experimento aleatorio Estado civil de una persona tiene comosucesos elementales:S] = Soltero.S2= Casado.S3 = Divorciado.S4 = Viudo.A partir de estes podemos formar:S 5= { S ],S 2} = Soltero 0 casado.S 6 = { S] ,S 3 } = Soltero 0 divorciado.S 7 = { S l, S4 } = Soltero 0 viudo.Y de la misma forma:S s= { S 2,S 3 }; S 9= { S 2,S 4 }; S J O = { S 3,S 4}; S ll= { S I,S 2,S 3}; S 12= { S ],S 2 ,S 4}; S J 3= { S ],S 3 ,S 4}; S I4 = {

    S2,S3,S4} 'Hay adernas dos sucesos triviales que son:Suceso imposible: 0 = 0 (que no suceda nada).Suceso seguro: Q = . { S ], S 2 ,S 3 , S 4 } (que suceda cualquier cosa)

    2. ESPACIO MUESTRAL.Se denomina Espacio Muestral (.Q) de un experimento aleatorio al conjunto de todos lossucesos elementales del mismo. Equivale al suceso segura definido anteriormente:Q=.{Sl ,S2,S3,S4} ' Puede ser:

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    28/33

    a) Finito: Si el nurnero de elementos que tiene Qesta acotado. Vgr.: Cualquiera de los doscasos anteriores.b) Infinito numerable: Cuando, a pesar de tener infinitos elementos, no siempre es posibleintercalar uno entre dos dados. Vgr.: NQde veces que hay que lanzar un dado hasta que

    salga un 6. Este nurnero, en teona es ilimitado, pero nunca puede estar entre 5 y 6(siempre sera entero).c) Infinito no numerable: Cuando Q tiene infinitos elementos, y adernas siempre se puedeintercalar uno entre dos cualesquiera de ellos. Vgr.: Tiempo de espera hasta que un

    paciente que acude a urgencias es atendido.Otra clasificaci6n que podnarnos realizar seria:a) Discreto: Si es fin i to 0 infinito numerable.b) Continuo: Si es infinito no numerable.EI conjunto de todos los posibles sucesos de un experimento aleatorio sera, 10que en teorfade conjuntos se denomina P(Q) (Conjunto de las partes del espacio muestral). En el ejemplodel estado civil sera: P(Q) = {0, S] ,S2 ,S3"",S13' S]4' Q}. En consecuencia, si Q consta de nsucesos elementales, podemos definir un total de 2n posibles sucesos.3. ALGEBRA DE SUCESOS.Dado un espacio muestral Q y dados S],S2",SiEQ, podemos definir las siguientesoperaciones entre sucesos:1. SUMA 0UNION DE SUCESOS: S]+S2 .Es el suceso compuesto que resulta de que ocurra S] 0 bien S2 .2. PRODUCTO 0INTERSECCION DE SUCESOS: S{S2 .Es el suceso que resulta al exigir que ocurra S j y S2 slrnultanearnente.3. COMPLEMENT ARlO DE UN SUCESO: SEs el suceso que se verifica si y 56/0 si no se verifica S.Muchas veces no estamos interesados en todos los sucesos posibles (P(Q)) y preferimoslimitarnos a una parte de ellos (FcP(Q)). Este subconjunto de sucesos no 10podemos elegirde forma totalmente arbitraria, sino que, para poder definir una medida de probabilidad sobreel, tal y como veremos mas adelante, es necesario que se cumplan 2 requisitos:1. Si S j' S2 E F => (S j + Sj)E F2. Si S E F => S E FEs decir, es necesario que F sea 10 que se denomina un Algebra aditiva 0 a-Algebra. Porejemplo, en el experimento del Estado Civil pueden interesarnos solamente los sucesos:A = Casado.B = No casado.Con 10 que F = {0, A, B, . . Q } , ya que 0 y .. Q se deben incluir siempre para que pueda ser unalgebra aditiva. Efectivamente, podemos comprobar que F cumple los requisitos anteriores,ya que:1 . A+B=QE F2. If= B E F Y B = A E F

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    29/33

    II. DISTINTAS DEFINICIONES DE PROBABILIDAD.1. DEFINICION DE LAPLACE E INTERPRETACION FRECUENCIALISTA.Hist6ricamente es la primera que surgi6 y corresponde a la idea intuitiva de:

    Probabilidad = Casos favorablesCasos posiblesSe aplica tacilrnente cuando ,Q es finito y nomoqeneo simettico, es decir: cuando todos lossucesos elementales de los que se compone ,Q tienen la misma probabilidad de ocurrir. Vgr.:lanzamiento de una moneda 0de un dado no cargados.Sin embargo fal la cuando ,Q no es hornoqeneo 0 no es finito. Este ultimo caso corresponde apreguntas como: l,Cual es la probabilidad de que al nacer un nino este sea var6n? l,Cual esla probabilidad de contraer determinada enfermedad? l,Cual es la probabilidad de queacudan mas de 100 pacientes a urgencias? ..Para resolverlas nos apoyamos en la Ley de la Regularidad Estadfstica 0 Ley de losGrandes Numeros, que afirma que cuando un experimento aleatorio se repiteindefinidamente, la frecuencia relativa con la que se da un determinado suceso tiende aestabilizarse en torno a un valor. Ese valor en el que se estabiliza la frecuencia relativa es elque tomaremos como probabilidad del suceso.Para ilustrar este concepto, aparece a continuaci6n un resumen de los resultados obtenidosal simular mediante un ordenador el lanzamiento de una moneda y contar el nurnero deveces que sale cara. Cuando el nurnero de lanzamientos es pequeno, la frecuencia relativadel suceso salir cara oscila entorno al valor 0.5 con un margen muy amplio, pero cuandocrece el nurnero de tiradas este margen se va reduciendo hasta lIegar a ser despreciable. Enconsecuencia, la diferencia entre la frecuencia registrada y la frecuencia que cabria esperarpuede hacerse tan pequefio como queramos, con solo aumentar el nurnero de tiradas.

    Tabla 1Simulacion por ordenador dellanzamiento de una moneda.Nde Frecuencia Diferencia Nde Nde caras Frecuencia Diferencia conIanzamien- N de caras relativa con la lanzamientos relativa la frecuenciatos frecuencia teorica

    teorica2 0 0 0.5 65.536 32.645 0.498 0.0024 1 0.25 0.25 131.072 65.535 0.499992 0.0000088 3 0.38 0.125 262.144 131.071 0.499996 0.00000416 7 0.437 0.063 524.288 262.143 0.499998 0.00000232 14 0.437 0.063 1.048.576 524.287 0.4999990 0.00000164 30 0.47 0.03 2.097.152 1.048.575 0.4999995 0.0000005128 65 0.508 0.008 4.194.304 2.097.151 0.4999998 0.0000002256 130 0.508 0.008 8.388.608 4.194.303 0.49999990 0.0000001512 261 0.51 0.01 16.777.216 8.388.607 0.49999994 0.00000006

    1.024 520 0.508 0.008 33.554.432 16.777.215 0.49999997 0.000000032.048 996 0.486 0.014 67.108.864 33.554.431 0.499999985 0.0000000154.096 2.005 0.49 om 134.217.728 67.108.863 0.499999993 0.0000000078.192 4.016 0.49 0.01 268.435.456 134.217.727 0.499999996 0.00000000416.384 8.075 0.493 0.007 536.870.912 268.435.455 0.499999998 0.00000000232.768 16.273 0.497 0.003 1.073.741.824 536.870.911 0.4999999990 0.000000001

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    30/33

    0,6

    ~ 0,5'" . 0,4 +-- - .--c~----- --~---~-------~---~--~-----------------------------~-------------------~-_I5 : :~ ~ 0,3=

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    31/33

    3. INTERPRETACION BAYESIANA 0 SUBJETIV A.Es una forma mucho mas operativa de definir la probabilidad, que consiste en utilizar lainformaci6n de la que un sujeto dispone, para realizar una apreciaci6n personal de laprobabilidad de un suceso. Obviamente, si el sujeto conoce la frecuencia relativa del suceso,y su actuaci6n es coherente, utilizara esta como probabilidad. Si no conoce la frecuenciarelativa, utilizara cualquier otro tipo de informaci6n para dar una estimaci6n de laprobabilidad. Es 1 0 que hacemos cuando, por ejemplo, decimos: Hay una probabilidad del60% de que lIueva este fin de semana; tenemos un 50% de posibilidades de que salgaadelante este proyecto...Evidentemente, la estimaci6n de la probabilidad variara en funci6n del sujeto y de lainformaci6n de la que este disponga. Por eso serfa mas correcto decir P(A/I), que se lee:Probabilidad de que suceda A dado que disponemos de la informaci6n I. (Este tipo denotaci6n se usa para la probabilidad condicionada, tal como veremos mas adelante).La Estadfstica clasica se apoya exclusivamente en los datos para estimar las caracterfsticasde la poblaci6n, mientras que la Estadfstica Bayesiana utiliza adernas la informaci6n basadaen el grado de creencia que tiene el experimentador acerca de esas caracterfsticas. EIanalisis de los datos permite variar esa creencia y el resultado puede servir de base para unanueva estimaci6n.4. CALCULO PRA.CTICO DE PROBABILIDADES.La rafz del problema esta en la asignaci6n de probabilidades a los sucesos elementales, yaque a partir de estes se puede calcular la probabilidad de cualquier suceso compuesto,aplicando las reglas que hemos visto en el apartado 2. La determinaci6n de la probabilidadde un suceso elemental puede hacerse:1. Estudiando la frecuencia relativa mediante la repetici6n del experimento hasta ver queesta se estabiliza.2. Deduclendolo de la naturaleza del experimento. EI caso mas simple es el de Qhornoqeneo 0 slrnetrlco, ya que todos los sucesos elementales seran equiprobables, por

    1 0 que todos tendran probabilidad 1 / N , siendo N el numero de sucesos elementales deQ.3. En este caso la probabilidad de un suceso compuesto obedece a la conocida f6rmula de:

    P(S) = Casos favorables = NQde sucesos elementales de SCasos posibles NQde sucesos elementales de Q4. Combinando la informaci6n acerca de la naturaleza del experimento con los resultados de

    este,

    III. TEOREMAS FUNDAMENTALES DEL CALCULO DEPROBABILIDADES.1. PROBABILIDAD CONDICIONADA.1. CONCEPTO:La probabilidad de A dado B, 0 condicionada a la ocurrencia de B, es la frecuencia relativacon la que se da el suceso A cuando se ha dado B. Se denota P(AlB) y no debe confundirsecon P(AB).

    P(AB) es la probabilidad de que se den sirnultanearnente A y B referida al espaciomuestral Q.

    P(A/B) es 1 0 mismo, pero tomando B como espacio muestral de referencia.

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    32/33

    Por ejemplo, si consideramos el experimento aleatorio resultado de lanzar un dado, entonces.Q={1,2,3,4,5,6}.Podemos tomar los sucesos:

    A = {5,6} (salir 50 mas)B = {2,4,6} (salir par)

    En consecuencia, AB = {6} Y de aquf P(AB) =1/6 (NQde elementos de AB/NQ de elementos de.Q )Si sabemos que ha sucedido B, el espacio muestral se reduce a B ya que los unicosresultados posibles son {2,4,6}. En tal caso: A = {6}, puesto que el 5 no existe en el nuevoespacio muestral. y entonces P(A/B) =1/3 (NQde elementos del nuevo A/NQ de elementos deB).2. DEFINICION.

    P(A/B) __P(AB)EI razonamiento anterior nos lIeva ala relaci6n: P(B)que tarnbien puede escribirse como: P(AB) = P(B)P(A/B) = P(A)P(B/A)Aplicada de forma iterativa nos da:P(A1A2,,An) = P(A1) P(A2..An/A1) = = P(A1)P(A2/A1)P(A3 ..An/A1A2) = ...Con 1 0 que al final obtenemos:

    P(A1A2..An) = P(A1)P(A2/A1)P(A3/A1A2) ..P(An/A1A2 ..An_1)

    2. SUCESOS INDEPENDIENT-ES.Decimos que los sucesos A y B son independientes cuando el conocimiento de que uno deellos ha ocurrido no modifica la probabilidad de que ocurra el otro.Teniendo en cuenta 1 0 dicho al hablar de probabilidad condicionada: A y B sonindependientes es equivalente a cualquiera de las 3afirmaciones siguientes:

    a) P(A/B) = P(A)b) P(B/A) = P(B)c) P(AB) = P(A)P(B)

    Este resultado es generalizable a un nurnero cualquiera de sucesos:A1A2...An son independientes ::} P(A1A2...An)=P(A1)P(A2) ...P(An)

    3. TEOREMA DE LA PROBABILIDAD TOTAL.Dado un espacio muestral .Q y un conjunto de sucesos B={B1, B2, ... , Bn} de modo que:

    a) B1 + B2 + ... + Bn = .Qb) Bj'Bj=0 V i : ; t : j 1

    para cualquier suceso Ae p( .Q) se verifica:n

    P(A) = 'LP(Bi)P(A/Bi)i=1

    Efectivamente:

    1 Es decir, B constituye 1 0 que se denomina una particion de .Q .

  • 5/16/2018 APUNTES ESTADISTICA DESCRIPTIVA

    33/33

    A = A-Q = ALBj = LABj => P(A) = P(LABj) Y por ser los Bj disjuntos dos ados: P(A) =LP(ABj) => P(A) = LP(Bj)P(AlBj).

    4. TEOREMA DE BAYES.Con las mismas premisas del caso anterior:P(B1/A) =P(AB1)/P(A) = P(B1)P(AlB1)/P(A)Y utilizando el resultado del teorema de la probabilidad total:

    P(Bl/A)= P(Bl)P(A/B1)P(Bl)P(A/ Bl)++P(Bn)P(A/ Bn)