estadistica descriptiva unidad 1

20
 ESTADÍSTICA DESCRIPTIVA La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas características de ese conjunto. M EDIDAS DE T ENDENCIA CENTRAL Estadística se conocen tres d iferent es, llamadas medidas de tendencia cent ral, cuy a utili zación varí a de acuerdo con lo que se desee del conju nto de datos recolectados. Esas tres medidas de tendencia centr al son la media, l a media na y la moda. LA MEDIA La media, llamada también media aritmética, es la medida de tendencia central conocida popularmente como “promedio”.  LA MEDIA PARA FRECUENCIAS SIMPLES: Cuando los datos recolectados han sido organizados en una tabla de distribución de fr ecuen cias simples, la media, para poblacio nes como para muestras, se p uede calcular por medio de l a fórmula: en donde: x= media o promedio. ¦f x = suma de las frecuencias por f x  su correspondiente dato nominal. n = suma de todas las frecuencias (número de datos recolectados). Para calcular la media, debe añadirse una column a fx a la tabla o rigi nal en l a que se regi stren los resultados correspondientes al producto de la frecuencia por su valor nominal (fx).

Upload: michael-martines-izquierdo

Post on 05-Jul-2018

231 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 1/20

  ESTADÍSTICA DESCRIPTIVA

La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta

y caracteriza un conjunto de datos (por ejemplo, edad de una población, altura de

los estudiantes de una escuela, temperatura en los meses de verano, etc.) con el

fin de describir apropiadamente las diversas características de ese conjunto.

MEDIDAS DE TENDENCIA CENTRAL

Estadística se conocen tres diferentes, llamadas medidas de tendencia central,

cuya utilización varía de acuerdo con lo que se desee del conjunto de datos

recolectados.

Esas tres medidas de tendencia central son la media, la mediana y la moda.

LA MEDIA

La media, llamada también media aritmética, es la medida de tendencia central

conocida popularmente como “promedio”. 

LA MEDIA PARA FRECUENCIAS SIMPLES:

Cuando los datos recolectados han sido organizados en una tabla de distribución

de frecuencias simples, la media, para poblaciones como para muestras, se puede

calcular por medio de la fórmula:

en donde:

x= media o promedio.

¦f x = suma de las frecuencias por ∑ f x su

correspondiente dato nominal.

n = suma de todas las frecuencias (número de

datos recolectados).

Para calcular la media, debe añadirse una columna fx a la tabla original en la que

se registren los resultados correspondientes al producto de la frecuencia por su

valor nominal (fx).

Page 2: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 2/20

Ejemplo 1: Las calificaciones de Matemáticas de los grupos “A” y “B” se muestranen la tabla de la derecha. Calcular el promedio (la media) obtenido por esos

grupos.

Solución: Debe añadirse a la tabla original una columna encabezada por fx en

donde se anotarán los resultados correspondientes a las multiplicaciones de cada

valor nominal x por su frecuencia f respectiva.

Por ejemplo, para la primera fila de la tabla: fx = 2x0 =0

La tabla completa con las tres columnas

queda como se muestra a la derecha. La

suma de los valores de la columna fx es544, de manera que utilizando la fórmula

para el promedio, recordando que n es la

suma de todas las f, se obtiene:

LA MEDIA PARA FRECUENCIAS POR INTERVALOS:

Cuando los datos recolectados han sido organizados en una tabla de frecuencias

por intervalos, la media para poblaciones como para muestras se puede calcular

por medio de la fórmula

En donde:

Page 3: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 3/20

= media

= punto medio del intervalo.

= suma de las frecuencias por su correspondiente dato nominal.

= suma de todas las frecuencias (número de datos recolectados). .Obsérvese que es la misma fórmula que la correspondiente a los datos

organizados en tablas de distribución de frecuencias simples, en donde la única

diferencia es la interpretación de la x. En una representa el valor nominal, en ésta

el punto medio del intervalo. De hecho, esta situación se va a repetir en las otras

dos medidas de tendencia central que faltan de estudiar aún, la mediana y la moda,

ya que también se estudiarán en dos casos: cuando los datos estén organizados en

tablas con frecuencias simples o cuando estén por intervalos.

Para calcular la media de datos organizados por

intervalos, deben añadirse ahora dos columnas a la

tabla original: la primera columna añadida es para

anotar el valor del punto medio del intervalo (x) y la

otra en la que se registren los resultados

correspondientes al producto de la frecuencia por el

correspondiente valor del punto medio del intervalo

(fx).

Ejemplo 1:  Calcular la media de los valores

agrupados en intervalos de la tabla de la derecha.

Solución: Deben añadirse a la tabla original dos columnas encabezadas por x y por

fx, en donde se anotarán los resultados correspondientes a los puntos medios de

cada intervalo y al producto de la frecuencia por ese punto medio.

La tabla completa con las cuatro columnas queda como se muestra abajo a

continuación:

Page 4: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 4/20

La suma de los valores de la columna fx es 619, de manera que utilizando la fórmula

para el promedio, donde hay que recordar que, se obtiene:

LA MODA

La moda es la medida de tendencia central que se define como aquel valornominal que tiene la frecuencia mayor. Por lo tanto, una distribución de frecuencias

puede tener más de una moda o, inclusive, no tener moda cuando todos los datos

tienen frecuencia 1.

Cuando los datos recolectados han sido organizados en una tabla de frecuencias

simples, la moda se obtiene buscando en la columna de frecuencias el o los valores

que tengan mayor frecuencia. Es exactamente lo mismo cuando están organizados

por intervalos.

La moda se simboliza con sus dos primeras iniciales: Mo

Ejemplos: De las dos tablas siguientes, localizar la moda de cada una de ellas.

Page 5: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 5/20

Solución: Para la tabla A basta recorrer la columna de las frecuencias y localizar

que la mayor frecuencia es f = 16 correspondiente al dato nominal 55. Por lo tanto

la moda es Mo = 55

Para la tabla B igualmente basta localizar que la mayor frecuencia es f = 29, que

corresponde a los datos nominales 200 y 400. Por lo tanto la moda es Mo = 200 y

también Mo = 400, es decir, la tabla B tiene dos modas. Se dice que es bimodal.

LA MEDIANA

La mediana es la medida de tendencia central que se define como aquel valor

nominal que tiene, dentro de un conjunto de datos ordenados, arriba y abajo de él,

el mismo número de datos nominales. En otras palabras, es el dato que está a la

mitad, es el dato que divide en dos partes iguales a un conjunto de datos.

Por ejemplo, del conjunto 3, 3, 3, 4, 5, 5, 5, 5, 5, 6, 6, 7, 8, 9, 9 el cinco remarcado

en negrita y subrayado es el que está a la mitad del conjunto ordenado, ya que antes

de él existen 7 datos y después de él también.

Para facilitar la localización de la mediana en una tabla, conviene agregarle una

columna en la que se anoten las frecuencias acumuladas fa. Entonces, el número

total de datos recolectados más uno, dividido entre dos da el dato central dc:

Ese resultado se busca en la columna de las frecuencias acumuladas y al dato

nominal que le corresponda, es la mediana.

La mediana se simboliza con las letras: Mdn

LA MEDIANA PARA DISTRIBUCIÓN EN FRECUENCIAS SIMPLES

Cuando los datos recolectados han sido organizados en una tabla de frecuencias

simples, la mediana se obtiene buscando en la columna de frecuencias acumuladas

el valor que esté situado exactamente a la mitad, conforme a la fórmula anterior.

Los casos de conflicto se explican en los siguientes ejemplos.

Ejemplo 1:  Localizar la mediana del conjunto de calificaciones mostrado en la

siguiente tabla.

Page 6: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 6/20

Solución:  A la tabla original ya se le añadió la

columna de frecuencias acumuladas.

La máxima frecuencia acumulada, que es lo

mismo que el número total de datos nominales, es

de 117. Es decir, la tabla corresponde a las

calificaciones de 117 alumnos.

El dato central respecto de los valores nominales

es el valor nominal 5 (ver tabla de la derecha). Ese

no es la mediana.

El valor central respecto de las frecuencias, no de

los datos nominales x, se obtiene sumando 1 al

117 y dividiéndolo entre dos, es decir,

Que significa que el dato ordinal 59, el quincuagésimo noveno, es el que está

situado a la mitad de todos. Observando la columna de las frecuencias acumuladas

se ve que hasta la calificación 7, contadas desde el principio, van apenas 49

alumnos, mientras que hasta la calificación 8 ya van 74. Esto significa que dentro

de la calificación 8 está el alumno número 59, que es el central. Por lo tanto, la

mediana es Mdn = 8.

Dicho de otra forma: cuando se fueron ordenando una por una las calificaciones,

al contar el último 7 se llevaban en ese momento 49 calificaciones ordenadas (ver

tabla). Al continuar, el 50º (quincuagésimo) dato o calificación fue de valor 8; el 51º

(quincuagésimo primer) dato fue también de valor 8; el 52º (quincuagésimo

segundo) dato o calificación fue también de valor 8, y así sucesivamente hasta el

74º (septuagésimo cuarto). Eso significa que el 59º dato correspondió al valor

nominal x = 8.

El error más común que se comete a la hora de intentar localizar la mediana es

buscar el dato nominal x central en vez del dato ordinal, o sea, el error consiste en

buscar en la columna de los datos nominales x el que está a la mitad y eso no es.

Page 7: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 7/20

CASOS DE CONFLICTO

Ejemplo 2: Localizar la mediana del conjunto de datos mostrado en la siguiente

tabla. 

Solución:  Debe entenderse que la tabla

original consta solamente de las dosprimeras columnas x y f. La que aparece a

la izquierda es dicha tabla original a la que

ya se le añadió la columna de frecuencias

acumuladas.

La máxima frecuencia acumulada, que es lo

mismo que el número total de datos

nominales, es de 574. Es decir, la tabla

corresponde a 574 datos recolectados.

El valor central respecto de las frecuencias,no de los datos nominales x, se obtiene

sumando 1 al 574 y dividiéndolo entre dos,

es decir,

Que significa que tanto el dato ordinal 287 como el 288 (el que ocupa en orden el

lugar 287 y el 288) son los que están situados a la mitad de todos. Observando la

columna de las frecuencias acumuladas se ve que dentro del conjunto de 112 datos

recolectados con valor nominal, están los que ocupan el x = 48 orden 287 y 288, de

manera que en este caso no hay conflicto para determinar la mediana y ésta es Mdn

= 48.

Dicho de otra forma: cuando se fueron ordenando uno por uno los datos

recolectados, al contar el último dato nominal con valor x = 47, se llevaban en ese

momento 269 datos recolectados ordenados (ver tabla). Al continuar, el 270º

(bicentésimo septuagésimo) dato fue de valor 48; el 271º (bicentésimo

septuagésimo primer) dato fue también de valor 48; el 272º (bicentésimo

septuagésimo segundo) dato fue también de valor 48, y así sucesivamente hasta

112 más (que es la frecuencia del dato nominal ) Eso x = 48 significa que el 287º(bicentésimo octogésimo séptimo) dato, lo mismo que el 288º (bicentésimo

octogésimo octavo), correspondieron al valor nominal x = 48.

Obsérvese que la mediana Mdn = 48 no es el que está situado a la mitad de la

columna de los datos nominales x.

Page 8: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 8/20

MEDIDAS DE DISPERSIÓN

Concepto

Las medidas de dispersión son un conjunto de valores que tienen por objeto

proporcionar, en un valor único información sobre la variabilidad que

presenta la población o la muestra con respecto a la variable de interés.

La dispersión o variación es una característica importante de un conjunto de

datos porque intenta dar una idea de cuán esparcidos se encuentran éstos.

Existen diversas medidas de dispersión, algunas de ellas son:

• Rango

• Desviación media

• Desviación estándar

• Varianza 

| ¿En qué se diferencian con las medidas de tendencia central?

Mientras las medidas de tendencia central nos indican dónde se concentra un

grupo de puntuaciones las medidas de se concentra un grupo de puntuaciones,

las medidas de dispersión refieren a la homogeneidad / heterogeneidad de una

distribución.

¿Cómo se relacionan con las medidas de tendencia central?

  Son complementarias Son complementarias.

  Para calcular algunas medidas de dispersión es necesario conocer losvalores de otras medidas.

  Ambos tipos de medidas son necesarias para una descripción acabada de

una distribución.

Medidas de dispersión para datos no agrupados

En realidad, es casi tan importante conocer un promedio como conocer la

variabilidad de los datos alrededor de él. Esto es lógico: la validez de un valor típico 

 para resumir o representar al conjunto de datos para el cual se calculó, depende,

en gran medida de si los datos individuales se concentran o se dispersan alrededor

de él . Cuanto más concentrados estén los datos alrededor del promedio aritmético,por ejemplo, mucho más confianza se tendrá en este valor para caracterizar o

representar el conjunto de datos.

Page 9: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 9/20

LA VARIABILIDAD Y SU IMPORTANCIA 

La importancia del concepto de variabilidad se hace aún más clara, si se nota

que en la práctica puede suceder que varios conjuntos de datos tengan, la misma

media aritmética y sin embargo, su dispersión sea muy diferente, tal como se

puede apreciar a continuación:

Los anteriores conjuntos tienen la misma media aritmética (5 ) pero su

dispersión o variabilidad es muy diferente: mientras que en el grupo A todos los

valores son iguales a cinco, es decir, no existe dispersión, en B sí existe cierto grado

de variabilidad y en el grupo C la dispersión es aún mayor. Aún más, en este último

grupo ni siquiera hay un valor que sea igual al promedio y esto puede darnos una

idea de las conclusiones erróneas a que podríamos llegar si no tomáramos en

cuenta la dispersión de los datos con respecto a esta medida. Para los

investigadores, la variabilidad es un fenómeno natural y corriente del cual tienen

clara conciencia.

LA MEDICIÓN DE LA VARIABILIDAD 

Dentro del tratamiento estadístico de la información cuantitativa, es necesario hacer

referencia a la medición de la variabilidad. Han sido propuestas diferentes formas

Page 10: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 10/20

de medir la dispersión o variabilidad de un conjunto de datos; cada una de ellas

posee ventajas y también limitaciones conceptuales y prácticas.

La elección de una de ellas, en particular, dependerá de la situación concreta que

se considere y de si, en ese caso, las ventajas de su utilización superan a las

desventajas, en relación a las demás medidas. Seguidamente se discutirán las

medidas de variabilidad más conocidas, a saber:

a) El recorrido o amplitud. 

b) La desviación media. 

c) La desviación estándar. 

d) La variancia. 

e) El coeficiente de variación. 

Rango

Es la variabilidad total de la variable expresada como la diferencia entre el

valor máximo encontrado en la población o muestra menos el valor mínimoencontrado en la misma colección de datos.

R = Vmax - Vmin

Desviación

Es la diferencia que se observa entre el valor de la variable y la media

aritmética. La denotaremos por di . 

No es una medida, son muchas medidas, pues cada valor de la variable

lleva asociada su correspondiente desviación, por lo que precisaremos una

medida que resuma dicha información.

La primera solución puede ser calcular la media de todas las desviaciones,

es decir, si consideramos como muestra la de todas las desviaciones y

calculamos su media. Pero esta solución es mala pues como veremos

siempre va a ser 0.

Page 11: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 11/20

La desviación media (DM)

La necesidad de definir una medida de dispersión que tome en cuenta para su

cálculo todos los datos y no esté tan estrictamente ligada al número de ellos, lleva

casi automáticamente a la conclusión de que esta medida tiene que estar basada

en las desviaciones o diferencias de los datos individuales respecto de un valor

central o típico.

Esta línea de razonamiento conduce lógicamente, a considerar la suma de las

desviaciones de los datos con respecto a la media aritmética como una posible

medida de dispersión. Sin embargo, como es sabido, la suma de las desviaciones

de las observaciones con respecto a la media aritmética siempre es igual a cero,

circunstancia que impide que pueda ser utilizada como medida de dispersión.

Para obviar este problema, se puede emplear la suma de los valores absolutos de

las diferencias y dividirla por el número de datos para obtener una medida de

dispersión promedio o por observación. Así se origina la llamada desviación media. 

Simbólicamente así:

Recuérdese que el símbolo se emplea para indicar que deben ser considerados

los valores absolutos de las diferencias, es decir, ignorando su signo.

Su cálculo se ilustra seguidamente para los valores: 3, 10, 2, 8, 7 . Primero se

obtiene la media aritmética:

Se recomienda hacer una tabla como la que se muestra a continuación:

Page 12: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 12/20

Luego se calcula la desviación media:

La desviación media, no obstante las ventajas conceptuales que reúne, casi no se

utiliza debido a que requiere el manejo de valores absolutos por una parte, y por el

hecho de que existe otra medida, basada también en las desviaciones respecto a la

media aritmética, que es mucho más cómoda y útil, y reúne numerosas ventajas

prácticas y teóricas. Esta medida es la desviación típica.

Desviación típica (Desviación estándar)

La desviación estándar -o típica- utiliza en lugar de los valores absolutos, los

cuadrados de las desviaciones. La desviación estándar nos indica cuánto se alejan,

en promedio, las observaciones de la media aritmética del conjunto.

Es la medida de dispersión más usada en estadística, tanto para aspectos

descriptivos como analíticos. Es, la raíz cuadrada del cuadrado de la suma de las

desviaciones entre el número total de observaciones, así:

Simbólicamente es así:

También tiene mucha importancia el cuadrado de la desviación estándar, que

recibe el nombre de variancia (en algunos textos aparece como “varianza”). 

Page 13: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 13/20

La Variancia

Como se dijo atrás, la variancia es el cuadrado de la desviación típica, así:

Es conveniente hacer algunas observaciones acerca de la definición de varianza,

según se considere una muestra o toda la población.

Como ya se ha explicado, el estudio de una población se realiza observando no

todos sus elementos, sino, tomando una muestra. Las medidas o valores calculados

a partir de las muestras se utilizan luego para representar o estimar los valores de

la población en los que estamos interesados.

Con el propósito de establecer claramente si el cálculo ha sido realizado para toda

la población o para una muestra, se acostumbra indicar con símbolos diferentes

cada una de las situaciones. Comúnmente se utilizan letras latinas mayúsculas o

letras griegas para indicar los valores de la población y letras latinas minúsculas

para los valores calculados a partir de los datos de la muestra (estimadores).

Definiciones para el promedio y la variancia, según se refieran a la población o a

una muestra:

 Algo que llama la atención inmediatamente es que, al definir, se utiliza n-1  como

divisor en vez de n. Esto obedece al hecho de que, de acuerdo con la teoría de la

estadística, al dividir por n-1 se obtiene una mejor estimación del valor poblacional

(variancia de la población).

Coeficiente de Variación

Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada

ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es laque presenta mayor dispersión. La denotaremos por C.V. 

Page 14: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 14/20

Error estándar

 A veces llamado también desviación estándar del estimador se define como

la desviación estándar divida entre n-1

Cálculo de la variancia en datos no agrupados 

Seguidamente se presentará el cálculo de la variancia cuando se tiene una muestra

de n datos sin agrupar. Como ya se vio, la fórmula de es la siguiente:

Utilizando esta fórmula y sacando luego la raíz cuadrada, puede obtenerse el valor

de la desviación estándar (s). Ahora se ilustra el cálculo de ambas medidas a partir

de la definición.

EJEMPLO: Para los valores: 3, 10, 2, 8, 7 . Calcular y s.

Primero se obtiene la media aritmética:

Se recomienda hacer una tabla como la que se muestra a continuación:

E.S. = 

σx 

√ n-1 

Page 15: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 15/20

DISTRIBUCIÓN DE FRECUENCIAS

Una distribución de frecuencias es método de clasificación de

datos en clases o intervalos, que muestra el número o porcentaje

de observaciones de cada una de ellas. Esto proporciona una

forma de observar un conjunto de números sin que se tenga queconsiderar en forma individual.

La distribución de frecuencias se puede presentar en forma

tabular y gráfica.

El procedimiento para elaborar una distribución de frecuencias,

depende del tipo de datos particulares (esto es, continuos,

discretos, nominales o jerarquizados). En primer lugar se

consideraremos datos que se miden en una escala continua.

CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIASPARA DATOS CONTINUOS

Los pasos principales en la elaboración de una distribución de frecuencias para

observaciones de una muestra se enumeran a continuación:

1 •Establecer el número de clases o intervalos (k) en que se agruparán los datos.

En la práctica se eligen entre 5 y 15 intervalos. Una regla empírica es calcular la

raíz cuadrada del número de observaciones (n), o bien la Regla de Sturges que se

utiliza para determinar el número mínimo de intervalos que debe tener la distribución

de frecuencias.

2. Determinar el rango o amplitud de las observaciones (R), el

cual se obtiene como la diferencia entre el mayor y el menor valor

numérico de las observaciones.

Para prevenir ambigüedades en la clasificación de las

observaciones, resulta conveniente considerar un rango 

extendido (R*) en lugar del rango original, R* se elige de modo  

que sea mayor que R, por ejemplo : R* = kR.

La longitud de cada intervalo se obtiene dividiendo al rango

ampliado por el número de intervalos.

3. Con el fin de que la diferencia R* - R se distribuya en forma

equitativa, debemos dividir esta diferencia por 2, y repartirla en

ambos extremos del rango original. Con esto logramos que los

límites de los intervalos tengan una mayor aproximación decimal

que la que tienen las observaciones originales.

Page 16: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 16/20

Usaremos el símbolo : (a,b] para representar a todas las

observaciones que son mayores que “a” pero menores o iguales  

que “b”. 

El límite del primer intervalo se obtiene restando a la primer

observación el cociente: (R* - R)/2. Los límites de los demás

intervalos se obtienen sumando sucesivamente la longitud de cada

intervalo.

4. El punto medio de cada intervalo, llamado marca de clase se

obtiene promediando los límites inferior y superior de cada

intervalo, es el valor más representativo de cada intervalo. Se le

simboliza por: xj

5. Contar el número de observaciones que pertenecen a cada

intervalo, a las cuales se les llama frecuencias absolutas de la

clase y se les representa por: fj

6. La frecuencia relativa f

r de un intervalo se obtiene dividiendo a la

frecuencia de la clase por el número total de observaciones en la

muestra.

7. La frecuencia acumulada F

a, es la cantidad que nos indica

cuántas observaciones existen, cuyo valor numérico es menor o

igual al límite superior de un intervalo. Esta se puede expresar en

términos de las frecuencias absolutas o de las frecuencias

relativas.

EJEMPLOS:

Page 17: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 17/20

 

Distribución de Frecuencias para datos en escala Nominal 

Una distribución de frecuencias para datos medidos en la escala Nominal puede

presentar las siguientes columnas de frecuencias:

•  Frecuencias absolutas simples (f i) 

•  Frecuencias relativas simples expresadas en proporción o porcentaje. 

Frecuencias absolutas simples 

Page 18: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 18/20

  Las frecuencias absolutas simples indican el número de veces que se repite

una modalidad, categoría o valor de la Tabla 1. Sexo de los estudiantes 

variable dentro del conjunto de datos.

Las frecuencias absolutas se pueden calcular

en cualquier escala de medición y se denotancomo f i.

Frecuencias relativas simples

Las frecuencias relativas simples expresan la proporción (fr i) o el porcentaje (%)

de veces que se repite una modalidad, categoría o valor de la variable. Las

frecuencias relativas simples se pueden calcular en cualquier escala de medición.

Ejemplo 

Frecuencias Relativas Acumuladas 

Las frecuencias acumuladas expresadas en proporción o porcentaje   sedefinen como la proporción o el porcentaje de sujetos que están en una categoría o

las inferiores.

 A las frecuencias acumuladas expresadas en porcentaje se les llama rangospercentiles.

Tipos de gráficos

abla 1. Clasificación de un grupo de estudiantes de la Facultad de Humanidades y

Educación, según el sexo. Unive rsidad de los Andes. Mérida - Vene zuela, 2002.

9 32,1

19 67,9

28 100,0

SEXO

Femenino

Masculino

Total

Frecuencia absoluta Porcentaje

Fuente: Desconocida

Page 19: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 19/20

Histograma 

Un Histograma es una herramienta útil cuando se quiere mostrar en forma gráfica

la información contenida en una distribución de frecuencias para datos agrupados

en intervalos de clase.

En un Histograma se usan barras para presentar el número de casos de cadaclase o intervalo. La altura de cada barra es proporcional a la frecuencia absoluta

de la barra que representa.

Estatura

1    , 8   6  0   -  1    , 9  1   5   

1    , 8   0  5    -  1    , 8   6  

0  

1    , 7   5   0   -  1    , 8   0  

5   

1    , 6  9  5    -  1    , 7   5   

0  

1    , 6  4   0   -  1    , 6  9  

5   

1    , 5   8   5    -  1    , 6  4   

0  

1    , 5   3  0   -  1    , 5   8   

5   

1    , 4   7   5    -  1    , 5   3  

0  

Gráfico 1.Estatura de un grupo de estudiantes de la Escuela de Educación

Universidad de los Andes, Mérida. Noviembre, 2004.

200

180

160

140

120

100

80

60

40

20

0  15

31

71

110

188

58

16

Page 20: Estadistica Descriptiva Unidad 1

8/16/2019 Estadistica Descriptiva Unidad 1

http://slidepdf.com/reader/full/estadistica-descriptiva-unidad-1 20/20

=REFERENCIAS=

  http://es.slideshare.net/biomecanicaestadistica/distribucion-de-frecuencias-

12225857?qid=bf03a0d8-24b9-4244-89ff-

9e91bb7b19c2&v=&b=&from_search=2

  http://es.slideshare.net/moibemo/tema-3-medidas-de-tendencia-central

  http://www.fic.umich.mx/~lcastro/3tendenciacentral.pdf

  https://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-

punt152.html

  http://colposfesz.galeon.com/est501/distfrec/meddisp/meddisp.htm

  http://www.uabcs.mx/maestros/descartados/mto07/mdispersion.htm

  http://www.ub.edu/aplica_infor/spss/cap2-1.htm