terminos basicos de estadistica

18
República Bolivariana de Venezuela Instituto Universitario Santiago Mariño Escuela: Ingeniería Civil Sección A Nocturno TERMINOS BASICOS DE ESTADISTICA Profesora: Maria Romano Alumno: Luis Dario Campins C.I: 8.296.951

Upload: luis-cr

Post on 21-Mar-2017

77 views

Category:

Engineering


2 download

TRANSCRIPT

Page 1: Terminos basicos de estadistica

República Bolivariana de VenezuelaInstituto Universitario Santiago Mariño

Escuela: Ingeniería CivilSección A Nocturno

       

TERMINOS BASICOS DE ESTADISTICA            

Profesora: Maria Romano Alumno: Luis Dario CampinsC.I: 8.296.951

Page 2: Terminos basicos de estadistica

Bibliografía    

http://www.vitutor.net/2/11/poligonos_frecuencia.html http://www.monografias.com/trabajos15/estadistica/estadistica.shtml

  http://www.vitutor.com/estadistica/descriptiva/a_6.html

http://educacionestadisticageneral.blogspot.com/2009/08/distribucion-de- frecuencia.html

http://estadisticacrisanto.blogspot.com/2013/10/representacion-tabular-y- grafica-de.html

Page 3: Terminos basicos de estadistica

VARIABLE. VARIABLES CUANTITATIVAS Y CUALITATIVAS Variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar

diferentes valores.

Existen diferentes tipos de variables:

Variables cualitativas

Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:

 

Variable cualitativa ordinal

También llamada variable cuasicuantitativa. La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: 

leve, moderado, grave.

Medallas de una prueba deportiva: oro, plata, bronce.

El grado de satisfacción de algo: Mucho, poco, nada. Bueno, regular, malo.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo:

los colores o el lugar de residencia.

El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Profesión, Maestro, Doctor, Ingeniero, entre otras

Page 4: Terminos basicos de estadistica

Variables cuantitativas

Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser:

 

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo:

- Número de hermanos: pueden ser 1, 2, 3 …, pero nunca podrá ser 3,45.

  - Número de empleados de una fábrica.

  - Número de goles marcados por un equipo de futbol en la liga.

 

Variable continua: 

Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2.3 kg, 2.4 kg, 2.5 kg, ...) o la altura (1.64 m, 1.65 m, 1.66 m, ...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos variables.

Ejemplo 1

Se desea realizar una estudio estadístico con algunas personas de la ciudad de Caracas, acerca de lo viable o no del horario del pico y placa para los automóviles.

  La Población es el conjunto de estudio más grande, para este caso las personas de la Ciudad de Caracas.

La Muestra es el conjunto de estudio más pequeño que la población, para este caso algunas personas de la Ciudad de Caracas.

La Variables es el horario del pico y placa para los automóviles, la cual vendría hacer una Variable Cualitativa Ordinal.

Page 5: Terminos basicos de estadistica

POBLACIÓN Es la colección de datos que corresponde a las características de  la totalidad de individuos, objetos, cosas o valores en un proceso de

investigación.

Para su estudio, en general se clasifican en Poblaciones Finitas y Poblaciones Infinitas.

Poblaciones Finitas: Constan de un número determinado de elementos, susceptible a ser contado. Ejemplo: Los empleados de una fábrica, elementos de un lote de producción, etc.

Poblaciones Infinitas: Tienen un número indeterminado de elementos, los cuales no pueden ser contados. Ejemplo: Los números naturales.

Así también las poblaciones pueden ser clasificadas en Reales e Hipotéticas, las reales son aquellas concretas, que ya existen. Ejemplo: Los aspirantes a un puesto de trabajo, los vendedores de una empresa. Mientras que las hipotéticas, son las formas imaginables en que se podría presentar un suceso. Ejemplo: Estimaciones de la población económicamente activa dentro de diez años.

Por ejemplo: los habitantes de un lugar, las piezas obtenidas de una máquina en un determinado tiempo, etc. 

Como se puede extraer de la definición, la población como tal es un concepto muy abstracto, esto da lugar a que sea muy difícil o incluso imposible trabajar con ella al completo ya que puede ser un tamaño infinito o muy caro. A efectos prácticos, se estudia un subconjunto o muestra a partir de la cual extrapolamos los resultados al resto de la población. En general, cuanto mayor es la muestra mejores son los resultados que podemos obtener. Por ejemplo: si queremos analizar la resistencia de las piezas producidas por una máquina en un determinado periodo de tiempo es evidente que no podemos probar todas las piezas porque las vamos a dañar debemos seleccionar sólo una parte de ellas.  

Por otro lado no podemos elegir la muestra que queramos sin más, para poder extrapolar los resultados es necesario que cumpla unos requisitos que la conviertan en estadísticamente significativa.  

Las características que se tienen en cuenta son:  

a) Tamaño: se establece mediante fórmulas en función del grado de confianza y precisión que planteemos.

b) Forma de elección: es fundamental para que la muestra sea representativa de la población de la cual se extrae.  

Por ejemplo, si analizamos las piezas producidas por dos máquinas de forma simultánea e igual número, debemos obtener una muestra en la que ambas estén representadas en la misma proporción

En toda investigación lo ideal sería contar con observaciones o características de todos los elementos de nuestro grupo de interés, pero en muchas ocasiones eso sería muy caro y/o muy tardado o simplemente imposible, es por ello que se toman muestras.

Page 6: Terminos basicos de estadistica

MUESTRA Es una parte representativa de la población que es seleccionada para ser estudiada, ya que la población es

demasiado grande para ser estudiada en su totalidad. Ejemplo:

- La población y la muestra en la siguiente situación: En una institución educativa se quiere saber la ocupación de los egresados de la última década. Para esto se convoca a una reunión de egresados y de los asistentes, se encuesta a diez egresados de cada año. Determina la población y la muestra.

Población. Todos los egresados de la última década.

Muestra. Los 100 estudiantes seleccionados, 10 de cada promoción

 - En un colegio de la ciudad de Barranquilla, en el cual el 90% de los estudiantes toman el servicio de ruta, se quiere medir el nivel de satisfacción. Halla una muestra para realizar el estudio.

Una posible muestra se obtiene al encuestar una cantidad fija de estudiantes de cada ruta; cada uno de ellos debe pertenecer a cursos y edades diferentes, de tal manera que se encueste equitativamente a representantes de todos los estudiantes del colegio.

Page 7: Terminos basicos de estadistica

ESCALAS DE MEDICIÓN El proceso de asignar un valor numérico a una variable se llama medición. Las escalas de medición sirven para ofrecernos información

sobre las clasificaciones que podemos hacer con respecto a las variables (discretas o continuas).

Cuando se mide una variable el resultado puede aparecer en uno de cuatro diversos tipos de escalas de medición; nominal, ordinal, intervalo y razón.

Conocer la escala a la que pertenece una medición es importante para determinar el método adecuado para describir y analizar esos datos.  

Escala nominal:

Utiliza los números para identificar que un dato pertenece a un grupo o a una categoría. Es aquella escala que no presenta un orden o dimensión particular, son observaciones que pueden clasificarse o contarse.

En el análisis de datos resulta más sencillo asignar a ciertos atributos “etiquetas” numéricas en lugar de utilizar datos complejos. Por ello podemos utilizar un “1” para designar a las mujeres y un “2” para designar a los hombres, sin que ninguno de los números represente más o menos, solamente con el objetivo de distinguir y organizar datos.

Ejemplo: Si se investiga el sexo de una colonia de animales las variables a emplear son dos: variables machos y variables hembras.

La escala empleada es de carácter cualitativo, nominal y, por tanto, por tener solamente dos alternativas son variables dicotómicas.

En esta escala cada persona u objeto debe pertenecer a una y solamente una de las categorías que tienen y el conjunto de estas categorías debe ser exhaustivo; es decir, tiene que contener a todos los casos posibles.

Escala ordinal:

En esta escala los números representan una clasificación (mayor que o menor que), sin que represente una unidad de medida, quedando implícito que un número de mayor cantidad tiene más alto grado de atributo medido en comparación de un número menor. Se establece una gradación u orden natural para las categorías, cada uno de los datos puede localizarse dentro de alguna de las categorías disponibles.

Ejemplo Si fuese posible medir los niveles de conocimiento de una persona, se podrían sugerir por ejemplo 6 categorías así: 1, 2, 3, 4, 5 y 6, siendo 6 el número correspondiente a la categoría del más alto nivel.

La escala empleada es de carácter ordinal porque en este caso los números representan un orden y una jerarquía entre las variables empleadas 

Page 8: Terminos basicos de estadistica

Escala de intervalo:

En esta escala además del “mayor que” y el “menor que” también se establece una unidad de medida que nos permite precisar cuánto se es mayor o menor. La unidad de medición es arbitraria, el cero es convencional y pueden existir cantidades negativas; la medición de la temperatura y del coeficiente intelectual son ejemplos de este tipo de escala.

En esta escala se pueden hacer comparaciones por medio de diferencias o de sumas, sin embargo no se admiten comparaciones por medio de multiplicaciones, divisiones o porcentajes pues carecen de sentido.

 

Escala de razón:

Similar a la escala de intervalo, pero tiene un cero absoluto y por ello los múltiplos de los valores de la escala serán significativos; el nivel de votos en una elección sería un buen ejemplo de una escala de medición de razón, son la distancia, altura, masa, peso.

SUMATORIA El sumatorio o sumatoria (también conocido como operación de suma, notación sigma o símbolo suma,), es una notación

matemática que permite representar sumas de muchos sumandos, n o incluso infinitos sumandos, evitando el empleo de los puntos suspensivos o de una explícita notación de paso al límite. Se expresa con la letra griega sigma mayúscula( {Σ).

 

RAZÓN

Es la comparación, a través de una división, de dos grupos de individuos con atributos de diferente naturaleza. Es la forma más simple de mostrar desigualdades entre grupos. Continuando con otro ejemplo hipotético, se han atendido a 1,200 pacientes con diabetes en el Servicio de Urgencias, 900 de ellos fueron mujeres y 300 hombres. En la división puede considerarse como numerador cualquiera de los valores. De ahí que 900/300 = 3, por lo que la relación entre mujeres y hombres con respecto a diabetes mellitus que acudieron al Servicio de Urgencias fue de 3 mujeres por cada hombre (3:1).

Page 9: Terminos basicos de estadistica

PROPORCIONES La proporción es la medida de estadística descriptiva que más se usa. Es el número de observaciones con una característica en particular entre la

población de referencia. El numerador siempre está incluido en el denominador. Se expresa en porcentaje. Las medidas de proporción utilizadas en la práctica clínica para describir la enfermedad son la prevalencia y la incidencia. La prevalencia es el número de casos existentes de una enfermedad en particular entre la población de referencia. Por ejemplo: la prevalencia de pacientes con cáncer de próstata diagnosticados en el Servicio de Urología en el 2004 sería: Prevalencia = No. de pacientes con cáncer de próstata: 75 Total de pacientes del Servicio de Urología:1,500 75/1500= 0.05. Generalmente la fracción resultante se multiplica por 100, debido a que la probabilidad es de 0 a 100 y se expresa en porcentaje. Esto es, la prevalencia de pacientes con cáncer de próstata diagnosticados en el Servicio de Urología durante el 2004 fue de 5%; dicho de otra manera, aproximadamente 5 de cada 100 pacientes que acuden al Servicio de Urología son diagnosticados con cáncer de próstata. La incidencia, a diferencia de la prevalencia, es el número de casos nuevos que se presentan de una enfermedad en particular dividida entre la población libre de la enfermedad al inicio del seguimiento. Incidencia: Número de casos nuevos Población libre de la enfermedad al inicio del periodo de seguimiento Ejemplo: Se pretende estimar la incidencia de infección de sitio quirúrgico en cirugías electivas en un hospital de segundo nivel. A lo largo del trimestre se presentaron 25 casos nuevos de infección de sitio quirúrgico y en ese mismo periodo se realizaron 789 cirugías. Incidencia: No. de casos nuevos de infección de sitio quirúrgico Población expuesta a cirugía electiva = (25) (789) x 100 = 3.17% es decir, durante el trimestre, de cada 100 pacientes que se operaron, aproximadamente 3 desarrollaron infección de sitio quirúrgico.

TASA Puede interpretarse como la frecuencia relativa con que se producen ciertos acontecimientos en relación a la población media existente durante el

tiempo en que se han registrado tales acontecimientos. Las más conocidas son las tasas de mortalidad y de natalidad. Lo que diferencia las tasas de las proporciones es que en el numerador se sitúan flujos, es decir, acontecimientos registrados durante cierto

periodo, mientras que el denominador corresponde a un stock y, por tanto, se refiere a un instante. Para que tengan utilidad y resulten comparables deben expresarse en tasas anuales, de modo que, cuando los datos registrados corresponden a más

de un año o a una fracción de año, hay que calcular el promedio anual de esos acontecimientos, antes de dividir por la población media. Se habla de tasas brutas cuando se refieren al conjunto de la población, y de tasas específicas cuando hacen alusión únicamente a un intervalo

concreto de edad. La palabra “tasa” ha ido utilizándose cada vez de manera más amplia, hasta denominar en la práctica a todo tipo de indicadores, como la mal

llamadas “tasa de actividad” y “tasa de paro” (que en realidad son proporciones de activos y de parados). Conviene, sin embargo, el uso de “índice” cuando no se especifica el tipo de indicador, y mantener el sentido estricto de los distintos tipos, como “tasa”, “proporción”, “probabilidad” o “razón”.

Por ejemplo, se pretende estimar la tasa de recuperación de los pacientes operados de colecistectomía por invasión mínima. Se siguió a 10 pacientes durante 7 días. Se construye un cuadro con la evolución de los pacientes en días (Figura 2), se realiza la suma de los días que tardaron en recuperarse, se divide el número de pacientes recuperados (9 pacientes) entre la sumatoria de los días-persona. La fracción se multiplica por 1,000 días persona, ya que la tasa se expresa en múltiplos de mil. Tasa de recuperación = 9/33.5 días persona = 0.269 x 1,000 días persona = 269. La interpretación es que si se siguiera a 1,000 pacientes postoperados de colecistectomía con cirugía de invasión mínima en un día, se recuperarían 269. La tasa debe describirse de acuerdo a la unidad de tiempo que puede ser día, mes o año. El paciente número 8 no se recuperó, pero se contaron los 7 días de contribución sin recuperación.

Page 10: Terminos basicos de estadistica

FRECUENCIA Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir,

recoger la información de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. Estos números se denominan frecuencias: Así tenemos los siguientes tipos de frecuencia:

Frecuencia absoluta: La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra dicho valor de la

variable, la representaremos por ni

Frecuencia relativa: La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la

muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fi

Donde N = Tamaño de la muestra Ver: PSU: Estadística; Pregunta 05_2006 Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa o

cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos porNi

Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el

tamaño de la muestra, y la denotaremos por Fi

Page 11: Terminos basicos de estadistica

PARAMETRO   Un parámetro es un número que resume la gran cantidad de datos que pueden derivarse del estudio de una 

variable estadística. El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población.

Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad.

El estudio de una gran cantidad de datos individuales de una población puede ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea global de la población, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros estadísticos.

Por ejemplo, suele ofrecerse como resumen de la juventud de una población la media aritmética de las edades de sus miembros, esto es, la suma de todas ellas, dividida por el total de individuos que componen tal población.

  Parámetros poblacionales Se llama parámetros poblacionales a cantidades que se obtienen a partir de las observaciones de la variable y sus

probabilidades y que determinan perfectamente la distribución de esta, así como las características de la población, por ejemplo: La media, μ, la varianza σ2, la proporción de determinados sucesos, P.

Los Parámetros poblacionales son números reales, constantes y únicos.   Parámetros muestrales Los Parámetros muestrales son resúmenes de la información de la muestra que nos "determinan" la estructura de la muestra. Los Parámetros muestrales no son constantes sino variables aleatorias pues sus valores dependen de la estructura de la

muestra que no es siempre la misma como consecuencia del muestreo aleatorio. A estas variables se les suele llamar estadísticos.

Los estadísticos se transforman en dos tipos: estadísticos de centralidad y estadísticos de dispersión.

Page 12: Terminos basicos de estadistica

ESTADISTICO Un estadístico (muestral) es una medida cuantitativa, derivada de un conjunto de datos de una muestra, con el objetivo de

estimar o inferir características de una población o modelo estadístico. Más formalmente un estadístico es una función medible T que, dada una muestra estadística de valores {\displaystyle

(X_{1},X_{2},...,X_{n})}(X1,X2,….XN) les asigna un número, T (X1,X2,….XN){\displaystyle T(X_{1},X_{2},...,X_{n})}, que sirve para estimar determinado parámetro de la distribución de la que procede la muestra. Así, por ejemplo, la media de los valores de una muestra (media muestral) sirve para estimar la media de la población de la que se ha extraído la misma; la varianza muestral podría usarse para estimar la varianza poblacional, etc.1 Esto se denomina como realizar una estimación puntual.

Estadísticos de centralidad: Son medidas de la tendencia central de la variable. los más conocidos son: 1)     La media aritmética Es el valor esperado de las observaciones de la muestra calculado como si la muestra fuera una variable completa, es decir,

multiplicando observaciones por frecuencias y sumando. Si x1, x2,.., xn representan una muestra de tamaño n de la población, la media aritmética se calcula como: La media aritmética es la medida de la tendencia central que posee menor varianza. Engloba en ella toda la información de la

muestra; esto, con ser una ventaja, supone una cierta desventaja pues los valores muy extremos, en muestras pequeñas afectan mucho a la media.

La media de la media aritmética es igual a la de las observaciones (μ) y su varianza es igual a la de las observaciones partida por n. En poblaciones normales, la distribución de la media es normal,

Si la población no es normal, pero la muestra es grande (n ≥ 30), por el teorema central del límite la distribución de la media será asintóticamente normal.

Page 13: Terminos basicos de estadistica

2) La mediana En una variable se define como el punto para el cual la función de distribución alcance el valor 0.5; en una muestra la

mediana es el valor central. Para calcularla se ordenan las observaciones de menor a mayor. Si n es impar, la mediana es la observación central

Si n es par, la mediana se define como la media de las dos observaciones centrales

En resumen, podríamos decir que la mediana es el valor que es mayor o igual que el 50% de las observaciones de la muestra y menor o igual que el otro 50%.

No tiene por qué ser igual a una de las observaciones de la muestra. Es más fácil de calcular que la media aritmética y apenas se afecta por observaciones extremas; sin embargo tiene mayor

varianza que X y sólo toma en cuenta la información de los valores centrales de la muestra.

Page 14: Terminos basicos de estadistica

3) La moda Es el valor más frecuente. Su cálculo es el más simple de los tres correspondientes a estadísticos de centralidad pero la moda es el estadístico de mayor

varianza. La moda puede no existir y cuando existe no es necesariamente única. No tiene sentido en muestras pequeñas en las que la aparición

de coincidencias en los valores es con gran frecuencia más producto del azar que de otra cosa. La media es el estadístico de centralidad más usado cuando uno espera que la población tenga una distribución más o menos

simétrica, sin estar clasificada en grupos claramente diferenciados. En el caso de distribuciones muy asimétricas, con una cola muy larga, la mediana es, normalmente, el valor de elección dado que la

media suele estar desplazada respecto al núcleo principal de observaciones de la variable. En estos casos, la mediana es el valor que mejor expresa el punto donde se acumulan mayoritariamente las observaciones de la variable.

En el caso de poblaciones o muestras subdivididas en grupos claramente definidos la media y la mediana carecen, normalmente, de sentido y los valores que más claramente reflejan el comportamiento de las observaciones de la variable son las modas.

Otros estadísticos de centralidad son los cuantiles. Los cuantiles o percentiles Un percentil X, PX, es un valor de la distribución muestral o poblacional de la variable que es mayor o igual que el X% de las

observaciones de la variable P(Y ≤ PX) = X%. Existe un tipo especial de cuantiles llamados cuartiles. Los cuartiles son tres valores que dividen la distribución en cuatro partes equivalentes porcentualmente. o       El primer cuartil es el valor que es mayor o igual que el 25% de las observaciones de la muestra y menor o igual que el 75%. o       El segundo cuartil es la mediana. o       El tercer cuartil es mayor o igual que el 75% de las observaciones de la muestra y menor o igual que el 25% Estadísticos de dispersión              Los estadísticos de dispersión son parámetros muestrales que expresan la dispersión de los valores de la variable respecto al

punto central, es decir, su posición relativa. Los más importantes son:

Page 15: Terminos basicos de estadistica

El rango Es la diferencia entre las dos observaciones extremas, la máxima menos la mínima. Expresa cuantas unidades de diferencia

podemos esperar, como máximo, entre dos valores de la variable. El rango estima el campo de variación de la variable. Se afecta mucho por observaciones extremas y utiliza únicamente una pequeña parte de la información. La varianza Es la desviación cuadrática media de las observaciones a la media muestral.

Su concepto es análogo al de la varianza poblacional. No obstante esta expresión de cálculo de la varianza muestral no se utiliza mucho pues sus valores tienden a ser menores que el de la auténtica varianza de la variable (debido a que la propia media muestral tiene una varianza que vale un enésimo de la de las observaciones) Para compensar esta deficiencia y obtener valores que no subestimen la varianza poblacional (cuando estamos interesados en ella y no en la varianza muestral) utilizaremos una expresión, esencialmente igual que la anterior salvo que el denominador está disminuido en una unidad

Normalmente, estaremos interesados en saber cosas acerca de la varianza poblacional y no de la varianza muestral. Por tanto, en adelante, cuando hablemos de varianza muestral, salvo indicación expresa, nos referiremos a la segunda.

Es el estadístico de dispersión más usado por las propiedades de su distribución. Si la población de la que procede la muestra es normal:

con n-1 grados de libertad.

Page 16: Terminos basicos de estadistica

Además, utiliza toda la información de la muestra. Su mayor inconveniente consiste en que se expresa en unidades cuadráticas. Por ello, para muchos propósitos se utiliza otro

estadístico de dispersión que la desviación típica. Si no disponemos de una calculadora, el cálculo de la varianza puede ser complicado porque, habitualmente, los valores de las

desviaciones de las observaciones a la media resultan ser números con varias cifras decimales. Por ello, se suele utilizar una ecuación que deriva directamente de la anterior:

o, alternativamente,  la equivalente a aquella de "la media de los cuadrados menos el cuadrado de la media".

La desviación típica Es la raíz cuadrada positiva de la varianza y, por tanto, se expresa en las unidades de medida de la variable.

Su concepto es análogo al de la desviación típica poblacional. Coeficiente de variación Es el cociente entre la desviación típica y la media aritmética muestrales y expresa la variabilidad de la variable en tanto por

uno, sin dimensiones.

Permite comparar muestras de variables de distinta naturaleza o muestras de la misma variable en poblaciones en las que el orden de magnitud de las observaciones sea muy diferente.

Page 17: Terminos basicos de estadistica

ESTADÍSTICA DESCRIPTIVA El origen de la Estadística descriptiva puede relacionarse con el interés por mantener registros

gubernamentales hacia fines de la Edad Media. Cuando los estados nacionalistas empezaron a surgir durante ese período, se volvió necesario obtener información acerca de los territorios bajo la jurisdicción de cada nación. Esta necesidad de información numérica acerca de los ciudadanos y recursos lleva al desarrollo de técnicos para obtener y organizar datos numéricos. Hacia fines del siglo XVII, ya existían investigaciones semejantes a nuestros censos modernos. Al mismo tiempo, las compañías de seguros empezaban a recopilar tablas de mortalidad para determinar las primas de seguros de vida. En las primeras etapas de desarrollo, la estadística incluía poco más que la obtención, clasificación y presentación de datos numéricos. Aún hoy en día, estas actividades siguen siendo una parte importante de la Estadística. A continuación se da una definición de Estadística Descriptiva. Ejemplo: Un director de escuela desea conocer las aptitudes de cinco secretarias que trabajan en dicha institución. Se aplica una prueba de aptitudes a las cinco secretarias y las calificaciones son 82, 85, 95, 92 y 91. La medida estadística que emplea el Director es la aptitud promedio o media aritmética, la cual es la suma de los valores obtenidos dividida por el número de observaciones. Entonces, la calificación promedio es: 82+85+95+92+91 = 445 = 89 5 5 La Estadística es el estudio científico relativo al conjunto de métodos encaminados a la obtención, representación y análisis de observaciones numéricas, con el fin de describir la colección de datos obtenidos, así como inferir generalizaciones acerca de las características de todas las observaciones y tomar las decisiones más acertadas en el campo de su aplicación. “La Estadística Descriptiva es el estudio que incluye la obtención, organización, presentación y descripción de información numérica”. 29 El cálculo de la media aritmética, simple como es, es una parte importante de la estadística descriptiva. El resultado se limita a los datos obtenidos en este caso particular y no implica ninguna inferencia o generalización acerca de las aptitudes de otras secretarias. Este método es de naturaleza descriptiva, debido a que el promedio condensa y describe la información obtenida, por ejemplo en el caso de las secretarias significa que el promedio de las aptitudes de las cinco secretarias es 89%. La descripción de los datos también puede hacerse usando representaciones gráficas como veremos posteriormente.

Page 18: Terminos basicos de estadistica

ESTADÍSTICA INFERENCIAL Si el interés del Director de la escuela va más allá de la información obtenida, necesitará otras técnicas distintas

a loa métodos descriptivos. Por ejemplo; podría desear conocer la aptitud promedio de las demás secretarias, pero carece del tiempo o de los recursos para aplicar una prueba a todas ellas. Podría utilizar la calificación promedio de las cinco secretarias como base para realizar una inferencia o estimación acerca de la aptitud promedio de todas las secretarias. Con ese fin, necesitará conocer otra rama de la Estadística conocida como Estadística Inferencial o Inferencia Estadística. Definición Para concluir diremos que existe otra gran división de las técnicas estadísticas: a) Estadística Paramétrica. b) Estadística No Paramétrica. La Estadística Paramétrica es un conjunto de técnicas desarrolladas para niveles altos de medición como el de intervalos. Los métodos paramétricos permiten hacer inferencias acerca de parámetros poblacionales de las distribuciones. Estos métodos fueron los primeros en ser desarrollados por los investigadores de la Estadística. “La inferencia estadística es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a una información parcial o completa obtenida mediante técnicas descriptivas”. 30 La Estadística no paramétrica es un conjunto de técnicas diseñadas para niveles de medición menores, por ejemplo, el nominal y ordinal, para efectuar estimaciones no habrá parámetros en estricto sentido. A los procedimientos estadísticos que no dependen para su validez de la forma funcional de la distribución original de la población se les denomina procedimientos no paramétricos o libres de distribución. Los Procedimientos No Paramétricos disponibles actualmente ofrecen varias ventajas para el investigador y analista de datos; entre ellos se pueden mencionar los que estableció Bradley en 1968: 1) La mayoría de los procedimientos no paramétricos se basan en un conjunto mínimo de suposiciones y esto tiende a reducir la posibilidad de utilizarlos inadecuadamente. 2) Los cálculos aritméticos necesarios para la aplicación de muchos procedimientos no paramétricos son cortos y fáciles, de manera que con su empleo se puede ahorrar tiempo. 3) Los procedimientos no paramétricos son por lo general fácilmente comprensibles para personas no muy formadas matemática o estadísticamente. 4) Se pueden aplicar los procedimientos no paramétricos cuando los datos que se van a analizar consisten más bien en rangos o conteos de frecuencia tales como porcentaje de pruebas, estatura, peso, longitud, entre otras.