investigación y estadística: parte ii

25
INVESTIGACIÓN Y ESTADÍSTICA Dra. Ana F. Marín San Pedro Doctora por la Universidad Politécnica de Madrid en Ordenación del Territorio, Urbanismo y Medio Ambiente Postgraduada en Sistemas de Información Geográfica y en Ingeniería Ambiental, y Licenciada en Ingeniería Química en procesos industriales Licenciada en Ingeniería Química en procesos industriales [email protected] 1

Upload: phd-ana-f-marin-san-pedro

Post on 30-Jun-2015

744 views

Category:

Education


1 download

DESCRIPTION

Asignatura UTRM.

TRANSCRIPT

Page 1: Investigación y Estadística: PARTE II

INVESTIGACIÓN Y ESTADÍSTICA

Dra. Ana F. Marín San PedroDoctora por la Universidad Politécnica de Madrid en Ordenación del Territorio, Urbanismo y Medio Ambiente

Postgraduada en Sistemas de Información Geográfica y en Ingeniería Ambiental, y

Licenciada en Ingeniería Química en procesos industrialesLicenciada en Ingeniería Química en procesos industriales

[email protected]

Page 2: Investigación y Estadística: PARTE II

INVESTIGACIÓN Y ESTADÍSTICAINVESTIGACIÓN Y ESTADÍSTICAUNIDADESTEMÁTICAS

Tema I Metodología de la InvestigaciónTema I. Metodología de la InvestigaciónTema II. Probabilidad y Estadística descriptivaTema III. Software Estadístico SPPSTema IV. Pronósticos

COMPETENCIASDirigir empresas y organismos turísticos a través del diseño de estrategias,

i i ió d li i d bj iprocesos, optimización de recursos y cumplimiento de objetivos paracontribuir al desarrollo y competitividad de la industria turística.

Desarrollar proyectos turísticos dentro del marco de la sustentabilidad,p y ,impulsando el trabajo en redes sociales, a partir de las características ynecesidades de la región y organizaciones, para contribuir a la calidad de vidade las comunidades, rentabilidad de las empresas y satisfacción de losturistas.

[email protected]

Page 3: Investigación y Estadística: PARTE II

TEMA II PROBABILIDAD Y TEMA II. PROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

OBJETIVO DEL TEMA IIEl alumno identificará las características de una población mediante el cálculo de

probabilidades, medidas de tendencia central y de dispersión para explicar el comportamiento de los datos y futuras tendencias en la actividad turística.

[email protected]

Page 4: Investigación y Estadística: PARTE II

Resultado del aprendizajeResultado del aprendizajeA partir del análisis de una serie de datos de la actividadturística, el alumno entregará un reporte que contenga:

Identificación del tipo de probabilidadLa tabla de distribución de frecuenciasLa tabla de distribución de frecuenciasGráficas con la representación física de los datosCálculo de la Media, Mediana y ModayCálculo del rango y desviación estándarInterpretación de los resultados para la explicación del

i d l dcomportamiento de los datos.

[email protected]

Page 5: Investigación y Estadística: PARTE II

SubtemasSubtemasTema II.1 Conceptos básicos de probabilidad y estadística

Tema II.2 Organización de datos

Tema II.3 Medidas de tendencia central

T II 4 M did d di ióTema II.4 Medidas de dispersión

EVALUACIÓN DE 2DO PARCIAL: lunes 7 noviembre

[email protected]

Page 6: Investigación y Estadística: PARTE II

Tema II.1 Conceptos básicos de probabilidad y estadísticaprobabilidad y estadística

[email protected]

Page 7: Investigación y Estadística: PARTE II

TEMA II.1 CONCEPTOS BÁSICOS DE PROBABILIDAD ESTADÍSTICAPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

1 1 ConceptosProbabilidad: Conjunto de todos los elementos a los que se somete a un estudio

1.1 Conceptos

estadístico.

Espacio muestral: Todos los posibles resultados de un experimento.

Estadística: Número que describe una característica de una muestra. Resulta de laqmanipulación de datos de la muestra según ciertos procedimientos especificados.

Datos: Características o números que son recolectados por observación.

V i bl F ó d di lVariable: Fenómeno que puede tomar diversos valores.

Población: Conjunto completo de observaciones reales opotenciales.

Muestra: Subconjunto de la población seleccionada deacuerdo con un criterio.

[email protected]

Page 8: Investigación y Estadística: PARTE II

1 2 Clasificación de la estadística

TEMA II.1 CONCEPTOS BÁSICOS DE PROBABILIDAD ESTADÍSTICAPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

1.2 Clasificación de la estadísticaESTADÍSTICA

C d h lConjunto de herramientas para recolectar, organizar, presentary analizar datos numéricos u observaciones.

ESTADÍSTICA DESCRIPTIVAProcedimientos empleados para organizar y presentar datos enuna forma conveniente útil y fácil de comunicaruna forma conveniente, útil y fácil de comunicar

ESTADÍSTICA INFERENCIALProcedimientos empleados para llegar a generalizaciones oinferencias más amplias para poblaciones a partir de datos demuestras.

[email protected]

Page 9: Investigación y Estadística: PARTE II

TEMA II.1 CONCEPTOS BÁSICOS DE PROBABILIDAD ESTADÍSTICAPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

La estadística trata del recuento, ordenación yclasificación de los datos obtenidos por lasobservaciones, para poder hacer comparaciones y sacarconclusiones.

Un estudio estadístico consta de las siguientesfases:fases:

Recogida de datosOrganización y representación de datosg y pAnálisis de datosObtención de conclusiones

[email protected]

Page 10: Investigación y Estadística: PARTE II

Ti d i bl t dí ti

TEMA II.1 CONCEPTOS BÁSICOS DE PROBABILIDAD ESTADÍSTICAPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

Tipos de variables estadísticas

Variable cualitativa. Se refieren a características o cualidades que noqpueden ser medidas con números. Podemos distinguir dos tipos:

Variable cualitativa nominal: presenta modalidades no numéricas queVariable cualitativa nominal: presenta modalidades no numéricas queno admiten un criterio de orden. Por ejemplo:o El estado civil, con las siguiente modalidades: soltero, casado, separado,

divorciado y viudo.y

Variable cualitativa ordinal o variable cuasicuantitativa: presentamodalidades no numéricas en las que un orden. Por ejemplo:q j po La nota en un examen: suspenso, aprobado, notable, sobresaliente.

o Puesto conseguido en una prueba deportiva: 1ro, 2do y 3ro.

o Medallas de una prueba deportiva: oro, plata, bronce.

[email protected]

p p , p ,

Page 11: Investigación y Estadística: PARTE II

Ti d i bl t dí ti

TEMA II.1 CONCEPTOS BÁSICOS DE PROBABILIDAD ESTADÍSTICAPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

Tipos de variables estadísticas

Variable cuantitativa: Es la que se expresa mediante un número, por lotanto se pueden realizar operaciones aritméticas con ella. Podemos distinguirdos tipos:

Variable discreta: es aquella que toma valores aislados, es decir, noadmite valores intermedios entre dos valores específicos. Por ejemplo:

o El número de hermanos de 5 amigos: 2,1,0,1,3.g

Variable continua: es aquella que puede tomar valores comprendidosentre dos números. Por ejemplo:j p

o La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

[email protected]

Page 12: Investigación y Estadística: PARTE II

Tema II.2 Organización de datosTema II.2 Organización de datos

[email protected]

Page 13: Investigación y Estadística: PARTE II

2 1 Distribución de frecuencias

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

2.1 Distribución de frecuenciasLa distribución de frecuencias o tablas defrecuencias es una ordenación en forma de tabla de losdatos estadísticos, asignado a cada dato su frecuenciacorrespondientecorrespondiente.

TIPO DE FRECUENCIASFrecuencia absoluta

Frecuencia relativa

Frecuencia acumulada

Frecuencia relativa acumulada

[email protected]

Page 14: Investigación y Estadística: PARTE II

FRECUENCIA ABSOLUTA fi

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

FRECUENCIA ABSOLUTA, fiEs el número de veces que aparece un determinado valor en unestudio estadístico.

FRECUENCIA RELATIVA, niEs el cociente entre la frecuencia absoluta de un determinado valor

l ú t t l d d t f iy el número total de datos.

FRECUENCIA ACUMULADA,NEs la suma de las frecuencias absolutas de todos los valores

Nf

n ii=

Es la suma de las frecuencias absolutas de todos los valoresinferiores o iguales al valor considerado.

FRECUENCIA RELATIVA ACUMULADA, Fi

ffff nN ++++= ...321

Es el cociente entre la frecuencia acumulada de un determinado valory el número total de datos. Se expresar en tantos por ciento.

[email protected]

Page 15: Investigación y Estadística: PARTE II

EJEMPLO 1

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

EJEMPLO 1Un estudio hecho al conjunto de los 20 alumnos de una clase parad i í h d d l i i l ddeterminar su grupo sanguíneo ha dado el siguiente resultado.

Grupo fipsanguíneo

A 6

B 4

AB 1

0 9

2020

[email protected]

Page 16: Investigación y Estadística: PARTE II

El diagrama de barras se utiliza para presentar datos cualitativos

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

El diagrama de barras se utiliza para presentar datos cualitativoso datos cuantitativos de tipo discreto.

Forma gráfica que utiliza barras para indicar la frecuencia de ocurrencia delas observaciones. Los datos se representan mediante barras de unaaltura proporcional a la frecuencia.

Histograma: forma gráfica de barras que emplea variables con escala deintervalo o de proporciones.

Escala de intervalo: escala cuantitativa que permite el uso de operacionesaritméticas. El punto cero en la escala es arbitrario.

Escala de proporción: igual a la escala de intervalo, excepto que hay un puntocero verdadero.

4

6

8

10

[email protected]

2

A B AB 0

Page 17: Investigación y Estadística: PARTE II

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

La curva de frecuencia es la forma gráfica que representa unadistribución de frecuencia en la forma de una línea continua quet hi ttraza un histograma.

Curva de frecuencia acumulada: línea continua que traza unhistograma donde las barras en todas las clases inferiores están apiladas enhistograma donde las barras en todas las clases inferiores están apiladas enla clase adyacentes superior. No puede tener pendiente negativa.

Curva normal: curva en forma de campana.

C d i ét i l d tCurva sesgada: es asimétrica y alargada en un extremo.

8

10

0

2

4

6

[email protected]

A B AB 0

Page 18: Investigación y Estadística: PARTE II

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

Un diagrama de sectores se puede utilizar para todo tipo devariables, pero se usa frecuentemente para las variables

lit ticualitativas.

Los datos se representan en un círculo, de modo que elángulo de cada sector es proporcional a la frecuenciag p p fabsoluta correspondiente.

El diagrama circular se construye con la ayuda de un transportador deg y y pángulos.

[email protected]

Page 19: Investigación y Estadística: PARTE II

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

EJEMPLO 2En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican lanatación, 9 juegan futbol y el resto no práctica ningún deporte.

14412360301

°°

== xα

3633602

°°

== xα

1089360303

°°

== xα

7263604

°°

== xα

Deporte alumnos ángulo

B l 12 144

363302α 726304α

Baloncesto40%

Sin deporte

20%Baloncesto 12 144

Natación 3 36

Fútbol 9 108 Natación10%

Fútbol30%

Sin deporte 6 72

Total 30 360

10%

[email protected]

Page 20: Investigación y Estadística: PARTE II

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

Un histograma es una representación gráfica de unavariable en forma de barras.

S ili bl bl dSe utilizan para variable continuas o para variables discretas, conun gran número de datos, y que se han agrupado en clases.

En el eje de la abscisas se construyen unos rectángulos que tienen por base laj y g q pamplitud del intervalo, y por altura, la frecuencia absoluta de cadaintervalo.

La superficie de cada barra es proporcional a la frecuencia de los valoresp p prepresentados.

[email protected]

Page 21: Investigación y Estadística: PARTE II

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVAEJEMPLO 3

Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectángulo.

Ej l El d 65 d lt i d d l i i tEjemplo: El peso de 65 personas adultas viene dado por la siguientetabla:

[email protected]

Page 22: Investigación y Estadística: PARTE II

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

La distribución agrupada de frecuencias o tablas dedatos agrupados se emplea si las variables toman un númerogrande de valores o la variable es continua.

Se agrupan los valores en intervalos que tengan la mismaamplitud denominados clases. A cada clase se le asigna suf dfrecuencia correspondiente.

Límites de la clase: cada clase está delimitada por el limite inferior del l l lí i d l lla clase y el límite superior de la clase.Amplitud de la clase: es la diferencia entre el límite superior einferior de la clase.Marca de clase: es el punto medio de cada intervalo para el cálculo deMarca de clase: es el punto medio de cada intervalo para el cálculo dealgunos parámetros.

[email protected]

Page 23: Investigación y Estadística: PARTE II

EJEMPLO 4TEMA II.2 ORGANIZACIÓN DE DATOS

PROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

Durante el mes de julio en una ciudad se han registrado lassiguientes temperaturas máximas:

32 31 28 29 33 32 31 30 31 31 27 28 29 30 32 31 31 30 30 29 2932,31,28,29,33,32,31,30,31,31,27,28,29,30,32,31,31,30,30,29,29,30,30,31,30,31,34,33,33,29,29.En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y

en la tercera anotamos la frecuencia absoluta.xi Recuento fi Fi Ni Ni

27 I 1 1 0,032 0,032

28 II 2 3 0 065 0 097Este tipo de tablas de frecuencias 28 II 2 3 0,065 0,097

29 IIII I 6 9 0,194 0,290

30 IIII II 7 16 0,226 0,516

31 IIII III 8 24 0,258 0,774

pse utiliza variables discretas.

, ,

32 III 3 27 0,097 0,871

33 III 3 30 0,097 0,968

34 I 1 31 0,032 1

[email protected]

31 1

Page 24: Investigación y Estadística: PARTE II

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVAEJEMPLO 5

Construcción de una tabla de datos agrupados.3,15,24,28,33,35,38,42,43,38,36,34,29,25,17,7,34,36,39,44,31,26,20,11,13,22,27,47,39,37,34,32,35,28,38,41,48,15,32,13.

intervalo Ci fi Fi Ni Ni

[0, 5] 2,5 1 1 0,025 0,025

1ro se localizan los valores menor ymayor de la distribución. En este caso 3 y48.2d t b ú [5, 10] 7,5 1 2 0,025 0,050

[10, 15] 12,5 3 5 0,075 0,125

[15, 20] 17,5 3 8 0,075 0,200

2do se restan y se busca un númeroentero un poco mayor que la diferencia yque sea divisible por el número deintervalos queramos establecer.E i t l ú d [20, 25] 22,5 3 11 0,075 0,2775

[25, 30] 27,5 6 17 0,150 0,425

[30, 35] 32,5 7 24 0,175 0,600

[35 40] 37 5 10 34 0 250 0 850

Es conveniente que el número deintervalos oscile entre 6 y 15. En estecaso, 48 - 3 = 45, incrementamos elnúmero hasta 50 : 5 = 10 intervalos.Se forma los inter alos teniendo presente [35, 40] 37,5 10 34 0,250 0,850

[40, 45] 42,5 4 38 0,100 0,950

[45, 50] 47,5 2 40 0,050 1

40

Se forma los intervalos teniendo presenteque el límite inferior de una clasepertenece al intervalo, pero el límitesuperior no pertenece intervalo, secuenta en el siguiente intervalo

[email protected]

40cuenta en el siguiente intervalo.

Page 25: Investigación y Estadística: PARTE II

TEMA II.2 ORGANIZACIÓN DE DATOSPROBABILIDAD Y ESTADÍSTICA DESCRIPTIVA

[email protected]