estadistica matlab 2

131
Esta obra esta bajo una licencia reconocimiento-no comercial 2.5 Colombia de creativecommons. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/2.5/co/ o envié una carta a creative commons, 171second street, suite 30 San Francisco, California 94105, USA ANALISIS ESTADISTICO EN MATLAB Autores: CRISTIAN GERARDO GIL SANCHEZ MILLER GIOVANNY FRANCO LEMUS Director Unidad Informática: Henry Martínez Sarmiento Tutor Investigación: Álvaro Enrique Palacios Coordinadores: María Alejandra Enríquez Leydi Diana Rincón Coordinador Servicios Web: Daniel Alejandro Ardila Analista de Infraestructura y Comunicaciones: Adelaida Amaya Analista de Sistemas de Información: Álvaro Palacios Villamil Líder de Gestión de Recurso Humano: Islena del Pilar González UNIVERSIDAD NACIONAL COLOMBIA FACULTAD DE CIENCIAS ECONÓMICAS UNIDAD DE INFORMÁTICA Y COMUNICACIONES BOGOTÁ D.C. FEBRERO 2005

Upload: gerson-villa-gonzalez

Post on 11-Mar-2016

241 views

Category:

Documents


1 download

DESCRIPTION

Analisis Estadistico en Matlab

TRANSCRIPT

Esta obra esta bajo una licencia reconocimiento-no comercial 2.5 Colombia de

creativecommons. Para ver una copia de esta licencia, visite

http://creativecommons.org/licenses/by/2.5/co/ o envié una carta a

creative commons, 171second street, suite 30 San Francisco, California 94105, USA

ANALISIS ESTADISTICO EN

MATLAB

Autores:

CRISTIAN GERARDO GIL SANCHEZ

MILLER GIOVANNY FRANCO LEMUS

Director Unidad Informática: Henry Martínez Sarmiento

Tutor Investigación: Álvaro Enrique Palacios

Coordinadores: María Alejandra Enríquez

Leydi Diana Rincón

Coordinador Servicios Web: Daniel Alejandro Ardila

Analista de Infraestructura

y Comunicaciones: Adelaida Amaya

Analista de Sistemas de Información: Álvaro Palacios Villamil

Líder de Gestión de Recurso Humano: Islena del Pilar González

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS UNIDAD DE INFORMÁTICA Y COMUNICACIONES

BOGOTÁ D.C. FEBRERO 2005

ANALISIS ESTADISTICO EN MATLAB

Director Unidad Informática: Henry Martínez Sarmiento

Tutor Investigación: Maria Alejandra Enríquez G.

Auxiliares de Investigación:

Adriana Lucia Castelblanco

Alexis de Jesús Moros Andrés Ricardo Romero

Brayan Ricardo Rojas Carlos Hernán Porras

Catherine Cruz Pinzón Cristian Gerardo Gil

Daniel Alejandro Melo Diana Patricia García

Diego Fernando Rubio Edwin Montaño German David Riveros

Guillermo Alberto Ariza Héctor Javier Cortés

Leydy Johana Poveda

Liliana Paola Rincón

Luis Alfonso Nieto Luz Karina Ramos

Maria Teresa Mayorga Martha Rubiela Guevara

Miller Giovanny Franco Nubia Yolima Cucarian

Rafael Leonardo Saavedra Sandra Liliana Barrios

Sandra Milena Cardenas Sandra Mónica Bautista Sonia Janeth Ramírez

Yaneth Adriana Cañón Juan Felipe Rincón

Leidy Viviana Avilés

Este trabajo es resultado del esfuerzo de todo el equipo perteneciente a la Unidad de Informática.

Se prohíbe la reproducción parcial o total de este documento, por cualquier tipo de método fotomecánico y/o

electrónico, sin previa autorización de la Universidad Nacional de Colombia.

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS UNIDAD DE INFORMÁTICA Y COMUNICACIONES

BOGOTÁ D.C. DICIEMBRE 2005

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

3

TABLA DE CONTENIDO

TABLA DE CONTENIDO ................................................................................................................ 3

1. RESUMEN ................................................................................................................................ 5

2. ABSTRACT .............................................................................................................................. 5

3. INTRODUCCIÓN .................................................................................................................. 7

Objetivo ............................................................................................................................................... 7

Justificación .......................................................................................................................................... 7

4. STATISTICS TOOLBOX ................................................................................................... 8

Estructura de funciones .................................................................................................................... 9

5. MANEJO DEL TOOLBOX ESTADISTICO ............................................................. 10

Estadística Descriptiva ................................................................................................................... 11

5.1.1. Medidas de localización ............................................................................ 11

5.1.2. Medidas de dispersión ............................................................................... 17

5.1.3. Grupos de datos ............................................................................................ 29

6. GRÁFICAS EN TOOLBOX ESTADÍSTICO........................................................... 37

Introducción ..................................................................................................................................... 38

Principales Funciones Utilizadas En Matlab Para Gráficas ...................................................... 38

7. PROBABILIDAD ................................................................................................................ 63

Distribuciones De Probabilidad Discretas................................................................................. 63

7.1.1. Distribución Binomial ................................................................................. 63

7.1.2. Distribución Poisson.................................................................................... 68

7.1.3. Distribución Hipergeometrica ............................................................... 74

Distribuciones De Probabilidad Continuas ............................................................................... 80

7.1.4. Distribución Normal .................................................................................... 80

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

4

7.1.5. Distribución Exponencial ......................................................................... 95

7.1.6. Distribución Gamma ................................................................................. 103

7.1.7. Distribución Chi-Cuadrado 2 ...................................................... 111

7.1.8. Distribución Beta ........................................................................................ 117

ANEXO 1 .......................................................................................................................................... 120

INNOVACIONES DE MATLAB 7 ................................................................................................ 120

NUEVAS CARACTERISTICAS .................................................................................................. 120

EDITOR AND DEBUGGER ....................................................................................................... 124

GRÁFICAS ...................................................................................................................................... 126

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

5

1. RESUMEN

Matlab es un software aplicativo que permite su utilización en diferentes

áreas del conocimiento, además permite la posibilidad de utilizar

Toolbox especializados que facilitan el trabajo y aumentan la

funcionalidad del programa, tal como es el caso del Toolbox estadístico

en el cual enfocamos este trabajo de investigación.

En el presente trabajo se pretenden dar a conocer algunas de las

funciones básicas manejadas en el Toolbox estadístico, con el propósito

de utilizar en la mayor medida posible, las herramientas proporcionadas

por el software y adecuarlas a las necesidades presentes en el área

estadística, complementando de esta forma las características básicas

del Software, con las presentadas en investigaciones anteriores, la

presente investigación y las posibles investigaciones futuras en el

programa.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

6

2. ABSTRACT

Matlab is applicative software that allows using in different areas of the

knowledge, in addition allows the possibility of using specialized Toolbox

that they facilitate the work and they increase the functionality of the

program, it is the case of the statistical Toolbox in which we focused this

work of investigation.

This work tried to present some basic functions handled in the statistical

Toolbox, in order to use in the greater possible measurement, the tools

provided by software and to adapt them to the present necessities in

the statistical area, complementing the Software‟s basic characteristics,

with the presented ones in previous investigations, the present

investigation and the future investigations possible in the program.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

7

3. INTRODUCCIÓN

Objetivo

Este trabajo se desarrolla con el objeto de continuar la investigación que

se viene realizando en la UIFCE con miras a ampliar el campo de

aplicación del programa MATLAB a las ciencias económicas, en este caso

con un énfasis estadístico, disponible en un paquete específico -

Statistics Toolbox- . Teniendo en cuenta lo mencionado con

anterioridad, se considera de gran importancia avanzar en este sentido

para llegar a consolidar un nivel adecuado en la aplicación de este

software que garantice la óptima utilidad del mismo.

De esta forma se busca desarrollar con esta investigación un manual

relacionado con el uso específico del paquete estadístico de MATLAB, de

tal manera que el mismo se encuentre disponible para los usuarios de la

UIFCE con conocimientos estadísticos básicos que quieran encontrar una

aplicabilidad suficiente del software.

Justificación

Durante el desarrollo de las carreras de la facultad de ciencias

económicas se destaca la gran importancia del manejo y el

procesamiento de datos de tal forma que nos permitan establecer

conclusiones fiables que se acerquen en gran medida a las situaciones

reales, es por esta razón que se considera de gran importancia

establecer un uso adecuado de un software, como MATLAB y

específicamente del Statistics Toolbox, que facilite este proceso de

análisis de datos y además permita complementar un proceso de

conocimiento en el área de la estadística.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

8

4. STATISTICS TOOLBOX

El paquete estadístico de MATLAB ha sido desarrollado para proveer

ayuda a cualquier tipo de área, desde las finanzas hasta la ingeniería,

con herramientas interactivas capaces de establecer análisis detallados

de datos, además viene acompañado de una completa serie de

funciones para desarrollar desde las más básicas aplicaciones

estadísticas hasta un completo diseño y proceso de cualquier análisis

estadístico.

Este paquete provee dos completas categorías para este uso:

- Una estructura de funciones.

- Herramientas de diseño interactivo.

Este paquete es de gran funcionalidad puesto que permite combinar

poderosas funciones estadísticas con interfaces gráficas interactivas,

que han de generar un ambiente ideal para un completo montaje

estadístico.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

9

Estructura de funciones

MATLAB acompaña cada paquete de funciones con una completa guía de

ayuda disponible en diferentes temas específicos, que se muestran a

continuación. Las funciones que MATLAB incluye en este paquete las

agrupa dentro de las siguientes áreas:

Estadística descriptiva 30 Control de procesos estadísticos 7

Estadística multivariada 25 Regresión no Lineal 10

Gráficos estadísticos 26 Diseño de Experimentos 12

Distribuciones de probabilidad 138 Técnicas de árbol de decisión 5

Pruebas de distribución 4 Pruebas No Paramétricas 6

Modelos Lineales 27 Modelos Hidden Harkov 5

Importar/exportar archivos 5 Demostraciones 7

Pruebas de hipótesis 6 Utilidades 2

Es importante destacar como en MATLAB es posible acceder al código

fuente de las funciones predeterminadas (*.m), y amplia este capacidad

hasta el punto en el cual se puede crear y/o personalizar cualquier tipo

de función, ajustándolas a necesidades especificas.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

10

Diseño interactivo - Interfaz Grafica de Usuario

Además de la posibilidad de diseñar cualquier interfaz para un análisis

especifico, MATLAB viene acompañado de opciones predefinidas muy

útiles, una de estas es “The Distribution Fitting Tool” (Herramienta

apropiada para las distribuciones) una herramienta de gran utilidad que

permite observar el comportamiento de 16 diferentes tipos de

distribuciones de probabilidad con la opción de combinar distintas

condiciones para cada una de ellas.

INVESTIGACIÓN

Se ha planeado la investigación de tal manera que su resultado pueda

acompañar un proceso académico, en el cual se establezca una

interrelación entre la estadística y las ciencias económicas, es de esta

manera como sin olvidar la gran funcionalidad de este paquete de

herramientas, la investigación se va a enfocar en tres ejes temáticos,

que se consideran de primera importancia para iniciar un estudio tan

extenso.

5. MANEJO DEL TOOLBOX ESTADISTICO

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

11

En esta sección se explicará el uso de las funciones de más utilidad del

toolbox estadístico, con ejemplos básicos y útiles donde se destaquen la

aplicabilidad de cada una de ellas.

Estadística Descriptiva

5.1.1. Medidas de localización

Mean ()

Descripción Calcula la media aritmética de determinados valores.

Sintaxis mean (a)

- Si a es un vector, calcula la media de los valores. - Si a es una matriz, calcula la media de cada

columna.

mean (a, dim)

- Devuelve los valores medios de la dimensión especificada de la matriz a.

- La dimensión predefinida es 1.

Ejemplo a = [1:10]

Media = mean (a)

Media = 5.5000

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

12

m_columnas = mean (b) % media por columnas

m_columnas = [5.0000 5.2500 4.0000]

m_filas = mean (b, 2) % media por filas

m_filas = [2

6

5

6]

Nota

Geomean ()

Descripción Calcula la media geométrica de determinados valores.

Sintaxis geomean (a)

- Al igual que la función anterior, si a es un vector, calcula la media de los valores.

- Si a es una matriz, calcula la media de cada

columna.

Ejemplo a = [1:10]

nanmean() Descripción Calcula la media ignorando aquellos datos perdidos.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

13

m_geometrica = geomean (a)

m_geometrica = 4.5287

Nota

Harmmean ()

Descripción Calcula la media armónica de determinados valores, en

este caso representada por H, es igual al recíproco de una cantidad finita de números, o inverso, de la media

aritmética de los recíprocos de dichos números

Sintaxis harmmean (a)

- Su parámetro funciona de la misma manera que para la media geométrica (mean).

Ejemplo a = [1:10]

m_armonica = harmmean (a)

m_armonica = 3.4142

Media aritmética > Media geométrica

mean (x) > geomean(x)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

14

Trimmean ()

Descripción Calcula la media ajustada de una muestra determinada,

es decir excluye los y/2 percentiles mas bajos como los mas altos, muy útil cuando encontramos datos atípicos en

la muestra.

Sintaxis trimmean (a, y)

- El parámetro a funciona de la misma manera que

las funciones anteriores, donde a es la muestra.

- Mientras y representa el numero de percentiles

que se quieren obviar en los extremos.

Ejemplo a = [1:10] %a = [1 2 3 4 5 6 7 8 9 10]

y = 20

m_ajustada = trimmean (a, y)

%Por el parámetro “y” la muestra que se calcula es a = [2 3 4 5 6 7 8 9]

m_ajustada = 5.5000

%En este caso la media ajustada es igual a la media aritmética por las características de la muestra.

b = [1 2 3 7 5 6 4 5 6 8 9 1]

z = 10

m_ajustada = trimmean (b, z)

m_ajustada = 5.5000

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

15

Max (); Min ()

Descripción Devuelve los valores extremos de una determinada muestra.

Sintaxis max(a); min(a)

- Si a es un vector, retorna el valor máximo/mínimo.

- Si a es una matriz, retorna máximo/mínimo de cada columna.

-

max(a,[],dim); min(a[],2)

- Si a es una matriz, retorna máximo/mínimo según

dim ya especificada, cuando dim = 2 devuelve los valores extremos para las filas.

Ejemplo b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

%Devuelve los valores extremos por cada columna.

mx = max(b) mi = min(b)

mx = [8 9 6] mi = [1 2 1]

%Devuelve los valores extremos por cada fila.

mxf = max(b,[],2) mif = min(b,[],2)

mxf = [ 3 mif = [ 1

7 5

6 4

9 ] 1 ]

Nota

nanmax() ; nanmin ()

Descripción Devuelve los valores extremos de una determinada

muestra ignorando aquellos datos perdidos.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

16

Median ()

Descripción Calcula la mediana de una muestra (matriz) especifica.

Sintaxis median (a)

- Si a es un vector, retorna la mediana de los valores.

- Si a es una matriz, retorna la mediana de cada

columna.

median (a, dim)

- Devuelve los valores medios de la

dimensión especificada. - La dimensión predefinida es 1.

Ejemplo a = [1:10]

Mediana = median (a)

Mediana = 5.5000

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

mediana_col = median (b) % mediana por columnas

mediana_col = [ 5.5000 5.0000 4.5000]

mediana_fil = median (b, 2) % mediana por filas

mediana_fil = [2

6

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

17

5

8]

Nota

5.1.2. Medidas de dispersión

Std ()

Descripción Devuelve la desviación estándar de una matriz o muestra específica.

Desviación estándar Corregida Desviación estándar sin Corregir

Sintaxis std (a)

- Si a es un vector, retorna la desviación estándar

corregida de los valores. - Si a es una matriz, retorna la desviación estándar

corregida de los valores por columnas.

std (a, flag)

nanmedian() Descripción Calcula la mediana ignorando aquellos datos perdidos.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

18

- Cuando flag = 0, std (a,0) se comporta de la

misma manera como std (a)

- Cuando flag = 1, std (a, 1) devuelve la

desviación estándar sin corregir, y el segundo momento de la muestra

std (a, flag, dim)

- obtenemos la desviación estándar de la dimensión determinada.

- Cuando dim = 0 obtenemos la desviación

estándar de las columnas. - Si dim = 1 se genera la desviación estándar de las

filas.

Ejemplo a = [1:10]

Des_std = std (a) % desviación estándar corregida Des_std = 3.0277

Dstd = std (a, 1)% desviación estándar sin corregir

Dstd = 2.8723 % segundo momento

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

dstd_col= std (b)% desviación estándar por columnas

dstd_col = [ 3.1623 2.8723 2.4495]

dstd_fil = std (b,0,2)% desviación estándar por filas

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

19

dstd_fil = [1.0000

1.0000

1.0000

4.3589 ]

Nota

Var ()

Descripción Calcula la varianza de una muestra específica, es igual al cuadro de la desviación estándar corregida.

Sintaxis var (a)

- Si a es un vector, retorna la varianza corregida de

los valores. - Si a es una matriz, retorna la varianza corregida

de cada columna.

var (a,1)

- Si a es un vector, retorna la varianza sin corregir

de los valores, mientras si a es una matriz, retorna la varianza sin corregir de cada columna.

Ejemplo a = [1:10]

Varz = var (a) % desviación estándar corregida

Varz = 9.1667

Recordemos que: std(a) = 3.0277.

nanstd() Descripción Calcula la desviación estándar ignorando aquellos datos

perdidos.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

20

[ std(x) ]2= (3.0277) 2 = 9.167 = var(x)

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

varc = var(b) % varianza por columnas

varc = [ 10.0000 8.2500 6.0000 ]

varf = var(b,1) % varianza por filas

varf = [ 7.5000 6.1875 4.5000 ]

Nota

Range ()

Descripción Devuelve el rango de una determinada serie de datos, es decir calcula la diferencia entre el dato máximo y el dato

mínimo.

Sintaxis range (a)

- Si a es un vector, calcula el rango del mismo. - Si a es una matriz, calcula el rango de cada

columna.

Varianza corregida: [ std(x) ] 2= var(x)

Varianza sin corregir: [ std(x,1) ] 2 = var(x,1)

nanvar() Descripción Calcula la varianza ignorando aquellos datos perdidos.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

21

Ejemplo a = [1:10]

rango = range (a)

rango = 9

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

ran = range (b)

ran = [ 7 7 5 ]

Iqr ()

Descripción Calcula el rango intercuartil de una muestra especifica, es decir, la diferencia entre el percentil 75 y el 25.

Sintaxis iqr (a)

- Si a es un vector, calcula el rango intercuartil del

mismo. - Si a es una matriz, calcula el rango intercuartil de

cada columna.

Ejemplo a = [1:10]

R_ intercuartil = iqr (a)

R_ intercuartil = 5

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

R_ intercuartil = iqr (a)

R_ intercuartil = [ 5.0000 3.5000 4.0000 ]

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

22

Prctile ()

Descripción Calcula el valor de un percentil determinado en el

intervalo de [0 100] en una muestra especifica.

Sintaxis prctile (a, p)

- “p”, corresponde al percentil que se busca, puede

ser un vector o escalar

- “a”, es la muestra que se analiza, puede ser

vector o matriz.

a p Prctile (a , p)

Vector Escalar Calcula el percentil “p” de la muestra “a”.

Matriz Escalar Genera un vector con los percentiles “p” por cada columna de la matriz “a”.

Vector Vector Genera un vector con los percentiles que contiene “p” de la muestra “a”.

Matriz Vector Genera una matriz en la cual cada columna corresponde a los percentiles especificados en “p” de cada columna de la matriz “a”

Nota

Ejemplo a = [1:10]

b = [25 50 75]

Percentil 50 = Mediana

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

23

percentiles = prctile (a,b)

percentiles = [ 3.0000 5.5000 8.0000 ]

c = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

d = [25 50 75]

percent = prctile (c,d)

percent = [ 2.5000 3.5000 2.0000

5.5000 5.0000 4.5000

7.5000 7.0000 6.0000 ]

Quantile ()

Descripción Calcula el valor de un quantiles de una muestra especifica, aunque su resultado es muy similar al de la

función anterior – prctile() - .

Sintaxis quantile (a, p, dim)

- “p”, corresponde al quantil que se busca, puede

ser un vector o escalar y se encuentra entre el

rango [0 1] .

- “a”, es la muestra que se analiza, puede ser

vector o matriz.

- Su comportamiento hasta este punto es igual a la función prctile().

- Sin embargo el parámetro dim es muy útil ya que nos permite buscar quantiles en otras dimensione.

dim=1, por columnas, dim=2, por filas

Nota

Prctile( x , 50) = quantile (x, .50) = mediana

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

24

Ejemplo a = [1:10]

Q5 = quantile(a, .5) %Igual a la mediana

Q5 = 5.5000

Resume = quantile(a,[.025 .25 .50 .75 .975] )

Resume = [1.0000 3.0000 5.5000 8.0000 10.0000 ]

b = magic(3)

b = [8 1 6

3 5 7

4 9 2 ]

MedianaC = quantile(b,.5,1) %Mediana por columnas

MedianaC = [ 4 5 6 ]

MedianaF = quantile(b,.5,1) %Mediana por filas

MedianaF = [ 6

5

4 ]

Skewness ()

Descripción Calcula la oblicuidad de una determinada muestra,

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

25

Sintaxis skewness (a)

- Si a es un vector, calcula la oblicuidad de los valores.

- Si a es una matriz, calcula la oblicuidad de cada

columna.

Ejemplo X = randn([5 4])

%genera una matriz aleatoria con distribución normal

X = [ 0.2944 0.8580 -0.3999 0.6686

-1.3362 1.2540 0.6900 1.1908

0.7143 -1.5937 0.8156 -1.2025

1.6236 -1.4410 0.7119 -0.0198

-0.6918 0.5711 1.2902 -0.1567 ]

obl = skewness (X)

%En este caso la oblicuidad se acerca a cero

obl = [ -0.0040 -0.3136 -0.8865 -0.2652 ]

Nota

.

La oblicuidad (obl.) es una medida de asimetría de las muestras con distribución normal, se mide a partir de la media.

Si obl. < 0, entonces la mayoría de los datos se encuentran a la izquierda de la media;

Si obl.> 0, entonces la mayoría de los datos se encuentran a la derecha de la media; y

Si obl. = 0, entonces la muestra corresponde a una distribución normal con perfecta simetría.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

26

kurtosis ()

Descripción Calcula la curtosis, removiendo los valores perdidos.

Sintaxis kurtosis (a)

- Cuando a es un vector, calcula la curtosis de los elementos del mismo.

- Cuando a es una matriz, calcula la curtosis para cada columna.

kurtosis (a, flag)

- Especifica si se quiere corregir la diagonal (flag = 0)

o no (flag = 1, por defecto).

Ejemplo a = [1 5 9; 2 6 10; 3 7 11; 4 8 12]

k=kurtosis (a)

k= [1.6400 1.6400 1.6400]

tabulate ()

Descripción Devuelve una tabla con las frecuencias absolutas y relativas de una muestra.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

27

Sintaxis tabulate (a)

- El parámetro a representa la muestra, y solo

puede ser un vector.

Ejemplo a = [4 1 4 4 2 3 4 3 1 2]

tabla = tabulate (a)

tabla =

Value Count Percent

1 2 20.00%

2 2 20.00%

3 2 20.00%

4 4 40.00%

mad ()

Descripción Desviación absoluta media o mediana de una muestra.

Sintaxis mad (a,flag,dim)

Si flag = 0 :

- Si a es un vector, calcula la desviación absoluta media de los valores.

- Si a es una matriz, calcula la desviación absoluta media de cada columna.

Si flag = 1:

- Si a es un vector, calcula la desviación absoluta mediana de los valores.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

28

- Si a es una matriz, calcula la desviación absoluta medina de cada columna.

- dim se usa para determinar la dimensión en la cual se quiere calcular.(dim = 0, por defecto,

columnas, dim=1 por filas)

Ejemplo a = [1:10]

DesvAbs = mad(a)

DesvAbs = 2.5000

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

dac = mad(b) % desviación media por columnas

dac =[ 2.5000 1.8750 2.0000 ]

daf = mad(b,0,1)% desviación media por filas

daf =[ * * * ]

Nota

moment ()

Descripción Devuelve los momentos centrales de cualquier orden (k).

Para una distribución normal 'mad ()' es menos eficiente que la desviación estándar 'std()' como medida de dispersión.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

29

Sintaxis moment(a, order, dim)

- Calcula el momento central de a según el entero

positivo order. - SI a es un vector, calcula el momento central por

cada columna. - dim especifica la dimensión con la cual se

calcularan los momentos centrales.

Ejemplo a = [1:10]

DesvAbs = mad(a)

DesvAbs = 2.5000

b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

dac = mad(b) % desviación media por columnas

dac =[ 2.5000 1.8750 2.0000 ]

daf = mad(b,0,1)% desviación media por filas

daf =[ * * * ]

5.1.3. Grupos de datos

cov()

Descripción Devuelve una matriz de covarianza.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

30

Sintaxis cov (a)

- Cuando a es un vector, devuelve un valor con la

varianza del mismo. - Cuando a es una matriz, cada columna es una

observación y cada columna una variable.

Proceso El algoritmo para cov () es:

[n,p] = size(X);

X = X - ones(n,1) * mean(X);

Y = X'*X/(n-1);

Ejemplo a = [1:10]

Covarianza = cov(a)

Covarianza = 9.1667

b = [1 2 3; 7 5 6; 4 5 6]

Covarianza = cov (b)

Covarianza =[ 9.0000 4.5000 4.5000

4.5000 3.0000 3.0000

4.5000 3.0000 3.0000 ]

corr()

Descripción Devuelve una matriz de correlación linear.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

31

Sintaxis RHO = corr(a)

- a debe ser una matriz, y devuelve un matriz de

correlacion entre columnas.

RHO = corr(a,b)

- Genera una matriz de correlación entre las dos

matrices, las dimensiones de a deben ser

iguales a las de b.

RHO = corr(...,'param1', val1, 'param2',val2,...)

- Especifica mas parámetros para determinar la

Correlación.

Parámetros Valores Descripción

'type' 'Pearson'

(por defecto)

● Calcula el coeficiente de correlación lineal de 'Pearson'.

● Para los valores-P usa la distribución T-Student

'Kendall'

● Calcula “Kendall's tau”, otra medida de correlación.

'Spearman' ● Calcula la correlación de 'Spearman'.

'rows' 'all'

(por defecto)

● Calcula usando todas las filas así contengas valores perdidos.

'complete'

● Calcula las filas que no tengan valores perdidos.

'pairwise'

● Calcula RHO[i,j] usando las filas que no tengan valores perdidos en las columnas j e i .

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

32

'tail'

'ne'

(por defecto)

● Correlación no es cero

'gt' ● Correlación es mayor que cero

'lt' ● Correlación es menor que cero

(Cola – La hipótesis alternativa contraria a la que deseamos comprobar.)

Ejemplo a = [1 2 3; 7 5 6; 4 5 6; 8 9 1]

Rho = corr(a)

Rho =[ 1.0000 0.8808 -0.1291

0.8808 1.0000 -0.4264

-0.1291 -0.4264 1.0000 ]

b=[1 2 3; 4 5 6; 7 8 9; 10 11 12]

RHO = corr(a)

RHO = [ 1 1 1

1 1 1

1 1 1 ]

corrcoef()

Descripción Devuelve una matriz con los coeficientes de correlación, en el cual las filas son observaciones y las

columnas son variables .

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

33

Sintaxis R = corrcoef (a)

- a debe ser una matriz.

[R,P]= corrcoef (a)

- Devuelve además una matriz con los valores p

usados en las pruebas de hipótesis.

[R,P,RLO,RUP]=corrcoef(...)

- Además devuelve RLO y RUP que son los límites de

determinado intervalo a 95% de confianza.

[...]=corrcoef(...,'param1',val1,'param2',val2,...)

-Parámetros adicionales

Parámetros Descripción

'alpha' Un numero entre 0 y 1 usado para especificar el nivel de confianza de 100*(1-alpha)%

Ejemplo. Cuando alpha es 0.05, el intervalo de confianza esta a 95%

'rows' Los valores se determinan de la misma manera que para corr().

crosstab()

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

34

Descripción Genera una matriz con tabulación-cruzada entre diferentes vectores.

Sintaxis crosstab (col1 ,col2)

- Se genera una matriz donde el elemento (i,j)

corresponde a la cuenta de todas las observaciones donde col1=i y col2 =j.

Ejemplo

a = [ 1 2 3 4 5 6 7 8 9 10 ]

%Código de diez estudiantes

b = [ 2 4 4 3 1 5 3.5 2.5 3 2 ]

%Nota para los diez estudiantes respectivamente

tabla = crosstab(a,b)

tabla = [ 0 1 0 0 0 0 0

0 0 0 0 0 1 0

0 0 0 0 0 1 0

0 0 0 1 0 0 0

1 0 0 0 0 0 0

0 0 0 0 0 0 1

0 0 0 0 1 0 0

0 0 1 0 0 0 0

0 0 0 1 0 0 0

0 1 0 0 0 0 0 ]

Puede interpretarse como:

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

35

Nota

Alumno

1 2 2.5 3 3.5 4 5

1 0 1 0 0 0 0 0

2 0 0 0 0 0 1 0

3 0 0 0 0 0 1 0

4 0 0 0 1 0 0 0

5 1 0 0 0 0 0 0

6 0 0 0 0 0 0 1

7 0 0 0 0 1 0 0

8 0 0 1 0 0 0 0

9 0 0 0 1 0 0 0

10 0 1 0 0 0 0 0

grpstats ()

Descripción Devuelve un resumen estadístico por grupo.

Sintaxis grpstats (a, group)

- Genera la media de cada columna de a por grupo, el vector group define como se agruparan los

datos.

grpstats (a, group, alpha)

- Genera un diagrama de las medias frente a un

índice 100(1 - alpha) % de intervalo de confianza por cada media.

grpstats (a, group, whichstats)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

36

- En este caso whichstats corresponde a otros estadísticos

que podemos calcular dentro de los siguientes:

'mean' Promedio

'sem' Error estándar

'numel' Cuenta, del número de elementos.

'gname' Nombre del grupo

'std' Desviación Estándar

'var' Varianza

'meanci' Intervalo de confianza al 95%

'predci' Intervalo de predicción a un 95% para una nueva observación

bootstr ()

Descripción Permite efectuar el Bootstrap con determinadas características.

Nota

El Bootstrap es una metodología estadística que a tenido gran aplicación en los últimos años, y consiste en obtener nuevas muestras con características similares a una primera muestra real (raíz), y partir de los estadísticos de todas las muestras generadas establecer conclusiones mas precisas.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

37

Sintaxis bootstr (nboot, fboot,d1,d2,…)

- nboot, es el numero de muestras que queremos generar.

- fboot, es la función que se quiere aplicar a las muestras.

- d1, d2, …. , son las muestras raíz.

Ejemplo X = [1:5] %Muestra raíz

B1 = bootstr(3,‟size‟,a)

B1 = [ 5 1

5 1

5 1 ]

B2 = bootstr(3,‟mean‟,a)

B2 = [ 2.6000

2.2000

3.8000 ]

6. GRÁFICAS EN TOOLBOX ESTADÍSTICO

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

38

Introducción

El Toolbox estadístico de MATLAB, proporciona grandes facilidades en lo relacionado con gráficas, situación que permite automatizar y agilizar el

manejo y procesamiento de las mismas. Para ello dispone de una serie de funciones que permiten modificar dentro de la figura los parámetros

que afectan el resultado de la misma. En el presente informe se pretende dar a conocer algunas de estas ventajas con una ayuda que

permita una fácil utilización las funciones predefinidas para el programa.

Las gráficas estadísticas en las que basaremos el presente trabajo serán algunas en las cuales se manejen las funciones de distribución básicas,

de tal manera que se adecue a las necesidades de los estudiantes de la facultad de ciencias económicas, dando principal énfasis en funciones de

distribución como la T, Chi-cuadrado, F, Binomial, Poisson, entre otras.

Principales Funciones Utilizadas En Matlab Para Gráficas

Existen una serie de criterios generales para seleccionar gráficas de tipo estadístico, criterios que corresponden a las posibilidades y

características que poseen las gráficas en el TOOLOBOX ESTADISTICO. Algunas de las características de mayor importancia se encuentran

relacionadas con el entendimiento de las gráficas, como bien es

expresado en la siguiente frase “toda grafica debe explicarse por si misma, por tanto debe llevar un titulo claro, la fuente de donde fueron

obtenidos los datos, rangos de escalas y leyendas o notas explicatorios”1. Las gráficas en matlab permiten la posibilidad de

adecuarlas de tal forma que sean completamente entendibles para los usuarios, por medio de las diferentes posibilidades existentes para

insertar en las graficas.

En el menú insertar, Matlab permite la posibilidad de agregar a la gráfica etiquetas de diferentes tipos, de igual forma es posible colocar al

interior de la misma formas y cuadros, estas opciones proporcionadas por el programa permiten responder a las características básicas para

graficas, y además colocar algunos elementos adicionales que dan un toque personal y mejor entendimiento de las mismas.

1 Ciro Martínez Bencardino, ESTADISTICA

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

39

Para conocer algunas de las posibilidades de las gráficas en el Toolbox, presentaremos algunas de las funciones relacionadas con graficas de

tipo estadístico en el programa. Las siguientes son las funciones básicas de mayor importancia, relacionadas con los estudios de tipo estadístico:

RANDTOOL

Esta función permite generar de forma interactiva números al azar mostrando los resultados gráficos por medio de un histograma. Instala

un interfaz gráfico que permite indagar los efectos al realizar cambios en los parámetros que afectan la función que se desee graficar.

Algunas características de la interfaz (VER FIGURA 1)

La interfaz que se abre con la función, permite fijar valores de

parámetro para la distribución y para cambiar sus límites superiores e inferiores en la generación de datos aleatorios.

Permite dibujar otra muestra con la misma distribución, con el mismo

tamaño y los parámetros, al igual que generar la grafica de otro tipo de distribución con los parámetros seleccionados en primera instancia.

Permite exportar la muestra actual al workspace, para ello proporciona la opción exportar la cual permite ver los datos aleatorios que generaron

la grafica y en general trabajar con estos como si hubiesen sido creados

en el command window.

Trae una barra de menús completa que permite realizar modificaciones a las características de la grafica, compuesta por bastantes opciones que permitirán adecuar la grafica a nuestros requerimientos y de igual

forma obtener todo tipo de información relacionado con la grafica

generada con datos aleatorios.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

40

FIGURA 1

DISTTOOL

Esta función permite generar de forma interactiva diagramas de

diferentes distribuciones de probabilidad. La interfaz generada por esta función permite escoger entre dos tipos de diagramas, el de cdf

(genera una función distribución acumulativa elegida) o el de pdf (Función de densidad de probabilidad para una distribución especificada)

y al igual que la función presentada con anterioridad permite realizar modificaciones a los parámetros relacionados con las características de

la misma interfaz generada.

Algunas características de la interfaz (VER FIGURA 2)

Barra de menús

Valor del parámetro

Exportar datos al workspace

Limite superior e inferior de los datos generados.

FUNCIONES DE DISTRIBUCION

TAMAÑO DE LA MUESTRA

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

41

La interfaz que se abre con la función, permite fijar valores de

parámetro para la distribución y para cambiar sus límites superiores e inferiores en la generación de datos aleatorios.

En la interfaz se tiene la posibilidad de conocer los valores de X correspondientes a un nivel de probabilidad, o viceversa. Estos

valores pueden ser modificados de acuerdo a nuestras necesidades y varían automáticamente en la interfaz generada con esta función.

Permite la posibilidad de generar un sin numero de gráficos, teniendo en cuenta los 20 tipos de distribución existentes, y las dos

posibilidades de funciones que se pueden generar para cada tipo de distribución.

FIGURA 2

TIPO DE FUNCION

FUNCION TIPO CDF O PDF

Limite superior e inferior de los datos generados.

FUNCIONES DE DISTRIBUCION

Valor del parámetro

VALOR DE

LA FUNCION

VALOR DE X

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

42

Lsline

Descripción

Esta función genera la línea de ajuste de los mínimos cuadrados de una función predeterminada.

Sintaxis

lsline

x = lsline

Ejemplo

Se puede generar un vector x con cualquier tipo de características (en este caso un vector que contiene 20

datos aleatorios con distribución normal), en este caso

utilizamos la función randn;

X = randn (20,1)

Graficamos la función y pedimos que nos señale los valores al interior de la gráfica.

plot (X,‟+‟)

Por último utilizamos la función lsline para que nos genere la línea de tendencia de los valores graficados.

lsline (ver FIGURA 3).

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

43

0 2 4 6 8 10 12 14 16 18 20-2.5

-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

FIGURA 3

Cdfplot

Descripción

Este comando permite ver la gráfica de una función de

distribución acumulativa empírica para datos en un solo vector X. El cdf empírico se define como la

proporción de valores de X menor o igual a x. Este diagrama, al igual que los generados por hist y

normplot, es útil para examinar la distribución de una muestra de datos.

Sintaxis

cdfplot (X)

h = cdfplot(X)

[h, stats] = cdfplot(X)

Línea de tendencia

Generada por la función

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

44

Ejemplo

En primer lugar generaremos un vector con media: 0, desviación estándar: 1; con dimensiones m: 20 y n: 1.

Para ello utilizaremos la función normrnd estableciendo los parámetros anteriormente

mencionados, así: x = normrnd (0,1,50,1);

Posteriormente utilizamos la función objetivo del ejemplo de la siguiente forma: cdfplot (x) (VER

FIGURA 4)

Y por ultimo le pedimos que nos muestre el h y los estadísticos básicos [h,stats] = cdfplot(X), así:

stats values

min: -1.7613

max: 2.7922

mean: -0.1579

median: -0.3096

std: 0.9138

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

45

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x

F(x

)

Empirical CDF

FIGURA 4

Boxplot

Descripción Diagrama de caja de una muestra de los datos

Sintaxis

- Boxplot(X): produce un diagrama de caja y de “bigotes” para cada columna de la matriz X. La caja tiene líneas en el cuartíl

superior, en el punto medio, y en el cuartíl inferior de la caja.

- Los “bigotes” son líneas que extienden de cada extremo de la caja para mostrar la extensión de los datos que se encuentran fuera de los limites de la caja. Los “mas” (+) son datos con valores más allá de los

extremos de los “bigotes”. Si no hay datos fuera de los “bigotes”, un punto se coloca en el “bigote” inferior

- boxplot (X,G): produce un diagrama de caja y bigotes para un vector X, agrupado por G. G es un grupo de variables definidas

por un vector, una matriz o un conjunto de celdas variables. G también puede ser un conjunto de variables

(tales como {G1 G2 G3} agrupando los valores en X por cada combinación de grupo de variables.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

46

- boxplot (...,'Param1', val1, 'Param2', val2,...): parámetros opcionales específicos, tales como los descritos en el siguiente

cuadro:

Parameter Name

Parameter Values

'notch' 'on' para incluir los cortes en la caja (por defecto es 'off')

'symbol' Símbolo para usar fuera del limite del grafico (por

defecto es r+')

'orientation' Orientación del diagrama 'vertical' (por defecto) o 'horizontal'

'whisker' Máxima extensión de los “bigotes” en unidades de rango de intercuartíl (por defecto 1.5)

'labels' Etiquetas para la secuencia de columnas (se usa solamente cuando X es una matriz, y la etiqueta

por defecto es el numero de la columna).

En un boxplot con cortes, dichos cortes representan un buen estimador de la incertidumbre, en la comparación de las medianas de cada caja

graficada. Cuando los cortes no se traslapan indican que las medianas de los dos grupos difieren con un 5 por ciento de nivel de significancia.

Ejemplo

Los siguientes comandos generan un diagrama de boxplot usando

una base de datos existente en el programa y que permite su

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

47

utilización para la explicación de varias funciones. Los siguientes comandos crean un boxplot de la aceleración relacionada con el

año de fabricación de los carros.

load carsmall

boxplot (Acceleration, Model_Year)

70 76 82

8

10

12

14

16

18

20

22

24

Valu

es

Boxplot Acelaracion VS Modelo del carro

En este ejemplo podemos ver un diagrama de caja para la aceleración

de los vehículos de acuerdo con el año de fabricación, y podemos evaluar algunas de las características que evidencia la figura, tales como

la diferencia entre medianas y los datos que se encuentra fuera de los límites del diagrama de caja.

Este ejemplo produce los diagramas de la caja para los datos de la muestra, y acepta el defecto 1,5 * IQR para la longitud de las

barbas.

X1 = normrnd(6,1,60,1); % normrnd genera datos aleatorios con distribución normal

X2 = normrnd(4,2,60,1); x = [X1 X2];

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

48

boxplot(x, 1)

1 2

0

1

2

3

4

5

6

7

8

9

Valu

es

Column Number

Boxplot para dos funciones con Dn normal

La diferencia entre los puntos medios de las dos columnas de x es aproximadamente 1. Puesto que los cortes en el boxplot no se traslapan, se puede concluir, con un nivel de significancia del 95%, que

las medianas de las dos muestras difieren.

Este diagrama tiene varios elementos gráficos:

Las líneas más bajas y superiores de la "caja" son el 25 y 75 por ciento de la muestra. La distancia entre la tapa y fondo de la caja

es el rango de interquartile.

La línea en el centro de la caja es el punto medio de la muestra. Si el punto medio no se centra en la caja, ésa es una indicación de la

oblicuidad.

Las " barbas" son líneas que extienden sobre y debajo de la caja. Demuestran el grado del resto de la muestra (a menos que hay

afloramientos). No si se asume que ningún afloramiento, el máximo de la muestra es la tapa de la barba superior. El mínimo

de la muestra es el fondo de la barba más baja. Por defecto, los datos que se encuentran por fuera de los bigotes son más de 1,5

veces la gama interquartile que se encuentran fuera de los límites de la caja.

El signo de más en la tapa del diagrama es una indicación de un afloramiento en los datos. Este punto pudo ser el resultado de un

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

49

error de la entrada de datos, de una medida pobre, o de un cambio en el sistema que generó datos de forma errónea.

Las cortes en la caja son un intervalo gráfico de la confianza sobre el punto medio de una muestra. Los diagramas de la caja no tienen cortes por defecto.

Qqplot

Descripción Un diagrama del quantile-quantile es útil para determinarse si dos muestras vienen de la misma distribución (si está

distribuido normalmente o no).

Sintaxis - qqplot(X) muestra una grafica de quantil-quantil para una muestra de datos de X en relación a una distribución teórica

normal. Si la distribución de X es normal, la grafica será lineal.

- qqplot(X, Y) muestra una grafica de quantil-quantil para dos muestras de datos si las muestra vienen de la misma

distribución, la gráfica será lineal. Para una matriz X y Y, qqplot muestra líneas separadas para cada pareja de

columnas, además la gráfica contiene la muestra de datos mostrando los mismos por medio de signos (+).

- qqplot () este tipo de gráfico es usado para especificar los cuartiles en el vector pvec.

Ejemplos

1. El ejemplo demuestra un diagrama del quantile-quantile-quantile de dos muestras de una distribución de Poisson.

x = poissrnd (15, 140,1); y = poissrnd (10, 80,1); qqplot(x, y););

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

50

6 8 10 12 14 16 18 20 22 24 260

2

4

6

8

10

12

14

16

18

20

X Quantiles

Y Q

uantile

s

QQPLOT para comparar dos dstribuciones Poisson

Aunque los parámetros y los tamaños de muestra son diferentes, la relación de línea recta demuestra que las dos muestras vienen de una

misma distribución.

2. El ejemplo debajo de demostraciones qué sucede cuando las distribuciones subyacentes no son iguales.

x = normrnd(10,1,50,1); y = weibrnd(4,0.5,50,1); qqplot(x, y);

7 7.5 8 8.5 9 9.5 10 10.5 11 11.5 12-0.2

-0.1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

X Quantiles

Y Q

uantile

s

QQPLT Para distribuciones diferentes

Estas muestras no son claramente de la misma distribución.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

51

Para determinar la validez de un procedimiento estadístico que dependa de que las dos muestras vienen de la misma distribución (ej. ANOVA),

un diagrama linear del quantile-quantile-quantile debe ser suficiente.

Gname

Descripción Etiqueta los puntos trazados con el respectivo nombre o

número, según el caso. Los datos que se ingresan para utilizar a función deben ser datos que se encuentren

relacionados con un nombre específico, es decir que cada punto al interior de la grafica corresponda a un nombre en

especial. Si se pulsa una vez un punto al interior de la gráfica, automáticamente el grafico muestra el nombre al que

corresponde el punto seleccionado.

De forma alternativa si se desea conocer el nombre de diferentes puntos se puede arrastrar el Mouse creando un

rectángulo que mostrara el nombre de cada uno de los puntos que se encuentran al interior del mismo. Con el botón

derecho del Mouse se puede quitar la etiqueta colocada sobre la gráfica. el gname sin discusiones etiqueta cada caja con su

número del caso. Se puede utilizar el gname para etiquetar diagramas creados por funciones tales como plot, Scatter,

gscatter, plotmatrix, entre otras.

Sintaxis gname() permite conocer la procedencia de los datos con solo

presionar el botón derecho del Mouse para gráficas realizadas de forma previa. h = gname(cases, line_handle)

Ejemplo Este ejemplo utiliza información de ciudades estadounidenses

con el objetivo de revisar la relación entre gastos e ingresos, y utilizando el comando gname para verificar a que ciudad

corresponde cada punto.

Load cities gastos = ratings(:,1);

ingresos= ratings (:,4); plot(Gastos, Ingresos,'+')

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

52

gname(names)

1000 2000 3000 4000 5000 6000 7000 8000 90000

1

2

3

4

5

6x 10

4

Los Angeles, Long Beach, CA

Philadelphia, PA-NJ

Para ver la procedencia de cualquier punto del grafico basta con dar clic sobre alguno de ellos.

Refline

Descripción Agregue una línea de referencia a la gráfica actual.

Sintaxis refline(slope, intercept)

- agrega una línea de referencia con la pendiente y a intercepción teniendo en

cuenta las condiciones actuales

refline(slope)

- agrega la línea de referencia al gráfico, y

utilizando únicamente la pendiente.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

53

h = refline(slope, intercept)

Ejemplo

Para este ejemplo creamos un vector Y, creando diferentes líneas de referencia en la grafica de acuerdo a condiciones especificas.

Y = [1.2 5.2 1.9 4.5 4.0 3.2 3.9 1.9 2.6 2.4 2.8]';

plot (y,'+')

refline(1,3)

refline(0.5,3)

refline(2,3)

refline(0,2)

1 2 3 4 5 6 7 8 9 10 11

2

4

6

8

10

12

14REFLINE

Gscatter

Diagrama de la dispersión del grupo

Sintaxis

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

54

gscatter(x,y,g) gscatter(x,y,g,'clr','sym',siz)

gscatter(x,y,g,'clr','sym',siz,'doleg')

gscatter(x,y,g,'clr','sym',siz,'doleg','xnam','ynam') h = gscatter(...)

Descripción

- gscatter(x, y, g)

Crea un diagrama de la dispersión de x y y, en el cual X y Y son los vectores con el mismo tamaño y g es un grupo de variables definidas por un vector, una matriz o un conjunto

de celdas variables. G también puede ser un conjunto de variables (tales como {G1 G2 G3} agrupando los valores en

X por cada combinación de grupo de variables.

Los puntos con el mismo valor de g se colocan en el mismo grupo, y aparecen en el gráfico con el mismo marcador y

color.

- gscatter(x, y, g, ' clr ', ' sym ', siz) Esta función permite crear el diagrama de dispersión y

especificar el color, el tipo del marcador, y el tamaño para cada grupo. ' clr ' es un conjunto de colores reconocidos por

la función plot.’sym ' son una serie de símbolos reconocidos por el comando plot, con el símbolo por defecto de '.'. siz es

un vector de tamaños, con el defecto determinado por ' defaultlinemarkersize ' característico. Si no se especifican las

características deseadas, gscatter establece los valores necesarios para el entendimiento de la gráfica.

- gscatter(x, y, g, ' clr ', ' sym ', siz, ' doleg ') controla si la leyenda es mostrada en el gráfico ('doleg' = 'on', por defecto) o no ('doleg' = 'off').

- gscatter(x, y, g, ' clr ', ' sym ', siz, ' doleg ', 'xnam', 'ynam ') especifica el nombre para utilizar en las etiquetas del eje X y el eje Y. Si las etiquetas par x y Y son omitidas,

por defecto se coloca en el gráfico el nombre de las variables.

Ejemplo

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

55

El siguiente ejercicio consistirá en realizar un diagrama de dispersión para dos grupos el de salud y el de condiciones

económicas agrupándolas por medio de la información de la

columna group. Para ello se deben ingresar los siguientes comandos:

Load discrim % carga tablas con información predefinida que se encuentra en el programa

scatter(ratings(:,3),ratings(:,9),group,'rk','.*')

0 1000 2000 3000 4000 5000 6000 7000 80003000

4000

5000

6000

7000

8000

9000

10000

SALUD

CO

ND

ICIO

N E

CO

NO

MIC

A

DIAGRAMA DE DISPERSION

1

2

Hist

Descripción Grafico de histograma

Sintaxis

- hist(y)

Grafica un histograma con diez barras para los valores contenidos en el vector y. las barras están igualmente

espaciados entre el valor mínimo y máximo que toma la variable.

- hist(y, nb) Las letras nb representan el número de barras que

queremos sean colocados en el gráfico final. - hist(y, x)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

56

Grafica un histograma usando el numero de barras que contiene el vector x.

- [n,x] = hist(y...) no realiza el gráfico de histograma,

pero retorna los vectores n y x, que contienen la frecuencia y la localización de las barras de tal forma

que bar(x,n) grafica el histograma.

Ejemplos

1. Con los siguientes comandos se genera un histograma

con diez divisiones.

y = normrnd(0,0.5,500,1) %la función normrnd genera datos aleatorios.

Hist (y)

-1.5 -1 -0.5 0 0.5 1 1.5 20

50

100

150HISTOGRAMA

2. Los siguientes comandos generan un histograma, en el cual se utiliza una variable x, para elegir el número de

barras contenidas en el gráfico y elegir los valores del eje x.

y= normrnd(0,1,1500,1); x= -4.5:0.7:4.5;

hist(y,x)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

57

-5 -4 -3 -2 -1 0 1 2 3 4 50

20

40

60

80

100

120

140

160

180

200HISTOGRAMA 2

Errorbar

Descripción Grafica las barras de error a lo largo de una curva.

Sintaxis - errorbar(X,Y,L,U,symbol)

Grafica X versus Y con un largo especifico de las barras de errores determinado por L(i)+U(i) que representan los puntos superiores e inferiores del gráfico. X, Y, L, y U deben

ser de la misma longitud. Si X, Y, L, y U son matrices, cada columna produce una línea por separado. Las barras de

error están graficadas a distancia de U(i) en la parte

superior y L(i) en la parte inferior de los puntos en (X,Y). El símbolo (symbol) es una forma de controlar el tipo de línea,

el símbolo del gráfico y el color de las barras de error.

- errorbar(X,Y,L)

Grafica X versus Y con barras de errores simétricas en relación a Y

- errorbar(Y,L)

Grafica Y con barras de error [Y-L Y+L]. Nota La función errorbar hace parte del lenguaje estándar de MATLAB

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

58

Ejemplo

Con los comandos siguientes genere los vectores necesarios para realizar la grafica de errorbar.

X =[1 2 3;6 5 4 ; 9 8 7];

Y =[5 4 9; 5 4 8 ; 1 8 6]; U =[3 6 7; 7 9 1; 8 9 2];

L =[2 8 6;7 9 5; 3 4 6]

errorbar (X, Y, L, U,'s')

0 1 2 3 4 5 6 7 8 9 10-5

0

5

10

15

20ERRORBAR

Ecdfhist

Propósito

Crea el histograma de salida de una distribución ecdf

Sintaxis

- n = ecdfhist (f, x)

Toma un vector f, de valores una función de distribución acumulativa (cdf) y un vector de

evaluación de los puntos de la función, y devuelve un vector n que contiene los puntos

altos del histograma para 10 barras igualmente

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

59

espaciadas. La función computa las barras de mayor altura desde el incremento en la función

empírica (cdf), y las normaliza de tal forma que el

área del histograma sea igual a 1. A diferencia el comando hist genera barras que representan la

frecuencia en la muestra.

- n = ecdfhist(f, x, m) En este caso m es un número escalar y

representa el numero de barras que deseamos aparezcan en el gráfico. n = ecdfhist(f, x, c)

- n = ecdfhist(f, x, c)

En este caso c es un vector, que permite centrar las barras específicamente en c.

- [n, c] = ecdfhist(...)

Devuelve la posición de las barras centradas en c.

- ecdfhist(...)

Sin argumentos produce un histograma de barras de los resultados.

Ejemplo

El código siguiente genera tiempos de error aleatorios y tiempos censurados , comparando la empírica pdf con una

pdf que se conoce que es verdadera.

“y = exprnd(10,50,1); % random failure times d = exprnd(20,50,1); % drop-out times

t = min(y,d); % observe the minimum of these times

censored = (y>d); % observe whether the subject failed

% Calculate the empirical cdf and plot a histogram from it

[f,x] = ecdf(t,'censoring',censored);

ecdfhist(f,x); % Superimpose a plot of the known true pdf

hold on;

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

60

xx = 0:.1:max(t); yy = exp(-xx/10)/10; plot(xx,yy,'g-');

hold off;”2

0 5 10 15 20 250

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.1ECDFHIST

GPLOTMATRIX

Descripción Matriz diagramas de dispersión por grupo.

Sintaxis -gplotmatrix(x,y,g)

Esta función crea una matriz de gráficos de dispersión.

Cada conjunto de ejes en la figura del resultado contiene un diagrama de dispersión de una columna de

x contra una de y. Todos los gráficos están agrupados por la variable g.

X y Y son matrices con el mismo número de filas. Si x

tiene p columnas y q filas la figura contiene una matriz p * q de diagramas de dispersión. G es una variable

para agrupar que puede ser vector, una matriz o un conjunto de celdas variables. G debe tener la misma

cantidad de filas que X y Y.

2 Tomado de MATLAB \ ESTATISTICS Toolbox\ HELP \ ecdfhist

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

61

- gplotmatrix(x,y,g,'clr','sym',siz)

Permite especificar el color, el tipo del marcador, y el tamaño para cada grupo. ' clr ' es un conjunto de

colores reconocidos por la función plot.’sym ' son una serie de símbolos reconocidos por el comando plot, con

el símbolo por defecto de '.'. siz es un vector de tamaños, con el defecto determinado por '

defaultlinemarkersize ' característico. Si no se especifican las características deseadas, gscatter

establece los valores necesarios para el entendimiento de la gráfica.

- gplotmatrix(x,y,g,'clr','sym',siz,'doleg')

Permite controlar si una leyenda está exhibida en el

gráfico (' doleg '=' on 'el defecto) o no (' doleg '=' off ')

-gplotmatrix(x,y,g,'clr' 'sym',siz,'doleg','dispopt')

Controla que aparezca alo largo de la diagonal del gráfico de la matriz de x versus x permitiendo a los valores nulos salir en la diagonal en blanco, 'hist'(por

defecto) en la gráfica de histogramas, o 'variable' para graficar los nombres de las variables.

- gplotmatrix(x,y,g,'clr','sym',siz,... 'doleg','dispopt','xnam','ynam')

Especifica los nombres en las columnas en X y Y. Estos nombres son usados para etiquetar los ejes. 'xnam' y

'ynam ' deben ser celdas contenidas por caracteres, con una fila para cada columna de X y Y,

respectivamente.

Ejemplo

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

62

Con los comandos siguientes es posible realizar diagramas de dispersión de las diferentes categorías que aparecen al

cargar los datos que aparecen en discrim. Los datos se

pueden agrupar por el código del tamaño de la ciudad.

load discrim

gplotmatrix(ratings(:, 2:5), ratings(:, 6:), group) %

en este caso lo que hacemos es seleccionar los datos que deseemos sean graficados de acuerdo a la

información contenida en la matriz ratings.

gplotmatrix(ratings(:,2:4),ratings(:,5:8),group, 'rk','.*' , [] , 'on' , '',categories(2:4,:)

,categories(5:8,:)) %para mayor entendimiento

Colocamos en el gráfico marcadores, colores y lo necesario para dar mas comprensibilidad

500 10001500 20002500

crime

0 2000 4000 6000 8000

health

0.5 1 1.5 2

x 104

2000

4000

housing

recre

ation

0

2

4

x 104

art

s

2000

2500

3000

3500

education

2000

4000

6000

8000

transport

ation

1

2

El gráfico generado por esta función genera la posibilidad de combinar

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

63

diferentes análisis en un solo gráfico, lo que puede ahorrar tiempo y dar mayor orden las diferentes gráficas de dispersión que muestra.

7. PROBABILIDAD

Distribuciones De Probabilidad Discretas

7.1.1. Distribución Binomial

Recordemos como la distribución binomial responde a una muestra de n eventos independientes, en los cuales solo es posible obtener dos

resultados.

Para este caso la función de densidad de probabilidad es:

nxqppnxfy xx

n

x

,...,1,0,, 1

Donde: x = [0 n] , p = [0 1] , q = 1- p y !!

!

xnx

nn

x

.

Binofit ()

Descripción Estimación del parámetro (x) o intervalos de confianza

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

64

para datos de tipo binomial. (Solo dos posibilidades)

Sintaxis p = binofit (a, n)

- Devuelve la máxima probabilidad estimada para a suceso en n oportunidades.

- a es una vector, entonces se devuelve un p(i) por cada a(i).

- Cuando n también es un vector de la misma

dimensión que a se calcula un p(i) para cada a(i) según n(i).

[p, nc] = binofit (a, n, alpha)

- Devuelve la máxima probabilidad estimada para a

suceso en n oportunidades a un nivel de confianza de 100(1-alpha)%.

- Por defecto el nivel de confianza es 95%, por ejemplo si queremos un nivel de confianza de

90% el valor de alpha debe ser 0.1.

Ejemplo p = binofit (2,5) %Probabilidad de 2/5

p = 0.4000

a = [2 4 6 8] %Probabilidad de a/8

p1 = binofit (a, 8)

p1 = [0.2500 0.5000 0.7500 1.0000]

a = [2 4 6 8] %Probabilidad de a/n

n = [4 8 12 16]

p1 = binofit (a, n)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

65

p1 = [0.5000 0.5000 0.5000 0.5000]

Binocdf ()

Descripción Función binomial de distribución acumulada.

niqpx

npnxFy ii

x

i

,...,1,0,, 1

0

Sintaxis p = binocdf (x, n, p)

- Devuelve el valor de la función binomial de distribución acumulada para estos parámetros.

- x, n y p, pueden ser un vector o una matriz, sin embargo deben tener las dimensiones iguales.

Ejemplo p = binocdf (3, 4 ,0.6)

p = 0.8704

Binopdf ()

Descripción Función binomial de densidad de probabilidad.

nxqp

x

npnxfy xx ,...,1,0,, 1

Sintaxis p = binopdf (x, n, p)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

66

- Devuelve el valor de la función binomial de densidad de probabilidad para estos parámetros.

- x, n y p, pueden ser un vector o una matriz, sin

embargo deben tener las dimensiones iguales.

Ejemplo p = binopdf (3, 4 ,0.6)

p = 0.3456

Binoinv ()

Descripción Función binomial de densidad de probabilidad inversa.

(Es la inversa de binocdf)

Sintaxis x = binoinv (y, n, p)

- Devuelve el valor de la función binomial inversa para estos parámetros.

- y, n y p, pueden ser un vector o una matriz, sin embargo deben tener las dimensiones iguales.

Ejemplo p = binopdf (2, 4 ,0.6)

p = 0.3456

x = binoinv (0.3456, 4 ,0.6)

x = 2

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

67

Si la probabilidad de lanzar una moneda y obtener cara frente a obtener sello es de 50-50, ¿Cual seria un rango

razonable de éxitos (cara) en 120 intentos?

Rango = [0.05 0.95]

Intentos = 120

P_Exito = 0.5 %Probabilidad exito

exitos = binoinv(Rango, Intentos, P_Exito)

exitos = [ 51 69 ]

Binornd ()

Descripción Genera una seria de números aleatorios a partir de una función binomial y unos parámetros definidos.

Sintaxis x = binornd (n, p)

- n y p, pueden ser un vector o una matriz, sin

embargo deben tener las dimensiones iguales

Ejemplo n = [10 20 30]

x = binornd (n ,0.6)

x = [ 8 8 17 ] %Primera serie obtenida

x = [ 6 11 16 ] %Segunda serie obtenida

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

68

Binostat ()

Descripción Calcula la media y la varianza para una seria con

distribución binomial.

Sintaxis [m , v] = binostat (n, p)

- n y p, pueden ser un vector o una matriz, sin embargo deben tener las dimensiones iguales

Ejemplo [m , v] = binostat (4 , 0.6)

m = 2.4000 %Media

v = 0.9600 %Varianza

Nota

7.1.2. Distribución Poisson

La distribución Poisson es adecuada para eventos que involucren una cantidad determinada de casos en un tiempo, distancia o área

determinada, solo es necesario un parámetro que sea entero no-

negativo, y el cual se considera como la media.

Para este caso la función de densidad de probabilidad es:

Para una distribución binomial: - La media es: med = np

- La varianza es: var = npq , q=1–p

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

69

,...1,0,

! xe

xxfy

x

poissfit ()

Descripción Estimación del parámetro (x) o intervalos de confianza para datos que se acomoden a las condiciones de una Poisson.

n

i

ixn 1

Sintaxis [lambda, linter] = poissfit (x, alpha)

- Genera el parámetro lambda ( ̂ ) a partir de la

muestra x.

- linter, muestra un intervalo con 100(1 - alpha)% de confianza, sino se especifica este parámetro el

intervalo por defecto es de 95%.

Ejemplo c = magic(3)

c = [ 8 1 6

3 5 7

4 9 2 ]

[d , intervalo ] = poissfit(c)

%Parámetro e intervalo al 90%

d = [ 5 5 5 ]

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

70

intervalo = [ 2.7985 2.7985 2.7985

8.2467 8.2467 8.2467 ]

a = [1:10 ; 2:2:20]

a = [1 2 3 4 5 6 7 8 9 10

2 4 6 8 10 12 14 16 18 20 ]

b = poissfit (a)

b = [1.5 3.0 4.5 6.0 7.5 9.0 10.5 12.0 13.5 15.0]

Poisscdf ()

Descripción Función de distribución poisson acumulada.

)(

0 !

xfloor

i

i

iexFp

Sintaxis p = poisscdf (x, lambda)

- Calcula el valor de la sumatoria de los valores Poisson para los respectivos parámetros, donde x

puede ser un vector o una matriz, sin embargo lambda debe ser positivo.

Ejemplo

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

71

● Supongamos que en cierta área el número X de tornados observados

durante un año, tiene una distribución de Poisson con ̂ = 8, entonces

cual es la probabilidad de obtener:

a. A lo mucho 5 tornados?

P(X≤5) entonces a = poisscdf(5 , 8) = 0.1912

b. Entre 6 y 9 tornados?

P(6≤X≤9) entonces b = poisscdf(9 ,8)- poisscdf(6 ,8)

= 0.7166 - 0.3134

= 0.4032

Poisspdf ()

Descripción Función Poisson de densidad de probabilidad.

,...1,0,!

xex

xfyx

Sintaxis p = poisspdf (x, lambda)

- Calcula el valor de densidad Poisson para un

punto respectivo, donde x puede ser un vector o

una matriz, sin embargo lambda debe ser positivo.

Ejemplo

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

72

Supongamos que en cierta área el número X de tornados observados durante un año, tiene una

distribución de Poisson con ̂ = 8, entonces cual es la

probabilidad de obtener:

a. exactamente 5 tornados ?

P(X=5) entonces a = poisspdf (5 , 8) = 0.0916

Poissinv ()

Descripción Función Poisson de densidad de probabilidad inversa.

(Es la inversa de poisscdf)

Sintaxis x = poissinv (p, lambda)

- Devuelve el valor de la función Poisson inversa mas aproximado para estos parámetros.

- p, y lambda, pueden ser un vector o una matriz, sin embargo deben tener las dimensiones iguales.

Ejemplo

Supongamos que en cierta área el número X de tornados observados durante un año, tiene una distribución de

Poisson con ̂ = 8; La afirmación de es falsa o verdadera :

a. La probabilidad de obtener a lo mas 5 tornados es

0.1912.

P(X≤5) = 0.1912 ?

X = poissinv (0.1912 , 8) = 5

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

73

Entonces la afirmación es verdadera.

b. La probabilidad de obtener a lo mas 9 tornados es 0.812.

P(X≤9) = 0.812 ?

X = poissinv (0.812 , 8) = 10

La afirmación es falsa, porque la probabilidad de 0.812 es de esperar 10 tornados

Poissrnd ()

Descripción Genera una seria de números aleatorios a partir de una función Poisson y unos parámetros definidos.

Sintaxis x = poissrnd (lambda, n, p)

- Genera X con media aproximada a lambda, puede ser un vector o una matriz según las dimensiones

del parámetro.

- n y p, Serán las dimensiones de x.

Ejemplo x = poissrnd (5 , 6 ,1)

x = [2

7

8

3

5

4 ]

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

74

Media = mean (x)

Media = 4.8333

Poisstat ()

Descripción Calcula la media y la varianza para una seria con distribución Poisson.

Sintaxis [m , v] = poisstat (lambda)

- n y p, pueden ser un vector o una matriz, sin embargo deben tener las dimensiones iguales

Ejemplo [m , v] = binostat (8)

m = 8.0000 %Media

v = 8.0000 %Varianza

Nota

7.1.3. Distribución Hipergeometrica

La distribución hipergeométrica es adecuada para determinar

Para una distribución Poisson: - La media es: med = ̂

- La varianza es: var = ̂

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

75

probabilidad de que ocurra en un evento en las siguientes condiciones: la cantidad total de la población (M) y de la cual escogemos una

muestra determinada (n) de donde se conoce un numero determinado

de fracasos y exitos.

Para este caso la función de densidad de probabilidad es:

M

n

KM

xn

K

xnKMxfy ,,

hygecdf ()

Descripción Función de distribución hipergeométrica acumulada.

M

n

KM

in

K

ix

i

nKMxfy0

,,

Sintaxis h = hygecdf (x,M,n,K)

- Calcula el valor de la sumatoria de los valores

para la distribución hipergeométrica para los respectivos parámetros, donde x,M,n,k pueden

ser un vector o una matriz.

Ejemplo

Se tienen 100 microchips, y se sabe que 20 de estos están

dañados. ¿Cuál es la probabilidad de sacar entre 0 y 3

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

76

microchips dañados de una muestra aleatoria de 10 microchips que escogemos?

p = hygecdf(3,100,20,10)

p = 0.8904

Hygepdf ()

Descripción Función hipergeométrica de densidad de probabilidad.

M

n

KM

xn

K

xnKMxfy ,,

Sintaxis p = hygepdf (x,M,n,K)

- Calcula el valor para la distribución hipergeométrica para los respectivos parámetros,

donde x,M,n,k pueden ser un vector o una matriz. - Donde M,n,k deben ser enteros positivos.

Ejemplo

Se tienen 100 microchips, y se sabe que 20 de estos están dañados. ¿Cuál es la probabilidad de sacar entre 0 y 5

microchips respectivamente dañados de una muestra aleatoria de 10 microchips que escogemos?

p2 = hygepdf(0:3,100,20,10)

p2 = [ 0.0951 0.2679 0.3182 0.2092 ]

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

77

suma = sum(p2)

suma = 0.8904

% Como se ve la suma de las probabilidades individuales corresponde a la probabilidad acumulad calculada en el

ejemplo anterior (p = 0.8904)

Hygeinv ()

Descripción Función Hipergeométrica de densidad de probabilidad inversa. (Es la inversa de hygecdf)

Sintaxis X = hygeinv (P,M,K,N)

- Devuelve el valor de la función Hipergeométrica inversa mas aproximado para estos parámetros.

- p puede ser observada como la probabilidad al

evaluar la función hipergeométrica con los parámetros x, m, k, n.

Ejemplo

Se tienen 100 microchips, y se sabe que 20 de estos están dañados. Obtengo una muestra aleatoria de 10 microchips de los cuales se desea saber ¿cual es el número máximo de

microchips dañados cuando se aceptan el 90% de error?

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

78

y = hygeinv(0.9,100,20,10)

y = 4

Si embargo si retomamos el primer ejemplo de esta sección obtendremos que:

p = hygecdf(3,100,20,10)

p = 0.8904

x = hygeinv(p,100,20,10) = hygeinv(0.8904,100,20,10)

x = 3

Hygernd ()

Descripción Genera una seria de números aleatorios a partir de una función hipergeométrica y unos parámetros definidos.

Sintaxis x = hygernd (M,K,N, f,c)

- Genera valores que se aproximen a una

distribución hipergeométrica con parámetros M, K y N, pueden ser un vector o una matriz sin

embargo de las misma dimensiones. - Los parámetros f y c son opcionales y permiten

generan un matriz aleatoria de dimensiones (f-

filas, c - columnas) con las especificaciones previas.

x = hygernd (M,K,N,v)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

79

- Genera valores aleatorios en una matriz con dimensiones v x v.

Ejemplo x = hygernd(1000,40,50)

x = 2

x = hygernd(1000,40,50,2,3)

X = [ 3 4 2

2 2 3 ]

hygestat ()

Descripción Calcula la media y la varianza para una seria con distribución Hipergeometrica.

Sintaxis [m , v] = hygestat (M,K,N)

- M, K y N, pueden ser un vector o una matriz, sin embargo deben tener las dimensiones iguales, y

determinan los parámetros de la distribución que se usa.

Ejemplo [m , v] = hygestat (8)

[m,v] = hygestat(10,1,9)

m = [ 0.9000 ] %Media

v = [ 0.0900 ] %Varianza

[m,v] = hygestat(10,3,9)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

80

m = [ 2.7000 ] %Media

v = [ 0.2100 ] %Varianza

Nota

Distribuciones De Probabilidad Continuas

7.1.4. Distribución Normal

La distribución Gaussiana o comúnmente conocida como Normal por que la mayoría de las variables continúas se ajustan a este tipo de distribución, esta en función de dos parámetros: la media y la

desviación estándar.

2,~ NX

La función de densidad de probabilidad para la normal es:

2

2

2

2

1,

x

exfy

Para una distribución Hipergeometrica: - La media es: med = M

NK

- La varianza es: var =

1M

NM

M

KM

M

KN

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

81

normcdf ()

Descripción Función de distribución normal acumulada.

dtexfy

tx 2

2

2

2

1,

Sintaxis p = normcdf (x,mu,sigma)

- Calcula el valor de la integral para la distribución

normal con los respectivos parámetros, donde x,mu,sigma pueden ser un vector o una matriz.

sigma debe ser positivo.

[p, plo, pup] = normcdf (x,mu,sigma,pcov, alpha)

- Calcula el valor de un intervalo de confianza con

los parámetros estimados, donde pcov es la covarianza estimada, y alpha especifica la

confianza 100(1-alpha)%. - Plo (PLow) Especifica el limite inferior.

- Pup (PUp) Especifica el limite superior.

Ejemplo

La función normcdf puede ser usada de la misma manera que una tabla de distribución normal estándar en la cual especificamos la media y la desviación

estándar como:

La distribución normal estándar tiene una media )0( y la desviación estándar. )1(

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

82

0 y 1 .

mu = 0; sigma=1;

X = normcdf(0, mu, sigma)

X = 0.5000

Y = normcdf(-1, mu, sigma)

Y = 0.1587

Z = normcdf(1, mu, sigma)

Z = 0.8413

Podemos generar una completa tabla de la distribución normal estándar usando el siguiente código:

mu = 0; sigma=1;z=(-3:0.1:3);

X = normcdf(z, mu, sigma);

Tabla = [z ; X]

Normpdf ()

Descripción Función normal de densidad de probabilidad.

2

2

2

2

1,

x

exfy

Sintaxis p = normpdf (x,mu,sigma)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

83

- Calcula el valor de la función para la distribución normal con los respectivos parámetros, donde

x,mu,sigma pueden ser un vector o una matriz.

sigma debe ser positivo.

Ejemplo

a = [-3:0.01:3];

p = normpdf(a,0,1); % Función para una normal estándar

plot(a ,p) % Grafica la probabilidad para cada

punto de la función normal estándar

-3 -2 -1 0 1 2 30

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

norminv ()

Descripción Función Normal de densidad de probabilidad inversa. (Es la

inversa de normcdf)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

84

Sintaxis X = norminv(P, mu, sigma)

- Devuelve el valor de la función Normal inversa mas

aproximado para estos parámetros. - P es interpretada como la probabilidad al evaluar

la función normal con los parámetros mu y sigma (debe ser positivo).

- Como P es una probabilidad debe estar dentro del intervalo [0 1].

Ejemplo

Encuentre un intervalo que contenga el 95% de los valores

de una distribución normal estándar.

x = norminv([0.025 0.975],0,1) % Intervalo para 95%

x = [ -1.9600 1.9600 ] % Mas Compacto y simétrico.

Nótese que el intervalo anterior no es el único que contiene el 95% de los elementos de una distribución de este tipo,

por ejemplo:

xx = norminv([0.01 0.96],0,1) % Intervalo para 95%

xx = [ -2.3263 1.7507 ]

Este intervalo también contiene el 95% de los datos de una distribución normal estándar sin embargo no es tan

compacto.

A partir de la información anterior, los intervalos para 90% y 99% serian:

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

85

X1 = norminv([0.05 0.95],0,1) % Intervalo para 90%

X1 = [ -1.6449 1.6449 ]

X2 = norminv([0.005 0.995],0,1) % Intervalo para 99%

X2 = [ -2.5758 2.5758 ]

Normrnd ()

Descripción Genera una seria de números aleatorios a partir de una

función normal y unos parámetros definidos.

Sintaxis x = normrnd (mu, sigma , f, c)

- Genera valores que se aproximen a una distribución normal con parámetros mu y sigma,

pueden ser un vector o una matriz sin embargo de las misma dimensiones.

- Los parámetros f y c son opcionales y permiten generan un matriz aleatoria de dimensiones (f-

filas, c - columnas) con las especificaciones previas.

x = normrnd (mu, sigma,v)

- Genera valores aleatorios en una matriz con

dimensiones v x v.

Ejemplo x = normrnd(0,1,3)

% Con una distribución normal estándar

x = [ 0.1326 -1.5804 -1.0246

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

86

1.5929 -0.0787 -1.2344

1.0184 -0.6817 0.2888 ]

x = normrnd(0,1,2,5)

% Con una distribución normal estándar

x = [ 1.0378 -1.3813 1.5532 1.9574 1.8645

-0.3898 0.3155 0.7079 0.5045 -0.3398 ]

x = normrnd(5,0.5,1,5)

% Con una distribución normal de media igual a 5 y

desviación estándar igual a 0.5

x = [ 4.7535 5.2310 4.8395 5.6183 4.6844 ]

Normstat ()

Descripción Calcula la media y la varianza para una seria con distribución Normal.

Sintaxis [m , v] = normstat (mu, sigma)

- Mu y sigma, pueden ser un vector o una matriz,

sin embargo deben tener las dimensiones iguales, y determinan los parámetro de la distribución que

se usa.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

87

Ejemplo [m , v] = normstat (0,1)

m = [ 0 ]

v = [ 1 ]

n = 1:3

n = [1 2 3]

[m,v] = normstat(n , n)

m = [ 1 2 3 ]

v = [ 1 4 9 ]

m= [ 1 2 ; 3 4]

m = [ 1 2

3 4 ]

[m,v] = normstat(m, m)

m = [ 1 2

3 4 ]

v = [ 1 4

9 16 ]

Nota

Normfit ()

Descripción Devuelve una estimación de los parámetros e intervalos de confianza para una muestra con distribución normal.

Para una distribución Normal: - La media es: med =

- La varianza es: var = 2

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

88

Sintaxis [mu , sigma] = normfit (muestra)

- Retorna la estimación de la media ( ) y la

desviación estándar ( ) para muestra, la cual

puede es una matriz.

[mu,sigma,muint,sigmaint] = normfit(muestra, alpha)

- Retorna la estimación de la media ( ) y la

desviación estándar ( ) para muestra, la cual

puede es una matriz. Además de generar intervalos a un nivel de confianza alpha para cada

parámetro. - muint y sigmaint, son matrices en las cuales la

primera fila corresponde al intervalo del limite inferior y la segunda fila corresponde a un

intervalo para el limite superior de la estimación del parámetro respectivo.

- Si no se incluye el argumento alpha en la función

se toma el nivel alpha por defecto que es 0.05, es decir un nivel de confianza de 95%. Pero si lo

incluimos alpha, el nivel de confianza será 100(1 - alpha) %.

Ejemplo

En este ejemplo tenemos una muestra aleatoria con 10

elementos, con media (µ)= 15 y desviación estándar ( )

= 2.

muestra = normrnd(15,2,10,1)

muestra = 15.9710

14.9900

14.4476

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

89

17.5529

18.7268

13.9549

15.2068

13.3847

16.3609

10.2708

[mu,sigma,muint,sigmaint] = normfit(muestra)

mu = 15.0866

sigma = 2.3462

muint = 13.4083

16.7650

sigmaint = 1.6138

4.2832

En este caso los valores mu y sigma corresponden a la media y la desviación estándar de la muestra, sin embargo

nótese que los valores reales se encuentran dentro de los intervalo respectivos.

Normplot()

Descripción Genera un grafico de distribución normal para una prueba grafica.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

90

Sintaxis normplot (muestra)

- Devuelve el grafico de la muestra ubicando cada

elemento como „+‟, junto con una línea que representa el primer y el tercer cuartil, útil para

identificar la linealidad de la muestra. - Entre mas normal se comporte la muestra mas

lineal debe ser, sobreponiéndose sobre la línea de referencia.

Ejemplo

muestra = normrnd(0,1,10,2)

muestra = 0.8115 -0.6547

0.6363 -1.0807

1.3101 -0.0477

0.3271 0.3793

-0.6730 -0.3304

-0.1493 -0.4999

-2.4490 -0.0360

0.4733 -0.1748

0.1169 -0.9573

-0.5911 1.2925

normplot(muestra)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

91

-2.5 -2 -1.5 -1 -0.5 0 0.5 1

0.05

0.10

0.25

0.50

0.75

0.90

0.95

Data

Pro

babili

ty

Normal Probability Plot

x = normrnd(0,1,50,1);

-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

0.01

0.02

0.05

0.10

0.25

0.50

0.75

0.90

0.95

0.98

0.99

Data

Pro

babili

ty

Normal Probability Plot

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

92

normspec()

Descripción Genera un grafico de densidad para una distribución normal.

Sintaxis p = normspec (limites, mu, sigma)

- Devuelve el grafico junto con la probabilidad p,

correspondiente al área de interés, es decir, la ubicada dentro de los limites definidos en el

vector que lleva el mismo nombre. - Dentro del vector limites al menos uno de los

valores debe ser real, no se acepta que el intervalo vaya desde infinito a infinito.

Error: limites = [-Inf Inf]

- Mu y sigma, corresponden a los parámetros propios de cada muestra.

Ejemplo

Tenemos una distribución normal estándar, y deseamos saber cuanta probabilidad existe:

a. antes de 0.5

a = normspec([-Inf 0.5],0,1)

a = 0.6915

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

93

-4 -3 -2 -1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4Probability Less than Upper Bound is 0.69146

Den

sity

Critical Value

a. después de - 0.3

b = normspec([-0.3 Inf],0,1)

b= 0.6179

-4 -3 -2 -1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4Probability Greater than Lower Bound is 0.61791

Den

sity

Critical Value

b. entre - 0.3 y 0.5

c = normspec([-0.3 0.5],0,1)

c = 0.3094

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

94

-4 -3 -2 -1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4Probability Between Limits is 0.30937

Dens

ity

Critical Value

Suponga que un productor de cereal desea saber: ¿ cual es el porcentaje de cajas de cereal con más de 10 onzas ?. Suponemos que el contenido de las cajas tiene una

distribución normal con media en 11.5 onzas y una

desviación estándar de 1.25 onzas.

P = normspec([10 Inf],11.5,1.25)

P = 0.89849

7 8 9 10 11 12 13 14 15 160

0.05

0.1

0.15

0.2

0.25

0.3

0.35Probability Greater than Lower Bound is 0.88493

Density

Critical Value

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

95

7.1.5. Distribución Exponencial

La distribución Exponencial es un caso específico de la distribución gamma (con a=1), y es la siguiente:

b

x

b

x

a

ae

bex

abbaxfy

1

)(

1, 1

Donde . es la función Gamma.

La distribución exponencial es especial para modelar eventos recurrentes durante un intervalo de tiempo determinado.

La distribución exponencial acumulada es:

x

exfy1

, donde µ es la media observada.

Expcdf ()

Descripción Función de distribución exponencial acumulada.

xt

x

edtexFy 11

0

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

96

Sintaxis p = expcdf (x,mu)

- Calcula el valor de la integral para la distribución

exponencial con los respectivos parámetros, donde x,mu pueden ser un vector o una matriz.

mu debe ser positivo. - P será el resultado correspondiente a una

probabilidad de que una observación de una distribución exponencial se ubicara dentro del

intervalo [0 x].

[p, plo, pup] = normcdf (x,mu,sigma,pcov, alpha)

- Calcula el valor de un intervalo de confianza con

los parámetros estimados, donde pcov es la varianza del estimado mu, y alpha especifica la

confianza 100(1-alpha)%. - Plo (PLow) Especifica el limite inferior.

- Pup (PUp) Especifica el limite superior.

Ejemplo

En una línea de atención al cliente el tiempo de espera(X) entre la llamada y la atención de la misma tiene una distribución exponencial con un tiempo esperado de 5 segundos. ¿ Cual es

la probabilidad de que el tiempo de espera:

a. sea a lo sumo 10 segundos?

P(X≤10) ›› p = expcdf(10,5)

p = 0.8647

b. sea Mayor de 10 segundos?

P(X>10) = 1 - P(X≤10) ›› p = 1 – expcdf(10,5)

p = 0.1353

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

97

c. Se encuentre entre 5 y 10 segundos?

P(5>X>10) = P(X≤10) - P(X≤5) ››

P= expcdf(10,5) - expcdf(5,5)

p = 0.8647 - 0.6321

p = 0.2325

Exppdf ()

Descripción Función exponencial de densidad de probabilidad.

x

exfy1

Sintaxis p = exppdf (x,mu)

- Calcula el valor de la función para la distribución

normal con los respectivos parámetros, donde x,mu pueden ser un vector o una matriz. mu debe

ser positivo.

Ejemplo

Retomando el ejemplo anterior tenemos que:

En una línea de atención al cliente el tiempo de espera(X) entre la llamada y la atención de la misma tiene una

distribución exponencial con un tiempo esperado de 5 segundos. ¿ Cual es la probabilidad de que el tiempo de

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

98

espera:

a. sea 10 segundos?

P(X=10) ›› p = exppdf (10,5) = 0.0271

b. sea 5 segundos?

P(X=5) ›› p = exppdf(5,5) = 0.0736

c. sea 3 segundos?

P(X=3) ›› p = exppdf(3,5) = 0.1098

Si deseamos ver la grafica completa de nuestra distribución exponencial tenemos que:

a = [0:0.01:30];

y = exppdf(a,5);

plot (a,y)

Y se generará una grafica como la siguiente:

0 5 10 15 20 25 300

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

Expinv ()

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

99

Descripción Función Exponencial de densidad de probabilidad inversa.

(Es la inversa de expcdf)

Sintaxis X = expinv(P, mu)

- Devuelve el valor de la función Exponencial inversa mas aproximado para estos parámetros.

- Como P es una probabilidad debe estar dentro del intervalo [0 1]. mu debe ser positivo.

Ejemplo

Retomando, en una línea de atención al cliente el tiempo de espera(X) entre la llamada y la atención de la misma tiene

una distribución exponencial con un tiempo esperado de 5 segundos.

¿ Con una probabilidad P, a cuantas llamadas se aproxima?

a. P = 0.9

X = expinv(0.9, 5) = 11.5129

b. P = 0.8

X = expinv(0.8, 5) = 8.0472

c. P = 0.5

X = expinv(0.5, 5) = 3.4657

d. P = 0.8647

%Como en el ejemplo anterior vimos que esta era la probabilidad para a lo sumo recibir 10 llamadas.

X = expinv(0.8647, 5) = 10.0013

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

100

exprnd ()

Descripción Genera una seria de números aleatorios a partir de una distribución exponencial y unos parámetros definidos.

Sintaxis x = exprnd (mu, f, c)

- Genera valores que se aproximen a una

distribución exponencial con parámetros mu - Los parámetros f y c son opcionales y permiten

generan un matriz aleatoria de dimensiones (f-filas, c - columnas) con las especificaciones

previas.

x = normrnd (mu, v)

- Genera valores aleatorios en una matriz con

dimensiones v x v.

Ejemplo

x = exprnd(2.5,1,5) % Muestra aleatoria de 1 fila y 5

columnas a partir de distribución exponencial de µ = 2.5

x = 2.0259 1.2136 0.5832 0.2035 0.7588

x = exprnd(3,3) % Muestra aleatoria de 3x3 a partir de distribución exponencial de µ = 3

x = [0.3373 0.6205 4.7871

8.5476 13.8574 4.8475

3.1250 5.9222 1.5136 ]

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

101

Expstat ()

Descripción Calcula la media y la varianza para una serie con distribución Exponencial.

Sintaxis [m , v] = expstat (mu)

- Mu, puede ser un vector o una matriz, sin embargo debe ser positivo.

Ejemplo [m , v] = expstat ([1:5])

m = [ 1 2 3 4 5 ]

v = [ 1 4 9 16 25 ]

Nota

expfit ()

Descripción Devuelve una estimación de los parámetros e intervalos de

confianza para una muestra con distribución exponencial.

Para una distribución Exponencial: - La media es: med =

- La varianza es: var = 2

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

102

Sintaxis [mu] = normfit (muestra)

- Retorna la estimación del parámetro ( -media –

valor esperado) para muestra, la cual puede es

una matriz.

[mu,muint] = normfit(muestra, alpha)

- Retorna la estimación de la media ( ) para

muestra, la cual puede es una matriz. Además de

generar intervalos a un nivel de confianza alpha

para cada parámetro. - muint, es un vector en el cual la primera fila

corresponde al limite inferior y la segunda fila corresponde al limite superior de un intervalo de

estimación del parámetro respectivo. - Si no se incluye el argumento alpha en la función

se toma el nivel alpha por defecto que es 0.05, es decir un nivel de confianza de 95%. Pero si lo

incluimos alpha, el nivel de confianza será 100(1 - alpha) %.

Ejemplo

En este ejemplo tenemos una muestra aleatoria con 10 elementos, con media (µ)= 5.

muestra = exprnd(5,10,1)

muestra = 2.4272

1.1664

0.4071

1.5177

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

103

8.6788

4.5106

0.3335

0.4338

4.4547

0.5622

[mu,muint] = expfit(muestra)

mu = 2.4492

muint = 1.4335

5.1074

En este caso el valor mu y corresponde a la media de la muestra, sin embargo, aunque dista mucho del parámetro original este se encuentre en el intervalo.

7.1.6. Distribución Gamma

La distribución Gamma es una familia de curvas que dependen de dos

parámetros, a partir de esta obtenemos otras distribuciones como la exponencial o la Chi-cuadrado. La función de densidad gamma esta

definida como:

b

x

a

aex

abbaxfy 1

)(

1,

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

104

Donde . es la función Gamma.

gamcdf ()

Descripción Función de distribución gamma acumulada.

dtetab

baxfpb

tx

a

a

0

1

)(

1,

Sintaxis p = gamcdf (x,a,b)

- Calcula el valor de la integral para la distribución

normal con los respectivos parámetros, donde x,a,b pueden ser un vector o una matriz. a y b

deben ser positivos.

Ejemplo

P1 = gamcdf(10,1,5)= 0.8647 %Como vemos la gamma con a = 1,

P2 = expcdf(10,5)= 0.8647 es la exponencial.

Suponga que el tiempo de supervivencia en minutos de un ratón de laboratorio, que ha ingerido cierta clase de veneno tiene una distribución gamma con a = 5 y b = 7.¿ Cual es la

probabilidad de que el ratón sobreviva:

a. menos de 30 minutos?

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

105

P(X≤30) ›› P = gamcdf(30,5,7) = 0.4268

b. mas de 60 minutos?

P(X>60) = 1 – P(X≤60) ›› P = 1 - gamcdf(60,5,7) = 1 - 0.9287

= 0.0713

c. entre 30 y 60 minutos?

P(30<X<60) = P(X≤60) - P(X≤30) ››

P = gamcdf(60,5,7) - gamcdf(30,5,7)= 0.9287 - 0.4268

= 0.5019

gampdf ()

Descripción Función gamma de densidad de probabilidad.

b

x

a

aex

abbaxfy 1

)(

1,

Sintaxis p = gampdf (x,a,b)

- Calcula el valor para la distribución gamma con

los respectivos parámetros, donde x,a,b pueden ser un vector o una matriz.

- a y b deben ser positivos, mientras x debe estar

en el intervalo [0 ].

Ejemplo

Vamos a graficar la función completa para cada punto del

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

106

ejemplo anterior.

Suponga que el tiempo de supervivencia en minutos de un ratón de laboratorio, que ha ingerido cierta clase de veneno

tiene una distribución gamma con a = 5 y b = 7.

X =[0:0.1:100];

P = gampdf(X,5,7);

plot(X,P)

0 10 20 30 40 50 60 70 80 90 1000

0.005

0.01

0.015

0.02

0.025

0.03

gaminv ()

Descripción Función Gamma de densidad de probabilidad inversa. (Es la inversa de gamcdf)

Sintaxis X = gaminv(P, mu, sigma)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

107

- Devuelve el valor de la función Gamma inversa mas aproximado para estos parámetros.

- P es interpretada como la probabilidad al evaluar

la función gamma con los parámetros a y b (deben ser positivo).

- Como P es una probabilidad debe estar dentro del intervalo [0 1].

Ejemplo

Suponga que el tiempo de supervivencia en minutos de un ratón de laboratorio, que ha ingerido cierta clase de veneno tiene una distribución gamma con a = 5 y b = 7.¿Con una

probabilidad de P cuantos minutos aproximadamente pueden sobrevivir:

a. P = 0.3?

X = gaminv(0.3,5,7) = 25.4353

b. P = 0.5?

X = gaminv(0.5,5,7) = 32.6964

c. P = 0.9?

X = gaminv(0.9,5,7) = 55.9551

d. P = 0.4268?

%Comprobamos la respuesta obtenida en el ejemplo de gamcdf.

X = gaminv(0.4268,5,7) = 30

gamrnd ()

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

108

Descripción Genera una seria de números aleatorios a partir de una

función gamma y unos parámetros definidos.

Sintaxis x = gamrnd (a, b , f, c)

- Genera valores que se aproximen a una distribución gamma con parámetros a y b, pueden

ser un vector o una matriz sin embargo de las misma dimensiones.

- Los parámetros f y c son opcionales y permiten generan un matriz aleatoria de dimensiones (f-

filas, c - columnas) con las especificaciones previas.

x = gamrnd (a, b ,v)

- Genera valores aleatorios en una matriz con

dimensiones v x v.

Ejemplo x = gamrnd(5,7,3)

% Genera una matriz de 3x3 con a=5 y b=7.

x = [26.5524 37.2128 54.1503

13.3987 18.2161 32.1009

34.5988 54.1874 37.8700]

x = gamrnd(3,2,2,4)

% Genera una matriz de 2x4 con a=3 y b=2.

x = [ 5.0270 6.3538 8.0230 3.3780

3.0506 2.0514 12.5873 8.6550]

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

109

Gamstat ()

Descripción Calcula la media y la varianza para una seria con distribución gamma.

Sintaxis [m , v] = gamstat (a,b)

- a y b, pueden ser un vector o una matriz y determinan los parámetros de la distribución que

se usa.

Ejemplo [m , v] = gamstat (3, 2)

m = [ 6 ]

v = [ 12 ]

[m,v]= gamstat([3 5 8 9],2)

m = [ 6 10 16 18 ]

v = [ 12 20 32 36 ]

Nota

Gamfit ()

Para una distribución Gamma: - La media es: med = ab

- La varianza es: var = ab2

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

110

Descripción Devuelve una estimación de los parámetros e intervalos de

confianza para una muestra con distribución gamma.

Sintaxis [parámetros] = gamfit (muestra)

- Retorna la estimación de los parámetros(a y b) para esta distribución según muestra, la cual

puede es una matriz.

[parámetros, intervalos] = gamfit(muestra, alpha)

- Retorna la estimación de la media ( ) y la

desviación estándar ( ) para muestra, la cual

puede es una matriz. Además de generar intervalos a un nivel de confianza alpha para cada

parámetro. - intervalos, es una matriz en las cuales la primera

fila corresponde al limite inferior y la segunda fila corresponde a al limite superior de la estimación

del parámetro respectivo. - Si no se incluye el argumento alpha en la función

se toma el nivel alpha por defecto que es 0.05, es decir un nivel de confianza de 95%. Pero si lo

incluimos alpha, el nivel de confianza será 100(1 -

alpha) %.

Ejemplo

En este ejemplo tenemos una muestra aleatoria con 10 elementos, con a = 3 y b = 5.

muestra = gamrnd(3,5,10,1)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

111

muestra = 6.4338

28.5470

7.7809

18.1332

15.2054

7.1337

2.3030

12.8559

6.6668

19.0060

[parámetros, intervalos] = gamfit(muestra)

parámetros = [ 2.5314 4.9010 ]

intervalos = [ 1.1090 1.9676

5.7782 12.2078 ]

En este caso los valores a y b corresponden a una estimación a partir de la muestra, sin embargo nótese que los valores reales se

encuentran dentro de los intervalo respectivos.

7.1.7. Distribución Chi-Cuadrado 2

La distribución Chi-Cuadrado es un caso específico de la distribución gamma (con b=2), y es la siguiente:

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

112

211

)(2

1

)(

1,

x

a

ab

x

a

aex

aex

abbaxfy

Donde . es la función Gamma y se incluye v que representa los

grados de libertad. 2va .Entonces tenemos que la distribución Chi-

Cuadrado acumulada es:

)(2 2

2

2

22

v

x

v

v

exvxfy

chi2cdf ()

Descripción Función de distribución Chi-Cuadrado acumulada.

x

v

t

dtet

vxFy v

v

0 2

2

)(2 2

22

Sintaxis p = chi2cdf (x,v)

- Calcula el valor de la integral para la distribución

Chi-cuadrado con los respectivos parámetros, donde x,v pueden ser un vector o una matriz. v

son los grados de libertad y junto con x deben ser

positivo. - P será el resultado correspondiente a una

probabilidad de que una observación de una

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

113

distribución exponencial se ubicara dentro del intervalo [0 x].

Ejemplo

P1 = chi2cdf (10,8) %Como vemos la distribución Chi se P1 =

0.7350 comporta de la misma manera que

P2 = gamcdf (10,4,2) una gamma con parámetros a=v/2 es p2 = 0.7350 decir 4 y b=2.

chi2pdf ()

Descripción Función Chi-cuadrado de densidad de probabilidad.

)(2 2

2

2

22

v

x

v

v

exvxfy

Sintaxis p = exppdf (x,v)

- Calcula el valor de la función para la distribución

normal con los respectivos parámetros, donde x,mu pueden ser un vector o una matriz. v son los

grados de libertad y junto con x deben ser positivo.

Ejemplo

x = (0:0.1:50); %Parámetros

v1 = 4; v2 = 8; v3 = 16;v4 = 32; %Grados de libertad

p1 = chi2pdf(x,v1); %Primera Función – Color AZUL

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

114

p2 = chi2pdf(x,v2); %Segunda Función – Color VERDE

p3 = chi2pdf(x,v3); %Tercera Función – Color ROJA

p4 = chi2pdf(x,v4); %Cuarta Función – Color CYAN

plot(x,p1, x,p2, x,p3,x,p4)

0 5 10 15 20 25 30 35 40 45 500

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

chi2inv ()

Descripción Función chi-cuadrado de densidad de probabilidad inversa. (Es la inversa de chi2cdf)

Sintaxis X = chi2inv(P, v)

- Devuelve el valor de la función chi-cuadrado

inversa mas aproximado para estos parámetros.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

115

- Como P es una probabilidad debe estar dentro del intervalo [0 1]. v debe ser positivo.

Ejemplo

● Con esta función podemos comprobar el resultado obtenido en el ejemplo de chi2cdf. ( P1 = chi2cdf (10,8)=0.7350 ) Entonces:

X1=chi2inv(0.735,8)

X1=10.0004

● Supongamos que tenemos una muestra con distribución Chi-cuadrado

y 5 grados de libertad. ¿Qué valor excedería al 90% de la muestra?

x = chi2inv(0.95,5)

x = 11.0705

Entonces solo se observaran valores mayores de 11 con una oportunidad del 5%.

chi2rnd ()

Descripción Genera una seria de números aleatorios a partir de una distribución Chi-cuadrado y unos parámetros definidos.

Sintaxis x = chi2rnd (v, f, c)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

116

- Genera valores que se aproximen a una distribución exponencial con parámetro v.

- Los parámetros f y c son opcionales y permiten

generan un matriz aleatoria de dimensiones (f-filas, c - columnas) con las especificaciones

previas.

x = normrnd (mu, v)

- Genera valores aleatorios en una matriz con dimensiones v x v.

Ejemplo

x = chi2rnd(10,4,2) % Muestra aleatoria de 4 fila y 2

columnas a partir de distribución Chi- cuadrado de v = 10

x = [ 10.1084 22.3001

8.5497 8.7564

12.8334 9.8343

7.0153 14.7426 ]

x = chi2rnd(10,3) % Muestra aleatoria de 3x3 a partir de distribución Chi-cuadrado de v = 10

x = [ 7.5864 10.6322 15.4715

3.8282 5.2046 9.1717

9.8854 15.4821 10.8200 ]

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

117

chi2stat ()

Descripción Calcula la media y la varianza para una serie con distribución Chi-cuadrado.

Sintaxis [m , v] = chi2stat (V)

- v, puede ser un vector o una matriz, sin embargo debe ser positivo.

Ejemplo [m,v] = chi2stat([1:5])

m = [ 1 2 3 4 5 ]

v = [ 2 4 6 8 10]

Nota

7.1.8. Distribución Beta

La distribución Beta es una familia de curvas que se encuentran dentro

del intervalo (0 1], esta función de densidad beta esta definida como:

Para una distribución Chi-cuadrado: - La media es: med = v

- La varianza es: var = 2v

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

118

xIxxbaB

baxfyba

1,0

11 1),(

1,

x)1,0(I significa que el valor de x se ubicara dentro del intervalo (0 1).

Donde .B es la función Beta.

ba

badtttbaB

ba

1

0

11 1,

Donde . es la función Gamma.

betacdf ()

Descripción Función de distribución beta acumulada.

xba dttt

baBbaxfy

0

11 1),(

1,

Sintaxis p = betacdf (x,a,b)

- Calcula el valor de la integral para la distribución normal con los respectivos parámetros, donde

x,a,b pueden ser un vector o una matriz. a y b deben ser positivos, mientras x debe estar en el

intervalo [0 1].

Ejemplo

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

119

x = [0:0.1:1];

p=betacdf(x,5,4)

0 0.0004 0.0104 0.0580 0.1737 0.3633 0.5941 0.8059 0.9437 0.9950 1.0000

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

120

ANEXO 1

INNOVACIONES DE MATLAB 7

MATLAB es un software muy utilizado en diferentes áreas en las que

resulta aplicable el lenguaje matemático, debido a este importante

factor y a que es necesario innovar y mejorar las condiciones de trabajo,

el software ha tenido una serie de modificaciones que permiten trabajar

en un escenario que se adecua a las necesidades para este tipo de

programas. Teniendo en cuenta lo anterior es de vital importancia tener

conocimiento de estas nuevas características; para ello hemos tomado

algunas de ellas con el objetivo que los usuarios del presente informe, al

igual que nosotros como sus creadores, tengamos la posibilidad de

conocer las facilidades presentadas por el programa y encontremos la

mejor forma de aplicarlas a las labores especificas que realizamos.

NUEVAS CARACTERISTICAS

1. El desktop en MATLAB 7 ha sido rediseñado para tener una

mayor funcionalidad y sensibilidad que facilite el entendimiento y

agilidad para llevar a cabo diferentes operaciones. Las nuevas

características del desktop permiten trabajar en diferentes

documentos al interior de MATLAB de forma simultánea, además

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

121

de la posibilidad de guardar customs layout y definir shortcuts

que facilitan el uso de los comandos.

2. En MATLAB 7 podemos crear algunas variables de de diferentes

características simplemente llamando las mismas con la función

create, cuando presionamos Tab después de escribir el comando

se despliega una lista de todos los posibles comandos y funciones

y variables que comienzan con caracteres de este tipo (create).

3. Una de las grandes ventajas del MATLAB 7 es que permite la

realización de gráficos desde la ventana del workspace, en la cual

con un simple click en el icono ( ) que aparece esta ventana

podemos escoger el tipo de gráfica que deseamos realizar con la

variable seleccionada.

4. Permite la posibilidad de ver las gráficas realizadas al interior del

desktop y no en una ventana aparte como lo realiza por defecto,

para ello basta con presionar en la parte superior derecha de la

ventana de figuras en la flecha dirigida hacia la parte de abajo( ),

esta nueva característica aplica para otras ventanas, por ejemplo

la ventana del Editor.

5. Se tiene la posibilidad de trabajar con diferentes documentos

como arrays, m-files, figuras y otros, en una misma ventana,

para ello debemos guardar y aplicar la opción desktop layouts que

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

122

se encuentra dentro del desktop de la barra de menús, en la cual

utilizando la opción de large documents Windows (gráfica 1).

GRAFICA 1

6. Después de habilitar la opción mencionada con anterioridad, el

programa permite además manipular la forma en la cual se

muestran los archivos, funciones o demás en la respectiva

ventana, es decir la cantidad de archivos que queremos que nos

muestre en la misma (ver gráfica 2). Esta nueva característica de

MATLAB 7 facilita el trabajo, dándonos la oportunidad de un mejor

entorno de trabajo que agilice el trabajo en el programa.

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

123

GRAFICA 2

7. Es posible en este modo abrir y editar cell arrays y estructuras

desde el workspace, para diferentes tipos de información

almacenada, desde la ventana del array editor es posible modificar

los datos, al igual que graficar la totalidad o parte de los datos a

parte de ellos con un simple clic en el icono ( ).

8. Otras de las grandes ventajas que presenta MATLAB 7 es la

relacionada con la creación de shortcuts, que permiten usar de

manera cómoda y ágil algunos de los comandos ejecutados en el

programa, para ello basta con seleccionar en el desktop la opción

de shortcuts toolbar y arrastrar con el Mouse hasta la parte

superior derecha en frente de los shortcuts que aparecen por

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

124

defecto algún comando existente en el Comand History,

automáticamente nos pide una etiqueta y después de guardar el

mismo comando que llevamos se ejecuta de forma ágil dando un

solo clic sobre el nombre que le hallamos colocado

EDITOR AND DEBUGGER

9. Para revisar los M-files MATLAB 7 ofrece gran facilidad, basta con

abrir el archivo desde el current directory y dirigirse a la opción

cell de la barra de menús y habilitar el cell mode; en el editor

las celdas aparecen separadas por doble comentario (%%),

además es posible ejecutar y avanzar a la otra celda con un solo

clic en el icono ( ), lo que realiza este botón es ejecutar las

celdas y avanzar a la siguiente que encuentre basándose en los

dos %%, esta nueva característica agiliza el trabajo y la revisión

de los M-files que en ocasiones pueden llegar a ser muy extensos.

10. En MATLAB 7 es posible de forma automática pasar o

publicar el M-code a formato HTML, WORD, u otros formatos a

documentos de trabajo o a partes de los mismos, con un solo clic

( ).

11. El editor ahora identifica otros lenguajes importantes como

c/ c++, html, and Java Code. Basta únicamente con dirigirse al

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

125

curren directory que ya reconoce este tipo de archivos y al dar clic

derecho, escoger la opción de abrir texto.

12. Condicional breakpoints: En primer lugar se debe escoger la

opción disable cell mode en el menú cell (ver gráfica 3),

después de esto es posible colocar breakpoints dando clic en el

icono que posee el programa para desarrollar esta tarea ( ). Esta

posibilidad nos permite trabajar y evaluar nuestros M-files hasta el

punto de quiebre definido lo que facilita la detección de posibles

errores, y el establecimiento de condiciones que debe cumplir el

archivos en este punto.

GRAFICA 3

13. Otra de las nuevas ventajas de MATLAB 7 es la de colocar

bloques completos de comentarios, para ello basta es posible

colocar bloques de comentarios colocando simplemente el símbolo

porcentaje (%), acompañado de un corchete abierto; el bloque de

comentarios se cierra de la misma forma como se abrió y cerrando

el corchete correspondiente. Esta nueva característica agiliza el

trabajo en el programa y permite la posibilidad de escribir grandes

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

126

cantidades de ayudas en el M-file que pueden orientar mejor la

posterior revisión de los mismos.

GRÁFICAS

14. MATLAB 7 tiene bastantes innovaciones en este aspecto, y

en su mayoría son enfocadas a incrementar el manejo de las

gráficas por medio de iconos y disminuir en alguna medida la

programación necesaria para la realización, y principalmente la

modificación de las mismas. Cuando abrimos un archivo tenemos

la posibilidad de valuar puntos específicos simplemente dando clic

en el icono data cursor ( ), y el cursos nos indica

automáticamente el valor de las variables en el punto

seleccionado dentro de la gráfica. Si queremos que nos muestre

en una ventana aparte el valor de las variables en el punto

especifico simplemente damos clic derecho y escogemos la opción

Display Style y en esta damos clic en Window Incide Figure.

(ver gráfica 4)

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

127

FIGURA 4

15. Otra de las innovaciones presentadas por MATLAB 7 es la

posibilidad de realizar anotaciones al interior de las gráficas, para

ello basta con pulsar en la flecha que aparece en la barra de

herramientas del dibujo ( ), y seleccionando la opción Insert

Text Arrow (ver gráfica 5) podemos colocar al interior del grafico

la flecha que deseamos, el programa por defecto coloca

anotaciones correspondientes a la gráfica en general y no al punto

que se esta señalando.

16. También es posible agregar otros pequeños gráficos como

rectángulos, elipses, cuadros de texto simplemente escogiendo la

opción insertar y seleccionando lo que deseamos insertar en la

gráfica. Existe también la posibilidad de modificar las propiedades

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

128

de las imágenes realizadas simplemente dando doble clic en el

objeto que deseamos modificar; automáticamente el programa

nos muestra en cuadro en el cual aparecen las propiedades del

objeto seleccionado y en el cual podemos modificar a nuestro

parecer.(ver gráfica 5)

GRAFICA 5

17. Es posible crear y modificar gráficas interactivamente con un

solo clic en el icono show plot tools ( ), esta opción

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

129

automáticamente permite modificar algunas de las propiedades de

la gráfica, además de trabajar interactivamente con otras

variables o gráficas ya creadas, de una manera sencilla y práctica.

Para esto debemos arrastrar las mismas hacia la gráfica ya

creada, o cuadrante vacío. De esta forma tenemos la posibilidad

de comparar las gráficas y cambiar propiedades de las gráficas al

mismo tiempo.

Para agregar gráficas en otros cuadrantes y trabajar

simultáneamente en varias gráficas nos a la ventana de Figure

Palette (figura 5) y creamos la cantidad de cuadrantes que

queremos que nos muestre en la ventana, automáticamente nos

aparece en la ventana el numero de cuadrantes que hallamos

seleccionado (por ejemplo en una fila y dos columnas).

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

130

GRAFICA 6

18. Desde el panel mencionado en el punto anterior es posible

acceder a las anotaciones del mismo, para ello nos dirigimos al

icono( ) que aparece en la barra de herramientas, cuando

habilitamos esta opción se genera la posibilidad de generar el

código-M que dio origen a las gráficas creada de una manera

rápida, para ello vamos a la barra de menús y en File

escogemos la opción Genérate M-File, y de forma automática nos

muestra en el Editor los comandos que se deberían utilizar para la

creación de esta gráfica, la cual es posible de almacenar como

cualquier otro archivo-M.

Después de revisar algunas de las nuevas características del

ANALISIS ESTADISTICO EN MATLAB

UNIVERSIDAD NACIONAL COLOMBIA

FACULTAD DE CIENCIAS ECONÓMICAS

UNIDAD DE INFORMÁTICA Y COMUNICACIONES

131

programa en esta versión, hemos encontrado que las ventajas e

innovaciones en lo relacionado con las gráficas son en las que mas

se trabaja, y que las mismas permiten trabajar en una forma

mucho más rápida que permite agilizar y optimizar las actividades

en el programa. Sin embargo todas las innovaciones realizadas

van encaminadas a mejorar el entorno del programa y

contribuyen a la optimización de tareas en el mismo.