regresión lineal

17
Regresión lineal El modelo de pronóstico de regresión lineal permite hallar el valor esperado de una variable aleatoria a cuando b toma un valor específico. La aplicación de este método implica un supuesto de linealidad cuando la demanda presenta un comportamiento creciente o decreciente, por tal razón, se hace indispensable que previo a la selección de este método exista un análisis de regresión que determine la intensidad de las relaciones entre las variables que componen el modelo. ¿Cuándo utilizar un pronóstico de regresión lineal? El pronóstico de regresión lineal simple es un modelo óptimo para patrones de demanda con tendencia (creciente o decreciente), es decir, patrones que presenten una relación de linealidad entre la demanda y el tiempo.

Upload: alexis-ariel

Post on 13-Dec-2015

34 views

Category:

Documents


3 download

DESCRIPTION

Regresión Lineal

TRANSCRIPT

Regresión lineal

El modelo de pronóstico de regresión lineal permite hallar el valor esperado de una

variable aleatoria a cuando b toma un valor específico. La aplicación de este método

implica un supuesto de linealidad cuando la demanda presenta un comportamiento

creciente o decreciente, por tal razón, se hace indispensable que previo a la selección de

este método exista un análisis de regresión que determine la intensidad de las relaciones

entre las variables que componen el modelo.

¿Cuándo utilizar un pronóstico de regresión lineal?El pronóstico de regresión lineal simple es un modelo óptimo para patrones de demanda

con tendencia  (creciente o decreciente), es decir, patrones que presenten una relación de

linealidad entre la demanda y el tiempo.

Existen medidas de la intensidad de la relación que presentan las variables que son

fundamentales para determinar en qué momento es conveniente utilizar regresión lineal.

Análisis de regresión

El objetivo de un análisis de regresión es determinar la relación que existe entre una

variable dependiente y una o más variables independientes. Para poder realizar esta

relación, se debe postular una relación funcional entre las variables. Cuando se trata de

una variable independiente, la forma funcional que más se utiliza en la práctica es la

relación lineal. El análisis de regresión entonces determina la intensidad entre las

variables a través de coeficientes de correlación y determinación.

Coeficiente de correlación [r]

El coeficiente de correlación, comúnmente identificado como r o R , es una medida

de asociación entre las variables aleatorias X y Y, cuyo valor varía entre -1 y +1.

El cálculo del coeficiente de correlación se efectúa de la siguiente manera:

Dónde t hace referencia a la variable tiempo y x a la variable demanda.

Ejemplo de aplicación de un pronóstico de Regresión lineal Simple

La juguetería Gaby desea estimar mediante regresión lineal simple las ventas para el mes

de Julio de su nuevo carrito infantil "Mate". La información del comportamiento de las

ventas de todos sus almacenes de cadena se presenta en el siguiente tabulado:

El primer paso para encontrar el pronóstico del mes 7 consiste en hallar la pendiente, para

ello efectuamos los siguientes cálculos:

Mes Ventas

1   Enero 7000

2   Febrero 9000

3   Marzo 5000

4   Abril 11000

5   Mayo 10000

6   Junio 13000

Luego, y dado que ya tenemos el valor de la pendiente b procedemos a calcular el valor

de a, para ello efectuamos los siguientes cálculos:

Ya por último, determinamos el pronóstico del mes 7, para ello efectuamos el siguiente

cálculo:

Podemos así determinar que el pronóstico de ventas para el período 7 es equivalente a

13067 unidades.

Relación de la regresión lineal en las ciencias ambientales.En Economía, Administración y en general en todas las ciencias sociales y naturales se estudia entre otros temas, la relación que existe entre dos variables.

La cantidad demandada de un determinado producto en un mercado se considera como una función del precio; los costos de producción de un determinado artículo se suponen que están en función de la cantidad de artículos producidos; los gastos de consumo se consideran como una función de la renta; etc. Todas estas relaciones son tal vez

representaciones muy simplistas de los verdaderos modelos cuyas formulaciones más realistas requieren tal vez de la especificación de muchas más variables en cada una de sus relaciones. Así podríamos decir que la demanda puede considerarse como una función del precio, de los ingresos y de los precios de otros productos afines: los costos de producción dependerán del volumen  de la misma, del precio de los factores de producción y de los cambios en dicho volumen; del mismo modo los gastos de consumo pueden especificarse como una función de los ingresos, de la liquidez y de los niveles previos de consumo.

ANÁLISIS DE OZONO Y OXÍDOS DE NITRÓGENO MEDIANTE TÉCNICAS DE SERIES DE TIEMPO Y REGRESIÓN LINEAL

INTRODUCCIÓN Por varios años en el pasado, estudios realizados en la Ciudad de México han mostrado que las concentraciones de ozono frecuentemente son altas en el sector Suroeste y más bajas en el Noreste de esta área urbana (Jauregui, 1992; Collin & Scott, 1993., Bravo et al., 1996., Streit & Guzmán, 1996., Bian et al., 1998, en Fast & Zhong, 1998). Asimismo, dichos estudios han venido proporcionando información suficiente sobre los complejos procesos que ocurren durante la formación del ozono por, ejemplo: en cámaras de exposición controlada se ha observado la formación de éste a partir del ciclo fotolítico del Bióxido de nitrógeno (NO2) bajo la influencia de la luz solar (Leighton, 1961, en Jauregui, 1993; Falcón, 1989). Aunque en atmósferas urbanas su producción es un tanto similar, el proceso es aún más complejo, pues en éste intervienen desde factores de emisión de precursores (NO2, NOx), que a su vez dependen en cierto modo de algunos elementos del tiempo (temperatura, humedad relativa, etc.), algunos factores climáticos (altitud, latitud, etc.) hasta condiciones meteorológicas adversas y la presencia de hidrocarburos (Jauregui, 1992, 1993; Bravo et al., 1992). Esta situación, en el caso del Distrito Federal, se ha traducido recientemente en un grave problema (Bravo et al., 1991,1992; Herrera et al., 1991; Jauregui, 1992; Jauregui et al., 1992; Fortoul et al., 1995; Téllez-Rojo et al., 1997; Torijano et al., 1997; Arriaga et al., 1997; Segura & Ruiz-Suárez, 1997; Sandoval et al., 1997, en Correa- García, 1999). Este trabajo presenta el análisis histórico del ozono en tres zonas del D.F. mediante técnicas de series de tiempo y regresión. Comprende el análisis de los datos de 1986 a 1999, para las estaciones Tlalnepantla, Merced y Pedregal. A su vez se analiza el grado de asociación de este contaminante con sus precursores (NO2, NOx) y algunos parámetros del estado del tiempo: temperatura, humedad relativa y velocidad del viento, con el propósito de mostrar un modelo matemático que estima valores máximos de O3, con base en valores de los parámetros del estado del tiempo y concentraciones de los contaminantes precursores del día anterior. Estos modelos forman parte de los resultados obtenidos del tema de tesis de licenciatura en Biología presentado en (CorreaGarcía, 1999).

MÉTODOS

Se obtuvieron las concentraciones expresadas en ppm de los siguientes contaminantes atmosféricos: · Óxidos de nitrógeno (NOX) · Bióxido de (NO2) · Ozono (O3) Se obtuvieron también los valores de las variables meteorológicas · Temperatura · Humedad relativa · Velocidad del viento En general, dichos datos provienen de las 32 estaciones de

monitoreo que conforman la Red Automática de Monitoreo Atmosférico (RAMA), distribuidas en las 5 zonas en las que para estos fines se divide comúnmente a la Ciudad de México (véase Fig. 1).

Se utilizaron los datos de las estaciones Tlalnepantla, Merced y Pedregal. Los registros se obtuvieron de las bases de datos de la Secretaría del Medio Ambiente del Distrito Federal (SMADF). Se seleccionó el valor máximo diario tanto de los contaminantes atmosféricos como de las variables meteorológicas.

Figura 1. Mapa topográfico del Distrito Federal y áreas circundantes [Modificado de INEGI (1991), el cual se basa en “datos obtenidos mediante identificación fotográfica y cartográfica en Cartas Topográficas y Cartografía Censal” del INEGI (1990)].Se sobreponen las estaciones de monitoreo de la RAMA: las 03 estaciones empleadas en este estudio forman parte de las 10 estaciones que cuentan con equipo meteorológico. (Modificado de Correa-García, 1999).

Las concentraciones de O3 se analizaron mediante técnicas de series de tiempo, de acuerdo con la metodología Box & Jenkins (1976). Por último, se hicieron análisis de correlación y regresión múltiple entre las concentraciones de los contaminantes y los valores de los parámetros meteorológicos.

RESULTADOS

Series de Tiempo Las Figuras 2, 3 y 4 muestran las series de tiempo de las concentraciones máximas diarias de ozono (O3) para las estaciones Tlalnepantla, Merced y Pedregal del período 1986-1999. Los valores observados no denotan un patrón

estacional, o bien es difícil de identificar en los tres sitios de monitoreo. Asimismo, las concentraciones de O3, rebasan con frecuencia en dos veces el valor estándar mexicano de 0.11 ppm y éstas se pueden presentar en cualquier época del año. La tendencia en términos generales es de un ligero descenso desde 1992 a la fecha. Estos resultados son similares a los reportados en (Santillán-Moncayo, 1997; Estrada-Hernández, 1998; Correa-García, 1999). No obstante los incrementos observados en Tlalnepantla y Merced 1998 y 1999 respectivamente, las concentraciones de O3 en Pedregal desde 1996 a la fecha han entrado en un aparente proceso de estabilización. Nótese que en las tres estaciones se presentó un aumento en 1990-1991. Esta situación se debió quizá al incremento del parque vehicular derivado de la aplicación del programa un día sin auto (el cual promovió la compra de un auto adicional Jauregui, 1992; Bravo et al., 1992). Los recientes aumentos en los niveles de O3 en las estaciones ya mencionadas, aunque un poco menores a las observadas en 1991, se deben probablemente a un cambio en el número de fuentes de emisiones de contaminantes precursores de O3 como: automóviles, industrias, servicios públicos (hoteles, restaurantes, baños públicos), cambios en las gasolinas mexicanas, etc. Además de condiciones meteorológicas extremas, con altas temperaturas, alteraciones en la época de lluvia, incendios forestales, que se presentaron en los alrededores de la Ciudad de México, durante 1997-1998, entre otros factores. Esta breve descripción proporciona una idea clara sobre la dificultad que representa evaluar la eficiencia de las políticas de control para mejorar la calidad del aire en la Zona Metropolitana de la Ciudad de México.

Figura 2. Concentración máxima diaria para el Ozono en la estación Tlalnepantla (Zona Noroeste del D.F.). En línea continua, serie de tiempo de los valores observados de 1986 a 1999; en línea ondulada, tendencia del O3. Las R indican el grado de asociación entre los precursores (NO2;NOX) y cada uno de estos con respecto al ozono.

Figura 3. Concentración máxima diaria para el Ozono en la estación Merced (Zona Centro del D.F.). En línea continua, serie de tiempo de los valores observados de 1986 a 1999; en línea ondulada, tendencia del O3. Las R indican el grado de asociación entre los precursores (NO2;NOX) y cada uno de estos con respecto al ozono.

Figura 4. Concentración máxima diaria para el Ozono en la estación Pedregal (Zona Suroeste del D.F.). En línea continua, serie de tiempo de los valores observados de 1986 a 1999; en línea ondulada, tendencia del O3. Las R indican el grado de asociación entre los precursores (NO2;NOX) y cada uno de estos con respecto al ozono.

En la Figura 5 se presentan las concentraciones máximas diarias para el O3 en la estación Pedregal de 1986 a 1999. Se muestra el pronóstico para el año 2000. Como se puede apreciar, las curvas de ajuste con respecto a los valores observados no son muy

estrechas, a pesar del intervalo de confianza del 90%. Esto sugiere que el O3 en el año 2000, seguirá experimentando un ligero descenso, aunque no en forma marcada y aproximadamente el 10% de los valores caerán cerca de los límites máximos del intervalo de confianza. El histograma del recuadro se conoce como análisis de residuales y consiste en evaluar el adecuado ajuste del modelo ARIMA, en este caso los residuales deben describir una distribución normal, tal como se aprecia en la misma figura 5.

Figura 5. Concentración máxima diaria para el Ozono en la estación Pedregal (Zona Suroeste del D.F.). En línea continúa, serie de tiempo de los valores observados de 1986 a 1999; en línea gris claro, intervalo de confianza del 90% para el pronóstico, generado mediante el modelo ARIMA (0, 0, 1)(3, 0, 0). Retraso estacional de 365 días; en línea gris obscura, el pronóstico para el año 2000.

Análisis de correlación y regresión múltiple

Figura 6. Modelo de regresión para la predicción de la concentración máxima diaria de ozono de 1999 al 01 de enero de 2000 para la estación Pedregal (Zona Suroeste del D.F.). Incluye como variables independientes, la media diaria del O3, el máximo diario de NO2, máximo y promedio diario de NOX, temperatura, humedad relativa y velocidad del viento del día anterior.

Figura 7. Modelo ARIMA para la predicción de la concentración máxima diaria de ozono de 1999 al 01 de enero de 2000 para la estación Pedregal (Zona Suroeste del D.F.).

Incluye como variables independientes, las mismas concentraciones máximas diarias del O3 observadas tiempo atrás.

En la tabla 1 se presentan las estaciones de monitoreo automático más consistentes en bases de datos de contaminación para el O3. Esta tabla indica que sólo siete de las 32 estaciones están completas, lo cual representa entre el 25% y 30% de los registros. En la práctica, ha sido común señalar a la estación Pedregal, como guía de los cambios en el comportamiento del ozono, sin tomar en cuenta que en otras estaciones, este contaminante, puede estar representando también un problema. Asimismo, dichos registros están disponibles a un nivel de promedios y máximos diarios. Por último, la tabla 2 muestra los promedios máximos anuales de las concentraciones de Ozono empleadas en este estudio, en donde se puede apreciar claramente la crisis ambiental de 1990-1991.

Tabla 1. Localización Geográfica de las Estaciones de Monitoreo Automático con mayor disponibilidad y consistencia de registros para ozono (O3), que mide la Red Automática de Monitoreo Atmosférico (RAMA), en la Ciudad de México. (Modificado de Correa-García, 1999). En negrita, las estaciones empleadas en este estudio.

Tabla 2. Concentraciones máximas promedio anual de Ozono, para las Estaciones de Monitoreo Automático que mide la (RAMA), en la Ciudad de México, empleadas en este estudio.

CONCLUSIONES El incremento en las concentraciones máximas diarias de ozono observado en 1990-1991, fue consistente en las tres estaciones de monitoreo con mayor crisis ambiental en 1991, seguido de un ligero descenso de 1993 a 1997, presentándose un segundo pero menor año de crisis en Tlalnepantla y Merced en 1998 y 1999, respectivamente, en tanto el Pedregal ha entrado en un aparente proceso de estabilización desde 1996 a la fecha. A pesar de esto, la tendencia de los niveles de O3 seguirá mostrando un ligero descenso, aunque al nivel de este estudio no es tan nítido. Por otra parte el O3 no presenta un patrón estacional y las concentraciones frecuentemente alcanzan en dos veces el valor estándar mexicano de 0.11 ppm al menos una vez al día durante todo el período de estudio. De acuerdo con el modelo de regresión múltiple aquí presentado, las fluctuaciones de las concentraciones de ozono están asociadas en mayor medida con las concentraciones promedio diario del ozono, seguido de los contaminantes precursores de ozono del día anterior. El comportamiento de este modelo se considera que es bueno, pero susceptible de presentar fallas en precisión de pronóstico a causa de la variación característica del fenómeno y a la falta de datos, entre otros aspectos. Esto último, también es aplicado para el modelo ARIMA, el cual es más útil para identificar las características propias y tendencia de los contaminantes, pero no necesariamente como una herramienta de pronóstico, sino más bien de diagnóstico.

Bibliografía

Armando Correa García; Roberto Muñoz Cruz & Gustavo García Cardoso Secretaría del Medio Ambiente, Dirección General de Prevención y Control de la Contaminación. Jalapa No. 15, 2° Piso Colonia Roma Norte 06700, México, D.F., Tel. (5) 511-8462 “ANÁLISIS DE OZONO Y OXÍDOS DE NITRÓGENO MEDIANTE TÉCNICAS DE SERIES DE TIEMPO Y REGRESIÓN LINEAL”

http://www.ingenieriaindustrialonline.com/herramientas-para-el-ingeniero-industrial/pron%C3%B3stico-de-ventas/regresi%C3%B3n-lineal/