tarea -data_ware_house

33
Universidad Austral de Chile Facultad de Ciencias Económicas y Administrativas Instituto de Administración Data WareHouse Curso: Sistemas de Información (ADMI2739) Integrantes: Macarena Bentjerodt Martino Evelyn Cárcamo Bello Felipe Schmidt Peralta

Upload: camila-soto-neira

Post on 27-Jun-2015

333 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Tarea  -data_ware_house

Universidad Austral de Chile

Facultad de Ciencias Económicas y Administrativas

Instituto de Administración

Data WareHouse

Curso: Sistemas de Información (ADMI2739)

Integrantes: Macarena Bentjerodt Martino

Evelyn Cárcamo Bello

Felipe Schmidt Peralta

Camila Soto Neira

Page 2: Tarea  -data_ware_house

Valdivia, 06 de Junio del 2010

Introducción

Con la informatización de la sociedad, y por lo tanto, de las empresas que se

encuentran en ella, se ha producido un crecimiento a nivel mundial de la capacidad de

generación y almacenamiento de la información. Sin embargo, esta información ya no

puede ser analizada por los métodos tradicionales existentes, debido a que mientras mayor

es la capacidad para almacenar cada vez más datos, mayor es la incapacidad para extraer

información realmente útil de éstos en las empresas. Por ello, mucha información

importante, quedaba sepultada y disgregada, a causa de que los sistemas existentes no

estaban preparados para el nuevo reto.

Actualmente, existe una gran cantidad de información acerca de la Era de la

Información y sus ventajas. Sin embargo, en este fenómeno, lo que constituye un valioso

recurso para la mayoría, se ha tornado en un problema para otros: manejar de forma óptima

grandes volúmenes de información.

Dentro de la competencia en el nuevo ambiente corporativo, donde, en general, todo

está influido por la información, es trascendente saber dónde y cómo se organiza toda la

información de interés. Es así como, en este contexto, surgen términos que se convierten en

conceptos y filosofías de trabajo, tales como “Data Warehouse”.

Un Data Warehouse o Almacén de Datos, es una colección de datos orientada a un

determinado ámbito al interior de una empresa o una organización. Es un sistema integrado,

no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que

se utiliza. Se dice que representa un expediente completo de una organización, el que va

más allá de tan sólo la información transaccional y operacional.

De acuerdo a lo anterior, en el presente trabajo se dará a conocer algunos conceptos

relacionados a Data Warehouse, incluyendo ejemplos claros de estas definiciones. Además

se buscará un área de negocio donde se pueda aplicar Business Intelligence, desarrollando

un Data Warehouse. Posteriormente, se concluirá respecto de los temas tratados en la

investigación.

Page 3: Tarea  -data_ware_house

Desarrollo de las Actividades

Business Intelligence

Se denomina inteligencia empresarial o inteligencia de negocios al conjunto de

estrategias y herramientas enfocadas a la administración y creación de conocimiento

mediante el análisis de datos existentes en una organización.

El término inteligencia empresarial se refiere al uso de datos en una empresa para

facilitar la toma de decisiones. Abarca la comprensión del funcionamiento actual de la

empresa, así como también la anticipación de acontecimientos futuros, con el objetivo de

ofrecer conocimientos para respaldar las decisiones empresariales.

Las herramientas de inteligencia se basan en la utilización de un sistema de

información de inteligencia que se forma con distintos datos.

Mediante las herramientas y técnicas ELT (extraer, cargar y transformar), o

actualmente ETL (extraer, transformar y cargar) se extraen los datos de distintas fuentes, se

depuran y preparan (homogeneización de los datos) para luego cargarlos en un almacén de

datos.

La vida o el periodo de éxito de un software de inteligencia de negocios dependerá

únicamente del nivel de éxito del cual haga en beneficio de la empresa que lo usa, si esta

empresa es capaz de incrementar su nivel financiero, administrativo y sus decisiones

mejoran el accionar de la empresa, la inteligencia de negocios usada estará presente por

mucho tiempo, de lo contrario será sustituido por otro que aporte mejores resultados y más

precisos.

Características

Este conjunto de herramientas y metodologías tienen en común las siguientes

características:

Page 4: Tarea  -data_ware_house

Accesibilidad a la información . Los datos son la fuente principal de este concepto.

Lo primero que deben garantizar este tipo de herramientas y técnicas será el acceso

de los usuarios a los datos con independencia de la procedencia de estos.

Apoyo en la toma de decisiones . Se busca ir más allá en la presentación de la

información, de manera que los usuarios tengan acceso a herramientas de análisis

que les permitan seleccionar y manipular sólo aquellos datos que les interesen.

Orientación al usuario final . Se busca independencia entre los conocimientos

técnicos de los usuarios y su capacidad para utilizar estas herramientas.

Niveles de realización de BI

De acuerdo a su nivel de complejidad se pueden clasificar las soluciones de

Business Intelligence en:

- Consultas e informes simples (Querys y reports).

- Cubos OLAP (On-Line Analytic Processing).

- Data Mining o minería de datos.

- Sistemas de previsión empresarial; predicción mediante estudio de series

temporales.

(http://informationmanagement.wordpress.com/2007/11/19/diseno-de-un-data-warehouse-

estrella-y-copo-de-nieve/)

Interfaz Web

Es una conexión física y funcional entre dos sistemas independientes que deben

tener una comunicación entre sí, donde la interfaz es el mecanismo o herramienta que hace

posible dicha comunicación.

Cuando uno de los sistemas que se comunican es un ser humano pasamos al

concepto de interfaz de usuario, la que se utiliza en muchos sistemas que nos rodean y

hacen nuestra vida más cómoda y segura. Por un lado tenemos un sistema informático y por

Page 5: Tarea  -data_ware_house

otro a una persona que desea interaccionar con él, darle instrucciones concretas, siendo la

interfaz de usuario la herramienta que entiende a ambos y es capaz de traducir los mensajes

que se intercambian.

Por ejemplo, el sistema de botones de control de un televisor o el mando a distancia

que lo controla, los diferentes mecanismos de control de un automóvil o los sistemas de

puesta en hora de un reloj.

Inicialmente las interfaces de usuario eran desarrolladas pensando solamente en su

correcto funcionamiento, luego se comprobó la necesidad de que fueran fácilmente usables

y después se hizo importante la estética en las mismas, destacando el diseño gráfico en las

interfaces de usuario, ya que un sistema de este tipo no sólo tiene que funcionar, sino que

además debe ser bonito y acorde con las inquietudes estéticas del mundo que nos rodea.

Se crearon interfaces basadas en iconos y menús, accesibles por medio del ratón,

surgiendo los entornos de ventanas, como Windows o MAC, que empezaron a utilizar

interfaces gráficas de usuario, verdaderas protagonistas del mundo informático actual.

Estamos tan acostumbrados a las interfaces gráficas que se puede afirmar que si

desaparecieran la gran mayoría del los usuarios de aplicaciones informáticas quedarían

anulados. Tanto es así que sistemas operativos y programas que antes funcionaban casi

exclusivamente en modo de comandos han tenido que actualizarse y ofrecer a los usuarios

interfaces gráficas equivalentes para no quedarse olvidados por el público general.

Las páginas Web supusieron la aparición de las interfaces Web, interfaces gráficas

de usuario con unos elementos comunes de presentación y navegación que se convirtieron

rápidamente en estándar. Este tipo de interfaces deben servir de intermediarias entre

usuarios poco acostumbrados al uso de aplicaciones informáticas, y sistemas de

información y procesos transaccionales, debiendo posibilitar la localización de la

información deseada, el entendimiento claro de las funcionalidades ofrecidas, la realización

práctica de tareas específicas por parte de los usuarios y la navegación intuitiva por las

diferentes páginas del sitio Web.

Page 6: Tarea  -data_ware_house

Buscando una homogeneidad entre los millones de páginas Web que existen

actualmente en Internet, el diseño de las mismas ha evolucionado con el tiempo hacia un

esquema general perfectamente definido, ofreciendo unas interfaces bien definidas, con un

conjunto de componentes gráficos y funcionales similares que hacen posible que sea cual

sea el usuario que accede a un sitio Web cualquiera la comunicación entre ellos sea posible

y efectiva.

ERP

Es un sistema abierto de gestión de la información estructurado para satisfacer la

demanda de soluciones de gestión empresarial, el cual se basa en el ofrecimiento de una

solución completa que permite a las empresas evaluar, implementar y gestionar más

fácilmente su negocio. Las soluciones ERP se caracterizan por su modularidad, integración

de la información, estandarización e interfaces con otras aplicaciones.

Otro aspecto importante a considerar es que las tendencias comerciales actuales y

futuras obligan a las empresas a ser cada vez más competitivas, por lo que es necesario que

una compañía tenga integrado sus flujos internos de información y sus relaciones

comerciales externas para así mejorar la productividad, la calidad, el servicio al cliente y

reducir costos.

Disponer de una solución ERP integrada no solo es un beneficio para la compañía,

sino que también una garantía de actualización continua y más inmediata de la aplicación a

las necesidades del negocio y la reducción de los costos fijos. El máximo beneficio de la

implantación de un ERP, la que es muy compleja debido a su profundo impacto en los

procesos de la empresa, debido a los distintos cambios de la empresa y el entorno,

solamente se obtiene cuando todas las aplicaciones de la compañía están totalmente

integradas, incluido sus proyectos de comercio electrónico, y cuando esta integración se

realiza en el menor plazo de tiempo posible.

Algunas de las amenazas de un Proyecto ERP es el mal manejo del proyecto, Sub o

Sobre estimación de los alcances del ERP, vulnerabilidad al tener datos valiosos con muy

fácil acceso, perder flexibilidad para asimilar nuevas olas tecnológicas, interdependencia de

Page 7: Tarea  -data_ware_house

las áreas de una empresa y no generar una ventaja competitiva. Por último, una ERP se

compone por un determinado número de módulos funcionales, es decir, módulos básicos,

opcionales y Verticales, donde se comparte base de datos. Todas las aplicaciones ofrecen

una misma interfaz de usuario, ofreciendo alta adaptabilidad a la situación particular de

cada empresa que cuente con Group Ware, Internet y comercio electrónico.

Modelos de DW

Star Schema

El Esquema en Estrella consiste en estructurar la información en procesos, vistas y

métricas recordando a una estrella (por ello el nombre star schema). Es decir, tendremos

una visión multidimensional de un proceso que medimos a través de unas métricas. A nivel

de diseño, consiste en una tabla de hechos en el centro para el hecho objeto de análisis y

una o varias tablas de dimensión por cada dimensión de análisis que participa de la

descripción de ese hecho. En la tabla de hecho encontramos los atributos destinados a

medir (cuantificar) el hecho: sus métricas. Mientras, en las tablas de dimensión, los

atributos se destinan a elementos de nivel (que representan los distintos niveles de las

jerarquías de dimensión) y a atributos de dimensión (encargados de la descripción de estos

elementos de nivel). En el esquema en estrella la tabla de hechos es la única tabla del

esquema que tiene múltiples joins que la conectan con otras tablas (foreign keys hacia otras

tablas). El resto de tablas del esquema (tablas de dimensión) únicamente hacen join con

esta tabla de hechos. Las tablas de dimensión se encuentran además totalmente

denormalizadas, es decir, toda la información referente a una dimensión se almacena en la

misma tabla.

Snowflake Schema

El Esquema en Copo de Nieve es un esquema de representación derivado del

esquema en estrella, en el que las tablas de dimensión se normalizan en múltiples tablas.

Por esta razón, la tabla de hechos deja de ser la única tabla del esquema que se relaciona

con otras tablas, y aparecen nuevas joins gracias a que las dimensiones de análisis se

representan ahora en tablas de dimensión normalizadas. En la estructura dimensional

normalizada, la tabla que representa el nivel base de la dimensión es la que hace join

Page 8: Tarea  -data_ware_house

directamente con la tabla de hechos. La diferencia entre ambos esquemas (star y snowflake)

reside entonces en la estructura de las tablas de dimensión. Para conseguir un esquema en

copo de nieve se ha de tomar un esquema en estrella y conservar la tabla de hechos,

centrándose únicamente en el modelado de las tablas de dimensión, que si bien en el

esquema en estrella se encontraban totalmente denormalizadas, ahora se dividen en

subtablas tras un proceso de normalización. Es posible distinguir dos tipos de esquemas en

copo de nieve, un snowflake completo (en el que todas las tablas de dimensión en el

esquema en estrella aparecen ahora normalizadas en el snowflake) o un snowflake parcial

(sólo se lleva a cabo la normalización de algunas de ellas).

(http://informationmanagement.wordpress.com/2007/11/19/diseno-de-un-data-warehouse-

estrella-y-copo-de-nieve/)

ER (entidad-relación)

Ejemplo de diagrama E-R.

El Modelo Entidad-Relación, también conocido como DER (diagramas entidad-

relación) es una herramienta de modelado de un sistema de información, mediante el cual

se pretende 'visualizar' los objetos que pertenecen a la Base de Datos como entidades las

cuales tienen unos atributos y se vinculan mediante relaciones.

Es una representación conceptual de la información.

Page 9: Tarea  -data_ware_house

El modelado entidad-relación es una técnica para el modelado de datos utilizando

diagramas entidad relación. No es la única técnica pero sí la más utilizada.

Brevemente consiste en los siguientes pasos:

1. Se parte de una descripción textual del problema o sistema de información a

automatizar (los requisitos).

2. Se hace una lista de los sustantivos y verbos que aparecen.

3. Los sustantivos son posibles entidades o atributos.

4. Los verbos son posibles relaciones.

5. Analizando las frases se determina la cardinalidad de las relaciones y otros detalles.

6. Se elabora el diagrama (o diagramas) entidad-relación.

7. Se completa el modelo con listas de atributos y una descripción de otras

restricciones que no se pueden reflejar en el diagrama.

Base Teórica y Conceptual

El modelo entidad-relación se basa en los conceptos descritos a continuación para

representar un modelo de la vida real.

Entidad: Representa una “cosa” u "objeto" del mundo real con existencia independiente, es

decir, se diferencia unívocamente de cualquier otro objeto o cosa, incluso siendo del mismo

tipo, o una misma entidad.

Una entidad puede ser un objeto con existencia física como: una persona, un animal, una

casa, etc. (entidad concreta), o un objeto con existencia conceptual como: un puesto de

trabajo, una asignatura de clases, un nombre,etc. (entidad abstracta).

Una entidad está descrita y se representa por sus características o atributos. Por ejemplo, la

entidad Persona puede llevar consigo las características: Nombre, Apellido, Género,

Estatura, Peso, Fecha de nacimiento, etc.

Conjunto de entidades: es una colección de entidades que comparten los mismos atributos o

características.

Page 10: Tarea  -data_ware_house

Atributos: son las propiedades que describen a cada entidad en un conjunto de entidades.

Los atributos identificativos son aquellos que permiten diferenciar a una instancia de la

entidad de otra distinta. Para cada atributo, existe un dominio del mismo, este hace

referencia al tipo de datos que será almacenado o a restricciones en los valores que el

atributo puede tomar. Cuando una entidad no tiene un valor para un atributo dado, este

toma el valor nulo, bien sea que no se conoce, que no existe o que no se sabe nada al

respecto del mismo.

Relación: Describe cierta dependencia entre entidades o permite la asociación de las

mismas. Una relación tiene sentido al expresar las entidades que relaciona.

Conjunto de relaciones: Consiste en una colección, o conjunto, de relaciones de la misma

naturaleza. La dependencia o asociación entre los conjuntos de entidades es llamada

participación. Se llama grado del conjunto de relaciones a la cantidad de conjuntos de

entidades participantes en la relación.

Restricciones

Son reglas que deben mantener los datos almacenados en la base de datos.

Correspondencia de cardinalidades: dado un conjunto de relaciones en el que participan dos

o más conjuntos de entidades, la correspondencia de cardinalidad indica el número de

entidades con las que puede estar relacionada una entidad dada. La correspondencia de

cardinalidades puede ser:

- Uno a uno: Una entidad de A se relaciona únicamente con una entidad en B y

viceversa.

- Uno a varios: Una entidad en A se relaciona con cero o muchas entidades en B.

Pero una entidad en B se relaciona con una única entidad en A.

- Varios a uno: Una entidad en A se relaciona exclusivamente con una entidad en

B. Pero una entidad en B se puede relacionar con 0 o muchas entidades en A.

- Varios a varios: Una entidad en A se puede relacionar con 0 o muchas entidades

en B y viceversa.

Page 11: Tarea  -data_ware_house

Restricciones de participación: Dado un conjunto de relaciones R en el cual participa un

conjunto de entidades A, dicha participación puede ser de dos tipos:

- Total: Cuando cada entidad en A participa en al menos una relación de R.

- Parcial: Cuando al menos una entidad en A NO participa en alguna relación de

R.

Claves

Es un subconjunto del conjunto de atributos comunes en una colección de entidades,

que permite identificar unívocamente cada una de las entidades pertenecientes a dicha

colección. Asimismo, permiten distinguir entre sí las relaciones de un conjunto de

relaciones.

Dentro de los conjuntos de entidades existen los siguientes tipos de claves:

Superclave: Es un subconjunto de atributos que permite distinguir unívocamente cada una

de las entidades de un conjunto de entidades. Si se añade un atributo al anterior

subconjunto, el resultado seguirá siendo una superclave.

Clave candidata: Dada una superclave, si ésta deja de serlo quitando únicamente uno de los

atributos que la componen, entonces ésta es una clave candidata.

Clave primaria: Es una clave candidata, elegida por el diseñador de la base de datos, para

identificar unívocamente las entidades en un conjunto de entidades.

(es.wikipedia.org/wiki/Modelo_entidad-relación)

UML (Lenguaje Unificado de Modelado)

UML es el lenguaje de modelado de sistemas de software más conocido y utilizado

en la actualidad. Es un lenguaje gráfico para visualizar, especificar, construir y documentar

un sistema.

UML ofrece un estándar para describir un "plano" del sistema (modelo), incluyendo

aspectos conceptuales tales como procesos de negocio y funciones del sistema, y aspectos

Page 12: Tarea  -data_ware_house

concretos como expresiones de lenguajes de programación, esquemas de bases de datos y

componentes reutilizables.

Es importante resaltar que UML es un "lenguaje de modelado" para especificar o

para describir métodos o procesos. Se utiliza para definir un sistema, para detallar los

artefactos en el sistema y para documentar y construir. En otras palabras, es el lenguaje en

el que está descrito el modelo.

UML no puede compararse con la programación estructurada, pues UML significa

Lenguaje Unificado de Modelado, no es programación, sólo se diagrama la realidad de una

utilización en un requerimiento. Mientras que, programación estructurada, es una forma de

programar como lo es la orientación a objetos, sin embargo, la programación orientada a

objetos viene siendo un complemento perfecto de UML, pero no por eso se toma UML sólo

para lenguajes orientados a objetos.

UML cuenta con varios tipos de diagramas, los cuales muestran diferentes aspectos

de las entidades representadas.

Diagramas

Jerarquía de los diagramas UML 2.0, mostrados como un diagrama de clases

Page 13: Tarea  -data_ware_house

En UML 2.0 hay 13 tipos diferentes de diagramas. Para comprenderlos de manera

concreta, a veces es útil categorizarlos jerárquicamente, como se muestra en la figura.

Los Diagramas de Estructura enfatizan en los elementos que deben existir en el

sistema modelado:

- Diagrama de clases

- Diagrama de componentes

- Diagrama de objetos

- Diagrama de estructura compuesta (UML 2.0)

- Diagrama de despliegue

- Diagrama de paquetes

Los Diagramas de Comportamiento enfatizan en lo que debe suceder en el sistema

modelado:

- Diagrama de actividades

- Diagrama de casos de uso

- Diagrama de estados

- Diagrama de secuencia

Los Diagramas de Interacción son un subtipo de diagramas de comportamiento, que

enfatiza sobre el flujo de control y de datos entre los elementos del sistema modelado:

- Diagrama de secuencia

- Diagrama de comunicación, que es una versión simplificada del Diagrama de

colaboración (UML 1.x)

- Diagrama de tiempos (UML 2.0)

- Diagrama global de interacciones o Diagrama de vista de interacción (UML 2.0)

(es.wikipedia.org/.../Lenguaje_Unificado_de_Modelado)

Page 14: Tarea  -data_ware_house

OO (Orientación a Objetos)

Bases de datos orientadas a objetos

Este modelo, bastante reciente, y propio de los modelos informáticos orientados a

objetos, trata de almacenar en la base de datos los objetos completos (estado y

comportamiento).

Una base de datos orientada a objetos es una base de datos que incorpora todos los

conceptos importantes del paradigma de objetos:

Encapsulación - Propiedad que permite ocultar la información al resto de los

objetos, impidiendo así accesos incorrectos o conflictos.

Herencia - Propiedad a través de la cual los objetos heredan comportamiento

dentro de una jerarquía de clases.

Polimorfismo - Propiedad de una operación mediante la cual puede ser aplicada

a distintos tipos de objetos.

Programación orientada a objetos

La programación orientada a objetos es un paradigma de programación que usa

objetos y sus interacciones, para diseñar aplicaciones y programas de ordenador. Está

basado en varias técnicas, incluyendo herencia, abstracción, polimorfismo y

encapsulamiento. En la actualidad, existe variedad de lenguajes de programación que

soportan la orientación a objetos.

Los objetos son entidades que combinan estado (atributo), comportamiento

(método) e identidad:

- El estado está compuesto de datos, será uno o varios atributos a los que se

habrán asignado unos valores concretos (datos).

Page 15: Tarea  -data_ware_house

- El comportamiento está definido por los procedimientos o métodos con que

puede operar dicho objeto, es decir, qué operaciones se pueden realizar con él.

- La identidad es una propiedad de un objeto que lo diferencia del resto, dicho con

otras palabras, es su identificador (concepto análogo al de identificador de una

variable o una constante).

La programación orientada a objetos, es necesaria en la vida de un programador ya

que con esta visualizamos las actividades de cada una de esas. Un objeto contiene toda la

información que permite definirlo e identificarlo frente a otros objetos pertenecientes a

otras clases e incluso frente a objetos de una misma clase, al poder tener valores bien

diferenciados en sus atributos. A su vez, los objetos disponen de mecanismos de interacción

llamados métodos, que favorecen la comunicación entre ellos. Esta comunicación favorece

a su vez el cambio de estado en los propios objetos. Esta característica lleva a tratarlos

como unidades indivisibles, en las que no se separa el estado y el comportamiento.

Los métodos (comportamiento) y atributos (estado) están estrechamente

relacionados por la propiedad de conjunto. Esta propiedad destaca que una clase requiere de

métodos para poder tratar los atributos con los que cuenta. El programador debe pensar

indistintamente en ambos conceptos, sin separar ni darle mayor importancia a alguno de

ellos. Hacerlo podría producir el hábito erróneo de crear clases contenedoras de

información por un lado y clases con métodos que manejen a las primeras por el otro. De

esta manera se estaría realizando una programación estructurada camuflada en un lenguaje

de programación orientado a objetos.

La Programación Orientada a Objetos difiere de la programación estructurada

tradicional, en la que los datos y los procedimientos están separados y sin relación, ya que

lo único que se busca es el procesamiento de unos datos de entrada para obtener otros de

salida. La programación estructurada anima al programador a pensar sobre todo en

términos de procedimientos o funciones, y en segundo lugar en las estructuras de datos que

esos procedimientos manejan. En la programación estructurada sólo se escriben funciones

que procesan datos. Los programadores que emplean Programación Orientada a Objetos, en

Page 16: Tarea  -data_ware_house

cambio, primero definen objetos para luego enviarles mensajes solicitándoles que realicen

sus métodos por sí mismos.

Conceptos fundamentales

La programación orientada a objetos es una forma de programar que trata de

encontrar una solución a estos problemas. Introduce nuevos conceptos, que superan y

amplían conceptos antiguos ya conocidos. Entre ellos destacan los siguientes:

Clase: definiciones de las propiedades y comportamiento de un tipo de objeto

concreto. La instanciación es la lectura de estas definiciones y la creación de un

objeto a partir de ellas.

Herencia: Es la facilidad mediante la cual la clase D hereda en ella cada uno de

los atributos y operaciones de C, como si esos atributos y operaciones hubiesen

sido definidos por la misma D. Por lo tanto, puede usar los mismos métodos y

variables públicas declaradas en C. Los componentes registrados como

"privados" (private) también se heredan, pero como no pertenecen a la clase, se

mantienen escondidos al programador y sólo pueden ser accedidos a través de

otros métodos públicos.

Objeto: entidad provista de un conjunto de propiedades o atributos (datos) y de

comportamiento o funcionalidad (métodos) los mismos que consecuentemente

reaccionan a eventos. Se corresponde con los objetos reales del mundo que nos

rodea, o a objetos internos del sistema (del programa). Es una instancia a una

clase.

Método: Algoritmo asociado a un objeto (o a una clase de objetos), cuya

ejecución se desencadena tras la recepción de un "mensaje". Desde el punto de

vista del comportamiento, es lo que el objeto puede hacer. Un método puede

producir un cambio en las propiedades del objeto, o la generación de un

"evento" con un nuevo mensaje para otro objeto del sistema.

Evento: Es un suceso en el sistema (tal como una interacción del usuario con la

máquina, o un mensaje enviado por un objeto). El sistema maneja el evento

Page 17: Tarea  -data_ware_house

enviando el mensaje adecuado al objeto pertinente. También se puede definir

como evento, a la reacción que puede desencadenar un objeto, es decir la acción

que genera.

Mensaje: una comunicación dirigida a un objeto, que le ordena que ejecute uno

de sus métodos con ciertos parámetros asociados al evento que lo generó.

Propiedad o atributo: contenedor de un tipo de datos asociados a un objeto (o a

una clase de objetos), que hace los datos visibles desde fuera del objeto y esto se

define como sus características predeterminadas, y cuyo valor puede ser alterado

por la ejecución de algún método.

Estado interno: es una variable que se declara privada, que puede ser

únicamente accedida y alterada por un método del objeto, y que se utiliza para

indicar distintas situaciones posibles para el objeto (o clase de objetos). No es

visible al programador que maneja una instancia de la clase.

Componentes de un objeto: atributos, identidad, relaciones y métodos.

Identificación de un objeto: un objeto se representa por medio de una tabla o

entidad que esté compuesta por sus atributos y funciones correspondientes.

(http://es.wikipedia.org/wiki/Base_de_datos_orientada_a_objetos;

(http://es.wikipedia.org/wiki/Programaci%C3%B3n_orientada_a_objetos)

Describir cada etapa del diseño de un DW

1. Análisis de requerimientos.

Identificar preguntas para las que queremos tener respuesta y los objetivos que se

quieren conseguir con el nuevo sistema.

Analizar las preguntas para determinar las perspectivas de análisis y los indicadores

de negocio.

Diseñar el modelo conceptual, que incluirá las perspectivas e indicadores

identificados. A través del modelo se podrán alcanzar claramente cuáles son los

alcances del proyecto, y será un punto de partida con alto nivel de definición para su

exposición a los usuarios y responsables.

Page 18: Tarea  -data_ware_house

2. Análisis de los sistemas transaccionales.

Determinación de indicadores: identificar el origen de los indicadores en los

sistemas transaccionales y determinar la forma de su cálculo.

Correspondencias: establecer correspondencias entre los elementos definidos en el

modelo conceptual y las fuentes de datos existentes en elos OLTP (sistemas

transaccionales).

Definición del nivel de granuralidad: nivel de detalle de los datos a obtener para

cada dimensión de análisis.

Modelo conceptual ampliado con los campos identificados para cada perspectiva.

3. Modelo lógico del ETL.

Tipo de modelo lógico del DW: selección del tipo de esquema que utilizaremos

(estrella, copo de nieve, etc).

Tabla de dimensiones: Construcción de las tablas de dimensiones para cada una de

las perspectivas de análisis considerada.

Tablas de Hechos: definición de las tablas de hechos que contendras la información

a partir de los cuales construiremos los indicadores de análisis.

Uniones: relaciones entre las tablas de dimensiones y las tablas de hechos.

4. Procesos ETL.

Análisis, definición y desarrollo de todos aquellos procesos necesarios para la

extracción, transformación y carga de datos desde los sistemas origen para “llenar” el DW.

Page 19: Tarea  -data_ware_house

5. Performance y Mantenimiento del DW

Ajustes en el diseño del DW y mantenimiento en el tiempo.

  Etapa Entrada Salida Involucrados

I Análisis de los Documentación Esquemas de bases deDiseñador y

administradores

 sistemas de Información Existente datos de los sistemas de info.

II Especificación Esquemas de Hechos y cargas Diseñador y usuarios  de requerimientos bases de datos de trabajo preliminares finales

III Diseño conceptualEsquemas de

bases Esquemas Diseñador  de datos, hechos y dimensionales   cargas de trabajo   preliminares IV Refinamiento de cargas esquemas Carga de trabajo Diseñador y usuarios   de trabajo y validación dimensionales y finales

  de esquemas cargas

preliminares   dimensionales V Diseño lógico Esquema Esquema DW lógico Diseñador  dimensional,   modelo lógico   objeto y cargas de   Trabajo VI Diseño físico Esquema de DW Esquema físico del DW Diseñador  lógico, DBMS   destino y cargas   de trabajo

(http://churriwifi.wordpress.com/2009/12/05/5-fases-en-la-implantacion-de-un-sistema-dw-

metodologia-para-la-construccion-de-un-dw/)

Page 20: Tarea  -data_ware_house

Negocio para desarrollar un DW – Gimnasio

Claramente el deporte en Chile ha ido aumentando de manera considerable, a pesar

de no tener una cultura deportiva como en otros países, como por ejemplo, Estados Unidos,

Alemania, Argentina, entre otros, las personas se van dando cuenta que tanto por temas de

salud y sociales, el tener una vida y cuerpo sano afecta en magnitud las posibilidades de

llevar a cabo las actividades cotidianas de la mejor forma posible. En relación a lo anterior,

no está demás mencionar, que el hecho de ser deportista y tener una imagen como tal,

aumenta claramente las ventajas de obtener un mejor puesto laboral en comparación con las

demás personas. En consecuencia, el negocio que se ha escogido está relacionado con el

boom del deporte, y sin duda, no existe otro mejor espacio para llevar a cabo las diferentes

actividades deportivas como en un gimnasio, representando ésta misma la industria la cual

es objetivo de análisis. Por esta razón, es indispensable tener un sistema para ir haciendo

mantención a las diversas maquinas que se utilizan en estos centros deportivos,

considerando el uso que se les da, existen varios elementos que se pueden remplazar a

medida que transcurre el tiempo. Como por ejemplo las mismas máquinas, los cables

sostenedores de los pesos, las bicicletas, las mancuernas, entre otros.

Page 21: Tarea  -data_ware_house

Se establecen intervalos de tiempos adecuados para evaluar las máquinas, estos son

mensuales, trimestrales, semestrales y anuales. Para lo cual es necesario determinar el tipo

de máquina y la categoría a la que corresponde para realizar su reemplazo si es que es

necesario efectuarlo, es decir, contactar a uno de los proveedores del determinado aparato,

quienes se han clasificado en ciudades, regiones y países, considerando las características

de algunas máquinas probablemente no todas son posible adquirirlas en Chile.

Debido a lo anteriormente mencionado, es posible efectuar análisis en el transcurso

del tiempo de los reemplazos y reparaciones que se tienen que realizar, como por ejemplo,

en un año se debe reemplazar las maquinas de tipo spinning, correspondientes a la categoría

de fitness, en donde los proveedores se ubican en Chile, Región Metropolitana, Santiago.

Page 22: Tarea  -data_ware_house

Conclusión

Efectivamente debido a la gran cantidad de información que presentan generalmente

las empresas de gran envergadura, resulta indispensable llevar a cabo un ordenamiento de

ésta para satisfacer las distintas necesidades dentro de una organización. Por esta razón,

como se ha observado tanto a través de los conceptos y el ejemplo de los gimnasios, resulta

indispensable utilizar Data Warehouses para tomar las decisiones correctas en los

momentos precisos, es decir, está orientado para establecer análisis y consultas de los

usuarios en el transcurso del tiempo. De esta forma es posible facilitar el acceso a los

usuarios finales a los almacenes de datos para obtener específicamente los datos que se

requieren.

Por esta razón, es fundamental utilizar las herramientas y técnicas para extraer,

cargar y transformar datos de diversas fuentes, para posteriormente depurarlos y prepararlos

para cargarlos en un almacén de datos, generando siempre valor agregado para la empresa

que los utiliza. Es en este aspecto en donde cumple suma relevancia el Business

Intelligence, en donde los resultados de las aplicaciones de los software de inteligencia se

ven si es que ha aumentado los beneficios tanto financieros, administrativos, y sin duda, un

aumento en la correcta toma de decisiones de los distintos departamentos que se encuentran

presente en una organización. De lo contrario, se buscarán nuevos métodos más eficientes

para llevar a cabo los procesos que presentan falencias.

Como se ha observado son mucho los procesos que se realizan al mantener un Data

Warehouse, por lo cual, pueden presentar costos bastantes elevados para las empresas, y

podría ser una de las causas que las pequeñas y medianas empresas no los utilicen. Además,

la información va cambiando rápidamente, y se requiere claramente un análisis minucioso

para actualizar la información, de modo que esta siga siendo relevante.