presentacion bi version print out - recortada [modo de...
TRANSCRIPT
Business IntelligenceBusiness Intelligence
SeminarioSeminario
Business IntelligenceBusiness Intelligence� Por qué BI?
◦ Avances tecnológicos y su costo de adquisición
� Definición de Intelligence◦ Transformación de información en conocimiento
◦ Ciclo de Inteligencia� Obtención de datos� Obtención de datos
� Seleccionar, clasificar, ordenar
� Presentar y recomendar
� Naturaleza de la información◦ Tiempo real
◦ Histórica
◦ Estadística
Business IntelligenceBusiness Intelligence
� Naturaleza de los productos de BI
◦ Indicadores de gestión � Varianzas, estáticos, recurrentes, triggers, event driven
Indicadores asociados a consultas especificas ad hoc◦ Indicadores asociados a consultas especificas ad hoc� Data mining, data wharehousing
◦ Predictores de comportamiento� Combina el uso de herramientas estadísticas con la
clasificación y selección de datos principalmente de naturaleza histórica.
¿Qué es Business Intelligence?¿Qué es Business Intelligence?
Business Intelligence es el proceso de juntar, consolidar y
analizar datos de múltiples fuentes para soportar el proceso de
decisión estratégico
In a word: Analysis� Customer Analytics
� Performance Management
� Risk, Fraud & Compliance
Las plataformas de BI posibilitan el desarrollo de aplicaciones de BI.
La evolución del escenario de análisisLa evolución del escenario de análisis
Embedded
Analytics
Impact
on
High
Customized
Analytic Applications
BI Market Maturity
on
Business
LowReporting
Ad-hoc
Query & Analysis
Pre-packaged
Analytic Applications
Fuente: IBM Business Intelligence
Arquitectura de Business IntelligenceArquitectura de Business Intelligence
DB2
VSAM
MQSeries
AS/400
DB2 UDB
Informix
Oracle
Microsoft
...Extracción
Transformación
Limpieza DW
ETL DW OLAP Reporting
Siebel
PeopleSoft
SAP R/3
XML
Flat files
FTP
Web Logs
Limpieza
CargaDW
Data
Mart
ODS
Data Mining
Por qué las empresas usan BI?Por qué las empresas usan BI?
� Compliance Entes Regulación
◦ Basilea
◦ Banco Central
◦ Sarbanes Oxley
◦ Sec. Energía, etc.
� Visión Cliente
◦ Lealtad de Clientes
◦ Ofertas Segmentadas
◦ Comportamiento de compra
◦ Rentabilidad de ClientesSec. Energía, etc.
◦ Bolsa de Comercio
� Performance
◦ Control de gestión
◦ M&A
◦ Eficiencias cadena de valor
Rentabilidad de Clientes
� Controles de Seguridad
◦ Detección Fraudes
◦ Record de incidentes
Necesidades Analíticas por tipo de Necesidades Analíticas por tipo de
UsuariosUsuarios
Executives
Dashboards y KPI´s
embebidos en portales
Front Line Users
Power Users
(e.g. “Analysts”)
Population size
Ad Hoc Queries
KPI´s de LoB
Easy-to-Use Analytics
Oportunidades del Mercado de Oportunidades del Mercado de
Business IntelligenceBusiness Intelligence
8,0
10,0
12,0
14,0
16,0O
pp
ort
un
ity ($B
)Technical Data Analysis
Spatial Data Analysis
Packaged Data
Mart/Warehouse Products
End User Query, Reporting,
Analysis
Data Mining Software
0,0
2,0
4,0
6,0
2004 2005 2006 2007 2008
Op
po
rtu
nit
y ($B
)
Data Warehouse Databases
Source: GMV 1H2005
Capacidades de BICapacidades de BI
� Gartner Group define algunos requisitos de
evaluación de una plataforma BI.
� Se dividen en las siguientes Categorías:� Se dividen en las siguientes Categorías:
◦ Desarrollo e Integración
◦ Information Delivery
◦ Análisis de Información
Desarrollo e IntegraciónDesarrollo e Integración
� Infraestructura de BI
� Ambiente de Desarrollo Programático
� Movimiento de Datos
� Administración de la Metadata
� Integración de Web Services
� Ambiente de Desarrollo Programático
� Ambiente de Desarrollo Visual
� Contenido de negocios preconfigurado
� Reglas de Negocio
� Collaboration y Workflow
� Infraestructura de BI
Todas las herramientas de la
plataforma deben usar la misma:
– Seguridad
Desarrollo e IntegraciónDesarrollo e Integración
– Metadata
– Administración
– Integración en el Portal
– Modelo de Objetos
– Motor de Queries
– Look & Feel
� Administración de la Metadata
Desarrollo e IntegraciónDesarrollo e Integración
� Componente principal de la
plataforma.
� Todas las herramientas deben
apalancarse en la metadata
� La solución debe prever
medios para
� capturar,
� almacenar,
� reutilizar,
� publicar objetos de la
metadata
� Es el movimiento de datos desde aplicaciones específicas
� Movimiento de Datos
Desarrollo e IntegraciónDesarrollo e Integración
desde aplicaciones específicas o repositorios de datos y su carga en el repositorio preparado para el análisis de información.
Set de herramientas de desarrollo
integradas a un Kit de Desarrollo
que permite a programadores:� Ambiente de Desarrollo Programático
Desarrollo e IntegraciónDesarrollo e Integración
− Crear/desarrollar aplicaciones
de BI
− Integrarlas a procesos de
negocio
− Embeberlas a otras
aplicaciones
� Ambiente de Desarrollo Programático
� Posibilita el desarrollo de
Desarrollo e IntegraciónDesarrollo e Integración
� Posibilita el desarrollo de
aplicaciones sin necesidad de
programar, mediante el uso de
wizards que ensamblan
componentes
� Ambiente de Desarrollo Visual
� Disponibilidad de objetos para
un rápido lanzamiento de un
proyecto. Se trata de disponer
de queries, reportes,
indicadores de performance,
etc.
Desarrollo e IntegraciónDesarrollo e Integración
etc.
� Esta capacidad puede incluso
ofrecer un esquema de datos
aplicable para una industria
vertical o algún tema
específico.
� Ejemplos: herramienta de
análisis de ventas, indicadores
de industria farmacéutica, etc.
� Contenido de negocios preconfigurado
Permite a la plataforma de BI:
− Schedule
− Entrega
− Manejo de Información
− Administración
Desarrollo e IntegraciónDesarrollo e Integración
− Administración
A través de standards de
integración Web Service.
Ejemplo: SOA (Service Oriented
Architecture)� Integración de Web Services
� El desarrollador de la
aplicación (o el usuario final)
Desarrollo e IntegraciónDesarrollo e Integración
aplicación (o el usuario final)
tiene la capacidad de crear
reglas de negocio que afectan
procesos operacionales
basados en los resultados de la
evaluación analítica.
� Reglas de Negocio
� Componente principal de la
plataforma.
� Todas las herramientas deben
apalancarse en la metadata
Desarrollo e IntegraciónDesarrollo e Integración
� La solución debe prever
medios para
� capturar,
� almacenar,
� reutilizar,
� publicar objetos de la
metadata
� Collaboration y Workflow
Information DeliveryInformation Delivery
� Reportes
� Dashboard
� Ad Hoc Queries� Ad Hoc Queries
� Queries Distribuidos
� Captura de Datos Real Time / Evento
� Integración con Msft Office
� Reportes
Information DeliveryInformation Delivery
� Es la capacidad de presentar
reportes con un formato
específico pero interactivo en
cuanto que es parametrizable
la condición de búsqueda.
� Debe ser escalable es cuanto al � Debe ser escalable es cuanto al
volumen de usuarios a
informar como a las
capacidades de scheduling.
� La mayoría de las herramientas
dispone de variados estilos de
reportes
� Dashboard
Information DeliveryInformation Delivery
� Le agrega a los reportes
formales una posibilidad de
visualización intuitiva, que visualización intuitiva, que
incluye escalas, deslizadores,
probetas, semáforos, etc. que
indican el estado del indicador
� Ad Hoc Queries
Information DeliveryInformation Delivery
� Permiten a los usuarios
enunciar sus propias preguntas
sobre los datos del
repositorios sin necesidad de
depender de TI para elaborar
el reporte.
� Las herramientas deben
ofrecer poseer una robusta � Ad Hoc Queries ofrecer poseer una robusta
capa “semántica” que le
permite a los usuarios navegar
por las fuentes de datos
disponibles.
� Estas herramientas deben
ofrecer un control y auditoría
de los queries para asegurar
que sean realizables y que no
afecten la performance del
sistema transaccional.
� “Costo de la consulta”
Information DeliveryInformation Delivery
� Capacidad de ofrecer
información a una audiencia
� Queries Distribuidos
información a una audiencia
numerosa y que son
optimizadas para atender a la
mayoría de las preguntas de
gestión.
Information DeliveryInformation Delivery
� Acceso a la fuente de
� Captura de Datos Real Time / Evento
� Acceso a la fuente de
información
� Disponibilidad de información
actualizada
Information DeliveryInformation Delivery
� Más allá de la existencia de
productos de BI para la
resolución de las consultas,
herramientas de Microsoft
Office son usadas como
cliente de la aplicación.
� El producto más usado es el
� Integración con Msft Office
� El producto más usado es el
Excel.
� Resulta vital esta integración,
incluyendo manejo de formato
Excel, fórmulas, actualización
de datos, manejos de tablas
pivotantes.
� Algunas funciones avanzadas
serían bloqueo de celdas o re-
escritura.
Análisis de InformaciónAnálisis de Información
� Front End con procesamiento analítico
� Back End para procesamiento analítico� Back End para procesamiento analítico
� Motor de Cálculo o Modelización
� Análisis avanzado y Data Mining
� Visualización avanzada
Análisis de InformaciónAnálisis de Información
� Front End con procesamiento analítico � Exploración de los datos
almacenados en un formato
multidimensional contra datos
relacionales.relacionales.
� La visión multidimensional se
trata de asociar campos a más
de una dimensión de análisis.
� Ejemplo: Ventas, Costos,
rentabilidad en el tiempo, por
producto, por territorio, por
organización
Análisis de InformaciónAnálisis de Información
� Back End para procesamiento analítico� Almacenamiento de datos en
el formato multidimensional
para posibilitar performance � Back End para procesamiento analítico
para posibilitar performance
aceptable al tiempo de la
consulta.
� Es de uso atractivo se permite
re-escritura o versionado para
el caso de planeamiento o
modelización de escenarios.
Análisis de InformaciónAnálisis de Información
� Capacidad de manipulación de
� Motor de Cálculo o Modelización
� Capacidad de manipulación de
información
� Incluye cálculos avanzados
(estadísticos, regresiones,
extra/intrapolaciones)
� Escenarios What if
Análisis de InformaciónAnálisis de Información
� Sofisticados métodos de
exploración de datos
� Métodos predictivos: Ej.
� Análisis avanzado y Data Mining
� Métodos predictivos: Ej.
Churn, comportamiento
clientes
� Mining, clustering: metáfora
con mundo geológico.
Exploración de raw data,
clasificación, tipificación.
Análisis de InformaciónAnálisis de Información
� Visualización de numerosos
� Visualización avanzada
� Visualización de numerosos
aspectos de los datos en un
modo eficiente usando
gráficos interactivos en vez de
filas y columnas.
ArquitecturasArquitecturas
� OLAP (On Line Analytical Processing): toma una copia de un set de datos y lo reestructura en un cubo OLAP. Queries corren contra este set. Exige un gran número de agregaciones por lo que se definen estrategias de cálculo para hacer las restante a demanda.
� MOLAP (OLAP generalmente): cuenta con una estructura de bases de datos muy efectiva para períodos de tiempo, locación, productos o códige de producto. La forma en que estas dimensiones se o códige de producto. La forma en que estas dimensiones se agrupan se define por jerarquías.
� ROLAP (Relational): trabaja directamente con DB relacionales, que almacenan la información básica, tablas de dimensiones y nuevas tablas se crean para información agregada. Usan un esquema especializado de diseño (Star schema).
� HOLAP (Hybrid): mezcla de las anteriores
� AQL (Associative Query Language)
ProductosProductos
� MOLAP:
− Cognos, Microsoft Analysis Services, Express
� ROLAP:
− Microstrategy, Discoverer
� Reporting:
− Business Objects, Crystal Reports, Oracle Reports− Business Objects, Crystal Reports, Oracle Reports
� AQL:
− QlikView
� Relational (Parallel Processing):
− Teradata
� Mining:
− SAS
Algunos temas de interés Algunos temas de interés
� Crecimiento explosivo de volúmenes (60%/año)
− Plataforma que permita mayor tiempo de análisis vs preparación
� Decisiones en tiempo real
− Menor tiempo de latencia
− “Right time” Data Movement
Dashboard manía:� Dashboard manía:
− Más usuarios, distribución de decisión
� Unica versión de la realidad
� Análisis a lo largo de todas las capas de información del
Data Warehouse
� Data Warehouse y/o Data Mart