Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
EL DATA SCIENTIST
MAS QUE UNA MODA
JULIO 2015
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
AGENDA
• Origen y Evolución
• ¿Qué conocimientos y skills deben tener?
• ¿Cómo son los actuales Data Scientist?
• ¿Dónde están ubicados en las empresas?
• SAS Data Scientist
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
AGENDA
• Origen y Evolución
• ¿Qué conocimientos y skills deben tener?
• ¿Cómo son los actuales Data Scientist?
• ¿Dónde están ubicados en las empresas?
• SAS Data Scientist
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
ORIGEN
• El Big Data
• El Business Intelligence/Analytics
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
VOLUMEN
VARIEDAD
VELOCIDAD
VALOR
HOY FUTURO
TA
MA
ÑO
DE
LO
S D
AT
OS
La ERA del BIG DATA
Datos Relevantes
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
BUSINESS INTELLIGENCE
En los años 90 aparecen los primeros sistemas ERP que se
convierten en los primeros grandes generadores de datos, y con estos
surgen las primeras preguntas de los Directivos
¿Dónde he vendido más?
¿A quién vendo más?
¿Qué producto es más rentable?
BUSINESS
INTELLIGENCE
BI 0.0
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
BUSINESS INTELLIGENCE + ANALITICA
Surgen nuevas preguntas, ya se QUÉ ha pasado pero necesito saber …
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
BUSINESS INTELLIGENCE/ANALYTICS
• Analítica Descriptiva
• Volúmenes pequeños de
Datos Estructurados
Internos de las Empresas
• Información con poca
influencia en la toma de
decisiones
Analytics 1.0
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
BUSINESS INTELLIGENCE/ANALYTICS
Los directivos son una fuente inagotable de preguntas; ya se PORQUÉ ha
pasado pero ahora quiero saber …
Analytics 2.0 • Analítica Predictiva
• Volúmenes medios de
Datos Estructurados
Internos de las Empresas
• Información para la toma
de Decisiones Operativas
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
PROCESO DE LOS DESARROLLOS ANALÍTICOS
Formula el
Problema
Explora y
Visualiza los
Datos
Prepara los
Datos
Análisis
Exploratorio de
los Datos
Construye
Modelos
Evalúa
Resultados y
crea Informes
Usuario de Negocio Analista de Negocio Analista de Datos Estadístico/Minero
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
CARACTERÍSTICAS DEL BIG DATA
Velocidad
• Los procesos tradicionales
de ETL’s en modo batch
ya no sirven.
• Los datos fluyen y se
necesitan en tiempo real.
Volumen
• Incorpora cualquier origen
de datos interno o externo
a las Compañías.
• Es necesario solucionar
tres problemáticas:
• Almacenamiento
• Proceso
• Acceso
Valor
• Disponemos de información que era inimaginable hace cincoaños.
• Esta información no siempre es obvia.
Variedad
• Datos NO Estructurados.
• Los formatos de los
campos origen no pueden
ser estructurados.
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
CARACTERÍSTICAS DEL BIG DATA ANALYTICS
Patrones
• Se cambia de un enfoque
de hypothesis-driven a
data-driven
• La complejidad de los
datos hace necesaria la
detección de patrones
antes del proceso de
modelización
Datos
• Usa el Big Data
• Un número mayor de
variables que muchas
veces son desconocidas
• El análisis previo de los
datos require de potentes
herramientas de
visualización
Modelización
• El número de modelos se
incrementa para alcanzar
una mayor granularidad
• Requiere de capacidades
iterativas automáticas
• Requiere de nuevas
técnicas de modelización
como por ejemplo la
Minería de Textos
Analytics 3.0
• Analítica Prescriptiva
• Volúmenes grandes de
Datos Estructurados o
no; y de origen Interno y
Externo a las compañías
• Información para la toma
decisiones operativas
con un mayor grado de
granularidad y para
decisiones Estratégicas
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
PROCESO DE LOS DESARROLLOS ANALÍTICOS CON BIG DATA
Analiza
diferentes
fuentes de
Datos
Formula el
Problema
Busca
Patrones
Prepara los
Datos
Construye
ModeloS
Evalúa y
Presenta
Resultados
Data Scientist
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
AGENDA
• Origen y Evolución
• ¿Qué conocimientos y skills deben tener?
• ¿Cómo son los actuales Data Scientist?
• ¿Dónde están ubicados en las empresas?
• SAS Data Scientist
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
CONOCIMIENTOS Y SKILLS DEL DATA SCIENTIST
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
CONOCIMIENTOS Y SKILLS
Analiza
diferentes
fuentes de
Datos
CONOCIMIENTOS
• Lenguajes de programación Not only SQL
• SAS Base
• “R”
• Herramientas de Visualización
• Análisis Estadístico
• Machine Learning
• Statistical Hypothesis Testing
Busca
Patrones
Formula el
Problema
SKILLS
• Curioso
• Proactivo
• Interés por el “Negocio”
• Curioso
• Imaginativo
• Creativo
• Habilidad para la solución de Problemas
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
CONOCIMIENTOS Y SKILLS
Prepara los
Datos
CONOCIMIENTOS
• Hadoop
• Tratamiento de Datos no Estructurados
• Modelización Predictiva
• Análisis Estadístico
• Machine Learning
• “R”, Python
• Statistical Hypothesis Testing
• Herramientas de Reporting
SKILLS
• Colaboración
• Curioso
• Innovación
• Imaginativo
• Buen Comunicador
• Habilidades de Presentación
Construye
ModeloS
Evalúa y
Presenta
Resultados
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
AGENDA
• Origen y Evolución
• ¿Qué conocimientos y skills deben tener?
• ¿Cómo son los actuales Data Scientist?
• ¿Dónde están ubicados en las empresas?
• SAS Data Scientist
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
TIPOLOGÍAS DE LOS ACTUALES DATA SCIENTIST
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
LOS FRIKIS (GEEKS)
Que aportan• Profundos conocimientos técnicos
• Mente Analítica
• Curiosos
• Creativos
• Resolución de Problemas
De que carecen• Interés por el Negocio, esto hace que su Proactividad e
Innovación sean cuestionables
• Habilidades de Comunicación y Presentación
• Colaboración
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
LOS GURÚS
Que aportan• Profundos conocimientos técnicos
• Innovación
• Curiosidad
• Habilidades de Presentación y
Comunicación
De que carecen• Interés por el Negocio, esto hace que su Proactividad no
sea eficiente
• Colaboración
• Resolución de Problemas
• Creatividad
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
LOS JEFES DE PROYECTO (DRIVERS)
Que aportan• Habilidades de Comunicación y
Presentación
• Resolución de Problemas
• Proactividad
• Interés en el Negocio
• Colaboración
De que carecen• Profundos Conocimientos Técnicos
• Creatividad
• Curiosidad
• Innovación
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
LOS EXPERTOS (CRUCHER)
Que aportan• Profundos Conocimientos Técnicos
• Resolución de Problemas
• Colaboración
De que carecen• Creatividad
• Habilidades de Comunicación y
Presentación
• Curiosidad
• Proactividad
• Innovación
• Interés por el Negocio
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
Los resultados no fueron buenos, la solución formarlos en las Habilidades (Soft Skills)
LO QUE LAS EMPRESAS BUSCAN
En los inicios del Big Data las empresas buscaban solo Conocimientos Técnicos:
Siguió sin funcionar había problemas por la personalidad de los primeros Data Scientist e
intervino RR HH
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
LO QUE RECURSOS HUMANOS BUSCA
Mente Abierta (Open)• No partir de premisas para
fomentar la Innovación
• Abiertos a cualquier nueva
idea = Curiosidad
• Imprescindible para el
desarrollo de la Creatividad
Meticuloso
(Conscienious)• Sin Organización no se
puede trabajar con la ingente
cantidad de variables del Big
Data
• Imposible trabajar con cientos
de modelos si no se es
meticuloso
Extrovertido (Extraverted)• Necesario para ser un buen
Comunicador
• Tienen mejores habilidades
de Presentación
• Los extrovertidos trabajan
mejor en Colaboración
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
LO QUE RECURSOS HUMANOS BUSCA
Estable (Stable)• El estrés está peleado con la
Ciencia de los Datos.
• Para ser Creativos hay que
sentirse felices
Afabilidad (Agreeable)• Mejora la Colaboración en el
trabajo
• Mejora la percepción en la
Comunicación
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
AGENDA
• Origen y Evolución
• ¿Qué conocimientos y skills deben tener?
• ¿Cómo son los actuales Data Scientist?
• ¿Dónde están ubicados en las empresas?
• SAS Data Scientist
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
SU ORIGEN EN LAS EMPRESAS
Origen de la necesidad• La Modelización Predictiva tradicional
empezaba a mostrar signos de
agotamiento
• No era capaz de generar
oportunidades creativas
• No aportaba ideas brillantes
para las Decisiones
Estratégicas
• La irrupción del Big Data con fuentes
de datos externos se vio como una
posibilidad de mejorar la Analítica de
las empresas
Sponsors de la idea• Las Áreas de Marketing son las
principales promotoras del uso del
Big Data Analytics
• Posibilidad de tener un mayor
grado de granularidad que
permitiría ofrecer una oferta aun
más personalizada
• Posibilidad de detectar nuevos
productos, servicios, canales,
vías de comunicación
• Las Áreas de Riesgos, para mejorar
los modelos y la posibilidad de hacer
cálculos más rápidos
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
¿DÓNDE?
Dónde los ubicamos• Se presentaban tres opciones:
• Del Área de Analytics
• Del Área de IT
• Del Área de Marketing
• Lo más habitual es el Área de
Analytics y luego de Marketing
De donde los sacamos• Se presentaban también diferentes
opciones:• Recursos Internos
• Estadísticos/Mineros
• Programadores expertos en
tratamiento de datos
• Analistas de Negocio
• Contratar Data Scientist
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
¿QUÉ HACEN EN LAS EMPRESAS?
• Medición efectiva y comprensión del impacto de las acciones de Marketing
• Análisis de las causas de la fuga de clientes
• Obtención de información a partir de las transacciones interbancarias
• Mejora de los modelos de cross selling y up selling con la inclusión de datos
externos para lograr un mayor nivel de granularidad
• Obtención de información de la visión de los productos y la compañía por
medio del análisis de las redes sociales
• Descubrir nuevos productos para incluir en el offering de las Empresa
• Mejora de la detección del fraude con la inclusión de datos externos
• Evaluación del Riesgo en clientes potenciales
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
AGENDA
• Origen y Evolución
• ¿Qué conocimientos y skills deben tener?
• ¿Cómo son los actuales Data Scientist?
• ¿Dónde están ubicados en las empresas?
• SAS Data Scientist
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
TECNOLOGÍAS PARA EL BIG DATA
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
DATA SCIENTIST PRESENTE O FUTURO
Buscando en Google por “ofertas de empleo sas
data scientist ” se obtienen 381.000 resultados
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d .
DATA SCIENTIST PRESENTE O FUTURO
Copyr i g ht © 2012, SAS Ins t i tu t e Inc . A l l r ights reser ve d . www.SAS.com
GRACIAS
Juan Lorenzo Prieto