introducción a data science
TRANSCRIPT
Data Science
“Data! Data! Data!” he cried impatiently. “I can’t make bricks without clay.”
— Arthur Conan Doyle
@educharlief
MSc. Carlos Fuentes
Historia
Historia
1.49 Billion perfiles 4.5 B. likes/mes 300 PB 5 nuevos perfiles c/seg
Cada 60 segundos en facebook: 510 comentarios 293000 estados
136000 fotos
Fuente: https://zephoria.com/top-15-valuable-facebook-statistics/ Octubre 2015
500 M 284 M 200 M
Cuan grande son los datos?• Byte Un grano de arroz
• Kilobyte Una taza de arroz
• Megabyte 8 libras de arroz
• Gigabyte 3 contenedores de camiones
• Terabyte 2 contenedores de barcos
• Petabyte Cubre Manhattan
• Exabyte Cubre UK (3 veces)
• Zettabyte Llena el océano Pacífico
Entonces..?• Estamos generando más datos que nunca
• Transacciones financieras
• Sensores de red
• Logs de aplicaciones
• Correo electrónico y mensajes de texto
• Redes sociales
• Estamos generando nuevos datos más rápido
• Automatización
• Conectividad de internet ubicua
• Contenido
Qué es un Data Scientist?
Algebra Lineal
Análisis estadístico
Análisis predictivo
Entrenamiento científicoMachine Learning
Minería de datosProcesamiento de datos &
Bases de datos
Herramientas de BI
Big Data
PHD en:Ciencias de la Computación?
Estadística?Física?
Biología?
Qué es Data Science?
• Campo multidisciplinario
• Extraer conocimientos o puntos de vista de los datos en diversas formas
• Combinación con estadística, análisis predictivo, minería de datos, etc.
http://www.datascienceontology.com/
Necesitaremos un Data Scientist?
• Necesitaremos una pelotón de PHDs para resolver problemas de machine learning?
• Probablemente no.
• Creo que si.
• Podremos encontrar mas valor en los datos que recogemos?
• Por supuesto!
• Necesitaremos personal que nos ayude a encontrar ese valor?
Puedo convertirme en un Data Scientist?
• Desarrolladores quienes quieran:
• Orientarse mas por las estadísticas.
• Mejor entendimiento del negocio.
• Analistas de negocio quienes:
• Tenga alguna habilidad para programar.
• Quieran crecer sus capacidades técnicas.
• Todos los candidatos deberían:
• Tener tremenda curiosidad
• Ser auto-manejables.
Machine Learning
• Object recognition
• Speech recognition
• Automated translation
Casos de uso• Finanzas
• Fraude electrónico
• Riesgo de análisis de un cliente
• Ventas
• Recomendación de productos
• Predecir e incentivar la compra
• Telecomunicaciones y utilidades
• Predecir el fallo de equipos
Y más…• Acelerar el tratamiento para enfermedades
• Uso de Deep Learning sobre registros para detectar cancer
• Política (Preferencia de votos)
• Ética gubernamental
• Neurociencia