azure data usando hdinsight ejemplo hadoop: madreduce, hive, pig

Azure DataIntroducción a HDInsight

Freddy Angarita C.MVP SQL Server@flacMVP | geeks.ms/blogs/fangarita/ @sqlpassmed

ApplicationBuilding Blocks

storagebig data

caching

database

identity

messaging

networking

trafficcloud

services

DemoConfiguración Storage y HDInsight

Hadoop• Framework• Procesamiento distribuido• Modelo de programación simple• Diseñado para escalabilidad• Cada Nodo ofrece computación y

almacenamiento• Diseñada para ser tolerante a fallos

Hadoop -Componentes• Framework de procesamiento• HDFS (Hadoo Distributed File System)

Esquema de Datos Tecnología de Consumo

Relacionales SQL

No relacionales NoSql (Not Only SQL)

Hadoop MapReduce

Consumo de información

MapReduce• Consumo de Datos mediante trabajos

(normalmente Java)• Alta Flexibilidad – Alta complejidad• Ha aumentado su adopción pero como DW

• Opciones• Hive – query en MapReduce

Distribuido en el clúster• Los datos y el procesamiento se hospeda

en cada máquina• Agrega redundancia y tolerancia a fallos• El procesamiento ocurre localmente

Cómo consulta

Master Node

JobTracker

TaskTracker

HDFS• Replica los datos en otros nodos (128M)• NameNode: Dónde están los datos• DataNodes: Almacenamiento de la

información• Cada máquina: más procesamiento, más

almacenamiento

DemoEjecutar un Job desde PowerShell

DemoObtener Resultados del Job localmente

DemoConectar herramientas BI (Excel)

PowerQuery http://bit.ly/1loMSko

HIVE• Consultas en paralelo usando MapReduce• Lenguaje parecido a SQL – HiveQL• Ideal para procesar grandes volúmenes de datos

inmutables• No se recomienda para almacenamiento transaccional• Optimizado para• Escalabilidad• Extensibilidad• Tolerancia a Fallos

• No se considera mucho la latencia

Ejecución Query HIVEEjemplo:

2012-02-03 20:26:41 SampleClass3 [ERROR] verbose detail for id 1527353937

Ejecución Invoke-Hive

• Alternativa para escribir MapReduce• Pasos• Carga: lee la información a usar• Transformación: Manipulación de los datos• Volcar o almacenar: Salida a pantalla o a almacenamiento

Acompáñanos mañana en EAFIT en el Bloque 19, Piso 4 desde las 9 a.m.

Evento de Comunidad

azure data usando hdinsight ejemplo hadoop: madreduce, hive, pig

distribuido en

datos inmutables

clster los datos y

datos tecnologa

sql hadoop mapreduce

ms almacenamiento

ms procesamiento

acompanos maana en eafit

Data & Analytics

· web viewmúltiples antenas que transmiten utilizando...

2016 dsg webinar azure hdinsight 2 v4

usando java usando · extreme guide: usando java ver 200804...

making your apps smarter with azure hdinsight

usando busybox

matemáticas discretas tc1003 - profesor eduardo...

introduction to mahout with hdinsight

server and cloud platform template€¦ · azure hdinsight,...

un ejemplo usando backpropagation y...

introduction to microsoft’s hadoop solution (hdinsight)

nuevos modelos de negocio con sap api management -...

campus days azure hdinsight automation

windows azure hdinsight service

big data, hadoop, hdinsight

divirtiéndose en el patío de...

informática past papers... · recopilarse datos sobre las...

introduction to azure hdinsight

qlik compose agent setup guide€¦ · microsoft azure...

create hdinsight cluster in azure portal (february 2015)

running with elephants: predictive analytics with hdinsight