kafka connect: real-time data integration at scale with apache kafka, ewen cheslack-postava

27

Kafka Connect: Real- time Data Integration at Scale with Apache Kafka By Ewen Cheslack-Postava

Upload: confluent

Post on 16-Apr-2017

3.796 views

Category:

Engineering

4 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Kafka Connect: Real-time Data Integration at Scale with Apache Kafka

By Ewen Cheslack-Postava

Page 2: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 3: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 4: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 5: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Data Integrationgetting data to all the right places

Page 6: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 7: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 8: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 9: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 10: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 11: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

IntroducingKafka ConnectLarge-scale streaming data import/export for Kafka

Page 12: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 13: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 14: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 15: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 16: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 17: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 18: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 19: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 20: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 21: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Offsets automatically committed and restored

On restart: task checks offsets & rewinds

At least once delivery – flush data, then commit

Exactly once for connectors that support it (e.g. HDFS)

Delivery Guarantees

Page 22: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Abstract serialization: 1 connector, many serialization formats

Convert between Kafka Connect Data API (Connectors) and serialized bytes (Kafka)

JSON and Avro are currently well supported

Converters

Page 23: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Page 24: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Confluent Open Source – HDFS, JDBC

Connector Hub: connectors.confluent.io

Examples: MySQL, MongoDB, Twitter, Solr, S3, MQTT, Bloomberg, Apache Ignite, and more

Connectors Today

http://connectors.confluent.io/

Page 25: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Jenkins connector – Aravind Yarram (Equifax)

Twitter semantic analysis and visualization – Ashish Singh (Cloudera)

Brain monitoring device connector – Silicon Valley Data Science

DynamoDB, Cassandra, Slack, Splunk, and many more

Connectors from the Hackathon

Page 26: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

Improved connector control via REST API, standardized configs, metrics

Single record transformations

Data pipelines in an app - embedded mode & Kafka Streams integration

Many more connectors

Coming soon…

Page 27: Kafka Connect: Real-time Data Integration at Scale with Apache Kafka, Ewen Cheslack-Postava

THANK YOU@ewencp@confluentincTry it out: http://confluent.io/downloadMore like this, but in blog form: http://confluent.io/blog

· Apache Kafka Introduction to Apache Kafka Apache Kafka Architecture explanation Practical Examples on Apache Kafka SCALA, PYTHON, SPARK Course Content

Metamorfoze Kafka

Forcepoint Behavioral Analytics Installation Manual › content › support › library › ... · Kafka kafka 9092-9095 API, Rose Kafka Manager kafka 9000 Administrator Workstation

Kafka Connect & Streams - the ecosystem around Kafka

MAURICE BLANCHOT, de Kafka a Kafka

Kelly Technologies · Kafka Introduction to kafka kafka Architecture Zookeeper quorum and Brokers Creating Topics , producers and consumers Kafka API Flume and Kafka PIG HBASE Introduction

Kafka Tutorial - Introduction to Apache Kafka (Part 1)

Kafka blr-meetup-presentation - Kafka internals

Cassandra and Kafka Support on AWS/EC2cloudurable.com/ppt/kafka-tutorial-cloudruable-v2.pdf · Cassandra / Kafka Support in EC2/AWS. Kafka Training, Kafka Consulting Cassandra and

Kafka Tutorial - basics of the Kafka streaming platform

A Pilot Study Keely Cheslack-Postava, Ph - Julkari

4D Compression and Relighting with High-Resolution Light ...graphics.berkeley.edu/papers/CheslackPostava-4CR... · Ewen Cheslack-Postava Stanford University Nolan Goodnight NVIDIA

Kafka Connect & Kafka Streams/KSQL - powerful ecosystem around Kafka core

Formatted: Figure [PACKT] cm, Width: 21.59 cm, Height: 27 ... · Kafka 0.7.x Consumer Kafka 0.7.x Cluster Kafka Migration Kafka 0.8 Cluster Kafka 0.8 Producer Producer (Front End)

Kafka Reliability Guarantees ATL Kafka User Group

Kafka Tutorial: Kafka Security

Building Realtime Data Pipelines with Kafka Connect and Spark Streaming: Spark Summit East Talk by Ewen Cheslack Postava

Kafka Low-Level Design discussion of Kafka Design Kafka …cloudurable.com/ppt/4-kafka-detailed-architecture.pdf · Cassandra / Kafka Support in EC2/AWS. Kafka Training, Kafka Consulting

Kafka Streams: Hands-on Session - ce.uniroma2.it · Kafka Streams Kafka Streams: • Kafka Streams is a client library for processing and analyzing data stored in Kafka • Supports

Kafka Performances 1perfug.github.io/assets/files/PerfUG68.pdf · Apache Kafka. 34 Consuming From Kafka - Single Consumer C. 35 Consuming From Kafka - Grouped Consumers ... programming.”

Kafka Connect & Kafka Streams/KSQL - the ecosystem around Kafka

Panelists: Brent Poliquin Jack Hornor Darren Balentine Richard Snyder John Postava MODERATOR: BILL KENNEDY

Kafka to the Maxka - (Kafka Performance Tuning)

Enterprise Kafka: Kafka as a Service

Kafka Audit - Kafka Meetup - January 27th, 2015

Franz Kafka - Letter to his · PDF fileFranz Kafka Pictures Home Page Kafka and Judaism The Holocaust photographs Galleries Franz Kafka Biography Franz Kafka-Wax Museum Kafka &

Working with Kafka Advanced Consumers - Cloudurable · 2020-02-12 · Kafka / Cassandra Support in EC2/AWS. Kafka Training, Kafka Consulting, Kafka Tutorial Objectives Advanced Kafka

PDF: Kafka Tutorial - Cloudurablecloudurable.com/ppt/cloudurable-kafka-tutorial-v1.pdf · Cassandra / Kafka Support in EC2/AWS. Kafka Training, Kafka Consulting ™ What is Kafka?

Kafka Messaging JavaCro2019 IBM pdfv · •Kafka basics •Kafka Use Cases •Java Connector Architecture •Distributed messaging challenges •Reliable Kafka Processing •IBM Event

Ispitivanje iskrenja postava nadograđene komore …...Ispitivanje iskrenja postava nadograđene komore vremenske projekcije u ALICE detektoru na LHC-u Author Fizika Created Date 1/24/2019

Metamorfoza - Franz Kafka - Franz Kafka.pdf · Title: Metamorfoza - Franz Kafka Author: Franz Kafka Keywords: Metamorfoza - Franz Kafka Created Date: 5/13/2019 11:17:21 AM

Apache Kafka - RainFocus · Apache Kafka Scalable Message ... Introduction& Motivation Apache Kafka -Scalable Message Processing and more! Apache Kafka -Overview ... • Apache Spark

Authorization in Apache Kafka - Seattle Kafka Meetup - Ashish Singh