sascha dittmann, ernst & young: big data in der cloud

11
Sascha Dittmann Software Developer / Solution Architect Twitter: @SaschaDittmann Blog: http://www.sascha-dittmann.de *

Upload: cloudcamp

Post on 29-Nov-2014

816 views

Category:

Technology


0 download

DESCRIPTION

Lightning Talk anlässlich des zweiten CloudCamp Frankfurt am 24.5.2012 in der Brotfabrik in Hausen.

TRANSCRIPT

Page 1: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

Sascha Dittmann Software Developer / Solution Architect

Twitter: @SaschaDittmann

Blog: http://www.sascha-dittmann.de

*

Page 2: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

*Seit über 13 Jahren:

*Software Developer

*Solution Architect

*Seit über 7 Jahren:

*Trainer für technische Trainings

*Sprecher auf Konferenzen

* IT Consulting

Page 3: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

180.000.000.000.000.000.000

1.800.000.000.000.000.000.000

Page 4: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

180.000.000.000.000.000.000

= 0,18 ZB (Zettabytes) - Stand 2006

1.800.000.000.000.000.000.000

= 1,8 ZB (Zettabytes) - Stand 2011

Quelle: IDC – Analyze the Future

Page 5: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*Vertikale Skalierung Horizontale Skalierung

Page 6: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

Atomicy

Consistecy

Isolation

Durabilty

Basically

Available

Soft State

Eventually Consistent

Page 7: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

Page 8: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

Map

Sort

Shuffle

DataNode

Map

Sort

Shuffle

DataNode

Map

Sort

Shuffle

DataNode

Reduce

0067011990999991950051507004+68750

0043011990999991950051512004+68750

0043011990999991950051518004+68750

0043012650999991949032412004+62300

0043012650999991949032418004+62300

1949,0

1950,22

1950,55

1952,-11

1950,33

1949,0

1950,[22,33,55]

1952,-11

1949,0

1950,55

1952,-11

Page 9: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

Map

Combine

Sort

Shuffle

DataNode

Map

Combine

Sort

Shuffle

DataNode

Map

Combine

Sort

Shuffle

DataNode

Reduce

0067011990999991950051507004+68750

0043011990999991950051512004+68750

0043011990999991950051518004+68750

0043012650999991949032412004+62300

0043012650999991949032418004+62300

1949,0

1950,22

1950,55

1952,-11

1950,33

1949,0

1950,55

1952,-11

1950,33

1949,0

1950,[33,55]

1952,-11

1949,0

1950,55

1952,-11

Page 10: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*

RDBMS Map/Reduce

Datenmenge Gigabytes Petabytes

Zugriff Interaktiv und Batch Batch

Lese- / Schreibzugriffe Viele Lese- und

Schreibzugriffe

Einmaliges Schreiben

Viele Lesezugriffe

Datenstruktur Statisches Schema Dynamisches Schema

Datenintegrität Hoch Niedrig

Skalierverhalten Nicht-Linear Linear

Page 11: Sascha Dittmann, Ernst & Young: Big Data in der Cloud

*