urs köster presenting at re-work dl summit in boston

Proprietary and confidential. Do not distribute.

Deep Learning at Scale

May 2016 Urs Köster, PhD

Nervana

MAKING MACHINES SMARTER.

ne r vana

About nervana

• A platform for machine intelligence

• enable deep learning at scale

• optimized from algorithms to silicon

ne r vana

The Nervana Platform - a full-stack solution

neon deep learning

framework

nervana cloud Solutions

Images

Tabular

Speech

Time series

neon: nervana python deep learning library

• User-friendly, extensible, fast

• Support for many deep learning models

• Interface to nervana cloud

• Multiple backends

• nervana engine

• GPU (optimized assembler kernels)

• CPU cluster

Open source (Apache 2.0) on github.com/nervanaSystems/neon

ne r vana

Nervana Cloud

web interface

command line

ne r vana

Deep learning as a core technology

Photos Maps

Voice Search

Self-driving car

Ad Targeting

Machine Translation

‘Google Brain’ model

Image Classification

Object Localization

Video Indexing

Speech Recognition

Nervana Platform

Natural Language

ne r vana

Video recognition with 3D convolution

Training Speed

epochs / hour

neon caffe

ne r vana

Object Localization / Segmentation

CamVid DatasetSegNet model

KITTI DatasetFast R-CNN model

neon (ms) caffe (ms) Speedup

Fast-RCNN (batch size=4) 360 670 1.8x

SegNet (batch size=4) 267 1455 5.4x

SegNet (4 GPUs, batch size=16) 348 -- *5.9x

ne r vana

Image Classification (Residual Network)

ne r vana

Speech to text

ne r vana

Imagenet ILSVRC Challenge

2010 2011 2012 2013 2014 2015

Deep learninghuman

performance

larifa

ne r vana 12

• Same model, better performance:

• Hardware improvements

• Algorithmic improvements

Speeding up Deep Learning

0100200

300400500600

CPU GTX580TitanX neon

Soumith's AlexNet Benchmark

4/2015 8/2015 3/2016

neonCuDNN

Soumith's GoogleNet Benchmark

4/2015 8/2015 3/2016

neonCuDNN

15,000 ...

Alexnet ms / iteration

ne r vana

Dennard scaling has ended

# OF PROCESSORS

LEARNING SPEED

INDUSTRY STANDARD: COMMUNICATION OVERHEAD = PERFORMANCE CEILING

NERVANA: BETTER COMMUNICATION FABRIC, NEAR LINEAR SCALING

Transistors Clock speed Power Perf / clock

ne r vana

Nervana Engine (coming in 2017)

• Unprecedented computing power

• 10x speedup over current GPUs

• More memory on-chip

• High-Bandwidth Memory off-chip

• Six bi-directional high-bandwidth

links for 3D torus interconnect

• 8 chips in a box, seamlessly scale

to multiple chassis

ne r vana

Summary

• Deep learning is a new computational paradigm

• Learning and Inference on data

• neon with state-of-the-art GPU kernels

• Nervana Cloud with multi-GPU training

• Watch for Nervana Engine deep learning processor

urs köster presenting at re-work dl summit in boston

Technology

juliane köster task as workplan, task in process: welche...

prof. jürgen dix nils bulling michael köster - informatik...

frederik köster quartett momentaufnahme · indigo cd...

kisi kisi urs

kollmorgen urs catalog

barrier isolat or urs urs

epd kÖster 2 in 1 kÖster 2 in 1.pdf · environmental...

urs muntwyler iea

fmk2015: neue funktionen in filemaker go 14 by jörg köster

secure roof waterproofing kÖster tpo · 2020. 9. 16. ·...

urs series

urs köster - convolutional and recurrent neural networks

swivel reach truck urs urs 150 - ifoy.org 150 (2) en.pdf ·...

range tenure ran076373 (pieter bleeker) overlap with or...

urs quick_user_guide.pdf

urs festival india

who is urs?

82g - alc.gov.bc.ca · alc website: this map represents...

frederik köster quartett zeichen der zeit - · pdf...

svaa urs: supplier volume allocation agency user ... · web...