sublinear algorihms for big data

11

Sublinear Algorihms for Big Data Grigory Yaroslavtsev http://grigory.us Lectur e 4 Slides are available at http://grigory.us/big-data.html

Upload: colman

Post on 06-Jan-2016

17 views

Category:

Documents

0 download

Report

Download

Embed Size (px):

DESCRIPTION

Slides are available at http://grigory.us/big-data.html. Sublinear Algorihms for Big Data. Lecture 4. Grigory Yaroslavtsev http://grigory.us. Today. Dimensionality reduction AMS as dimensionality reduction Johnson- Lindenstrauss transform Sublinear time algorithms - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Sublinear Algorihms for Big Data

Sublinear Algorihms for Big Data

Grigory Yaroslavtsevhttp://grigory.us

Lecture 4

Slides are available at http://grigory.us/big-data.html

http://grigory.us/

http://grigory.us/big-data.html

Page 2: Sublinear Algorihms for Big Data

Today

• Dimensionality reduction– AMS as dimensionality reduction– Johnson-Lindenstrauss transform

• Sublinear time algorithms– Definitions: approximation, property testing– Basic examples: approximating diameter, testing

properties of images– Testing sortedness– Testing connectedness

Page 3: Sublinear Algorihms for Big Data

-norm Estimation

• Stream: updates that define vector where . • Example: For

• -norm:

Page 4: Sublinear Algorihms for Big Data

-norm Estimation

• -norm: • Two lectures ago:– -moment – -moment (via AMS sketching)

• Space: • Technique: linear sketches– for random set s – for random signs

Page 5: Sublinear Algorihms for Big Data

AMS as dimensionality reduction

• Maintain a “linear sketch” vector

, where • Estimator for :

• “Dimensionality reduction”: “heavy” tail

Page 6: Sublinear Algorihms for Big Data

Normal Distribution

• Normal distribution – Range: – Density: – Mean = 0, Variance = 1

• Basic facts:– If and are independent r.v. with normal

distribution then has normal distribution

– If are independent, then

Page 7: Sublinear Algorihms for Big Data

Johnson-Lindenstrauss Transform

• Instead of let be i.i.d. random variables from normal distribution

• We still have because:– “variance of “

• Define and define:

• JL Lemma: There exists s.t. for small enough

Page 8: Sublinear Algorihms for Big Data

Proof of JL Lemma

• JL Lemma: s.t. for small enough

• Assume . • We have and

• Alternative form of JL Lemma:

Page 9: Sublinear Algorihms for Big Data

Proof of JL Lemma

• Alternative form of JL Lemma:

• Let and • For every we have:

• By Markov and independence of :

• We have , hence:

Page 10: Sublinear Algorihms for Big Data

Proof of JL Lemma

• Alternative form of JL Lemma:

• For every we have:

• Let and recall that • A calculation finishes the proof:

Page 11: Sublinear Algorihms for Big Data

Johnson-Lindenstrauss Transform

• Single vector: – Tight: [Woodruff’10]

• vectors simultaneously: – Tight: [Molinaro, Woodruff, Y. ’13]

• Distances between vectors = vectors:

for Big Data B669 Sublinear Algorithmshomes.sice.indiana.edu/qzhangcs/B669-17-fall-sublinear/slides/intro.pdfWhat is the meaning of Big Data IN THEORY? We don’t de ne Big Data in

Sublinear Time Algorithms - People | MIT CSAILRonitt Rubinfeld ∗ Asaf Shapira † Abstract Sublinear time algorithms represent a new paradigm in computing, where an algorithm must

Limits of Practical Sublinear Secure Computation · Limits of Practical Sublinear Secure Computation Elette Boyle? Yuval Ishai?? Antigoni Polychroniadou? ? ? Abstract. Secure computations

Distributed Algorithms and Sublinear-Time Algorithms

Sublinear and Locally Sublinear Prices

SimpleFlow: A Non-iterative, Sublinear Optical Flow Algorithmkubitron/courses/cs252-S11/projects/reports/project1...SimpleFlow: A Non-iterative, Sublinear Optical Flow Algorithm Michael

Sublinear and Locally Sublinear Prices - Slides

Lecture 13-14: Sublinear-Time Algorithms · Lecture 13-14: Sublinear-Time Algorithms 3. Motivation Goal: Estimate properties of big probability distributions big means that the domain

Sublinear-time algorithms - University of Warwickczumaj/PUBLICATIONS/...Sublinear-time algorithms∗ Artur Czumaj† Christian Sohler‡ Abstract In this paper we survey recent advances

LowerBoundsandHardnessMagniﬁcationfor Sublinear

Distributed Learning with Sublinear Communicationproceedings.mlr.press/v97/acharya19b/acharya19b.pdf · Distributed Learning with Sublinear Communication Jayadev Acharya 1Christopher

An Adaptive Sublinear-Time Block Sparse Fourier Transform

Sublinear Algorithms

Sublinear Algorihms for Big Data

Perfectly Secure Oblivious RAM with Sublinear Bandwidth ... · only achieve sublinear bandwidth overheads in the amortized sense. We present a fundamentally new approach for construction

Outsider-Anonymous Broadcast Encryption with Sublinear ... · Outsider-Anonymous Broadcast Encryption with Sublinear Ciphertexts Nelly Fazio1; 2and Irippuge Milinda Perera 1 The City

Secure Function Collection with Sublinear Storage

Secure Computation with Sublinear Amortized Workmariana/papers/oram.pdf · the feasibility of sublinear-complexity secure computation, and serves as a useful template for the more

Sublinear Evolutive Design of Error Correcting Output Codessergioescalera.com/wp-content/uploads/2016/09/aciaprize2010Miguel.pdf · Thank&you& QUESTIONS?! Sublinear Evolutive Design

Secure Computation with Sublinear Amortized Workmariana/papers/oram.pdf · 2011-09-26 · Secure Computation with Sublinear Amortized Work S. Dov Gordon Jonathan Katzy Vladimir Kolesnikovz

Linear-Time Arguments with Sublinear Verification from

Asymmetric LSH (ALSH) for Sublinear Time Maximum Inner Product …statistics.rutgers.edu/home/pingli/papers/Asymmetric... · 2016-01-10 · Asymmetric LSH (ALSH) for Sublinear Time

Sublinear deviation between geodesics and sample paths

Estimating the unseen: A sublinear-sample canonical ...cs.brown.edu/~pvaliant/unseenVV.pdfEstimating the unseen: A sublinear-sample canonical estimator of distributions Gregory Valiant

Asymmetric LSH (ALSH) for Sublinear Time Maximum Inner ......Asymmetric LSH (ALSH) for Sublinear Time Maximum Inner Product Search (MIPS) Anshumali Shrivastava Department of Computer

Sublinear Algorithms Lecture 23: April 20 10312013 …

Implicit regularization in sublinear approximation algorithms

Asymmetric LSH (ALSH) for Sublinear Time Maximum Inner ...anshu/presentations/NIPS_14.pdf · Asymmetric LSH (ALSH) for Sublinear Time Maximum Inner Product Search (MIPS) Anshumali

4321 Fast Sublinear Sparse Representation using Shallow ...av21/Documents/2014/Fast... · Fast Sublinear Sparse Representation using Shallow Tree Matching ... We propose a framework

Networks Cannot Compute Their Diameter in Sublinear Time SODA.pdfSilvio Frischknecht Roger Wattenhofer . Networks Cannot Compute Their Diameter in Sublinear Time ... Thanks for slide

Sketching, Sampling and other Sublinear Algorithms: Streaming

Sublinear Time Algorithm

An introduction to chaining, and applications to sublinear

Learning Determinantal Point Processes in Sublinear Time

IEEE TRANSACTIONS ON BIG DATA, VOL. 2, NO. 3 ...csdwang/Publication/TBD16-meter.pdfAnalyzing Big Smart Metering Data Towards Differentiated User Services: A Sublinear Approach Erte