Евгений Смирнов — numbuster — icbda 2015

11
http://numbuster.com Как выявить и правильно использовать паттерны поведения в социальном графе с помощью Machine Learning

Upload: rusbase

Post on 07-Jan-2017

1.890 views

Category:

Data & Analytics


2 download

TRANSCRIPT

Page 1: Евгений Смирнов — Numbuster — ICBDA 2015

http://numbuster.com

Как выявить и правильно использовать паттерны поведения в социальном графе с

помощью Machine Learning

Page 2: Евгений Смирнов — Numbuster — ICBDA 2015

Обычно используют простые связи: Маша находится в контактах у Васи

Page 3: Евгений Смирнов — Numbuster — ICBDA 2015

Обычно используют простые связи: Маша находится в контактах у Васи

Page 4: Евгений Смирнов — Numbuster — ICBDA 2015

Но связей намного больше:например, 10 звонков и СМС от Оли Васе

Page 5: Евгений Смирнов — Numbuster — ICBDA 2015

Или Вася и Оля любят один и тот же отель

Page 6: Евгений Смирнов — Numbuster — ICBDA 2015

Любая связь имеет ценность

Page 7: Евгений Смирнов — Numbuster — ICBDA 2015

С чем мы работаем?Количество профилей 53,000,000

Прирост в день +100,000

Количество связей 4,000,000,000

Прирост в день +8,000,000

Объём базы 120 Гб

Page 8: Евгений Смирнов — Numbuster — ICBDA 2015

Технология — Vowpal Wabbit

https://github.com/JohnLangford/vowpal_wabbit

Page 9: Евгений Смирнов — Numbuster — ICBDA 2015

Что мы делаем со связями?

Page 10: Евгений Смирнов — Numbuster — ICBDA 2015

Уже улучшаем холодные звонки с помощью регрессии и обучения-с-учителем

Page 11: Евгений Смирнов — Numbuster — ICBDA 2015

Выявляем кластеры и лидеров мнений