Евгений Смирнов — numbuster — icbda 2015
TRANSCRIPT
http://numbuster.com
Как выявить и правильно использовать паттерны поведения в социальном графе с
помощью Machine Learning
Обычно используют простые связи: Маша находится в контактах у Васи
Обычно используют простые связи: Маша находится в контактах у Васи
Но связей намного больше:например, 10 звонков и СМС от Оли Васе
Или Вася и Оля любят один и тот же отель
Любая связь имеет ценность
С чем мы работаем?Количество профилей 53,000,000
Прирост в день +100,000
Количество связей 4,000,000,000
Прирост в день +8,000,000
Объём базы 120 Гб
Технология — Vowpal Wabbit
https://github.com/JohnLangford/vowpal_wabbit
Что мы делаем со связями?
Уже улучшаем холодные звонки с помощью регрессии и обучения-с-учителем
Выявляем кластеры и лидеров мнений