sna во времена big data: насколько социален ваш анализ...

Post on 28-May-2015

359 Views

Category:

Science

2 Downloads

Preview:

Click to see full reader

DESCRIPTION

Черновая версия слайдов моего доклада на Moscow Data Science Meetup в Mail.ru 05.09.2014

TRANSCRIPT

SNA ВО ВРЕМЕНА BIG DATA: НАСКОЛЬКО СОЦИАЛЕН ВАШ АНАЛИЗ СОЦИАЛЬНЫХ СЕТЕЙ?

Александр Семёнов (Social | Network | Data) Analyst semenoffalex@gmail.com ru.linkedin.com/in/semenoffalex/ Jarens.ru

Интересы

Опыт работы

Образование и стажировки

Инструменты

Членство в профессиональных ассоциациях

“I’M HERE TO INFORM AND ENTERTAIN”

Краткое содержание доклада

• SNA «для менеждеров»: что, зачем и с чем едят?

• SNA и Big Data: Сказка про Гигантские волосяные шары

• So What, Who Cares and Why Bother?

• Кейсы, Кейсы и ещё раз Кейсы: Fail’s & Wins

• Заключение: Как сделать SNA полноценным?

«Классический» SNA

Лес Деревья

SNA

увидеть лес из-за деревьев

Анализ социальных сетей (Social Network Analysis) – это научный метод сбора, анализа и визуализации данных, который позволяет

SNA во времена Big Data

Или ещё хуже

Social graph revealing Facebook friendship associations between self–identified gay male students in the MIT network.

http://firstmonday.org/ojs/index.php/fm/article/view/2611/2302

Gaydar: Facebook friendships expose sexual orientation

Определение сексуальной ориентации пользователя на основе бинарной логистической регрессии с одним параметром?! Really?

ТАК В ЧЁМ ЖЕ ПРОБЛЕМА?

LiveJournal “Community” Structure

LiveJournal: сеть комментариев Теперь лучше?

КЕЙСЫ

Influence Fail: Правило 10% меньшинства

Xie, Jierui, et al. "Social consensus through the influence of committed minorities." Physical Review E 84.1 (2011): 011130.

К сожалению, не многие журналисты и простые обыватели понимаю разницы между исследованиями, основанными на анализе эмпирических данных и результатом компьютерной симуляции, основанной на абстрактной математической модели.

Influence: Win. Well, sort of… • Paper: Experimental evidence of massive-scale emotional contagion through social networks

Company: Facebook What they did: Randomized people to get different emotions in their news feed and observed if they showed an emotional reaction. What they found: That there was almost no real effect on emotion. The effect was statistically significant but not scientifically or emotionally meaningful.

• Paper: Social influence bias: a randomized experiment Company: Not stated but sounds like Reddit What they did: Randomly up-voted, down voted, or left alone posts to the social networking site. Then they observed whether there was a difference in the overall rating of posts within each treatment. What they found: Posts that were upvoted ended up with a final rating score (total upvotes - total downvotes) that was 25% higher.

• Paper: Identifying influential and susceptible members of social networks Company: Facebook What they did: Using a commercial Facebook app, they found users who adopted a product and randomized sending messages to their friends about the use of the product. Then they measured whether their friends decided to adopt the product as well. What they found: Many interesting things. For example: susceptibility to influence decreases with age, people over 31 are stronger influencers, women are less susceptible to influence than men, etc. etc.

• Paper: Inferring causal impact using Bayesian structural time-series models Company: Google What they did: They developed methods for inferring the causal impact of an ad in a time series situation. They used data from an advertiser who showed ads to people related to keywords and measured how many visits there were to the advertiser's website through paid and organic (non-paid) clicks. What they found: That the ads worked. But more importantly that they could predict the causal effect of the ad using their methods. http://simplystatistics.org/2014/08/20/a-very-brief-review-of-published-human-subjects-research-conducted-with-social-media-companies/

Наиболее популярные методы «выявления сообществ» не работают

Качество «кластеризации» зависит от социального контекста

arxiv.org/abs/1407.5547 : Reading the Source Code of Social Ties

Структура сообществ значимо влияет на виральность мемов

созданная авторами модель, предсказывает виральность мема в 7 раз лучше, чем случайный выбор и в 3 раза лучше, чем модель без “социальных эффектов”.

http://arxiv.org/abs/1306.0158

Summary: Что делает SNA по-настоящему социальным?

Социальный

Контекст Структура Капитал

ТАК ДАВАЙТЕ ЖЕ ПОВЫШАТЬ НАШУ СОЦИАЛЬНУЮ КАПИТАЛИЗАЦИЮ!

http://jarens.ru/

http://datajournal.ru/

top related