eleições sem fake - evcompevcomp.dcc.ufmg.br/wp-content/uploads/fabriciobenevenuto.pdf · true,...
TRANSCRIPT
Eleições sem Fake www.eleicoes-sem-fake.dcc.ufmg.br
Fabrício Benevenuto
Departamento de Ciência da Computação
Universidade Federal de Minas Gerais (UFMG)
2
Estratégias adotadas por
campanhas de desinformação
1. Propagandas (impulsionamento)
2. Aplicativos de Mensagens (WhatsApp)
Transparência
www.eleicoes-sem-fake.dcc.ufmg.br
3
Anúncios
Monetização de dados obtidos por vigilância
• Facebook e Instagram: Conhecem meus interesses
• Google e YouTube: Conhece o que eu busco e os vídeos que eu vejo
Impulsionamento
1100 atributos
260000 atributos
Marketing direcionado
Impulsionamento nas eleições americanas
6
Propagandas russas • Temas que dividem as pessoas
• Taxa de cliques 10x maior que outros ads no Facebook
• Foram enviadas ao longo de 3 anos
• http://www.socially-divisive-ads.dcc.ufmg.br/
www.eleicoessemfake.dcc.ufmg.br
Impulsionamento
7
• Nossa abordagem
• Coletar anúncios de voluntários através de extensões para chrome e Firefox
• Construir um banco de dados público contendo propagandas políticas impulsionadas via Facebook e seus alvos
www.eleicoessemfake.dcc.ufmg.br
Coletor de Propagandas
www.eleicoessemfake.dcc.ufmg.br
Impulsionamento: Nossa abordagem
www.eleicoessemfake.dcc.ufmg.br
• Quem fez o anúncio?
• Quando fez?
• Qual o conteúdo?
• Quem foi o alvo?
Anúncios no Facebook
Construção de uma banco pública com anúncios políticos no Facebook
https://www.eleicoessemfake.dcc.ufmg.br/anuncios/
O TSE disse que não cabe ao órgão "a
tarefa de monitorar anúncios em qualquer
rede social ou veículo de comunicação".
O Facebook diz que planeja lançar em
junho em alguns países -mas inicialmente
não no Brasil- exatamente "um arquivo
de anúncios políticos para pesquisa por
todo o público".
www.eleicoessemfake.dcc.ufmg.br
https://www.eleicoes-sem-fake.dcc.ufmg.br/anuncios/
Colocamos o problema em debate público
Anúncios no Facebook
Facebook criou sua base de propagandas a tempo das eleições e os gastos de campanha com propagandas auto-declaradas de candidatos e partidos ficaram registrado https://www.facebook.com/politicalcontentads
www.eleicoessemfake.dcc.ufmg.br
Como encontrar propagandas não declaradas?
www.eleicoessemfake.dcc.ufmg.br
ComScore
Fake News no WhatsApp
Coleta de Dados Grupos públicos relacionados a política
Busca no Twitter e no Google por "chat.whatsapp.com”
Filtro por palavras relacionadas às eleições brasileiras de 2018
No total, 3400 grupos 350 grupos políticos selecionados
Dados: Usuário (anonmizado), Grupo, timestamp, Mensagem/Conteúdo
Não sabemos o quão representativos eses grupos são
• Sistema para Monitorar os grupos públicos de WhatsApp
• www.monitor-de-whatsapp.dcc.ufmg.br
• 350 grupos públicos
• Mostra o que foi mais compartilhado num dia
• Imagens, vídeos, áudios, links, textos (longos)
• Disponível para:
• jornalistas (mais de 150 com linha editorial)
• Equipes de checagem de fatos
• Pesquisadores que atuam no tema
Fake News no WhatsApp
www.eleicoessemfake.dcc.ufmg.br
18
Fake News como memes e imagens falsas
Fake News como memes e imagens falsas
(a) False edited photo of ex-presidentDilma next to Fidel Castro
(b) Fakephoto of Bolsonaro’saggressornext to Lula
Figure 7: Images checked as fake by both fact-checking
methodologies.
thevisibility of linksratedasfalse[16].Thiskindof partnership
neglectsfakenewsin images,asfact-checkersonly provideratesto
linkscontainingfakestories.Next,weprovideastrategy toconnect
thefalsestoriesfound in imagessharedwith external linksthat
appear ontheWeb,providingasimpleway for Facebook todemote
links containing fake images identi ed within WhatsApp.
First, weidenti edthemain fact-checkingagenciesinBrazil 11
After that,weautomatizetheprocessof searchingeachWhatsApp
imageon theWebby lookingfor themusingGoogleImagesearch.
Havingthelist of pagesinwhicheach imageappear,welookedfor
thosefromdomainsof our list of fact-checkingsites. By parsing
thefact-checkingpageweautomatically set thisimageasfakeor
true, depending on the label that website tagged that image.
Weapply thismethodology to all WhatsApp imagesof both
datasetsand, afterward,webuildadataset only containing images
checked by other fact-checking agenciesas fake. That way, we
foundonly twofakeimagesin thetruck drivers’ strikedataset and
70 fake images in the Electoral dataset.
Discardingmisleading andother categories, weobtainedtwo
distinct datasets of images labeled as fake: 70 we identi ed by
searchingfor theimageinother fact-checkingagenciesandmore
17werelabeledby Lupa. Astwoimagesappear inbothdataset, we
haveidenti edatotal of 85fakeimageslabeledlikethat by o cial
fact-checking agencies.
Toidentify other Websitesthat alsodisplay thesefakeimages,
onecansimply searchfor thoseimagesinGoogleor Bing.Next,we
characterizethewebsitesandother sourcesontheWebinwhich
thesefakeimagesalsoappear.Wecompareall set of Fakeimages
totheremainingimagesof periodof elections, called, respectively,
as"CheckedasFake" and"Not Checked".Notethat although we
expectedthat therearenosubstantially Fakein the"Not Checked"
dataset, wecan not guarantee the total absence of this typeof
content in these messages.
5.3 Fake Images on WhatsApp and the Web
After processing and setting which images are fake, we assess
theresultsfor thedataset of theimagescheckedasFake.Table5
11Fact-checkingagencies: Boatos.org: https://www.boatos.org; e-Farsas: http://www.e-farsas.com; Comprova: https://projetocomprova.com.br; Lupa: https://piaui.folha.uol.com.br/lupa; GloboG1: http://g1.globo.com/fato-ou-fake; and AosFatos: https:
//aosfatos.org.
describesthesummary of quantitieswefoundasfakecompared
to thetotal of images in each period. Notethat fakeimagesset
containsonly 85images, but theseimagessummedup1,168shares
by 582di erent usersandoccurredin157di erent groups. Inspite
of imagescheckedasFakerepresent aportion lessthan1%of the
total, theseimagesappearedin44%of thegroupsof theperiodof
theelectoral campaign andnearly 5.6%of all usersof thisperiod
posted images with misinformation.
Strike Elections Fake
#Active Groups 138 351 157
#Active Users 2,264 10,339 582
#Unique Images 8,564 69,590 85
#Total Shares of Images 11,610 110,954 1,168
Table 5: Summary of Fake Images compared with remaining
images of the period of Trucker’sStr ike and Elections.
Toevaluatethepropagationof themisinformationonWhatsApp,
weconstructedagraph of occurrencesof theseimages. Figure8
showsthefakeimagenetwork inWhatsAppby consideringonly
theset of imagescheckedasfakeandthegroupswherethey " rst
appeared".Wehave lterednodesthatpost at least 2imageschecked
asfake.A noderepresentsaWhatsAppgroupandadirectededge
fromnodeA tonodeBmeansthat nodeA wasthe rst toshare
thefakeimageandthen thesameimagewasseen ingroupB.The
weight of theedgeisassociatedwith thevolumeof fakeimages
that originatedinagroupandco-occurredinanother group.The
sizeof thenodesrepresentshowmany fakeimagesthat grouphas
postedandthecolor representsthesumof theedgesoutgoingfrom
thisvertex, that is, thetotal of imagesthat were“ rst seen” in that
group and spread to the rest of the network.
Wecan seethat somefewnodesaremuchdarker than others
which representsahighout-degreevalue, that meansthey arethe
main “seeds” of the fakecontent on thegraph. It is relevant to
highlight that thegroup which shared moreimageschecked as
fakewasalso thesamegroupwhich hasmoreusersand images
asreportedpreviously inTable3.But theamount of fakeimages
postedinagroupdoesnot necessarily meanthat thisgroupisthe
creator of content, duetosomelargenodeshavelighter colors(e.g.
“ARAGUANA BOLSONARO1” and “BOLSONAROPRESIDENTE”),
whichmeansthat theypostedmany fakeimages,but they act more
likeareceptor than aseed since their out-degree is low. These
resultssuggest that just fewer groupsareresponsiblefor great part
of fakeimagesspreadinginWhatsApp,even if they arenot those
which most posted fakes.
Wealsoanalyzedthebehavior of FakeImagesontheWeb.As
wecollectedtheset of URLswherethevery sameimageappeared
accordingtoour search,wecouldevaluatethedomainsandTwitter
accountswhich theseFakeImagesmost appeared.Figure9show
theseresults. By looking for thosedomainswecan seethat the
imagesmostlyappearedinother social networks,whichsuggest the
AmongtheaccountsonTwitter that most postedimageschecked
as Fake, we havesome o cial journalistic accounts (folha and
agencialupa)andalsoo cial accountsof thepresidential candidate
FernandoHaddadandhisvice,Manuelad’Avila. Lookingat these
posts,it canbenotedthat thesepro lespostedsomeFakeImagesfor
thepurposeof repudiating them,actingasfact-Checkingaccounts.
8
21
Reportagem da Lupa
Estrutura típica de redes sociais
Figure 5: WhatsApp Network of Users with Common Public Political Groups
• Grupos públicos são porta de entrada da desinformação e conectam uma rede ativistas
• Uma imagem pode ser enviada (broadcast) para 256 groups, com 256 pessoas • Broadcast = 256x256 = 65536 pessoas
• Cada pessoa pode repassar a mensagem para 20 grupos • Forward = 20x256 = 5120
• Broadcast e forward podem ser automatizados
WhatsApp e viralidade
www.eleicoessemfake.dcc.ufmg.br
24
Fake News no WhatsApp
• Opinião no New York Times sugerindo mudanças para o período eleitoral:
• Limite do broadcast
• Limite do forward
• Limite na criação de grupos
25
Fake News no WhatsApp
26
Susceptible b
Exposed Infected
Limitações no repasse das mensagens ajudam a reduzir o alcance das notícias
falsas, mas não são eficientes para conteúdos altamente virais
Uso de modelo epidemilógico e simulações para checar o quanto as mudanças
implementadas pelo WhatsApp poderiam conter o espalhamento da desinformação
•Quem pode usar nossos sistemas
• PF, MP, Partidos, etc. podem verificar irregularidades em impulsionamentos
• Equipes de checagem de fatos
• Jornalistas
• Eleitores
•Próximos Passos • Eleições municipais são ainda mais complicadas
• Atenção a sistemas emergentes no Brasil como o Gab e o Telegram
• Atenção ao Wikipedia
Projeto eleições sem fake
Eleições sem Fake
www.eleicoes-sem-fake.dcc.ufmg.br
www.dcc.ufmg.br/~fabricio