[ieee 2014 brazilian symposium on computer networks and distributed systems (sbrc) - florianopolis,...

8
Influences of Facebook Torrent dissemination in BitTorrent Swarms Thiago A. Guarnieri , Ana Paula Couto da Silva , Jussara M. Almeida , Alex Borges Vieira Computer Science Department Universidade Federal de Minas Gerais, Brazil {ana.coutosilva; jussara}@dcc.ufmg.br Computer Science Department Universidade Federal de Juiz de Fora, Brazil thiago.guarnieri; [email protected] Abstract—Bittorrent is one of the most popular file sharing applications on the Internet. It is well-known that its success mainly depends on its user cooperation. Systems with a small number of altruist users or without incentive mechanisms are fated to failure. This paper discusses the influence of Facebook on Bittorrent swarms. We analyze data from more than 16,600 Bittorrent swarms disseminated by Facebook and by traditional torrent websites. Our results show that the dissemination process is enhanced when a torrent is announced on a social network. Social torrents have up to 50% more seeders and four times more peers that participate on multiple swarms. Furthermore, peers in social torrents exhibit high locality, both geographically and in terms of ASes. If the Bittorrent protocol leverages the knowledge of physical networks for building the P2P overlay network, social torrents may have better locality in the partnerships established between peers. As consequence, social torrents may have better throughput, faster data dissemination and less data traffic between ASes. I. I NTRODUC ¸˜ AO Desde a d´ ecada passada, observa-se a massiva adoc ¸˜ ao do paradigma peer-to-peer (P2P) na Internet. De fato, o tr´ afego gerado por suas aplicac ¸˜ oes ´ e de grande representatividade nas redes de computadores. Estimativas mostram que 36% de todo tr´ afego de upload da Am´ erica do Norte tem como origem o Bitorrent, atualmente a principal aplicac ¸˜ ao para compartilhamento de arquivos em redes P2P. Al´ em disso a parcela deste protocolo no tr´ afego de pico desta regi˜ ao ultrapassa 10% 1 . O sucesso de sistemas P2P depende fortemente do ıvel de colaborac ¸˜ ao de seus participantes (peers). A falta de cooperac ¸˜ ao imp˜ oe um grande desafio ` a garantia de qualidade de servic ¸o e por isso, existem v´ arios mecanismos que procuram incentivar a cooperac ¸˜ ao em sistemas P2P. O Bittorrent implementa um esquema descentralizado conhecido por tit-for-tat [3]. Por esse esquema, peers monitoram-se mutuamente e assim, recursos s˜ ao oferecidos a um peer de acordo com sua contribuic ¸˜ ao. Apesar da larga adoc ¸˜ ao e uso do tit-for-tat, observa-se que em muitos casos, a rede P2P n˜ ao se beneficia dele [6]. Esse mecanismo n˜ ao favorece relac ¸˜ oes baseadas em localizac ¸˜ ao 1 Global Internet Phenomena Report: 2H 2012, www.sandvine.com geogr´ afica (ou topol´ ogica de redes) dos peers e nem relacionamentos de longa durac ¸˜ ao: de acordo com [11] a taxa de reencontro entre peers ´ e menor que 5%. Mais ainda, n˜ ao ao considerados fatores sociais, como o relacionamento dos usu´ arios do Bittorrent em outros tipos de redes (e.g., redes sociais). ´ E de se esperar uma melhor disseminac ¸˜ ao dos dados pelo Bittorrent caso se considere esses fatores [1]. A intuic ¸˜ ao ´ e simples: pode-se esperar de forma razo´ avel forte cooperac ¸˜ ao entre parceiros, ou amigos, e assim, o tit-for-tat ao seria necess´ ario [10]. De fato, h´ a ind´ ıcios que a disseminac ¸˜ ao de dados no Bittorrent pode ser melhorada quando se utiliza redes sociais para fazer o seu an´ uncio inicial. Por exemplo, [11], [10] mostram que torrents anunciados via Twitter, uma rede social popular, apresentam um n´ umero maior de peers est´ aveis, quando comparados a torrents anunciados de maneira tradicional. Esses peers est´ aveis entram no enxame e seguem padr˜ oes bem previs´ ıveis. Eles se mantˆ em compartilhando por um per´ ıodo maior, melhorando a disseminac ¸˜ ao do conte´ udo na rede P2P. Adicionalmente, a localidade de um peer, mesmo em um ´ unico enxame, pode ser importante para reduc ¸˜ ao global do tr´ afego entre sistemas autˆ onomos. Por exemplo, [9], [11] mostram que 85% dos peers participam de m´ ultiplos enxames e essa caracter´ ıstica pode ser usada para reunir peers pr´ oximos em comunidades que compartilham o mesmo conjunto de arquivos. Neste contexto, este trabalho avalia a influˆ encia de uma rede social, o Facebook, na disseminac ¸˜ ao de dados em redes Bittorrent. S˜ ao analisados dados coletados de mais de 16.600 enxames Bittorrent reais, disseminados tanto pelo Facebook quanto por sistemas tradicionais (e.g., sistemas web como pirate bay e btmon). Diferente dos trabalhos anteriores, que focam no estudo das parcerias e como os arquivos s˜ ao disseminados mais rapidamente, neste trabalho as comparac ¸˜ oes entre torrents tradicionais e os disseminados pelo Facebook s˜ ao abordados sob 3 aspectos: (I) as caracter´ ısticas gerais da rede P2P, (II) as caracter´ ısticas que indicam melhor disseminac ¸˜ ao de dados (definidas como sa´ ude de um torrent) e (III) a localidade dos peers da rede P2P. 2014 Brazilian Symposium on Computer Networks and Distributed Systems 978-1-4799-5612-8/14 $31.00 © 2014 IEEE DOI 10.1109/SBRC.2014.31 258

Upload: alex-borges

Post on 09-Mar-2017

212 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: [IEEE 2014 Brazilian Symposium on Computer Networks and Distributed Systems (SBRC) - Florianopolis, Brazil (2014.5.5-2014.5.9)] 2014 Brazilian Symposium on Computer Networks and Distributed

Influences of Facebook Torrent

dissemination in BitTorrent Swarms

Thiago A. Guarnieri∗, Ana Paula Couto da Silva†, Jussara M. Almeida†, Alex Borges Vieira∗

∗Computer Science Department

Universidade Federal de Minas Gerais, Brazil

{ana.coutosilva; jussara}@dcc.ufmg.br

†Computer Science Department

Universidade Federal de Juiz de Fora, Brazil

thiago.guarnieri; [email protected]

Abstract—Bittorrent is one of the most popular file sharingapplications on the Internet. It is well-known that its successmainly depends on its user cooperation. Systems with a smallnumber of altruist users or without incentive mechanisms arefated to failure. This paper discusses the influence of Facebookon Bittorrent swarms. We analyze data from more than 16,600Bittorrent swarms disseminated by Facebook and by traditionaltorrent websites. Our results show that the dissemination processis enhanced when a torrent is announced on a social network.Social torrents have up to 50% more seeders and four times morepeers that participate on multiple swarms. Furthermore, peers insocial torrents exhibit high locality, both geographically and interms of ASes. If the Bittorrent protocol leverages the knowledgeof physical networks for building the P2P overlay network,social torrents may have better locality in the partnershipsestablished between peers. As consequence, social torrents mayhave better throughput, faster data dissemination and less datatraffic between ASes.

I. INTRODUCAO

Desde a decada passada, observa-se a massiva adocao doparadigma peer-to-peer (P2P) na Internet. De fato, o trafegogerado por suas aplicacoes e de grande representatividadenas redes de computadores. Estimativas mostram que 36%de todo trafego de upload da America do Norte tem comoorigem o Bitorrent, atualmente a principal aplicacao paracompartilhamento de arquivos em redes P2P. Alem dissoa parcela deste protocolo no trafego de pico desta regiaoultrapassa 10%1.

O sucesso de sistemas P2P depende fortemente donıvel de colaboracao de seus participantes (peers). A faltade cooperacao impoe um grande desafio a garantia dequalidade de servico e por isso, existem varios mecanismosque procuram incentivar a cooperacao em sistemas P2P. OBittorrent implementa um esquema descentralizado conhecidopor tit-for-tat [3]. Por esse esquema, peers monitoram-semutuamente e assim, recursos sao oferecidos a um peer deacordo com sua contribuicao.

Apesar da larga adocao e uso do tit-for-tat, observa-se queem muitos casos, a rede P2P nao se beneficia dele [6]. Essemecanismo nao favorece relacoes baseadas em localizacao

1Global Internet Phenomena Report: 2H 2012, www.sandvine.com

geografica (ou topologica de redes) dos peers e nemrelacionamentos de longa duracao: de acordo com [11] a taxade reencontro entre peers e menor que 5%. Mais ainda, naosao considerados fatores sociais, como o relacionamento dosusuarios do Bittorrent em outros tipos de redes (e.g., redessociais).

E de se esperar uma melhor disseminacao dos dados peloBittorrent caso se considere esses fatores [1]. A intuicao esimples: pode-se esperar de forma razoavel forte cooperacaoentre parceiros, ou amigos, e assim, o tit-for-tat nao serianecessario [10]. De fato, ha indıcios que a disseminacao dedados no Bittorrent pode ser melhorada quando se utiliza redessociais para fazer o seu anuncio inicial. Por exemplo, [11],[10] mostram que torrents anunciados via Twitter, umarede social popular, apresentam um numero maior de peersestaveis, quando comparados a torrents anunciados de maneiratradicional. Esses peers estaveis entram no enxame e seguempadroes bem previsıveis. Eles se mantem compartilhando porum perıodo maior, melhorando a disseminacao do conteudo narede P2P.

Adicionalmente, a localidade de um peer, mesmo emum unico enxame, pode ser importante para reducao globaldo trafego entre sistemas autonomos. Por exemplo, [9], [11]mostram que 85% dos peers participam de multiplos enxamese essa caracterıstica pode ser usada para reunir peers proximosem comunidades que compartilham o mesmo conjunto dearquivos.

Neste contexto, este trabalho avalia a influencia de umarede social, o Facebook, na disseminacao de dados em redesBittorrent. Sao analisados dados coletados de mais de 16.600enxames Bittorrent reais, disseminados tanto pelo Facebookquanto por sistemas tradicionais (e.g., sistemas web comopirate bay e btmon). Diferente dos trabalhos anteriores, quefocam no estudo das parcerias e como os arquivos saodisseminados mais rapidamente, neste trabalho as comparacoesentre torrents tradicionais e os disseminados pelo Facebook saoabordados sob 3 aspectos: (I) as caracterısticas gerais da redeP2P, (II) as caracterısticas que indicam melhor disseminacao dedados (definidas como saude de um torrent) e (III) a localidadedos peers da rede P2P.

2014 Brazilian Symposium on Computer Networks and Distributed Systems

978-1-4799-5612-8/14 $31.00 © 2014 IEEE

DOI 10.1109/SBRC.2014.31

258

Page 2: [IEEE 2014 Brazilian Symposium on Computer Networks and Distributed Systems (SBRC) - Florianopolis, Brazil (2014.5.5-2014.5.9)] 2014 Brazilian Symposium on Computer Networks and Distributed

Os resultados deste trabalho indicam mudancas na rede P2Pe melhorias quando um torrent e anunciado pelo Facebook.Por exemplo, indicadores de saude, como proporcao desemeadores (seeders) e quantidade de peers que participam demultiplos enxames sao significantemente maiores. Os torrentssociais apresentam ate 50% a mais de seeders e quatrovezes mais peers que participam de multiplos enxames. Essacaracterıstica pode ser explorada em mecanismos de incentivoque considerem a permanencia em multiplos enxames,premiando o usuario com, por exemplo, um aumento emseu share-ratio2. A proporcao de usuarios em um enxamepertencentes a uma mesma localizacao geografica ou AStambem e maior nos torrents sociais. Dessa forma, caso oprotocolo Bittorrent utilize conhecimento das redes fısicas naconstrucao da rede sobreposta, torrents sociais apresentaraomelhores resultados no agrupamento de peers. Resumindo, osresultados apontam na direcao de uma difusao mais eficientede conteudo, quando um torrent e disseminado pelo Facebook.

II. BITTORRENT E METODOLOGIA DE COLETA DE DADOS

Nesta secao, sao apresentados conceitos gerais sobreo Bittorrent, o principal sistema de compartilhamento dearquivos em P2P na atualidade. Alem disso, e apresentada ametodologia de coleta de dados e as definicoes relativas aostorrents sociais.

A. Bittorrent Revisitado

O Bittorrent e, atualmente, a principal aplicacao paracompartilhamento de arquivos via P2P. Arquivos saocompartilhados por ele em redes P2P sobreposta a redefısica existente. Essa rede sobreposta nao apresenta hierarquiasexplıcitas. Ela e baseada em malhas com troca de dadosrealizadas por pedidos explıcitos entre seus participantes(peers).

Cada conjunto de arquivos, compartilhado via um torrent,apresenta uma rede sobreposta correspondente (enxametorrent). Um arquivo torrent contem informacoes sobrepossıveis entidades centralizadoras (trackers) que contabilizamestatısticas sobre o compartilhamento e gerenciam os peers doenxame. Alem disso, um arquivo torrent possui informacoessobre os arquivos compartilhados, os chunks de arquivos, assimcomo codigos hash de cada chunk (utilizado para verificacaode integridade).

(a) Enxames Torrent. (b) Processo de entrada no enxame.

Figura 1. Usuarios de BitTorrent sao agrupados em enxames P2P. Cadaenxame corresponde a uma rede sobreposta onde sao compartilhados arquivosrelacionados a um unico torrent. Para iniciar o processo de compartilhamento,usuarios do Bittorrent, geralmente, contatam uma entidade centralizadora.

Como mostra a Figura 1-a, um enxame torrent contemn peers que colaboram entre si para disseminar o conteudo

2Proporcao entre download e upload

dos arquivos compartilhados. Cada peer pi possui uma listacom mi parceiros e troca dados (chunks) somente com eles.Os peers sao livres para abandonar parcerias, alem de entrare sair do enxame a qualquer momento. Periodicamente, ospeers trocam entre si mapas de chunks. Assim, pi conhece oschunks disponıveis em seus parceiros, e vice-versa. Assim, pifaz requisicoes explıcitas a seus parceiros pelos chunks que elenecessita para completar o(s) arquivo(s) compartilhado(s).

Para entrar em um enxame, um peer novato pi, geralmente,contata uma entidade centralizadora - o tracker (Figura 1-b[1]).O tracker retorna pi uma lista com peers candidatos a parceria(Figura 1-b[2]). Finalmente, pi tenta contatar cada um doscandidatos e envia requisicoes de parceria (Figura 1-b[3]).Uma vez estabelecida a parceria, pi troca mapas de chunkse dados com seus parceiros.

Um peer pi pode participar de multiplos enxames. Emoutras palavras, quando pi realiza multiplos compartilhamentos(cada um associado a um torrent), ele participa dediferentes redes sobrepostas. Em cada enxame, pi podeapresentar diferentes parcerias, assim como diferentes nıveisde cooperacao. Um dos mecanismos mais importantes doBittorrent e o tit-for-tat [3]. Nesse esquema descentralizado,os peers se monitoram mutuamente, e assim, recursos saooferecidos a um parceiro de acordo com sua contribuicaoprevia. De forma simples, quando pi doa algum chunk a umparceiro pj , ele fica com creditos com esse parceiro. Assim, pjprioriza requisicoes realizadas por pi ate que seu debito compi se anule.

B. Coleta de Dados

Para a conducao deste trabalho, foram coletados 16.698arquivos torrent. Estes arquivos foram divididos em duasclasses como segue: torrents tradicionais, que sao osarquivos torrents coletados de sistemas web tradicionais(www.btmon.com) e torrents sociais, que sao arquivos torrentscoletados a partir de comunidades no Facebook.

O conjunto de torrents tradicionais foi obtido por umprocesso de busca recursiva em um sistema web dedicadoa anuncios de torrent (www.btmon.com). A partir da paginaprincipal, arquivos torrents foram capturados para posterioranalise. A coleta foi interrompida no primeiro nıvel derecursividade com um numero de torrents acima de 15 mil.Assim, Foram coletados 15.086 torrents a partir desse sistemaweb.

Os torrents sociais foram obtidos em comunidades doFacebook, a partir de um coletor desenvolvido com a APIpublica do Facebook. O coletor varre uma lista de comunidadesinicialmente usada como semente. Essa lista foi definida apartir de buscas no Facebook por termos como “Bittorrent”,“torrent” e “P2P sharing”. Adicionalmente, sao varridas ascomunidades relacionadas as encontradas na lista inicial.Foram encontrados 1.612 torrents nessas comunidades. Foramencontrados apenas 38 torrents pertencentes a ambos osconjuntos. Assim, por representarem uma parcela pequena dototal de dados coletados, esses torrents foram excluıdos dasanalises apresentadas.

A coleta dos dados dos enxames de cada um dos torrentscapturados foi efetuada utilizando-se a rede do campus da

259

Page 3: [IEEE 2014 Brazilian Symposium on Computer Networks and Distributed Systems (SBRC) - Florianopolis, Brazil (2014.5.5-2014.5.9)] 2014 Brazilian Symposium on Computer Networks and Distributed

Universidade Federal de Juiz de Fora, por um perıodo de60 dias (julho a agosto de 2013). Foi desenvolvido umcoletor de informacoes (crawler), utilizando a linguagemde programacao python (python.org) em conjunto com abiblioteca libtorrent (libtorrent.org). O crawler permanececontinuamente conectado aos enxames durante todo o perıodode coleta. Nesse perıodo, ele apenas faz requisicoes aostrackers e estabelece parcerias. Por respeito as propriedadese direitos intelectuais, nenhum arquivo compartilhado nostorrents e capturado e armazenado em disco.

Nesse trabalho, informacoes e metadados a respeito dosenxames sao obtidas diretamente dos trackers associados aostorrents (e.g., tamanho do enxame e quantidade de seeders).A data de criacao, embora mportante para medir popularidade,nao foi armazenada por nao ser de preenchimento obrigatoriono conjunto de metadados. Alem disso um arquivo torrentpode ser republicado, o que torna essa informacao imprecisa.Alem disso, a popularidade tambem e influenciada pelotipo de conteudo disseminado. Ja informacoes a respeito dalocalizacao dos peers nao sao providas pelos trackers. Essasinformacoes foram obtidas a partir da consulta dos enderecosIP dos peers na base de dados Geolite (www.maxmind.com),por onde e possıvel obter dados a respeito do paıs, do AS eda empresa que gerencia o endereco IP do peer torrent.

Para descrever as propriedades gerais dos enxames(e.g., o tamanho dos enxames e a quantidade de arquivoscompartilhadas) foram utilizadas todas as amostras coletadas.Entretanto, para comparar a localizacao dos peers dos enxamese a saude dos enxames, foi utilizado um subconjunto aleatoriodos torrents tradicionais, de tamanho similar a amostra social.O tamanho dos swarms tambem foi utilizado como criterio deescolha. Assim, as comparacoes sao realizadas em cojuntos demesma ordem de grandeza.

III. CARACTERIZACAO E RESULTADOS

Esta secao discute os resultados da comparacao entretorrents anunciados via rede social e torrents anunciadosde forma tradicional. A comparacao e realizada em tresdimensoes. Na secao III-A, sao discutidas as propriedadesgerais dos torrents, como a quantidade e os tipos de arquivosdisseminados em cada enxame e os tamanhos das redes decompartilhamento. Na secao III-B, a saude de um enxameem cada tipo de torrent e avaliada. No contexto dessetrabalho, a saude de um enxame refere-se a um conjuntode metricas que indicam bons nıveis de compartilhamentocomo proporcoes entre copias completas e incompletas ea fracao de participantes que fazem compartilhamento emmultiplos enxames. Finalmente, na secao III-C sao comparadasas caracterısticas de localizacao geografica e topologica dosparticipantes dos dois tipos de enxames estudados.

A tabela I resume o conjunto de dados coletado pararealizar esse trabalho. Nas analises apresentadas, foramidentificados quase 2 milhoes de peers, espalhados por maisde 11 mil sistemas autonomos e 230 paıses diferentes. Ostorrents analisados cobrem praticamente 1 milhao de arquivoscom quase 1800 extensoes diferentes.

Torrent tradicional Torrent social

Numero de IPs unicos 1.280.688 358.463

Numero de Participantes 1.434.393 410.858

Numero de paıses 230 222

Numero de ASs 11.366 7.567

Numero de Trackers 3.602 821

Numero de Arquivos 962.997 23.398

Numero de Extensoes de arquivo 1.747 457

Tabela I. RESUMO DA AMOSTRA DE DADOS COLETADA.

A. Propriedades Gerais

Os enxames analisados apresentam uma populacao quepode variar de apenas alguns participantes ate dezenas demilhares. A Figura 2 apresenta a distribuicao dos tamanhosdos enxames. A linha azul, marcada com quadrado, apresenta adistribuicao de todos dos enxames avaliados (torrents sociais etradicionais); a linha em preto, marcada com cırculo, apresentaa distribuicao somente dos enxames de torrents tradicionais;e a linha vermelha, marcada com asterisco, apresenta adistribuicao para os torrents sociais.

0

0.2

0.4

0.6

0.8

1

1 10 100 1000 10000 100000

P(N

ro. d

e pe

ers

<=

n)

Nro. de peers no enxame n

Torrent TradicionalTodos Enxames

Torrent Social

Figura 2. Distribuicao do tamanho dos enxames de torrents.

0

0.2

0.4

0.6

0.8

1

1 10 100 1000 10000

P(N

ro. d

e ar

quiv

os <

= n

)

Nro. de arquivos no enxame n

Torrent SocialTorrent Tradicional

Figura 3. Distribuicao da quantidade de arquivos compartilhados.

Quando se avalia todos enxames (linha azul), observa-seque, apesar de existirem enxames com milhares de peers, agrande maioria apresenta na ordem de ate 100 participantes. Defato, mais de 40% apresentam menos de 10 participantes. Hatambem uma fracao nao desprezıvel de enxames com apenas1 participante (por volta de 2,7%).

Os enxames sociais e tradicionais apresentam propriedadesgerais diferentes. Por exemplo, os enxames sociais avaliadostendem a ser maiores que os tradicionais. De acordo com aFigura 2 enquanto 50% dos enxames tradicionais apresentammenos de 10 peers durante a observacao, a mesma fracaode enxames de torrents sociais apresentam ate 60 peers. Namedia, durante o perıodo de observacao, um torrent social tem

260

Page 4: [IEEE 2014 Brazilian Symposium on Computer Networks and Distributed Systems (SBRC) - Florianopolis, Brazil (2014.5.5-2014.5.9)] 2014 Brazilian Symposium on Computer Networks and Distributed

tres vezes mais peers que um torrent tradicional. Alem disso,cerca de 3% dos torrents tradicionais apresentam somente 1peer. Para torrents sociais esse numero cai para cerca de 1%.

O numero de enxames com baixo numero de participantespossivelmente reflete a distribuicao de popularidade entreos torrents. Geralmente, arquivos compartilhados atraem aatencao apenas nos perıodos de recente divulgacao. Com opassar do tempo, esses arquivos sao disseminados e perdempopularidade. Seus enxames perdem participantes e podemchegar ao caso extremo de se tornarem torrents mortos (deadtorrents), isto e, enxames sem copias completas dos arquivoscompartilhados.

A Figura 3 apresenta as distribuicoes do tamanhodo conjunto de arquivos compartilhados em um unicotorrent. Para avaliar estas distribuicoes, os torrents (sociaise tradicionais) sao divididos em 2 grupos: torrents quecompartilham ate 7 arquivos e torrents que compartilhammais de 7 arquivos. Considerando somente os torrentsque compartilham ate 7 arquivos, nota-se que os torrentssociais tendem a ser um pouco maiores que os tradicionais.Por exemplo, 36% dos torrents tradicionais neste grupocompartilham apenas 1 arquivo versus somente 15% dostorrents sociais. Ja para os torrents que compartilham maisde 7 arquivos, nota-se uma inversao de padroes: os torrentstradicionais tendem a ser maiores. Por exemplo, cerca de 9%dos torrents tradicionais tem mais de 100 arquivos, mas menosde 2% dos sociais tem essa mesma quantidade. Na media geral,os torrents tradicionais tem 63,26 arquivos, enquanto os sociaissomente 14,51.

Entre os torrents avaliados, os dois torrents tradicionaiscom maior numero de arquivos compartilhados apresentam29.780 e 9.845 arquivos. Ambos tem mais de 50 GB detamanho e compartilham jogos e musicas respectivamente. Emcontrapartida, os torrents sociais, os dois enxames com maiornumero de arquivos compartilhados tem somente 1.973 e 1.421arquivos. Os dois conjuntos tem 6 GB e 3 GB respectivamentee ambos compartilham jogos e programas (com extensoes dll,cab, exe, .dat, msi, etc).

Finalmente, a Figura 4 apresenta as 20 extensoes dearquivo mais comuns em cada tipo de torrent. Note que, osarquivos mais comuns dos enxames de torrents tradicionaissao diferentes dos encontrados nos torrents sociais (i.e. oseixos “x” dos graficos sao diferentes). Especificamente, ascomunidades sociais tendem a compartilhar temas especıficosde arquivos (e.g. jogos e filmes). Por esse motivo, as20 extensoes nesse tipo de torrent sao praticamente todasrelativas a vıdeo e audio (mp3, wmv, avi, etc.) e jogos (cab,zip, BNDL, etc.). Enquanto isso, torrents tradicionais naosao enviesados por tema, tendo uma diversidade maior nasextensoes dos arquivos compartilhados. Desta forma, arquivosde interesse restrito tendem a ser encontrados mais facilmentevia mecanismos tradicionais de disseminacao.

Tanto para os torrents sociais quanto para os tradicionais,e comum existir arquivos de texto descrevendo o conteudocompartilhado. Assim, observa-se que em ambos os conjuntosha um numero expressivo de arquivos “txt” e “nfo”.

Figura 4. Top 20 extensoes compartilhadas.

Tradicional Social

% de peers sem tracker 82% 84%

% de enxames multitracker 81% 92%

% de torrents mortos (dead torrents) 47,45% 28,16%

Tabela II. ASPECTOS GERAIS DE SAUDE DOS ENXAMES.

B. Saude dos Enxames Torrent

Neste trabalho, a saude de um torrent indica o quanto essetorrent pode ter sucesso em ser compartilhado. Por exemplo,quanto maior a quantidade de copias completas, ou maior onumero de seeders, maiores as chances de se difundir os dadosde um torrent.

A Tabela II resume aspectos gerais relacionados a saude dasduas classes de torrents. Tanto os torrents sociais quanto ostradicionais apresentam proporcoes semelhantes de peers semtracker associado. Como discutido anteriormente (Secao II),um tracker serve para gerenciar um enxame. Porem, por serum ponto de centralizacao, ele pode ser alvo de ataques ouimpedimentos judiciais3. Atualmente, como corroborado pelosnumeros da Tabela II, os torrents tendem a ser disseminadossem ajuda de trackers, o que pode aumentar sua resiliencia. Atabela tambem mostra um numero significativamente maior detorrents sociais que sao auxiliados por mais de um tracker.Em outras palavras, por terem redundancia de assistencia,os torrents sociais podem apresentar melhor resiliencia queos torrents tradicionais. Finalmente, ha um numero maior detorrents tradicionais mortos, comparados aos torrents sociais.Quase metade dos torrents tradicionais analisados ja haviam

3No caso de compartilhamento de conteudo ilegal ou com restricoes decopyright.

261

Page 5: [IEEE 2014 Brazilian Symposium on Computer Networks and Distributed Systems (SBRC) - Florianopolis, Brazil (2014.5.5-2014.5.9)] 2014 Brazilian Symposium on Computer Networks and Distributed

0

0.2

0.4

0.6

0.8

1

1 10 100 1000 10000

P(N

ro. d

e se

eder

s <

= n

)

Nro. de seeders no enxame n

Torrent TradicionalTorrent Social

Figura 5. Distribuicao do numero de seeders em um enxame.

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1P(N

ro. d

e se

eder

s po

r pe

ers

<=

n)

Nro. de seeders por peers no enxame n

Torrent TradicionalTorrent Social

Figura 6. Distribuicao da proporcao seeders/peers em um enxame.

perdido interesse do publico e nao tinham nenhum seeder noenxame. Esse numero cai para 28% entre os torrents sociais.

Em numeros absolutos, os torrents sociais tendem a termais seeders que os tradicionais. A Figura 5 apresenta asdistribuicoes acumuladas dos numeros de seeders de umenxame. Note que 80% dos torrents tradicionais tem menosde 16 seeders. Em comparacao, a mesma fracao de torrentssociais chega a ter 102 seeders. Em media, torrents sociaistem 137,3 seeders enquanto os tradicionais tem apenas 39,06.

Um numero maior de seeders pode ser reflexo de ummaior numero de participantes no enxame. Assim, uma outrametrica que reflete a saude de um torrent e a razao entre onumero de seeders e o numero total de peers no enxame.A Figura 6 apresenta as distribuicoes dessa proporcao paratorrents sociais e tradicionais. Os torrents sociais tambemtendem a ser melhores que os tradicionais quanto a estametrica: 60% dos torrents sociais tem mais de 28% de seusparticipantes atuando como seeders, enquanto que somente40% dos torrents tradicionais tem uma proporcao de seedersnesta faixa.

A incidencia de grupos de peers que participam de mais deum enxame tambem pode ser um indicador de saude de umtorrent uma vez que, neste caso, realocacao e agrupamentodinamico de enxames podem melhorar o desempenho docompartilhamento dos arquivos pertencentes aos enxames compeers em comum [4].

A Figura 7 mostra a distribuicao acumulada do numerode peers que participam de mais de um enxame em cadatipo torrent analisado. Nitidamente, observa-se que os torrentssociais apresentam um numero maior de peers com esse tipode caracterıstica. Na media, os torrents sociais tem cerca de 81peers que participam de multiplos enxames, e os tradicionais

0

0.2

0.4

0.6

0.8

1

1 10 100 1000 10000P(N

ro. d

e pe

ers

mul

ti−sw

arm

<=

n)

Nro. de peers multi−swarm no enxame n

Torrent TradicionalTorrent Social

Figura 7. Distribuicao de peers que participam de multiplos swarms.

0.92

0.96

1

1e−05 0.0001 0.001 0.01 0.1

P(S

imila

ridad

e de

Jac

card

<=

s)

Similaridade de Jaccard s

Torrent SocialTorrent Tradicional

Figura 8. Distribuicao do coeficiente de similaridade de Jaccard.

apenas 20. Em termos percentuais, cerca de 20% dos peers detorrents tradicionais participam de apenas 1 enxame, enquantonos torrents sociais, esta proporcao e de 5%.

Intuitivamente, peers com interesses em comum tendem acompartilhar tambem a participacao em multiplos enxames eassim, o protocolo Bittorrent poderia usar isso para estabelecerparcerias de longa duracao. Alem da melhora das parceriasformadas, a participacao em multiplos enxames pode serexplorada para balancear a carga (contribuicao) entre os peersdos varios enxames envolvidos.

Para avaliar a coparticipacao de peers em multiplosenxames, foi analisado o coeficiente de Jaccard entre osconjuntos de participantes de cada par de enxames, para cadatipo de torrent. Mais precisamente, seja A e B dois enxames.O coeficiente de Jaccard e uma medida de similaridade entreesses dois conjuntos A e B, sendo definido como:

Coeficiente de similaridade de Jaccard(A,B) =|A∩B||A∪B| .

A Figura 8 apresenta a distribuicao dos coeficientes deJaccard encontrada entre os enxames sociais e tradicionais.Claramente, observa-se o efeito da disseminacao social nosurgimento de grupos de peers em comum entre enxames:enquanto essa caracterıstica e praticamente ausente emenxames tradicionais, a mesma se torna evidente na difusaosocial, mesmo levando-se em conta o fato de que o Facebooknao tem foco em distribuicao de conteudo e que os enxamessociais tambem podem ser disseminados em sites de indexacao,o que poderia reduzir suas intersecoes.

Para melhor visualizacao de como a disseminacao socialfaz surgir grupos de peers comuns, a Figura 9 apresentaas matrizes de similaridade para os enxames tradicionais esociais. Cada cruzamento de linha e coluna dessa matriz

262

Page 6: [IEEE 2014 Brazilian Symposium on Computer Networks and Distributed Systems (SBRC) - Florianopolis, Brazil (2014.5.5-2014.5.9)] 2014 Brazilian Symposium on Computer Networks and Distributed

representa a semelhanca entre 2 enxames. O coeficiente desimilaridade entre 2 enxames varia de baixo (branco) a alto(azul escuro). Enquanto a matriz dos torrents tradicionaisindica baixa similaridade entre todos os pares de enxame dessetipo, a matriz de torrents sociais indica o contrario: uma grandeproporcao de pares de enxame de torrent social tem evidentesimilaridade. Observa-se entao a superposicao entre o grafode amigos do Facebook e os peers do enxame, o que poderiaestar induzindo a formacao de proto-comunidades de peers emdecorrencia da disseminacao social.

Figura 9. Matriz de similaridade.

C. Localizacao do peers nos enxames torrent

De forma geral, aplicacoes P2P nao consideram localizacaona rede fısica para criar as parcerias da rede sobreposta [7].O mesmo ocorre com o Bittorrent. Seu protocolo tentamaximizar o volume de dados trocados entre os peers, semtomar conhecimento de suas localizacoes geograficas ou outraspropriedades da rede fısicas [8]. Isso pode causar um grandevolume de trafego entre ASes ou ISPs, e consequentemente,alto custo.

Ha varias propostas para lidar com os problemas que odesconhecimento da rede fısica pode causar na construcao darede P2P. Uma abordagem comum e enviesar a selecao deparcerias e favorecer aquelas entre peers que sao localizadosproximos uns aos outros (i.e. peers localizados em ummesmo ISP, AS ou paıs) [7], [8]. Assim, uma comparacaoda localizacao dos peers nos enxames torrent permite avaliaro potencial de eficacia desta estrategia.

Os torrents sociais e tradicionais apresentam diferencassubstanciais com relacao a localizacao de seus peers. Porexemplo, observa-se um numero maior de paıses entre ospeers de um torrent social. A Figura 10 mostra a distribuicaodo numero de paıses identificados nos enxames analisados.

0

0.2

0.4

0.6

0.8

1

1 10 100 1000 10000

P(N

ro. d

e pa

íses

<=

n)

Nro. de países no enxame n

Torrent TradicionalTorrent Social

Figura 10. Numero de paıses distintos em um enxame.

Figura 11. Top 15 paıses mais frequentemente encontrados nos enxames.

Em media, os peers nos torrents sociais estao localizados emate 30 paıses distintos, contra apenas 14 paıses nos torrentstradicionais.

A Figura 11 apresenta os top-15 paıses maisfrequentemente encontrados em cada tipo de torrent.Note que, embora as distribuicoes sejam razoavelmentesemelhantes, porem, os paıses sao diferentes. A distribuicaopara torrents sociais e influenciada pela distribuicao dos paısesmais comuns no Facebook4. Paıses como India, Filipinase Brasil tiveram suas posicoes melhoradas no ranking paratorrents sociais, o que indica uma sobreposicao entre as redessocial e P2P.

Como mencionado, a localizacao topologica dos peersna rede fısica tambem pode ser explorada para favorecerestabelecimento de parcerias entre pares localizados no mesmoAS, por exemplo, reduzindo assim o trafego entre ASesdiferentes. Logo, a localizacao dos peers nos enxames emtermos de ASes tambem e analisada.

A Figura 12 apresenta o numero de ASes encontradosem cada enxame e seu respectivo tamanho (em numero depeers). Nao ha grandes diferencas entre os enxames sociais eos tradicionais. Para ambos tipos de torrents, pode se observaruma correlacao nao linear entre o tamanho dos enxames e aquantidade de ASes encontrados entre seus participantes. Alemdisto, em ambos casos, os enxames apresentam tipicamente ate800 ASes diferentes entre seus participantes. Entretanto, haenxames com peers distribuıdos por ate 1800 ASes diferentes.

De acordo com a Figura 13, torrents sociais apresentammaiores proporcoes de peers por paıs e por AS. Em outraspalavras, a localidade (por paıs e por AS) e maior nos torrentssociais. Praticamente 50% dos torrents tradicionais tem de

4http://www.quintly.com/blog/2013/03/facebook-country-statistics-march-2013/

263

Page 7: [IEEE 2014 Brazilian Symposium on Computer Networks and Distributed Systems (SBRC) - Florianopolis, Brazil (2014.5.5-2014.5.9)] 2014 Brazilian Symposium on Computer Networks and Distributed

Figura 12. Numero de ASes por enxame.

0

0.2

0.4

0.6

0.8

1

1 10 100 1000 10000

P(P

eers

por

paí

s <

= p

)

Peers por país p

Torrent TradicionalTorrent Social

(a) Proporcao de peers porpaıs

0

0.2

0.4

0.6

0.8

1

1 10 100 1000 10000

P(P

eers

por

AS

<=

a)

Peers por AS a

Torrent TradicionalTorrent Social

(b) Proporcao de peers porAS

Figura 13. Localizacao dos peers de um enxame torrent.

menos de 29 peers por paıs. Esse numero e significativamentemaior torrents sociais: 50% dos torrents chega ter ate 89peers por paıs. A diferenca na relacao de peers por AS emais estreita, mas ainda assim impactante. Enquanto 60% dosenxames tradicionais tem menos de 10 peers por AS, a mesmafracao de enxames de torrents sociais apresenta ate 22 peerspor AS.

Esses numeros deixam claro que, caso o protocoloBittorrent utilize conhecimento das redes fısicas na construcaoda rede P2P, torrents sociais apresentarao melhores resultadosno agrupamento de peers. Consequentemente, torrents sociaispoderao ter melhor taxa de transferencia, difusao de dadosmais rapida e menor trafego de dados entre ASes.

IV. TRABALHOS RELACIONADOS

Ha um grande numero de trabalhos que foca na analisee melhoria da disseminacao de conteudo no Bittorrent.Notadamente, um dos mecanismos mais importantes nessalinha e o tit-for-tat [3]. Esse mecanismo incentiva a cooperacaomutua nos enxames torrent a partir de monitoracoesdistribuıdas, realizadas localmente pelos peers. De certa forma,a eficiencia do Bittorrent e associada a esse mecanismo.Porem, ha um grande numero de enxames torrents que naose beneficiam dele.

De fato, cerca de 40% dos torrents apresentam umdesempenho baixo, com um grande numero de usuariosincapazes de obter o conteudo compartilhado por completo [6].Esse baixo desempenho e explicado pela falta de incentivoa um peer para que ele permaneca contribuindo com oenxame apos ele ter conseguido capturar o conteudo completo.O tit-for-tat, que e o principal mecanismo de incentivo noBittorrent, nao utiliza informacoes de longa duracao, naoexplora as interacoes sociais dos peers e nao extrapola asavaliacoes entre enxames diferentes. Assim, tao logo um

peer consegue baixar os arquivos compartilhados, ele costumaabandonar o enxame.

Ha um numero ainda pequeno de trabalhos que extrapolaos incentivos providos pelo tit-for-tat e tenta utilizar o contextosocial dos peers para melhorar a eficiencia de sistemas P2P.Por exemplo, [2] explora o contexto social do Youtube5 emostra a forte correlacao existente entre os vıdeos Youtubee os que sao sugeridos na pagina de exibicao. Assim, elespropoem mecanismos para melhorar a difusao desses vıdeosem redes P2P. Os peers fazem cache dos vıdeos e redistribuemo entre seus parceiros, inclusive aqueles que estao assistindoos vıdeos sugeridos.

Wang et al. apresentam tres trabalhos que tratam o contextosocial na difusao de torrents [11], [9], [10]. Nesses trabalhos,os autores avaliam contatos de longa duracao entre peers deenxames torrents que sao divulgados pelo Twitter. Segundoos autores, em torrents divulgados pelo Twitter, ha umagrande localidade temporal entre os peers. Enquanto nosenxames de torrents tradicionais, menos de 5% dos peersse reencontraram durante os 80 dias de experimento, essenumero chega a 35% nos torrents divulgados pelo Twitter.Essa localidade temporal oferece uma grande oportunidadepara melhorar o grau de compartilhamento. Por exemplo, emseus experimentos, os autores mostram que a latencia inicial dedownload dos arquivos e o tempo para completar o downloadsao melhorados.

Outros fatores, alem da localidade temporal, tambem saoimpactados pelo contexto social. Anteriormente, [5] mostraramque o perfil dos arquivos compartilhados e o agrupamentodos peers em torno de determinados paıses e diferentequando o torrent e disseminado via Facebook. Os resultadospreliminares desse trabalho indicam uma melhor localizacaodos peers de um enxame, com possıvel formacao de gruposem torno de paıses e ASes.

Neste trabalho, diferente dos anteriores, sao analisadostres aspectos diferentes do impacto da divulgacao em redessociais de torrent. Inicialmente, sao avaliadas as caracterısticasgerais da rede P2P e dos arquivos compartilhados. Emsegundo lugar, e quantificada a diferenca na saude dos torrentssociais e dos tradicionais. Nesse caso, sao verificadas metricasque indicam que um torrent social tem melhor desempenhoque um tradicional. Mesmo sem nenhuma modificacao nosmecanismos existente do Bittorrent, as metricas de saudeindicam que os torrents sociais podem ter melhores tempos dedisseminacao dos arquivos, melhores proporcoes de (seeders)e menos enxames mortos (dead torrents). Finalmente, eabordado a localidade dos peers da rede P2P, principalmentequanto ao agrupamento de peers em paıses e ASes. O estudoda localizacao dos peers estende o trabalho anterior [5] e avalianao so o aspecto de agrupamento em torno de paıses ou ASesespecıficos, mas quantifica esses agrupamentos.

V. CONCLUSOES E TRABALHOS FUTUROS

Nesse trabalho foi avaliada a influencia de uma rede social,o Facebook, na disseminacao de arquivos pelo Bittorrent.Foram analisados dados coletados de mais de 16.600 enxames

5youtube.com

264

Page 8: [IEEE 2014 Brazilian Symposium on Computer Networks and Distributed Systems (SBRC) - Florianopolis, Brazil (2014.5.5-2014.5.9)] 2014 Brazilian Symposium on Computer Networks and Distributed

Bittorrent reais, disseminados tanto pelo Facebook quanto porsistemas web tradicionais, como o pirate bay e btmon.

As propriedades gerais dos torrents sao diferentes entres ossociais e os tradicionais. Enxames de torrents sociais tendema ser maiores. Na media, observou-se que enxames sociaissao 3 vezes maiores que os tradicionais. O numero de deadtorrents e maior entre os enxames tradicionais. Alem disso,cerca de 3% dos torrents tradicionais apresentam somenteum peer. Para torrents sociais esse numero cai para cerca de1%. Os torrents sociais tambem apresentam indicadores desaude melhores que os tradicionais. Por exemplo, os torrentsdivulgados pelo Facebook apresentam ate 50% a mais desemeadores (seeders) e quatro vezes mais peers que participamde multiplos enxames. E relevante ressaltar que, como osgrupos sociais tendem a se organizar em torno de um interessecomum, a variedade de conteudo ofertada e menor. Portanto, ousuario que busca por um conteudo de interesse restrito, teramais probabilidade de sucesso se recorrer a mecanismos dedisseminacao tradicionais.

A quantidade e a distribuicao de paıses nos enxamessociais e tradicionais sao, no geral, similares. Porem, ospaıses envolvidos mudam. Em particular, paıses populares noFacebook tendem a ocupar posicoes de maior destaque nostorrents sociais, o que indica uma sobreposicao entre as redessocial e P2P.

Finalmente, a proporcao de usuarios em um enxamepertencentes a uma mesma localizacao geografica ou AStambem e maior nos torrents sociais. Isto implica que o usode propriedades das redes fısicas ou da localizacao geograficapode levar a um maior agrupamento dos peers nos torrentssociais e menor trafego de dados entre ASes distintos. Alocalidade, associada a maior intersecao entre exames indicatambem uma possıvel melhoria do desempenho global desistemas P2P, pois peers podem colaborar entre si em diversosenxames, promovendo relacoes de maior duracao.

Como trabalho futuro, pretende-se avaliar as diferencasentre as topologias de rede de enxames de torrents sociais etradicionais. Tambem e de interesse a investigacao da formacaodas comunidades em torno dos peers que participam demultiplos enxames (multi-swarm). A identificacao de padroesnestas comunidades pode ajudar no desenvolvimento de umprotocolo de escolha de parceiros baseado em interessescomuns.

AgradecimentosOs autores agradecem o apoio do CNPq, CAPES, FAPEMIG,Instituto Nacional de Ciencia e Tecnologia para Web (InWeb)e do projeto EU-IP mPlane (n-318627).

REFERENCES

[1] N. Andrade, M. Mowbray, A. Lima, G. Wagner, and M. Ripeanu,“Influences on cooperation in bittorrent communities,” ACM SIGCOMMWorkshop on Economics of peer-to-peer systems, pp. 111–115, 2012.

[2] X. Cheng and J. Liu, “Nettube: Exploring social networks forpeer-to-peer short video sharing,” in In Proc. ACM SIGCOMM Workshopon Economics of peer-to-peer systems, 2009.

[3] B. Cohen, “Incentives build robustness in bittorrent,” In proc. of the 1st

Workshop on Economics of Peer-to-Peer Systems (P2PECON), 2003.

[4] G. Dan and N. Carlsson, “Dynamic swarm management for improvedBitTorrent performance,” in In Proc. IPTPS, 2009.

[5] T. Guarnieri, A.B. Vieira and A.P.C. da Silva, “Impacto das relacoessociais em sistemas de compartilhamento de arquivos,” In Proc. WP2P+SBRC, 2013.

[6] S. Kaune, G. Tyson, K. Pussep,A. Mauthe and R. Steinmetz, “The seederpromotion problem: Measurements, analysis and solution space,” In Proc.IEEE ICCCN, 2010.

[7] J. Seedorf, S. Kiesel, and M. Stiemerling, “Torrents on twitter:Explore long-term social relationships in peer-to-peer systems,” Trafficlocalization for p2p- applications: The alto approach, 2009.

[8] M. Varvello and M. Steiner, “Traffic localization for DHT-basedBitTorrent networks,” In Proc. IFIP NETWORKING, 2011.

[9] H. Wang and J. Liu, “Exploring peer-to-peer locality in multiple torrentenvironment,” IEEE TPDS, pp. 1216–1226, 2012.

[10] F. Wang, J. Liu, K. . Xu, and D. Wu, “Torrents on twitter:Explore long-term social relationships in peer-to-peer systems,” IEEE

Transactions on Network and Service Management, pp. 1–10, 2012.

[11] H. Wang, F. Wang, and J. Liu, “On long-term social relationships inpeer-to-peer systems,” In proc. of the IEEE Int. Workshop on QoS, 2011.

265