Sentence alignment for gv-ces-20150413-4110.xml (html) - gv-eng-20150402-516312.xml (html)

#ceseng
1Analýza Twitteru poukazuje na rozsah informační války na ruském internetuSocial Network Analysis Reveals Full Scale of Kremlin's Twitter Bot Campaign
2Profilové fotografie široké sítě prokremelsky naladěných účtů na Twitteru.Profile pictures from a large network of pro-Kremlin Twitter accounts.
3Obrázek vytvořil autor článku.Image by Lawrence Alexander.
4Za pomoci volně dostupných programů shromáždil výzkumník v oblasti internetu Lawrence Alexander data téměř 20 500 prokremelských účtu na Twitteru a vizualizoval je. Odkryl tak široký rozsah pokusů o manipulaci informací na ruském internetu.With the aid of open-source tools, Internet researcher Lawrence Alexander gathered and visualised data on nearly 20,500 pro-Kremlin Twitter accounts, revealing the massive scale of information manipulation attempts on the RuNet.
5V první části dvoudílného článku vysvětluje, jak tuto analýzu provedl a co zjistil.In what is the first part of a two-part analysis, he explains how he did it and what he found.
6Služba RuNet Echo již dříve psala o snaze ruské „armády trollů“ zanést na sociální sítě a stránky online médií prokremelskou rétoriku.RuNet Echo has previously written about the efforts of the Russian “Troll Army” to inject the social networks and online media websites with pro-Kremlin rhetoric.
7Twitter není žádnou výjimkou a mnoho uživatelů si všimlo, že různé účty na Twitteru píší podobné texty v reakci na důležité zprávy a události.Twitter is no exception, and multiple users have observed Twitter accounts tweeting similar statements during and around key breaking news and events.
8Se začátkem konfliktu na Ukrajině se tito „boti“ stali aktivnějšími. Jejich účty přitom vyvolávají dojem běžných uživatelů Twitteru, i s fotografiemi.Increasingly active throughout Russia's interventions in Ukraine, these “bots” have been designed to look like real Twitter users, complete with avatars.
9Nicméně indicie shromážděné v této dvoudílné analýze poukazují na jejich roli v rozsáhlém dezinformačním programu.But the evidence in this two-part analysis points to their role in an extensive program of disinformation.
10Novinář z USA Alec Luhn, který píše o dění v Rusku, si povšiml, jak se 27. února - jen pár hodin po zastřelení Borise Němcova - několik účtů na Twitteru snažilo ovlivnit způsob, jakým veřejnost vnímá tuto událost:Alec Luhn, a US journalist reporting on Russian affairs, observed how mere hours after the shooting of Boris Nemtsov on February 27th, a group of Twitter accounts were already attempting to sway the narrative:
11Boti rozšiřují historky o Němcovově smrti typu „Zabili ho Ukrajinci… přebral jednomu z nich přítelkyni. “Bots spread stories about Nemtsov's death like “Ukrainians killed him…he was stealing one of their girlfriends” pic.twitter.com/CNtNvsTPYI
12Za použití nástroje s otevřeným zdrojovým kódem NodeXL jsem sestavil kompletní seznam účtů, které na Twitteru napsaly tuto větu, a importoval ho do tabulky.- Alec Luhn (@ASLuhn) February 28, 2015 Using the open-source NodeXL tool, I collected and imported a complete list of accounts tweeting that exact phrase into a spreadsheet.
13Z tohoto seznamu jsem také vzal a importoval nejbližší okolí těchto uživatelů, tedy ty, kteří tyto účty sledují.From that list, I also gathered and imported an extended community of Twitter users, comprised of the friends and followers of each account.
14Měl to být zajímavý test - pokud je Němcovovo očerňování jen malá epizoda v šíření fám, nemělo by jít o více než pár desítek účtů.It was going to be an interesting test: if the slurs against Nemtsov were just a minor case of rumour-spreading, they probably wouldn't be coming from more than a few dozen users.
15Když ovšem software dokončil svou analýzu, odkryl rozsah této sítě: ohromujících 2 900 účtů. Toto číslo je do určité míry pochopitelné.But once the software had finished crunching data, the full scale of the network was revealed: a staggering 2,900 accounts.
16Aby byly falešné účty na Twitteru důvěryhodné, musí tu být dostatek lidí, kteří je sledují. A to vyžaduje další podpůrné účty.This figure is perhaps understandable: for a fake Twitter account to be credible, it needs plenty of followers-which in turn requires more supporting bots.
17Poté jsem použil další volně dostupný analytický nástroj Gephi k vizualizaci dat v takzvaném grafu „entity-relationship“.Then I used Gephi, another free data analysis tool, to visualize the data as an entity-relationship graph.
18Barevná kolečka - uzly grafu - představují účty na Twitteru, spojující čáry - hrany - ukazují, že jednotlivé účty navzájem sledují své zprávy.The coloured circles-called Nodes-represent Twitter accounts, and the intersecting lines-known as Edges-refer to Follow/Follower connections between accounts.
19Účty jsou značeny několika různými barvami podle algoritmu, který vyhodnocuje úzce propojené skupiny.The accounts are grouped into colour-coded community clusters based on the Modularity algorithm, which detects tightly interconnected groups.
20Velikost každého uzlu je dána počtem spojení, který má daný účet s ostatními v této síti.The size of each node is based on the number of connections that account has with others in the network.
21Síť 2 900 botů na Twitteru pocházející ze vzorku tweetů o Borisu Němcovovi.Extended network of 2,900 Twitter bots taken from Nemtsov thread sample.
22Obrázek vytvořil autor článku.Image by Lawrence Alexander.
23Podle toho, jak je tato síť hustá a jak blízko si jsou jednotlivé uzly, je zřejmé, že jde o rozsáhlou a vysoce propojenou síť.It is clear from how dense and close to each other the nodes are in the graph that this is a large and highly-connected network.
24Většina botů sleduje zprávy mnoha ostatních a umocňují tak navzájem svůj status.Most of the bots follow many others, giving them each a high follower/followed count.
25Na okrajích je několik kruhů méně propojených účtů, které mohou naznačovat, že síť „botů“ v době pořízení těchto dat stále ještě rostla. Můžete si ji představit jak strom, jehož větve se roztahují do prostoru.On the periphery, there are a few rings of lesser-connected accounts, perhaps indicating that the “bot” network was still being “grown” at the time of its capture; you could think of it like a tree, with branches spreading outwards.
26K této analýze se ovšem nabízí jedna zásadní otázka: Jak si můžeme být jistí, že se v této síti nacházejí převážně automatičtí boti, nikoli reální lidé?But there was one crucial question in this analysis: how was it possible to be sure that the network consisted chiefly of bots and not real humans?
27NodeXL nesbírá jen informace o tom, kdo koho sleduje.NodeXL doesn't just gather information on who follows whom.
28Pořizuje také metadata - veřejně dostupné detaily o každém účtu na Twitteru a o jeho chování.It also acquires metadata-the publicly-available details of each Twitter account and its behavior.
29Tyto informace ukázaly, že ze sítě 2 900 účtů nemělo 87 % profilů vyplněnou informaci o časové zóně, 92 % žádné oblíbené tweety.This shows that out of the 2,900-strong network, 87% of profiles had no timezone information and 92% no Twitter favorites.
30Ovšem v náhodném vzorku 11 282 obyčejných uživatelů Twitteru (vytvořeném z účtů, v jejichž zprávách bylo použito slovo „and“) nemělo jen 51 % žádnou časovou zónu a pouhých 15 % žádné oblíbené tweety (oba tyto rysy by mohly být označeny za „lidské“ chování).But in a randomized sample of 11,282 average Twitter users (based on accounts that had tweeted the word “and”) only 51% had no timezone and tellingly, only 15% had no favorites (both traits of what could be classified as “human” behavior).
31Pro porovnání je níže ukázán graf sestrojený na základě tohoto náhodného vzorku uživatelů Twitteru.For added comparison, an entity-relationship graph of the randomized Twitter user control network is shown below.
32Na rozdíl od sítě botů má tento graf několik na sebe nenapojených a izolovaných shluků - skupin uživatelů Twitteru, které navzájem nesledují své zprávy. Jde o zcela přirozený jev v případě výběru náhodné skupiny uživatelů.In contrast with the bots visualisation, this network has several unconnected and isolated clusters: groups of Twitter users that aren't linked to each other-a perfectly normal occurrence in a random group of users.
33Analýza využívání slova „and“ zobrazuje nenapojené, izolované shluky náhodných skupin uživatelů Twitteru.Shared use of the word “and” results in unconnected, isolated clusters in a random Twitter user group.
34Obrázek vytvořil autor článku.Image by Lawrence Alexander.
35Po odkrytí tak velké sítě pomocí jediného zdroje jsem se rozhodl ve svém lovu botů pokračovat.Having unearthed such a large-scale network from a single source, I decided to take the bot-hunting further.
36Při hledání frází typu „kremelští boti“ (hashtag #Kremlinbots nebo #Кремлеботы), „proruští trollové“ nebo „Putinovy loutky“ jsem našel několik uživatelů, kteří ve svých tweetech upozorňovali na domnělé aktivity botů.Searching Twitter for phrases such as “Kremlin bots”, “pro-Russian trolls” and “Putin sockpuppets,” I found several users sharing screenshots of alleged bot activity. Some also used the #Kremlinbots (#Кремлеботы) hashtag to report sightings.
37Použil jsem stejnou metodu jako v případě tweetů týkajících se Němcova a analyzoval jsem sítě účtů vybrané na základě používání některých klíčových frází, na které upozorňovala širší komunita. Někdy jsem ovšem vzal přímo jen seznam „podezřelých“ uživatelů, který někdo sdílel.Using the same method as with the anti-Nemtsov tweets, I gathered networks of accounts based around the use of some of the reported key phrases that revealed larger communities-or, in some cases, just a list of users shown in the screenshot.
38Rozdělil jsem se tyto skupiny do vzorků A, B, C a D (o důvodech tohoto značení se zmíním v druhé části analýzy).These were divided into groups labelled A, B, C and D. (I will elaborate on the reason for this grouping in part two of the analysis.)
39Satirický účet @PressRuissa (nyní pozastaven) paroduje proruská média, jde o směs satiry a komentářů k dezinformacím nebo předpojatosti.@PressRuissa is a parody account (now suspended) spoofing a pro-Russian media, a mix of satire and commentary on disinformation and bias.
40Jeden z jeho tweetů posloužil jako základ pro skupinu A:One of its tweets was the starting source for the Group A network:
41Ruští uživatelé Twitteru odhalují, že „Novaja gazeta tutlá aktivity svých botů“, překvapivě unisono.The Russian tweeters reveal that “Novaya Gazeta covers up their bots' activity” in a surprising unison. (via @nokato) pic.twitter.com/DSwcIKWpDg
42(od uživatele @nokato)- Falcon News Intl. (@PressRuissa) March 13, 2015
43Skupina B zahrnovala jiné podezřelé účty, jejichž chování se blížilo předešlým vzorkům.Group B came from different sources of suspected bot accounts whose behavior seemed to match the previous samples.
44Některé bylo možné identifikovat podle jejich tendence přejít z ruštiny do angličtiny s chybovou hláškou „RSS in offline mode“. Ta byla nejspíše způsobena chybou v softwaru, který je ovládal.Some were identified by their tendency to change from Russian language to English with the single error message “RSS in offline mode”-presumably caused by a glitch in their control software.
45RSS in offline modeRSS in offline mode
46Pro skupinu C byl použit tweet Devina Acklese, analytika think tanku CASE Ukraine.For the remaining sources, a tweet by Devin Ackles, an analyst for think tank CASE Ukraine provided the basis for Group C.
47Proruští boti v ofenzívě po útoku na Mariupol.Pro-Russian bots on the offensive following attack on #Mariupol pic.twitter.com/AiH95Dp1wb
48A nakonec Vitalij Moroz z organizace Internews Ukraine sdílel snímek obrazovky, který posloužil pro vznik skupiny D.- Devin Ackles (@DevinAckles) January 24, 2015 And lastly, Vitaliy Moroz of Internews Ukraine shared a screencap of bot accounts that formed the sample for Group D.
49Ruští boti rozšiřují poselství války: „Myslím, že začne velká válka. “Russian bots have disseminated the message of war: “I think Great War will start!”
50Ze všech čtyř skupin byla vytvořena jediná sada dat, která dohromady čítá 17 590 účtů na Twitteru.#RussiainvadedUkraine #russia pic.twitter.com/kCVDioIAGH - Vitaliy Moroz ENG (@vitaliymoroz) February 13, 2015
51Stejně jako v případě tweetů týkajících se Němcova se potvrdilo, že většinu těchto účtů opravdu tvořili boti.All four groups were merged into a single data set, resulting in a total of 17,590 Twitter accounts.
5293 % nemělo v profilu vyplněnou zeměpisnou polohu, 96 % časovou zónu a 97 % nemělo žádné oblíbené tweety.As with those producing the anti-Nemtsov tweets, the metadata confirmed that the vast majority were indeed bots.
53Také navzdory průměrné produkci 2 830 tweetů nevstupovaly tyto účty téměř nikdy do kontaktu s ostatními uživateli, ať už přímým zmíněním nebo odpovědí na jejich tweety.93% showed no location on their profile, 96% had no time zone information and 97% had no Twitter favorites saved.
54Boti píšou tweety, ale neinteragují - většina uzlů vykazuje smyčky, což ukazuje na absenci interakce s ostatními uživateli zmíněním nebo odpovědí na jejich tweety.Also, despite having produced an average of 2,830 tweets, the accounts almost never interacted with other Twitter users through @replies or @mentions. The bots broadcast tweets, but don't interact.
55Obrázek vytvořil autor článku.Image by Lawrence Alexander.
56Je zajímavé, že většině botů byla dána „západně“ znějící jména jako třeba barnardgrant, terancebarnaby, terencecoward a duncanstarks.Intriguingly, many of the bots had been given western-sounding names such as barnardgrant, terancebarnaby, terencecoward and duncanstarks.
57Ale ještě překvapivější výsledek jsem získal, když jsem zobrazil tyto skupiny botů podle jejich vztahů.But an even more surprising result came when I visualized the bot groups' follow relationships.
58Ačkoli byly vzorky vybrány z různých zdrojů, byla výsledná síť silně propojena.Even though the samples had been taken from four separate sources, the combined network was found to be intensely interconnected.
59Všech 17 590 účtů ze čtyř vzorků.All 17,590 accounts from all four sources.
60Povšimněte si silného propojení a nepřítomnosti izolovaných ostrůvků.Note the tight interconnections and lack of isolated clusters.
61Obrázek vytvořil autor článku.Image by Lawrence Alexander.
62Tyto výsledky ostře kontrastují s náhodným vzorkem, který byl použit jako kontrolní skupina - v obrázku výše nevidíme žádné izolované skupiny nebo jedince.This sharply contrasts with the randomized control sample: the final dataset showed no isolated groups or outliers at all.
63To přesvědčivě potvrzuje domněnku, že tito boti byli vytvořeni jediným úřadem. A zdá se, že vše ukazuje na Moskvu.This strongly supports the idea that the bots were created by a common agency-and the weight of evidence points firmly towards Moscow.
64Ve svém příštím článku se podívám na časovou posloupnost zakládání účtů těchto botů a na korelaci s politickými událostmi v Rusku a na Ukrajině.In my next post I will look at the timeline behind the creation of the bots, and see how it correlates with political events in Russia and Ukraine.