# | ces | eng |
---|
1 | Analýza Twitteru poukazuje na rozsah informační války na ruském internetu | Social Network Analysis Reveals Full Scale of Kremlin's Twitter Bot Campaign |
2 | Profilové fotografie široké sítě prokremelsky naladěných účtů na Twitteru. | Profile pictures from a large network of pro-Kremlin Twitter accounts. |
3 | Obrázek vytvořil autor článku. | Image by Lawrence Alexander. |
4 | Za pomoci volně dostupných programů shromáždil výzkumník v oblasti internetu Lawrence Alexander data téměř 20 500 prokremelských účtu na Twitteru a vizualizoval je. Odkryl tak široký rozsah pokusů o manipulaci informací na ruském internetu. | With the aid of open-source tools, Internet researcher Lawrence Alexander gathered and visualised data on nearly 20,500 pro-Kremlin Twitter accounts, revealing the massive scale of information manipulation attempts on the RuNet. |
5 | V první části dvoudílného článku vysvětluje, jak tuto analýzu provedl a co zjistil. | In what is the first part of a two-part analysis, he explains how he did it and what he found. |
6 | Služba RuNet Echo již dříve psala o snaze ruské „armády trollů“ zanést na sociální sítě a stránky online médií prokremelskou rétoriku. | RuNet Echo has previously written about the efforts of the Russian “Troll Army” to inject the social networks and online media websites with pro-Kremlin rhetoric. |
7 | Twitter není žádnou výjimkou a mnoho uživatelů si všimlo, že různé účty na Twitteru píší podobné texty v reakci na důležité zprávy a události. | Twitter is no exception, and multiple users have observed Twitter accounts tweeting similar statements during and around key breaking news and events. |
8 | Se začátkem konfliktu na Ukrajině se tito „boti“ stali aktivnějšími. Jejich účty přitom vyvolávají dojem běžných uživatelů Twitteru, i s fotografiemi. | Increasingly active throughout Russia's interventions in Ukraine, these “bots” have been designed to look like real Twitter users, complete with avatars. |
9 | Nicméně indicie shromážděné v této dvoudílné analýze poukazují na jejich roli v rozsáhlém dezinformačním programu. | But the evidence in this two-part analysis points to their role in an extensive program of disinformation. |
10 | Novinář z USA Alec Luhn, který píše o dění v Rusku, si povšiml, jak se 27. února - jen pár hodin po zastřelení Borise Němcova - několik účtů na Twitteru snažilo ovlivnit způsob, jakým veřejnost vnímá tuto událost: | Alec Luhn, a US journalist reporting on Russian affairs, observed how mere hours after the shooting of Boris Nemtsov on February 27th, a group of Twitter accounts were already attempting to sway the narrative: |
11 | Boti rozšiřují historky o Němcovově smrti typu „Zabili ho Ukrajinci… přebral jednomu z nich přítelkyni. “ | Bots spread stories about Nemtsov's death like “Ukrainians killed him…he was stealing one of their girlfriends” pic.twitter.com/CNtNvsTPYI |
12 | Za použití nástroje s otevřeným zdrojovým kódem NodeXL jsem sestavil kompletní seznam účtů, které na Twitteru napsaly tuto větu, a importoval ho do tabulky. | - Alec Luhn (@ASLuhn) February 28, 2015 Using the open-source NodeXL tool, I collected and imported a complete list of accounts tweeting that exact phrase into a spreadsheet. |
13 | Z tohoto seznamu jsem také vzal a importoval nejbližší okolí těchto uživatelů, tedy ty, kteří tyto účty sledují. | From that list, I also gathered and imported an extended community of Twitter users, comprised of the friends and followers of each account. |
14 | Měl to být zajímavý test - pokud je Němcovovo očerňování jen malá epizoda v šíření fám, nemělo by jít o více než pár desítek účtů. | It was going to be an interesting test: if the slurs against Nemtsov were just a minor case of rumour-spreading, they probably wouldn't be coming from more than a few dozen users. |
15 | Když ovšem software dokončil svou analýzu, odkryl rozsah této sítě: ohromujících 2 900 účtů. Toto číslo je do určité míry pochopitelné. | But once the software had finished crunching data, the full scale of the network was revealed: a staggering 2,900 accounts. |
16 | Aby byly falešné účty na Twitteru důvěryhodné, musí tu být dostatek lidí, kteří je sledují. A to vyžaduje další podpůrné účty. | This figure is perhaps understandable: for a fake Twitter account to be credible, it needs plenty of followers-which in turn requires more supporting bots. |
17 | Poté jsem použil další volně dostupný analytický nástroj Gephi k vizualizaci dat v takzvaném grafu „entity-relationship“. | Then I used Gephi, another free data analysis tool, to visualize the data as an entity-relationship graph. |
18 | Barevná kolečka - uzly grafu - představují účty na Twitteru, spojující čáry - hrany - ukazují, že jednotlivé účty navzájem sledují své zprávy. | The coloured circles-called Nodes-represent Twitter accounts, and the intersecting lines-known as Edges-refer to Follow/Follower connections between accounts. |
19 | Účty jsou značeny několika různými barvami podle algoritmu, který vyhodnocuje úzce propojené skupiny. | The accounts are grouped into colour-coded community clusters based on the Modularity algorithm, which detects tightly interconnected groups. |
20 | Velikost každého uzlu je dána počtem spojení, který má daný účet s ostatními v této síti. | The size of each node is based on the number of connections that account has with others in the network. |
21 | Síť 2 900 botů na Twitteru pocházející ze vzorku tweetů o Borisu Němcovovi. | Extended network of 2,900 Twitter bots taken from Nemtsov thread sample. |
22 | Obrázek vytvořil autor článku. | Image by Lawrence Alexander. |
23 | Podle toho, jak je tato síť hustá a jak blízko si jsou jednotlivé uzly, je zřejmé, že jde o rozsáhlou a vysoce propojenou síť. | It is clear from how dense and close to each other the nodes are in the graph that this is a large and highly-connected network. |
24 | Většina botů sleduje zprávy mnoha ostatních a umocňují tak navzájem svůj status. | Most of the bots follow many others, giving them each a high follower/followed count. |
25 | Na okrajích je několik kruhů méně propojených účtů, které mohou naznačovat, že síť „botů“ v době pořízení těchto dat stále ještě rostla. Můžete si ji představit jak strom, jehož větve se roztahují do prostoru. | On the periphery, there are a few rings of lesser-connected accounts, perhaps indicating that the “bot” network was still being “grown” at the time of its capture; you could think of it like a tree, with branches spreading outwards. |
26 | K této analýze se ovšem nabízí jedna zásadní otázka: Jak si můžeme být jistí, že se v této síti nacházejí převážně automatičtí boti, nikoli reální lidé? | But there was one crucial question in this analysis: how was it possible to be sure that the network consisted chiefly of bots and not real humans? |
27 | NodeXL nesbírá jen informace o tom, kdo koho sleduje. | NodeXL doesn't just gather information on who follows whom. |
28 | Pořizuje také metadata - veřejně dostupné detaily o každém účtu na Twitteru a o jeho chování. | It also acquires metadata-the publicly-available details of each Twitter account and its behavior. |
29 | Tyto informace ukázaly, že ze sítě 2 900 účtů nemělo 87 % profilů vyplněnou informaci o časové zóně, 92 % žádné oblíbené tweety. | This shows that out of the 2,900-strong network, 87% of profiles had no timezone information and 92% no Twitter favorites. |
30 | Ovšem v náhodném vzorku 11 282 obyčejných uživatelů Twitteru (vytvořeném z účtů, v jejichž zprávách bylo použito slovo „and“) nemělo jen 51 % žádnou časovou zónu a pouhých 15 % žádné oblíbené tweety (oba tyto rysy by mohly být označeny za „lidské“ chování). | But in a randomized sample of 11,282 average Twitter users (based on accounts that had tweeted the word “and”) only 51% had no timezone and tellingly, only 15% had no favorites (both traits of what could be classified as “human” behavior). |
31 | Pro porovnání je níže ukázán graf sestrojený na základě tohoto náhodného vzorku uživatelů Twitteru. | For added comparison, an entity-relationship graph of the randomized Twitter user control network is shown below. |
32 | Na rozdíl od sítě botů má tento graf několik na sebe nenapojených a izolovaných shluků - skupin uživatelů Twitteru, které navzájem nesledují své zprávy. Jde o zcela přirozený jev v případě výběru náhodné skupiny uživatelů. | In contrast with the bots visualisation, this network has several unconnected and isolated clusters: groups of Twitter users that aren't linked to each other-a perfectly normal occurrence in a random group of users. |
33 | Analýza využívání slova „and“ zobrazuje nenapojené, izolované shluky náhodných skupin uživatelů Twitteru. | Shared use of the word “and” results in unconnected, isolated clusters in a random Twitter user group. |
34 | Obrázek vytvořil autor článku. | Image by Lawrence Alexander. |
35 | Po odkrytí tak velké sítě pomocí jediného zdroje jsem se rozhodl ve svém lovu botů pokračovat. | Having unearthed such a large-scale network from a single source, I decided to take the bot-hunting further. |
36 | Při hledání frází typu „kremelští boti“ (hashtag #Kremlinbots nebo #Кремлеботы), „proruští trollové“ nebo „Putinovy loutky“ jsem našel několik uživatelů, kteří ve svých tweetech upozorňovali na domnělé aktivity botů. | Searching Twitter for phrases such as “Kremlin bots”, “pro-Russian trolls” and “Putin sockpuppets,” I found several users sharing screenshots of alleged bot activity. Some also used the #Kremlinbots (#Кремлеботы) hashtag to report sightings. |
37 | Použil jsem stejnou metodu jako v případě tweetů týkajících se Němcova a analyzoval jsem sítě účtů vybrané na základě používání některých klíčových frází, na které upozorňovala širší komunita. Někdy jsem ovšem vzal přímo jen seznam „podezřelých“ uživatelů, který někdo sdílel. | Using the same method as with the anti-Nemtsov tweets, I gathered networks of accounts based around the use of some of the reported key phrases that revealed larger communities-or, in some cases, just a list of users shown in the screenshot. |
38 | Rozdělil jsem se tyto skupiny do vzorků A, B, C a D (o důvodech tohoto značení se zmíním v druhé části analýzy). | These were divided into groups labelled A, B, C and D. (I will elaborate on the reason for this grouping in part two of the analysis.) |
39 | Satirický účet @PressRuissa (nyní pozastaven) paroduje proruská média, jde o směs satiry a komentářů k dezinformacím nebo předpojatosti. | @PressRuissa is a parody account (now suspended) spoofing a pro-Russian media, a mix of satire and commentary on disinformation and bias. |
40 | Jeden z jeho tweetů posloužil jako základ pro skupinu A: | One of its tweets was the starting source for the Group A network: |
41 | Ruští uživatelé Twitteru odhalují, že „Novaja gazeta tutlá aktivity svých botů“, překvapivě unisono. | The Russian tweeters reveal that “Novaya Gazeta covers up their bots' activity” in a surprising unison. (via @nokato) pic.twitter.com/DSwcIKWpDg |
42 | (od uživatele @nokato) | - Falcon News Intl. (@PressRuissa) March 13, 2015 |
43 | Skupina B zahrnovala jiné podezřelé účty, jejichž chování se blížilo předešlým vzorkům. | Group B came from different sources of suspected bot accounts whose behavior seemed to match the previous samples. |
44 | Některé bylo možné identifikovat podle jejich tendence přejít z ruštiny do angličtiny s chybovou hláškou „RSS in offline mode“. Ta byla nejspíše způsobena chybou v softwaru, který je ovládal. | Some were identified by their tendency to change from Russian language to English with the single error message “RSS in offline mode”-presumably caused by a glitch in their control software. |
45 | RSS in offline mode | RSS in offline mode |
46 | Pro skupinu C byl použit tweet Devina Acklese, analytika think tanku CASE Ukraine. | For the remaining sources, a tweet by Devin Ackles, an analyst for think tank CASE Ukraine provided the basis for Group C. |
47 | Proruští boti v ofenzívě po útoku na Mariupol. | Pro-Russian bots on the offensive following attack on #Mariupol pic.twitter.com/AiH95Dp1wb |
48 | A nakonec Vitalij Moroz z organizace Internews Ukraine sdílel snímek obrazovky, který posloužil pro vznik skupiny D. | - Devin Ackles (@DevinAckles) January 24, 2015 And lastly, Vitaliy Moroz of Internews Ukraine shared a screencap of bot accounts that formed the sample for Group D. |
49 | Ruští boti rozšiřují poselství války: „Myslím, že začne velká válka. “ | Russian bots have disseminated the message of war: “I think Great War will start!” |
50 | Ze všech čtyř skupin byla vytvořena jediná sada dat, která dohromady čítá 17 590 účtů na Twitteru. | #RussiainvadedUkraine #russia pic.twitter.com/kCVDioIAGH - Vitaliy Moroz ENG (@vitaliymoroz) February 13, 2015 |
51 | Stejně jako v případě tweetů týkajících se Němcova se potvrdilo, že většinu těchto účtů opravdu tvořili boti. | All four groups were merged into a single data set, resulting in a total of 17,590 Twitter accounts. |
52 | 93 % nemělo v profilu vyplněnou zeměpisnou polohu, 96 % časovou zónu a 97 % nemělo žádné oblíbené tweety. | As with those producing the anti-Nemtsov tweets, the metadata confirmed that the vast majority were indeed bots. |
53 | Také navzdory průměrné produkci 2 830 tweetů nevstupovaly tyto účty téměř nikdy do kontaktu s ostatními uživateli, ať už přímým zmíněním nebo odpovědí na jejich tweety. | 93% showed no location on their profile, 96% had no time zone information and 97% had no Twitter favorites saved. |
54 | Boti píšou tweety, ale neinteragují - většina uzlů vykazuje smyčky, což ukazuje na absenci interakce s ostatními uživateli zmíněním nebo odpovědí na jejich tweety. | Also, despite having produced an average of 2,830 tweets, the accounts almost never interacted with other Twitter users through @replies or @mentions. The bots broadcast tweets, but don't interact. |
55 | Obrázek vytvořil autor článku. | Image by Lawrence Alexander. |
56 | Je zajímavé, že většině botů byla dána „západně“ znějící jména jako třeba barnardgrant, terancebarnaby, terencecoward a duncanstarks. | Intriguingly, many of the bots had been given western-sounding names such as barnardgrant, terancebarnaby, terencecoward and duncanstarks. |
57 | Ale ještě překvapivější výsledek jsem získal, když jsem zobrazil tyto skupiny botů podle jejich vztahů. | But an even more surprising result came when I visualized the bot groups' follow relationships. |
58 | Ačkoli byly vzorky vybrány z různých zdrojů, byla výsledná síť silně propojena. | Even though the samples had been taken from four separate sources, the combined network was found to be intensely interconnected. |
59 | Všech 17 590 účtů ze čtyř vzorků. | All 17,590 accounts from all four sources. |
60 | Povšimněte si silného propojení a nepřítomnosti izolovaných ostrůvků. | Note the tight interconnections and lack of isolated clusters. |
61 | Obrázek vytvořil autor článku. | Image by Lawrence Alexander. |
62 | Tyto výsledky ostře kontrastují s náhodným vzorkem, který byl použit jako kontrolní skupina - v obrázku výše nevidíme žádné izolované skupiny nebo jedince. | This sharply contrasts with the randomized control sample: the final dataset showed no isolated groups or outliers at all. |
63 | To přesvědčivě potvrzuje domněnku, že tito boti byli vytvořeni jediným úřadem. A zdá se, že vše ukazuje na Moskvu. | This strongly supports the idea that the bots were created by a common agency-and the weight of evidence points firmly towards Moscow. |
64 | Ve svém příštím článku se podívám na časovou posloupnost zakládání účtů těchto botů a na korelaci s politickými událostmi v Rusku a na Ukrajině. | In my next post I will look at the timeline behind the creation of the bots, and see how it correlates with political events in Russia and Ukraine. |