# | rus | zht |
---|
1 | В Twitter говорят о Путине и Порошенко: языковой анализ | 推特語言解密:推友怎麼看俄、烏總統? |
2 | | 圖片由 Tetyana Lokot 製作 |
3 | Редакция изображения: Татьяна Локоть. | 本篇文章是一份公民媒體資料分析計畫的其中部分。 |
4 | Эта статья - часть проекта по анализу данных по гражданским медиа, проводимого в качестве совместной инициативы «Эха Рунета» и Мэрилендского института технологий в области гуманитарных наук [анг]. | 該計畫是由回聲計畫(RuNet Echo)和馬里蘭科技暨人文學院共同合作。 請上總統們的所有貼文一文頁面,探索完整的文章系列。 |
5 | Вы можете изучить полную серию статей на странице рубрики«Все президентские твиты». | 去年10月我們開始蒐集推特上的資料,當時我們最感興趣的內容便是俄烏兩國民眾對於他們總統的談論內容。 |
6 | | 但我們決定把網撒得更廣一些,蒐集所有包含兩國總統姓氏俄文(Путин 和 Порошенко)、烏克蘭文(Путін 和 Порошенко)及英文(Putin 和 Poroshenko)等不同語言寫法的推文。 |
7 | Когда в прошлом октябре мы начали собирать наши данные, нас в основном интересовало, что говорят о своих президентах россияне и украинцы. | 最終我們蒐集到超過6百萬筆的推文,確切來說是 6,342,294 筆推文。 |
8 | Но мы решили забросить сеть побольше и собрать все твиты, содержащие фамилии глав государству на русском (Путин и Порошенко), украинском (Путін и Порошенко) и английском (Putin и Poroshenko). | 我們取得所需資料後便面臨一個問題:該如何判斷發那些關於普丁和波洛申科的推文的推友是俄國人或烏克蘭人,而不是英國人或韓國人? 其實,推文內容和推友的帳號包含了許多特性,而這些可以幫我們找出推友所在的國家和使用的語言。 |
9 | | 首先,在個人檔案裡有推友所選的位置;接著,在帳戶和介面也有推友自己設定的語言;第三,每一筆推文也有語言指示工具,由使用者鍵盤設定和推文內容所決定;最後,一些推友在使用他們智慧型手機時,地理標記也會開啟,這樣一來每筆推文都會具有一組可以配在地圖上的經緯值。 |
10 | В конце концов, мы получили более шести миллионов твитов - 6 342 294, если точно. | 當然這些選項並不會百分百準確地告訴你推友的國籍,但是這些也可以告訴我們一些有用的資訊。 |
11 | Собрав данные, мы столкнулись с проблемой: как мы можем отличить, когда пишет в Twitter о Путине или Порошенко россиянин или украинец, а когда - британец или кореец? | 在本章節裡,我們會帶各位看看,在資料裡的推文的語言使用。 |
12 | Есть несколько признаков твитов и аккаунтов, которые помогают помочь страну и язык пользователя. | 而推文的地理標記和其他針對國籍推文的更多討論,則留待下一次談。 |
13 | Во-первых, местоположение, указанное пользователем в профиле. | 以下是我們對這多達六百萬筆的推文資料所做出的分析結果。 |
14 | Далее, язык, выбранный пользователем для аккаунта и интерфейса. | 各語言的推文數量。 |
15 | В-третьих, каждый твит также имеет языковой индикатор, определяемый настройками клавиатуры и содержанием твита. | 推文發表日從2014年10月12日至11月30日,共6,342,294 則推文樣本。 |
16 | Наконец, некоторые пользователи включают на своих смартфонах отслеживание по геолокации, и в таком случае каждый твит также получает набор координат, которые можно проследить по карте. | 所有的推文包含以下至少一項關鍵字詞:poroshenko, putin, порошенко, путин, путін。 |
17 | Никакая из этих опций не раскрывает вам национальность пользователя со 100-процентной уверенностью, конечно же, но каждая из них даёт полезную информацию. | 很明顯地,在推文中所使用的語言,以俄語佔大多數,占了資料庫中至少一半的推文。 |
18 | Итак, в этом выпуске мы рассмотрим использование различных языков в твитах из нашего набора данных и оставим твиты с геолокациями и дальнейшее обсуждение сообщений из конкретных стран на следующий раз. | 但是這些以俄語發文的推友不只包括俄國人,也包含烏克蘭人、哈薩克人、摩爾多瓦人和其他前蘇聯加盟共和國的公民。 且說俄語的移民遍及各地,從義大利到澳大利亞,他們的推文在我們的資料庫中也佔了極大部分。 |
19 | Вот анализ нашего архива шести миллионов твитов. | 雖然俄語佔最多,但是烏克蘭人卻是時斷時續地以俄語和烏語貼文。 |
20 | Сразу очевидно, что больше всего места занимают твиты на русском, составляя более половины всех твитов в массиве данных. | 所以其實以烏語和俄語寫成的貼文總數和俄烏兩國推特使用者總數,兩者並無關連(在2014年俄羅斯的推特使用者超過800萬,而在6月烏克蘭統計約有60萬位推特使用者)。 |
21 | Но пользователи Twitter, публикующие сообщения на русском, - это не только россияне, но также украинцы, казахи, молдаване и граждане других бывших советских республик. | 此外我們還知道,俄國人和烏克蘭人通常也會以非母語來貼文,例如英語和法語,在烏克蘭政治劇變的那段期間這現象尤其明顯。 |
22 | Русскоговорящие эмигранты во всех странах от Италии до Австралии также вносят вклад в серьёзное присутствие этого языка в нашем наборе данных. | 這現象和Poell、Darmoni在2012年突尼西亞革命研究一文中提到的推文變化情形相吻合,人們以英語來推文,藉以吸引西方主流媒體和英語使用者的興趣。 |
23 | Хотя русский удерживает первое место, многие украинцы пишут то на русском, то на украинском, так что реальной корреляции между числом твитов на русском и на украинском и числом пользователей Twitter в России (более восьми миллионов в 2014 году) и на Украине (около 600 000 на июль 2014 года) нет. | 另一個讓我們這次語言分析更顯複雜的因素,就在於主題標籤(Hashtag)的使用:推友同時使用拉丁字母、非拉丁字母(譯註: 此指西里爾字母)。 在卡特理娜. |
24 | | 庫森諾克(Katerena Kukusenok)針對在烏克蘭親歐盟示威期間發佈的數百萬筆推文所做的分析中,她發現了「有為數甚多的推文每一筆都同樣同時使用了許多語言」,例如:#Євромайдан、 #Евромайдан、#Euromaidan(註: 三者依序為烏克蘭語、俄語、英語的寫法,前二者屬於西里爾文字系統),這麼做無非是為了增加自己推文曝光的機會。 |
25 | Кроме того, мы знаем, что и русские, и украинцы часто пишут в Twitter не на родных языках, а, например, на английском и французском. | 雖然要解釋俄文和烏克蘭文為什麼會佔據我們語言分析金字塔之頂十分容易,然而要解釋一些其他同樣佔據頂端的語言,卻沒這麼簡單,尤其如果把我們樣本分析的結果,拿來和統計更廣的「推特最常使用語言」互做比較的話。 |
26 | Это особенно очевидно во времена политических потрясений, согласуясь с поведением, которое Поэлл (Poell) и Дармони (Darmoni) описали в своём исследовании 2012 года о революции в Тунисе [анг], когда люди писали твиты на английском, чтобы привлечь западные СМИ и англоговорящих пользователей. | 每日平均推文語言百分比。 數據來源:Semiocast (以國家列出語言及推文,10%樣本,2013年9月) 、推特。 |
27 | Использование хэштегов на латинице и кириллице одновременно в одном твите - ещё один фактор, затрудняющий языковой анализ. | * 每一個”other”的語言佔少於1% |
28 | Проведя анализ миллионов твитов [анг] во время протестов Евромайдана на Украине, Катерина Куксенок заметила «большое число твитов, использующих равнозначные хэштеги на разных языках» (например, «#Євромайдан #Евромайдан #Euromaidan»), по всей видимости для увеличения распространения твитов. | 英語的人氣當然是最明顯的,因為英語使用者不只來自像是美國、英國等英語系國家,也來自全世界。 |
29 | В то время как нахождение русского и украинского на вершине нашей языковой пирамиды легко объяснить, попадание в топ некоторых других языков менее очевидно, особенно если сравнить результаты по нашему набору с более широкой статистикой наиболее используемых в Twitter языков. | 此外,一般來說西班牙語在推特上也很普遍,我們採計的樣本中也反映出這點。 整體來說,法語則較不普遍,德語甚至更少,不過這兩種語言的貼文在我們的樣本資料中是相當重要的存在。 |
30 | Популярность английского очевидна, так как англоговорящие пользователи живут не только в англоговорящих странах, как США и Великобритания, но и по всему миру. | 這可能是因為,對於烏俄兩國之間針對烏東衝突的斡旋,法德兩國也牽涉其中,所以這兩國的媒體和社群網路用戶也更加關注波洛申科和普丁的大小事。 |
31 | Испанский в целом популярен в Twitter, что также отражено в анализе нашей выборки. | 使用土耳其語和義大利語的推友似乎也是如此。 |
32 | Однако французский в целом менее популярен, а немецкий - и того меньше, и всё же написанные на них твиты занимают достаточно значительную часть в нашей выборке. | 所有提到烏俄兩國總統的土耳其語貼文數量,和德語貼文數量是不相上下的,義大利語貼文總數也差不了多少。 |
33 | Возможно, причина в том, что Франция и Германия тесно связаны с переговорами между Украиной и Россией по поводу конфликта на востоке Украины, из-за чего «обитатели» СМИ и социальных сетей в обеих странах выше среднего уделяют внимание действиям Порошенко и Путина. | 這些足可指出,這些國家對於鄰國命運的關注是有所提高的。 在我們的樣本中,日語寫成的推文數量相對稀少,這樣的數量值得注意。 |
34 | То же, судя по всему, верно и для пользователей Twitter из Турции и Италии, так как число туркоязычных твитов, содержащих упоминания двух президентов, почти равно числу твитов на немецком, и итальянский отстаёт не намного, показывая повышенное внимание этих стран к судьбе соседей. | 在所有的推文裡,以日語寫成的貼文總共佔了16%。 阿拉伯語、馬來語及葡萄牙語寫成的關於俄烏兩國總統的貼文,所佔比例也少到可被忽略,使用印尼語的推友似乎反而比他們更好奇俄烏間的情勢。 |
35 | Примечательно относительно малое количество твитов на японском в нашем наборе, учитывая, что довольно большая часть всего контента Twitter - 16 процентов - создаётся на японском. | 雖然總體來說,全世界都好奇烏俄兩國元首到底在做什麼,不過來自網友的關注和輿論,數量上卻是壓倒性地集中在俄語和烏語推特圈裡。 |
36 | Арабский, малайский и португальский также составляют незначительную часть твитов о президентах России и Украины, тогда как говорящие на индонезийском пользователи Twitter, судя по всему, более заинтересованы этим вопросом. | 我們期望在深掘其中的同時,也能在回聲計畫頁面(RuNet)上帶給你有關政治討論的新見解,讓你能更仔細去理解,弗拉基米爾. |
37 | Хотя миру в целом очевидно интересны действия лидеров России и Украины, наиболее заинтересованы, судя по всему, пользователи русскоязычной и украинской сфер Twitter. | 普丁與彼得羅. 波洛申科兩人對烏俄兩國的推友們來說意味著什麼。 |
38 | Продалжая их исследование, мы надеемся представить вам новый взгляд на политические споры и обсуждения в Рунете и более сложное понимание того, что Владимир Путин и Пётр Порошенко значат для пользователей Twitter на Украине и в России. | 譯者:Chien-An Wang 校對:Timmy Shen |