Протидія дезінформації
9 хв читання
Рік дослідження: 2019

Несправжній я: фейкові акаунти на сторінках українських ЗМІ

showcase image
Протидія дезінформації

Про проєкт

Увага! Цей проєкт проводився в рамках компанії Artellence і разом з подібними проєктами став передумовою створення ГО “Асоціація розвитку великих даних та інформаційних технологій України” з залученням експертів, які безпосередньо впроваджували цей проєкт.

Активні користувачі Facebook повідомляють, що надають перевагу цій мережі як джерелу інформації через те, що там вона агрегована. Не потрібно ходити по різних сайтах, якщо у Facebook-стрічці є сторінки новинних медіа.

Мета дослідження — дослідити, як боти формують суспільну думку на сторінках українських медіа.

Чому це важливо?

На те, які пости користувач побачить найпершими у своїй стрічці, впливає ряд факторів, і один з них — це кількість коментарів. Та якщо коментарі не від справжніх людей і цікавість до теми підігрівається штучно? Тоді користувач замість новин, які цікаві багатьом людям, з більшою імовірністю бачитиме новини, які просуваються певними алгоритмами, і його думки будуть формуватися на основі недостовірної інформації.

Методологія дослідження

Період дослідження: з 01.05.2019 по 08.07.2019.

  • проаналізували найбільш коментовані ботами Facebook-дописи на сторінках найпопулярніших медіа. Вибірку медіа формували на основі списку найпопулярніших ЗМІ України, до якого додали сторінки з найбільшою кількістю підписників з України. Загалом до цієї вибірки увійшли 332 Facebook-сторінки;
  • була проаналізована п’ятірка найпопулярніших медіа, які регулярно читають та яким довіряють:
    • Сегодня (39,8% коментарів — від ботів),
    • Obozrevatel (34,7%), УНІАН (30,6%),
    • Українська правда (28,8%),
    • Politeka (22,7%);
  • були проаналізовані коментарі на сторінках де боти були найактивніші, у яких згадувались Володимир Зеленський, Петро Порошенко, Юлія Тимошенко, Володимир Гройсман та Святослав Вакарчук. Ми розподілили ці коментарі за конотацією (позитивна — нейтральна — негативна);
  • було згрупувано коментарі ботів під найбільш резонансними новинами у меседжі. Меседж — це основне повідомлення, яке несе в собі певна кількість ботських коментарів. У кожний меседж увійшли пости, які були написані різними формулюваннями, але містили однаковий сенс. Ми описали тільки ті меседжі, у які ввійшло більше 50 коментарів ботів.

Як визначалися боти:

  • для визначення ботів Artellence розробив алгоритм машинного навчання, що аналізував публічну інформацію з українського сегменту Facebook у період 9 місяців, з листопада 2018 року по липень 2019 року;
  • враховувалися як коментарі, так і інформація з профілів;
  • до аналізу бралися лише користувачі, що залишили більше 10 коментарів на політичні теми;
  • в результаті ботом ми вважаємо тих користувачів, яких модель віднесла до ботів з ймовірністю 95% (ми використали 8 характеристик ботів, які детально описані в Проєкті “Дослідженні “Зітри це, якщо зможеш. Як живуть українські боти на сторінках українських політиків”).

Як відбирались новини:

  • новини були відібрані за допомогою методу обробки природної мови machine learning — векторного аналізу (NLP Word Vectors). Алгоритм аналізував тексти постів та групував схожі за змістом в одну новину.

Результати дослідження

Активність ботів на сторінках Facebook:

  • найбільш активними виявилися боти на сторінках маловідомих ЗМІ з невеликою кількістю підписників (до 200 тисяч). На них більше половини усіх коментарів зроблені ботами;
  • у трійці лідерів:
    • NewsFacts.com (56% ботських коментарів, 24 832 фоловерів),
    • Україна24 (53% коментарів ботів від усіх коментарів та 169 659 фоловерів),
    • Українські новини (52% коментарів публікують боти, 6 970 фоловерів);
  • у топ-20 сторінок, де кількість коментарів ботів перевищує 45%, увійшли 2 сторінки популярних українських медіа: 
    • РБК-Україна* (399 256 фоловерів),
    • Страна.UA (78 984 фоловерів);
  • до топ-20 за кількістю несправжніх коментарів увійшли також і 15 іноземних сторінок з великою українською аудиторією (кількість коментарів ботів на них не перевищувала 31%. У середньому на таких ресурсах ботські коментарі становлять 18%):
    • 5 міжнародних новинних агентств,
    • 9 медіа з росії (серед яких 6 великих відомих медіа),
    • одне ЗМІ з Ізраїлю;
  • найбільше співвідношення коментарів ботів до всіх коментарів на сторінках:
    • СGTN на русском (31%),
    • Chastime (29%),
    • на підрозділах видання DW українською (27%) та російською (25%) мовами;
  • найменший відсоток ботів у коментарях:
    • Esquire Russia (8%),
    • Журнал «Нож» (5%);
  • на третині медіа з нашої вибірки (115 з 332 сторінок) понад 30% коментарів становлять коментарі ботів. До них входять 10 сторінок ЗМІ з топ-20 ЗМІ з найбільшим охопленням:
    • РБК-Україна** (44% коментарів на сторінці становлять коментарі ботів),
    • Страна.UA (43%),
    • 112 канал (41%),
    • Сегодня (40%),
    • Гордон (40%),
    • Gazeta.ua (38%),
    • Цензор.НЕТ (35%),
    • Obozrevatel (35%),
    • Факти ICTV (34%),
    • УНІАН (31%).

Поведінка ботів:

  • боти активно коментують пости на сторінках медіа з великою аудиторією, але найбільше вони «накручують» перегляди на сторінках маловідомих ЗМІ;
  • боти можуть коментувати дописи для створення ілюзії актуальності та зацікавленості у певній темі;
  • мета створення ботів — ідеологічна, вони намагаються сформувати певний порядок денний та вплинути таким чином на суспільну думку.

Боти на сторінках медіа, яким довіряють:

  • п’ятіркою найпопулярніших медіа, які регулярно читають та яким довіряють є видання:
    • Сегодня (39,8% коментарів — від ботів),
    • Obozrevatel (34,7%), УНІАН (30,6%),
    • Українська правда (28,8%),
    • Politeka (22,7%);
  • ми проаналізували коментарі на цих сторінках, у яких згадувались Володимир Зеленський, Петро Порошенко, Юлія Тимошенко, Володимир Гройсман та Святослав Вакарчук. Ми розподілили ці коментарі за конотацією (позитивна — нейтральна — негативна):
    • для кожного з досліджуваних політиків найбільше ботських коментарів серед критики та негативу (в середньому 18% від усіх коментарів, для яких ми визначили конотацію),
    • ботських коментарів з нейтральною конотацією у середньому більш ніж у 2,5 рази менше, ніж хейтерських: 6,8% проти 18%. А позитивних утричі менше, ніж негативних — у середньому 5,7%,
    • про Володимира Зеленського боти писали майже у півтора рази більше негативних та нейтральних коментарів, ніж про про Петра Порошенка. Позитивних коментарів від ботів про Зеленського майже у п’ять разів більше, ніж у колишнього президента (21% позитиву про Зеленського проти 4% позитиву про Порошенка),
    • про Вакарчука пишуть тільки на трьох ресурсах (Сегодня, Politeka та УНІАН) та переважно негатив — 77% від усіх ботських коментарів про нього були з критикою,
    • про Юлію Тимошенко боти на цих ресурсах пишуть хоч і порівняно небагато (всього 4,4% ботських коментарів стосуються пані Тимошенко), зате переважно позитив. Він становить 58% від усіх ботських коментарів про неї на сторінках цих ресурсів,
    • майже нічого на сторінках цих медіа боти не пишуть про Володимира Гройсмана.

Боти у коментарях під резонансними новинами:

  • найбільш обговорюваними новинами на сторінках медіа за період травень-липень 2019 року були суспільно-політичні повідомлення: марш ЛГБТК+ та повернення Росії в ПАРЄ;
  • за часткою ботів у коментарях лідирують новини про державну політику: заяви Гройсмана, мітинг Порошенко, суперечка Тимошенко та Гройсмана на одному з телеканалів (про це є окреме Дослідження “Зітри це, якщо зможеш. Як живуть українські боти на сторінках українських політиків”);
  • Марш ЛГБТ:
    • новина викликала найдільший суспільний резонанс. Вона зібрала 21 640 коментарів, із них 15 954 від справжніх людей та 5 686 (26%) від ботів,
    • визначили 635 основних меседжів у коментарях ботів. Їх небагато порівняно з іншими топ-новинами, оскільки вони більш одноманітні та концентровані. Всі вони були негативними, з різним ступенем агресії,
    • більшість коментарів були з текстом «Не підтримую ЛГБТК+» (180 коментарів із 635), 150 коментарів висловлювалися проти колони ЛГБТК+-військових. На третьому місці серед ботських коментарів про цю новину повідомлення у стилі «Орієнтація-власний вибір кожного, не проти ЛГБТК+, але марш — це занадто». Таких повідомлень 52;
  • росія повертається в ПАРЄ:
    • на другому місці за резонансом. Під новиною коментарів ботів також 26% (2 781 коментар бота проти 8 078 коментарів справжніх людей),
    • для 37,5% (1 079) коментарів ботів ми визначили основне повідомлення. Переважно вони критикували Європу (312 коментарів з 1 079),
    • домінували повідомлення типу «Європа — продажна» (200 ботських коментарів), «Делегацію в ПАРЄ треба міняти!» (158 повідомлень) та «Треба вийти з ПАРЄ та посваритися з Європою» (112 повідомлень),
    • під цією новиною було багато меседжів з критикою дій чинного (217 коментарів) та колишнього (90 коментарів) президентів.

Рекомендації

1. Опублікувати результати цього дослідження;
2. Проводити подібні дослідження з певною періодичністю задля перевірки реальної громадської думки і можливості сформувати громадську думку на основі реальних даних;
3. Публікувати результати — це може позитивно вплинути на зменшення дезінформації у мережі, оскільки в українського суспільства буде місце, де можна побачити, які коментарі фейкові, а які реальні;
4. Проводити такі дослідження щодо інших категорій сторінок.

Партнери

Інші проєкти

Дослідження

ЛГБТК+

Дослідження

Протидія дезінформації
Завантажити ще