"Українська криза" поряд з насиллям та хейтом: Twitter оприлюднив свій алгоритм рекомендацій

3 квітня 2023, 19:31
Читать новость на русском

Джерело:

Engadget

Після нещодавнього зливу початкового коду Twitter, компанія сама опублікувала його на GitHub. Зокрема, можна побачити суперечливі алгоритми соцмережі, які визначають, кого показати в стрічці, а кого сховати в "тіньовий бан". Вгадайте, в якій категорії опинилась Україна.

У блозі компанії оголосили "нову еру прозорості для Twitter". За задумом Ілона Маска, це зробить соцмережу схожою на Linux, де розвиток здійснюватиметься шляхом залучення зовнішніх розробників для поліпшення алгоритмів і усунення помилок – кожен охочий зможе запропонувати свої правки до коду.

Раніше Початковий код Twitter злили в інтернет

Що стало відомо з коду

Ентузіасти вже почали вивчати код і знайшли там чимало цікавого. Варто зазначити, що опублікований код – лише мала частина всього коду Twitter. Вона стосується лише того, як твіти відображаються у стрічці "Для вас", але не зачіпає код, що лежить в основі пошукового алгоритму або того, як контент відображається в інших частинах Twitter.

  • Повідомляється, що рекомендаційна нейронна мережа сканує сотні мільйонів твітів за величезною кількістю параметрів, щоб виділити близько 1500 повідомлень, які найбільше відповідають інтересам кожного конкретного користувача. Вони ранжуються за ймовірністю взаємодії користувача з автором твіту – чим більша ймовірність, тим більше його твітів з'являється.
  • Потім ці твіти проходять додатковий фільтр і потрапляють у розділ рекомендацій "Для вас". У цьому розділі половина твітів від авторів, за якими користувач стежить, а інша половина від авторів, які йому не знайомі.
  • Твіти від незнайомих користувачів підбираються на основі сподобань ваших підписок, а також схожих з вашими твітів.

З цікавого:

  • Алгоритм Twitter спеціально позначає, чи є автором твіту Ілон Маск. Це може дати ще одне пояснення, чому твіти Маска з'являються так часто.
  • Алгоритм має позначки, які вказують на те, чи є автор твіту "впливовим користувачем", а також на те, чи є він республіканцем або демократом.

Коли Маска запитали про цей аспект алгоритму в просторі Twitter, він відповів: "Я згоден, що цього не повинно бути. Він точно не повинен ділити людей на республіканців і демократів, це не має ніякого сенсу". Пізніше інженер Twitter пояснив, що категорії призначені лише для "відстеження статистики й не мають нічого спільного з алгоритмом". Ці ярлики начебто призначені для того, щоб "переконатися, що ми неупереджено ставимося до однієї групи порівняно з іншою". При цьому розробник не пояснив, чому Маск має власну категорію, а сам глава компанії каже, що це "дивно" і він взагалі чує про це вперше. Twitter Space завершився менш ніж через хвилину після цього питання.

На другому зображенні з цього твіту видно категорії "author_is_elon", "author_is_power_user", "author_is_democrat" та "author_is_republican"

  • Серед інших факторів, які враховуються при оцінці твіту, є те, чи був він написаний понад 30 хвилин тому, чи є в ньому фотографії, і чи він написаний "досвідченим користувачем", що, на думку деяких, означає старий перевірений обліковий запис.

Україна в коді Twitter

Цікавий момент можна знайти про Україну. Війна там називається "Українською кризою", і розміщена вона в тому ж блоці неприйнятних тем, що й насильницький, токсичний, шахрайський і ненависницький контент.

В тексті коду прямо не вказується, що ця тема є забороненою. Але оскільки "Українська криза" знаходиться з насиллям і хейтом під одним і тим же маркуванням "Space Safety Label", яке змушує соцмережу знижувати певний контент у видачі в стрічці, можна впевнено казати, що війну в Україні зрівняли саме з таким вмістом.

"Твіттер Ілона заважає українським твітам. Давно підозрювали, нарешті підтвердилося"

Українські користувачі вже давно помітили, що їхні твіти почали отримувати менше охоплень, ніж раніше. Завдяки нещодавно доданій кнопці перегляду статистики перегляди твітів можна легко побачити.

Подібні маркування використані також для січневих протестів у Бразилії, виборів у США, Франції, Філіппінах, а також щодо вакцини від COVID-19. Однак зараз ці маркування вказані як "застарілі", тобто раніше вони використовувались, а тепер були вимкнені.
  • Україна є єдиною темою пов’язаною з геополітикою в списку заборон.
  • Водночас Ілон Маск є єдиним користувачем соціальної мережі з індивідуальними привілеями просування.
  • З коду неясно, чи компанія знижує видачу лише твітів про війну, чи взагалі контент всіх українців на будь-яку тему.