"Украинский кризис" наряду с насилием и хейтом: Twitter обнародовал свой алгоритм рекомендаций
Источник:
EngadgetПосле недавнего слива исходного кода Twitter, компания сама опубликовала его на GitHub. В частности, можно увидеть противоречивые алгоритмы соцсети, определяющие, кого показать в ленте, а кого спрятать в "теневой бан". Угадайте, в какой категории оказалась Украина.
В блоге компании объявили "новую эру прозрачности для Twitter". По замыслу Илона Маска, это сделает соцсеть похожей на Linux, где развитие будет осуществляться путем привлечения внешних разработчиков для улучшения алгоритмов и устранения ошибок – каждый желающий сможет предложить свои правки в код.
Ранее Исходный код Twitter слили в интернет
Что стало известно из кода
Энтузиасты уже начали изучать код и обнаружили там немало интересного. Следует отметить, что опубликованный код – лишь малая часть всего кода Twitter. Она касается только того, как твиты отображаются в ленте "Для вас", но не затрагивает код, лежащий в основе поискового алгоритма или того, как контент отображается в других частях Twitter.
- Сообщается, что рекомендательная нейронная сеть сканирует сотни миллионов твитов по множеству параметров, чтобы выделить около 1500 сообщений, наиболее отвечающих интересам каждого конкретного пользователя. Они ранжируются по вероятности взаимодействия пользователя с автором твита – чем больше вероятность, тем больше его твитов появляется.
- Затем эти твиты проходят дополнительный фильтр и попадают в раздел рекомендаций "Для вас". В этом разделе половина твитов от авторов, за которыми пользователь следит, а другая половина от авторов, которые ему не знакомы.
- Твиты от незнакомых пользователей подбираются на основе лайков ваших подписок, а также схожих с вашими твитами.
Из интересного:
- Алгоритм Twitter специально обозначает, является ли автором твита Илон Маск. Это может дать еще одно объяснение, почему твиты Маска появляются столь часто.
- Алгоритм имеет отметки, указывающие на то, является ли автор твита "влиятельным пользователем", а также на то, является ли он республиканцем или демократом.
Когда Маска спросили об этом аспекте алгоритма в Пространстве Twitter, он ответил: "Я согласен, что этого не должно быть. Он точно не должен делить людей на республиканцев и демократов, это не имеет никакого смысла". Позже инженер Twitter объяснил, что категории предназначены только для "отслеживания статистики и не имеют ничего общего с алгоритмом". Эти ярлыки якобы предназначены для того, чтобы "убедиться, что мы непредвзято относимся к одной группе по сравнению с другой". При этом разработчик не объяснил, почему у Маска есть собственная категория, а сам глава компании говорит, что это "странно" и он вообще слышит об этом впервые. Twitter Space завершился менее чем через минуту после этого вопроса.
На втором изображении из этого твита видны категории "author_is_elon", "author_is_power_user", "author_is_democrat" и "author_is_republican"
- Среди других факторов, учитываемых при оценке твита, есть то, был ли он написан более 30 минут назад, есть ли в нем фотографии, и написан ли он "опытным пользователем", что, по мнению некоторых, означает старую проверенную учетную запись.
Украина в коде Twitter
Интересный момент можно найти об Украине. Война там называется "Украинским кризисом", и размещена она в том же блоке неприемлемых тем, что и насильственный, токсичый, мошеннический и ненавистнический контент.
В тексте кода прямо не указывается, что эта тема запрещена. Но поскольку "Украинский кризис" находится с насилием и хейтом под одной и той же маркировкой "Space Safety Label", заставляющей соцсеть снижать определенный контент в выдаче в ленте, можно уверенно говорить, что войну в Украине сравнили именно с таким содержанием.
"Твиттер Илона мешает украинским твитам. Давно подозревали, наконец подтвердилось"
Украинские пользователи уже давно заметили, что их твиты стали получать меньше охватов, чем раньше. Благодаря недавно добавленной кнопке просмотра статистики просмотры твитов можно легко увидеть.
Подобные маркировки использованы также для январских протестов в Бразилии, выборов в США, Франции, Филиппинах, а также для вакцины от COVID-19. Однако сейчас эти маркировки указаны как "устаревшие", то есть раньше они использовались, а теперь были отключены.- Украина является единственной темой, связанной с геополитикой в списке запретов.
- В то же время, Илон Маск является единственным пользователем социальной сети с индивидуальными привилегиями продвижения.
- Из кода неясно, снижает ли компания выдачу только твитов о войне, или вообще контент всех украинцев на любую тему.