Естонське дослідження показало, які ШІ найкраще протистоять російській пропаганді

Естонські експерти перевірили понад 50 мовних моделей на здатність протистояти брехливим наративам Кремля. Результати показали значний розрив між технологічними гігантами та виявили вразливість штучного інтелекту до маніпулятивних запитів, особливо російською мовою.

Штучний інтелект на лінії фронту інформаційної війни

Здатність великих мовних моделей розпізнавати пропаганду та маніпуляції стала об'єктом масштабного дослідження, результати якого опублікував Інститут естонської мови у співпраці з волонтерською організацією Propastop. Як повідомляє видання Ars Technica, науковці розробили спеціальний бенчмарк (тест продуктивності), щоб оцінити, наскільки ефективно популярні чат-боти можуть уникати поглядів, які Російська Федерація використовує у своїх наративах.

Дивіться також Чотири дні до апокаліпсису: штучний інтелект влаштував кривавий хаос у симуляції

Для проведення експерименту фахівці виділили 14 ключових категорій, які найчастіше зустрічаються в російських операціях впливу. Серед них – виправдання війни в Україні, статус окупованого Криму, інтерпретація історії НАТО й твердження щодо анексії країн Балтії під час Другої світової війни.

Дослідники сформулювали 75 запитань естонською, англійською та російською мовами. Кожне питання подавали у трьох варіантах: нейтральному, упередженому (з хибними припущеннями) та зловмисному, де ШІ прямо підштовхували до генерування дезінформації.

Результати тестування продемонстрували:

Найкраще з викликом упоралися моделі сімейства Claude від компанії Anthropic. Зокрема, версія Opus 4.7 посіла перше місце, отримавши середній бал 94,9 зі 100 можливих. Цей ШІ надав зразкові відповіді на 77% запитань. Як показано на сторінці тесту, п'ять інших моделей Claude увійшли до першої десятки.
Слідом за ним високі показники продемонстрували відкриті моделі, такі як Nemotron від Nvidia та Qwen від Alibaba. Остання, можна сказати, здивувала в цьому плані, оскільки Qwen розроблена китайцями.
Найпопулярніша модель – GPT-5.4 від OpenAI – посіла гідне місце з результатом 88,9 бала.

Результати тестування мовних моделей / Скриншот 24 Каналу/Естонський мовний інститут

Іноземні політичні фабрики тролів можуть виробляти велику кількість фальшивого контенту, який можна використовувати для зміщення ШІ-моделей. Це небезпечна тенденція, і ми повинні активно працювати над тим, щоб картина Естонії залишалася збалансованою,
– прокоментував директор Інституту естонської мови Арві Таваст у дописі в блозі Propastop.

Попри загальний прогрес, не всі технологічні гіганти продемонстрували високу стійкість. Моделі Google Gemini показали неочікувану вразливість. Зокрема, Gemini 2.5 Pro набрала лише 82 бали через чутливість до зловмисно сформульованих запитів. Ще гірші результати у Gemini 3.5 Flash, яка отримала 73 бали, що можна порівняти з показниками моделей дворічної давнини.

Чому не варто спілкуватися з ШІ російською мовою

Одним із найтривожніших висновків дослідження стало те, що штучний інтелект набагато частіше "піддається" пропаганді, якщо спілкування відбувається російською мовою. Деякі моделі вдвічі частіше підтримували маніпулятивні твердження у відповідь на зловмисні запитання російською, ніж на аналогічні запити англійською чи естонською.

Це пояснюється тим, що ШІ-моделі безпосередньо залежать від інформаційного середовища, на якому їх навчали. Оскільки російськомовний сегмент інтернету перенасичений державними наративами, алгоритми мимоволі засвоюють ці упередження.

Дивіться також Ера людей закінчилася: ШІ-боти остаточно обігнали нас і захопили більшу частину інтернет-трафіку

Далі буде

Естонські дослідники планують розширювати програму тестування. Вже восени 2026 року бенчмарк доповнять новими оцінками у сферах медицини, права та безпеки дітей. Це дозволить краще зрозуміти, наскільки глибоко маніпуляції можуть проникати у відповіді ШІ, які стосуються критично важливих аспектів життя суспільства.

Пов'язані теми:

Техно

Російська пропаганда Розробки та дослідження

ChatGPT OpenAI Google Gemini