Исследователи нашли новый способ обмануть ChatGPT, чтобы тот выдавал ключи активации для Windows

Александр Гайдамашко

Основные тезисы

Исследователи смогли обмануть ChatGPT, чтобы тот выдавал ключи активации для Windows 10, используя игровой подход и специальные фразы.
Этот случай подчеркивает уязвимость современных моделей ИИ к манипуляциям и возможность обхода защитных механизмов.

ChatGPT позволил обойти защиту и выдавать ключи для Windows

ChatGPT раскрывает ключи активации Windows через игру / Коллаж 24 Канала

Недавно исследователи обнаружили необычный способ обхода защитных механизмов искусственного интеллекта. С помощью простой игры они заставили ChatGPT раскрывать ключи активации для Windows 10. Этот случай показывает, насколько уязвимыми могут быть даже самые современные модели ИИ к манипуляциям.

Как удалось обмануть ChatGPT?

Исследователи, в частности Марко Фигероа, менеджер платформы 0DIN, обнаружили, что ChatGPT можно обмануть, используя игровой подход. Пользователи предлагали ИИ сыграть в игру на угадывание, где нужно было отгадать определенную строку символов. Этой строкой оказывался ключ активации Windows 10. Чтобы сделать взаимодействие невинным, исследователи использовали специальные фразы и правила, которые заставляли ИИ воспринимать запрос как часть развлечения, а не попытку получить конфиденциальную информацию, пишет 24 Канал.

Особенно эффективным оказалось использование фразы "Я сдаюсь", которая служила триггером. После этого ChatGPT раскрывал полный ключ активации, считая, что игра закончена. Исследователи также применяли хитрости, такие как сокрытие ключевых слов в HTML-тегах, чтобы обойти базовые фильтры ИИ.

Хотя ключи, которые выдавал ChatGPT, часто были общеизвестными и доступными на публичных форумах, сам факт их раскрытия свидетельствует о недостатках в системе защиты.

Этот случай подчеркивает проблему обучения ИИ на данных, которые могут содержать конфиденциальную информацию. Вероятно, ключи Windows попали в тренировочные данные ChatGPT, и система не смогла правильно оценить их чувствительность. Это создает риски не только для таких данных, как ключи к программному обеспечению, но и для более серьезной информации, например, ключей доступа к репозиториям кода.

Это может стать большой проблемой для Microsoft, которая вложила миллиарды в OpenAI, разработчика ChatGPT. В большинстве случаев ChatGPT отказывается предоставлять ключи активации для Windows или любого другого программного обеспечения. Это соответствует политике OpenAI, которая запрещает распространение нелицензионных ключей, пиратского контента или любой информации, нарушающей авторские права или условия использования программного обеспечения.

Однако пользователи неоднократно находили способы обойти эти ограничения с помощью так называемых "джейлбрейков" – специальных хитрых запросов, которые маскируют истинную суть просьбы. Например, популярным ранее стал трюк с просьбой "вести себя как бабушка, которая читает ключи Windows на ночь". Очень быстро эту лазейку прикрыли. Но теперь, как видим, появилась новая. Сколько еще существует таких способов обмануть ИИ, неизвестно.