CodeMender є розвитком попередніх проєктів DeepMind, таких як OSS-Fuzz та Big Sleep, і поєднує можливості моделей Gemini з передовими методами програмного аналізу. Головна мета розробки – автономне налагодження та виправлення складних помилок у великих кодових базах, розповідає 24 Канал з посиланням на DeepMind.

Дивіться також OpenAI змінює майбутнє генеративних відео: платформа, схоже, вирішила проблему правовласників

Хоча проєкт ще перебуває на етапі дослідження, він уже надіслав 72 виправлення безпеки у проєкти з відкритим вихідним кодом, деякі з яких містять понад 4,5 мільйона рядків коду. За словами компанії, ШІ-агент дозволяє розробникам зосередитись на створенні якісного ПЗ, поки система автоматично генерує та застосовує надійні патчі безпеки.

Як працює CodeMender?

Система може працювати як реактивно, миттєво виправляючи виявлені вразливості, так і проактивно, переписуючи наявний код для усунення цілих класів помилок.

Як приклад, дослідники наводять роботу з бібліотекою стиснення зображень libwebp, яку використали в атаці на iOS у 2023 році. Агент застосував до неї спеціальні анотації, після чого, за заявою розробників, уразливості переповнення буфера стали "неможливими для експлуатації назавжди".

Як це влаштовано?

Внутрішня архітектура CodeMender містить набір інструментів: статичний та динамічний аналіз, фазинг та символьне виконання, пояснює SiliconAngle. Також є так званий "суддя LLM", який перевіряє, чи зберігають запропоновані зміни початкову функціональність.

Якщо під час перевірки виявляється проблема, система здатна до самокорекції. Усі зміни перед відправкою проходять ретельну перевірку на коректність, відповідність стандартам стилю та відсутність регресій.

Водночас у DeepMind наголошують, що всі згенеровані патчі перевіряються людьми-дослідниками перед їх відправленням у проєкти.

Після повноцінного запуску інструмент запропонує новий підхід, що відрізняється від традиційних методів, які знаходять вразливості, але все ще сильно залежать від досвіду людини. Штучний інтелект зможе самостійно виявляти та усувати помилки, що є критично важливим кроком, оскільки розмір та складність сучасних кодових баз зростають експоненційно.