Укр Рус
15 серпня, 16:31
3

Витік показує, що саме лежить в основі майбутнього ШІ-браузера від OpenAI

Основні тези
  • OpenAI розробляє новий ШІ-браузер на базі Chromium, дозволивши агенту контролювати браузер користувача й усуваючи обмеження поточного хмарного браузера.
  • Інтеграція ШІ-агента відкриває можливості для автоматичного виконання складних завдань, таких як бронювання квитків та дослідження в інтернеті.

Розробник ChatGPT, компанія OpenAI, готує новий амбітний проєкт, який може кардинально змінити нашу звичну взаємодію з інтернетом – ШІ-браузер з вбудованими можливостями агента. Хоча ми досі маємо лише окремі натяки на те, що чекає попереду, свіжий витік проливає трохи більше світла на це питання.

Як OpenAI планує змінити нашу взаємодію з інтернетом?

Віднедавна у складі ChatGPT запустили так званий Agent mode – режим агента, який дозволяє штучному інтелекту самостійно працювати в мережі, виконуючи багатошарові й складні завдання без втручання людини. Ця функція використовує віртуальну машину на базі Linux, що працює в хмарному середовищі Azure. Агент може переглядати сайти, скролити, натискати на посилання та кнопки й заповнювати форми, працюючи у віртуальному браузері в рамках ChatGPT. Однак його здібності обмежені: він фактично замкнений у своєрідній клітці Фарадея, не маючи можливості контролювати ваш реальний браузер, бачити відкриті вкладки чи взаємодіяти з іншими елементами інтерфейсу операційної системи, пише 24 Канал з посиланням на допис Тібора Благо, комп'ютерного інженера з ШІ-стартапу AIPRM.

До теми OpenAI готується запустити ШІ-браузер для конкуренції з Google Chrome 

Новий витік, виявлений у коді OpenAI, свідчить, що компанія планує усунути ці обмеження. Розробники створюють механізм, який дозволить "Агенту" обирати між двома шляхами виконання завдань: поточним віддаленим "хмарним браузером" та новим локальним браузером, розробленим самою OpenAI. Цей браузер буде створено на основі відкритої технології Chromium, що лежить в основі таких популярних оглядачів, як Google Chrome та Microsoft Edge.

Це означає, що ШІ-агент отримає прямий контроль над браузером користувача. В коді було знайдено прихований перемикач "Use cloud browser" (Використовувати хмарний браузер), а також спеціальний шлюз, який перевіряє, чи запущений ChatGPT у фірмовому додатку OpenAI. 

Такий крок є логічним продовженням стратегії OpenAI щодо побудови так званого "агентського майбутнього", де штучний інтелект виступає не просто як інструмент, а як повноцінний помічник, що автономно виконує складні багатоетапні завдання. Інтеграція ШІ-агента безпосередньо в браузер відкриває величезні можливості: від автоматичного бронювання квитків та готелів за одним запитом до проведення комплексного дослідження в інтернеті та підготовки звітів.

Інформація про розробку власного браузера OpenAI уперше з'явилася в липні. Вже тоді було очевидно, що на нас чекає саме такий підхід, де агент керує всім браузером, оскільки це пропонують найближчі конкуренти, які також розробляють ШІ-браузери, зокрема The Browser Company з її Dia, а також Perplexity з його технологією Comet, яка вже виходить з етапу тестування. Тож цей витік просто підтвердив те, що ми й так уже знали.

Створення браузера на базі Chromium є розумним кроком, оскільки це забезпечить сумісність із мільйонами сайтів та існуючими розширеннями, що спростить перехід для користувачів. Випуск такого продукту може серйозно вплинути на ринок браузерів, кинувши виклик домінуванню Google. Нарешті, для самої OpenAI це стане величезним плюсом, адже дозволить утримувати користувачів усередині екосистеми ChatGPT.