IBM розробляє енергоефективний аналоговий процесор для штучного інтелекту

25 серпня 2023, 11:03
Читать новость на русском

Джерело:

Ars Technica

Технологічний гігант IBM успішно розробив новий енергоефективний аналоговий процесор, покликаний вирішити проблему зростаючого енергоспоживання, пов'язану з великими мовними моделями, такими як ChatGPT, що є значним досягненням у галузі штучного інтелекту (ШІ).

Складна архітектура, що лежить в основі таких великих мовних моделей, як ChatGPT, які містять мільярди складних обчислювальних вузлів, вже давно страждає від величезного енергоспоживання, спричиненого численними зверненнями до пам'яті та складними взаємозв'язками.

Читайте на сайті OpenAI дозволяє компаніям самостійно вдосконалювати GPT-3․5 за допомогою власних даних

Один з перспективних підходів до вирішення цієї проблеми полягає в інтеграції пам'яті та обчислювальних блоків в окремі мікросхеми. І IBM, і Intel наважилися піти в цьому напрямку, створивши чіпи, в яких кожен нейрон отримує спеціальну пам'ять для виконання своїх функцій. Альтернативна тактика передбачає виконання операцій безпосередньо в пам'яті, що було продемонстровано на прикладі пам'яті з фазовою зміною.

Революційне рішення IBM

IBM стала лідером у цій галузі, представивши революційний чіп, заснований на технології фазової пам'яті, що демонструє відчутний крок до функціонального процесора штучного інтелекту. Розроблене обладнання здатне виконувати завдання з розпізнавання мови з величезною точністю, працюючи при цьому зі значно меншим енергоспоживанням.

Цікавий факт! Фазозмінна пам'ять є предметом широких досліджень, що об'єднують характеристики витривалості флеш-пам'яті з показниками продуктивності, встановленими для існуючої оперативної пам'яті. Основний принцип полягає в контрольованому нагріванні мізерно малої ділянки матеріалу з подальшим регулюванням швидкості її охолодження.

Ця унікальна поведінка виявилася особливо сприятливою для тонкощів нейронних мереж. У цих мережах окремі вузли інтерпретують вхідні сигнали і, виходячи з притаманних їм станів, модулюють ступінь ретрансляції цих сигналів. Внутрішні характеристики фазової пам'яті дозволяють представити цю модуляцію як окремий біт пам'яті, що функціонує в аналоговому режимі.

Цікаво Google готує справжнього "вбивцю" ChatGPT: ШІ Gemini вийде вже цієї осені

Традиційно зберігання даних базується на двох фундаментальних станах – увімкненому та вимкненому – ретельно розроблених для мінімізації помилок при зберіганні даних. Однак новаторський аспект тут полягає в адаптивності цієї пам'яті до гами проміжних значень між бінарними станами "увімкнено" і "вимкнено", що фактично відображає аналогову поведінку.

Ця аналогія з аналоговою поведінкою проводить паралелі з регулюванням рівня гучності звуку, де кожна градація відповідає безперервному спектру потенційних значень. Ці проміжні значення можуть бути використані для представлення різної сили або ступеня важливості зв'язків у нейронних мережах.

Хоча інноваційні кроки IBM в цьому напрямку заслуговують на увагу, останнє втілення мікросхеми означає стрибок до практичного процесора. Маючи всі необхідні компоненти для полегшення взаємозв'язку між окремими вузлами, чіп відкалібрований для сумісної роботи з розширеними мовними моделями.

Основою нового чіпа є компонент, який отримав назву "плитка" – сукупність хрестиків, що утворюють сітку 512 на 2,048 окремих бітів пам'яті з фазовою зміною. Один чіп містить 34 такі плитки, що в сумі дає вражаючу сукупність близько 35 мільйонів біт пам'яті зі змінною фазою.

Гнучкість процесора дозволяє динамічно маніпулювати міцністю з'єднання, що визначається різною кількістю бітів. Крім того, процесор підтримує зв'язок між мікросхемами, що полегшує делегування складних завдань між кількома мікросхемами.

Дивіться також Тепер навіть Paint отримає власний штучний інтелект

У реальній демонстрації дослідники використали можливості процесора для вирішення завдань розпізнавання мови. Процесор продемонстрував виняткову продуктивність, досягнувши 12,4 трильйона операцій на ват споживаної енергії на піку, що значно перевершує традиційні процесори, які виконують аналогічні завдання.

Однак важливо підкреслити, що оптимізація процесора адаптована до певного типу нейронних мереж. Крім того, він менш придатний для завдань навчання ШІ, що вимагає спеціальних модифікацій процесу навчання нейронних мереж. Попри те, що процесор не є універсальним рішенням для ШІ, він обіцяє помітне зниження енергоспоживання, прокладаючи більш екологічний курс для майбутніх досягнень ШІ.