Сучасна революція ШІ почалася у ході дослідного змагання. Йшов 2012 рік – третій рік конкурсу ImageNet, на якому команди змагалися у створенні системи комп'ютерного зору, яка розпізнавала б більше ніж 1000 об'єктів, від пейзажів до тварин та людей, розповідає 24 канал.
Цікаво Штучний інтелект навчили визначати COVID-19 у безсимптомних носіїв
У перші два роки кращі команди не могли добитися навіть 75% точності. Але на третій три людини – професор Джеффрі Хінтон і два його студенти – значно перевершили інших. Цю технологію назвали глибоким навчанням.
Робота над технологією
Насправді Хінтон працював над технологією з 1980-х, але її ефективність страждала від відсутності даних і низьких обчислювальних потужностей. Але все ж його віра в метод принесла в кінці кінців великі дивіденди. На наступний рік майже всі команди на конкурсі ImageNet застосовували глибоке навчання та досягали високих результатів. Незабаром технологія вийшла за межі розпізнавання зображень.
У минулому році за свої досягнення Хінтон присудили премію Тюрінга. Журналісти Technology Review поговорили з піонером глибокого навчання під час минулої в жовтні конференції EmTech MIT.
Я вірю, що глибоке навчання здатне виконати будь-яке завдання, але я думаю, що для цього буде потрібно кілька концептуальних проривів. Наприклад, у 2017 Ашиш Васвані й інші представили трансформери, які витягували дуже хороші вектори значень слів. Це був концептуальний прорив. Тепер він використовується майже в усіх кращих системах обробки природної мови. Нам потрібно ще кілька таких проривів,
– сказав Хінтон.
Ці досягнення дозволять машинам апроксимувати весь людський інтелект методом глибокого навчання, переконаний він. У людського мозку близько 100 трильйонів синапсів. У GPT-3, однією з найбільших на сьогодні моделей, їх 175 мільйонів. Це в тисячу разів менше. GPT-3 вже вміє генерувати правдоподібні тексти, але вона все одно крихітна порівняно з мозком.
Хінтон, як і багато його колег, вважає, що наступна важлива властивість, якою повинен оволодіти ШІ, це здоровий глузд. Крім того, велике значення має руховий контроль для роботів. А для мовних ШІ, на кшталт GPT-3, велике значення має здатність розуміти, але як цього добитися – неясно.