24 Канал згадав усі ключові події, які вплинули на розвитку ШІ у 2024 році і які продовжать формувати вектор галузі в майбутньому.
Читайте на сайті Обов'язково спробуйте: OpenAI запускає пошукову систему на основі ШІ для всіх користувачів
Запуск OpenAI Sora – нова ера відеоконтенту
Однією з найгучніших подій року став реліз генератора відео Sora від OpenAI. Цей інструмент дозволяє перетворювати текст у відео з високою швидкістю та точністю, створюючи як прості анімації, так і реалістичні кінематографічні сцени. OpenAI представила Sora 15 лютого 2024 року.
На момент анонсу, розробники обіцяли наступні можливості:
- Генерація відео: Sora могла створювати реалістичні HD-відео тривалістю до однієї хвилини на основі текстових описів. Це включало складні сцени з кількома персонажами, різними типами руху та детальним пропрацюванням об'єктів і фону.
- Інтеграція з існуючим контентом: Модель могла працювати з уже існуючими зображеннями чи відео, дозволяючи "додумувати" передісторію або завершення до вже наявних кадрів.
- Безпека та контроль: Розробники згадували про обмеження в генерації контенту, які стосуються насильства, сексуального контенту, образливих зображень та порушення інтелектуальної власності. Також вони працювали над інструментами для виявлення оманливого контенту.
- Реалістичність та деталізація: Sora обіцяла реалізм у генерації відео з високою якістю зображення та дотриманням вказівок користувача, включаючи правильну передачу фізики та просторову орієнтацію.
9 грудня 2024 року Sora стала доступною для користувачів з деякими умовами.
Наразі доступ до Sora надається користувачам з підпискою ChatGPT Plus та ChatGPT Pro:
ChatGPT Plus: Користувачі можуть створювати до 50 відео на місяць з роздільною здатністю до 720p і тривалістю до 5 секунд.
ChatGPT Pro: За підписку вартістю 200 доларів на місяць, користувачі отримують можливість створювати до 500 відео на місяць, з роздільною здатністю до 1080p і тривалістю до 20 секунд. Також ця підписка дозволяє завантажувати відео без водяних знаків і працювати з кількома відео одночасно.
На момент запуску Sora доступна у США та більшості інших країн, за винятком ЄС, Великої Британії та Китаю.
Відео, створені за допомогою Sora, мають водяні знаки та метадані C2PA, що вказують на використання ШІ у їх створенні. OpenAI обіцяє строго контролювати використання для запобігання генерації забороненого контенту, як-от насильство, сексуальні фейки тощо.
Sora надає можливість створювати відео з текстових описів, перетворювати фотографії у відео, а також використовувати функцію "Re-mix" для модифікації вже створених відео. Є також функція "розкадровки", що дозволяє створювати сцени чи послідовності відео з низки підказок.
Чому це важливо
Можливість автоматизованого створення відео відкрила нові перспективи для освітнього, рекламного та розважального контенту. Викладачі зможуть швидко створювати навчальні матеріали, а маркетологи – індивідуалізовані рекламні кампанії.
Відеоредактори та маркетологи оцінили зручність створення професійних відео без необхідності залучення великих команд фахівців, що значно скорочує витрати часу та коштів на виробництво.
Водночас слід зазначити, що з доступом до такого інструменту підіймає низку очевидних ризиків. Одним із найбільших побоювань є потенціал Sora для створення високоякісних, реалістичних відео, які можуть бути використані для поширення дезінформації. Це може мати серйозні наслідки для політичних процесів, суспільної думки та безпеки, оскільки відео може бути складно відрізнити від справжніх матеріалів.
Дивіться також Google розсекретила дві революційні розробки у галузі ШІ: що готує компанія
Оновлення Google Gemini до версії 2.0 – асистент нового покоління
Google не пас задніх протягом 2024 року і оновив свого ШІ-асистента Gemini до версії 2.0, що стало значним кроком у розвитку інтелектуальних помічників. Основні зміни включають підтримку понад 100 мов та підвищену продуктивність, що дозволяє асистенту швидше та точніше обробляти запити користувачів.
Завдяки цьому інструмент став доступним для мільярдів людей по всьому світу, розширюючи можливості як для приватних осіб, так і для корпоративних користувачів.
У корпоративному середовищі Gemini 2.0 автоматизує рутинні завдання, що дозволяє компаніям підвищувати ефективність, зменшувати витрати часу на обробку запитів та оптимізувати робочі процеси. Для Google ця версія є стратегічно важливою, адже компанія прагне зміцнити свої позиції на ринку ШІ-асистентів та зберегти конкурентоспроможність у боротьбі з OpenAI та іншими технологічними гігантами.
Можливості Gemini 2.0 – дивіться відео:
Gemini 2.0 – це вкрай амбітний інструмент на який Google покладає великі надії. З огляду на те, що Android є операційною системою з найбільшим охопленням серед користувачів, Gemini 2.0 потенційно має таке ж широке охоплення і Google вбачає в асистенті помічника на кожен день, який здатен зробити життя людей кращим.
Власне, саме інтеграція ШІ в усі аспекти цифрового життя користувачів, від смартфонів до корпоративних інструментів, і є метою компанії. Очікується, що подальший розвиток Gemini дозволить створювати більш персоналізовані та адаптивні помічники, які будуть ще тісніше інтегровані у повсякденні сервіси Google, такі як Gmail, Google Docs та інші продукти екосистеми.
Gemini 2.0 змінить досвід взаємодії з ШІ / Фото Google
Тож вже цілком скоро настане той день, коли ми зможемо дати завдання своєму смартфону і очікувати, що він виконає його – від замовлення доставки обіду, до формування продуктової корзини і більш серйозних побутових та робочих завдань. Вже сьогодні Gemini 2.0 здатен суттєво покращити життя людини і з часом він розвиватиметься і масштабуватиметься охоплюючи все більше сфер нашого життя.
Дивіться також YouTube запускає автоматичний дубляж відео іншими мовами на основі штучного інтелекту
Розвиток ChatGPT і нові можливості
2024 рік став важливим етапом для розвитку ChatGPT, оскільки OpenAI продовжує впроваджувати інноваційні можливості для покращення взаємодії з користувачами. Ці зміни значно розширюють функціонал платформи, роблячи її ще більш інтегрованою в щоденні завдання та комунікацію.
Протягом 2024 року ChatGPT отримав кілька версій доступних як для безкоштовних, так і для платних користувачів:
GPT-4o: Ця версія стала доступною для всіх користувачів, включно з безкоштовними, з певними обмеженнями на кількість запитів. Для платних користувачів (Plus, Pro та Team) доступ не має таких обмежень. GPT-4o була представлена як мультимодальна модель, здатна обробляти текст, аудіо, зображення та відео.
GPT-4 Turbo: Спочатку доступна тільки для платних користувачів (Plus, Team, Enterprise), але згодом стала доступною і для безкоштовних користувачів у обмеженому вигляді. Ця версія фокусується на покращенні письма, математики, логічного мислення та кодування.
GPT-4o mini: Це оновлена версія, яка замінила GPT-3.5 Turbo для безкоштовних користувачів. Для платних користувачів функціонал залишається розширеним.
Метою OpenAI є зробити ChatGPT універсальним інструментом та мультифункціональним помічником для користувачів, який зможе виконати будь-яку роботу, від генерації рецептів страв за запитом до написання коду та допомозі науковціям в розрахунках.
Ось що нового було додано до ChatGPT у 2024 році
- Відео та голосовий чат у реальному часі
Однією з найбільш очікуваних функцій стала можливість взаємодії з ChatGPT через відео та голосові дзвінки в реальному часі. Тепер користувачі можуть спілкуватися зі штучним інтелектом не лише текстово, а й через аудіо та відео. Крім того, значно розширилися можливості Advanced Voice
Тож тепер з ChatGPT можна обговорювати теми, показувати предмети на камеру або просто приємно спілкуватися, якщо захотілося щось обговорити. Ця функція дуже корисна для ситуацій, коли потрібно наочно пояснити певні аспекти роботи чи процесу.
- Проєкти (Projects)
ChatGPT тепер дозволяє організовувати чати за темами або контекстами у рамках нової функції "Проєкти". Це дозволяє зберігати всі пов'язані чати в одному місці, що зручно для виконання конкретних завдань, таких як написання текстів, кодинг чи дослідження.
Користувачі можуть створювати різні проєкти, зберігати їх та ефективно працювати в межах однієї платформи. Функція доступна для користувачів Plus, Pro та Team, а в січні 2025 року буде доступна для Enterprise та Edu користувачів. Безкоштовні користувачі також отримають доступ до цієї можливості найближчим часом.
- Пошук в Інтернеті (ChatGPT Search)
Ще однією важливою новинкою став інтегрований пошук в Інтернеті. Тепер ChatGPT може шукати та використовувати інформацію з мережі для надання більш точних та актуальних відповідей.
Ця функція дозволяє користувачам отримувати інформацію безпосередньо з Інтернету, що робить відповіді ще більш інформативними та корисними. Функція пошуку почала розгортатися для всіх користувачів, включаючи безкоштовних, тож випробувати її можна прямо зараз.
Canvas
Canvas – це новий інструмент для роботи з текстами та кодом, що дозволяє користувачам отримувати відгуки та працювати над вдосконаленням контенту у більш інтерактивний спосіб. За допомогою цього вікна в чаті користувачі можуть легко редагувати свої тексти та отримувати допомогу від ChatGPT для покращення якості роботи.
Цей інструмент доступний для всіх користувачів моделі ChatGPT 4o і значно підвищує ефективність спільної роботи над проектами.
Grok та xAI: штучний інтелект Ілона Маска
У 2023 році Ілон Маск започаткував новий амбітний проєкт – xAI, стартап, орієнтований на розвиток інноваційних рішень у галузі штучного інтелекту. Однією з головних інновацій компанії став Grok – чат-бот, що став черговим амбітним інструментом на ринку AI попри початковий скепсис фахівців.
Завдяки своїм унікальним можливостям та інтеграції з платформою X (колишній Twitter), протягом 2024 року Grok пройшов кілька етапів розвитку та значно розширив свій функціонал, ставши важливим інструментом для бізнесу і звичайних користувачів.
Мета полягала в тому, щоб створити штучний інтелект, який би не тільки розв’язував технічні задачі, але й мав унікальний, навіть гумористичний підхід до взаємодії з користувачем. Маск хотів, щоб Grok володів здатністю давати чесні та інколи саркастичні відповіді, натхнені стилем "Путівника автостопом по Галактиці" Дугласа Адамса.
Дивіться також Штучний інтелект повертає голос людям з боковим аміотрофічним склерозом
Рання розробка та версії Grok
Grok-1: Початок
Перша версія Grok – Grok-1 – стала доступною для обмеженого кола підписників Premium+ на платформі X в грудні 2023 року. Це була початкова версія, здатна відповісти на широкий спектр запитань, із доступом до інформації в реальному часі через X. Хоча функціонал був обмежений, цей старт уже свідчив про великий потенціал проекту.
Grok-1.5: Поліпшення можливостей
У березні 2024 року xAI представив оновлену версію – Grok-1.5. Це оновлення дозволило значно покращити продуктивність Grok у складних завданнях, зокрема у програмуванні та математичних обчисленнях.
Grok-1.5 також стала доступною для перших тестувальників та існуючих користувачів на платформі X, що дозволило зібрати цінні відгуки для подальших удосконалень.
Grok-2: Масове поширення
15 грудня 2024 року xAI запустив Grok-2, зробивши його доступним безкоштовно для всіх користувачів X. Це стало значним кроком до масового поширення штучного інтелекту серед широкої аудиторії.
Grok-2 вніс важливі зміни, зокрема впровадив можливість генерації зображень та покращені функції для аналізу контенту, що ще більше збільшило його популярність серед користувачів.
Можливості для користувачів Grok
У 2024 році Grok став доступним для різних категорій користувачів з різними функціональними можливостями в залежності від рівня підписки.
Безкоштовні користувачі: Мають можливість надсилати до 10 запитів кожні дві години та генерувати до 3 зображень на день. Вони можуть використовувати Grok для отримання відповідей на запитання, але з обмеженням на кількість взаємодій.
Підписники X Premium: Ці користувачі отримують вищі ліміти на кількість запитів, можуть генерувати більше зображень на день і отримують доступ до нових функцій раніше за інших.
Підписники X Premium+: Найвищий рівень підписки пропонує пріоритетну обробку запитів, доступ до експериментальних функцій Grok, а також можливість взаємодіяти з AI у більш інтерактивному режимі, наприклад, через "розважальний режим".
Завдяки інтеграції з X, Grok може використовувати актуальні дані для формування своїх відповідей, що дає йому перевагу перед іншими моделями, які можуть бути обмежені застарілими даними. Це робить його більш корисним інструментом для вирішення реальних задач у динамічному середовищі.
Починаючи з Grok-2, користувачі отримали можливість створювати зображення. Це розширило сферу застосування Grok для творчих задач, від генерації графіки до візуалізації ідей. Ця функція стала важливою для маркетингу, освіти та навіть для створення візуального контенту для соціальних мереж.
У Grok все ще попереду
У 2024 році Grok та xAI значно змінили підхід до взаємодії з штучним інтелектом. Стартап продовжує розвиватися, з акцентом на покращення взаємодії з користувачами, розширення можливостей обробки та генерації контенту, а також збільшення доступності для ширшої аудиторії.
З огляду на інновації, які вже були впроваджені, можна очікувати, що у майбутньому Grok стане ще більш потужним інструментом для бізнесу та приватних користувачів.
Дивіться також Штучний інтелект OpenAI керуватиме бойовими дронами
Інші важливі зміни в галузі ШІ
- Нова стратегія НАТО щодо ШІ – захист у цифрову епоху
у 2024 році НАТО оновило свою стратегію інтеграції штучного інтелекту в оборонну сферу, зокрема зосередивши увагу на підвищенні кібербезпеки та автоматизації аналізу розвідувальної інформації.
Завдяки автоматизованому обробленню великих обсягів даних, альянс отримує змогу оперативно ухвалювати стратегічні рішення та мінімізувати ризики кібератак. Це робить ШІ важливим компонентом сучасних оборонних технологій.
- Законодавчі ініціативи щодо регулювання ШІ
2024 рік також став роком активних кроків щодо регулювання технології ШІ. Європейський Союз зробив важливий крок вперед із прийняттям "Акту про ШІ", що передбачає суворий контроль за етичним і відповідальним використанням цієї технології.
У США також були ухвалені кілька важливих ініціатив для регулювання автоматизованих систем ухвалення рішень у таких сферах, як зайнятість, фінанси та соціальні послуги. Ці зусилля формують правову основу для безпечного та сталого впровадження ШІ у різних галузях.
- Прориви у медичному ШІ – точна діагностика та індивідуалізоване лікування
Медицина стала однією з найбільш прогресуючих сфер завдяки впровадженню ШІ у 2024 році. Нові алгоритми для ранньої діагностики онкологічних та нейродегенеративних захворювань, а також вдосконалені інструменти прогнозування ефективності лікування і персоналізованих медичних рекомендацій, значно підвищили точність та швидкість діагностики. Це дозволяє лікарям надавати більш ефективну медичну допомогу та покращує загальну якість лікування.
Підсумок і прогноз на 2025 рік
2024 рік став вирішальним для розвитку штучного інтелекту, що охоплює не лише новітні інструменти для створення контенту, але й змінює стратегії оборони, законодавчі ініціативи та медичні досягнення. Релізи таких інструментів, як Sora, оновлення Google Gemini, Grok та розвиток низки інших платформ ілюструють величезний технологічний прогрес.
2025 рік обіцяє стати періодом значних змін у сфері штучного інтелекту, де ШІ продовжить інтеграцію в ключові галузі, зокрема медицину, фінанси та роздрібну торгівлю. У сфері охорони здоров'я очікується значне зростання персоналізованої медицини, автоматизації діагностики та розробки нових ліків, що дозволить знизити витрати та покращити продуктивність. Водночас у фінансовому секторі ШІ продовжить покращувати аналітику даних, прогнозування ризиків та боротьбу з шахрайством.
Технологічні прориви в обчислювальних потужностях та квантових комп'ютерах відкриють нові можливості для ШІ, зокрема в галузях кібербезпеки та криптографії. Поява автономних агентів ШІ та розвиток генеративних моделей дозволить створювати високоякісні відео та реалістичні симуляції, що значно розширить застосування технологій у творчих індустріях.
Дивіться також Штучний інтелект матиме жахливий вплив на нашу науку
З точки зору етики та регулювання, у 2025 році очікується активізація зусиль щодо встановлення чітких стандартів безпеки, захисту даних та прозорості алгоритмів. Це дозволить забезпечити баланс між розвитком технологій і їх етичним використанням. Тож нас чекає не менш цікавий рік, а низка важливих відкриттів ще попереду.