Укр Рус
23 лютого, 15:06
6

Застосунок Wispr Flow підриває мережу: чому всі про нього говорять і як він спрощує життя

Основні тези
  • Wispr Flow – це ШІ-сервіс для перетворення мовлення в текст, який спрощує введення тексту завдяки плаваючій кнопці-бульбашці.
  • Застосунок підтримує понад 100 мов, має високу швидкість введення та точність, але поки що може робити помилки з вузькоспеціалізованими термінами.

Світ технологій стоїть на порозі серйозних змін у тому, як ми взаємодіємо зі своїми смартфонами. Звичне натискання клавіш на екрані поступово поступається місцем набагато природнішому способу спілкування. Нове рішення, яке нарешті стало доступним для користувачів Android, обіцяє перетворити хаотичний потік думок на ідеально структурований текст, змушуючи забути про обмеження традиційних клавіатур.

Що таке Wispr Flow і чому він потрібен вам негайно?

Wispr Flow – це не просто чергова програма для перетворення мовлення у текст. Це сервіс на базі штучного інтелекту, який вже встиг зарекомендувати себе на платформах Mac, Windows та iOS, а відтепер відкрив свої двері й для величезної аудиторії користувачів Android. Основна ідея розробників полягає в тому, щоб надати людям можливість спілкуватися зі своїми пристроями так само природно, як вони думають, не відволікаючись на виснажливу механічну роботу пальців, пише 24 Канал.

Дивіться також Прощавай, Photoshop: Canva поєднала три дизайнерські платформи в одну й зробила її безплатною 

На відміну від версії для iPhone, де Wispr Flow функціонує як окрема клавіатура, на Android застосунок отримав зовсім інший інтерфейс. Тепер це плаваюча кнопка-бульбашка, яка може вільно переміщатися по екрану та з'являтися поверх будь-якої іншої програми. Це дозволяє користувачеві не відмовлятися від улюбленої Gboard чи Samsung Keyboard, а використовувати потужність штучного інтелекту лише тоді, коли потрібно надиктувати великий обсяг інформації. 

Достатньо натиснути на бульбашку, висловити свої думки, і програма миттєво вставить готовий, професійно відредагований текст у потрібне поле.


Як працює Wispr Flow / Скриншот 24 Каналу

Великі можливості

Система працює значно інтелектуальніше за стандартні інструменти диктування, до яких ми звикли в, наприклад, клавіатурі Gboard. Вона здатна розпізнавати та самостійно видаляти зайві слова-паразити, виправляти пунктуацію та навіть структурувати текст залежно від контексту програми.

Наприклад, якщо людина дає команду створити список, програма автоматично додасть маркери або пункти. Крім того, штучний інтелект розуміє, коли користувач виправляється безпосередньо під час мовлення, і залишає на екрані лише фінальну, правильну версію фрази.

Згідно з даними, вказаними на сайті розробників Wispr Flow, швидкість такого введення досягає 220 слів за хвилину, що в чотири рази швидше за середню швидкість друкування на клавіатурі, яка становить близько 45 слів за хвилину. 

Нещодавнє оновлення інфраструктури дозволило збільшити швидкість обробки голосу ще на 30 відсотків, що робить процес майже миттєвим. Підтримка понад 100 мов, у тому числі й української, а також можливість перекладу в реальному часі роблять цей інструмент універсальним для міжнародної комунікації.


Українська мова обирається автоматично при налаштуванні / Скриншот 24 Каналу

Особливу увагу приділили індійському ринку, створивши спеціальну модель для Hinglish – суміші хінді та англійської мови, яка відображає реальний стиль спілкування мільйонів людей.

Робота ще не завершена

Незважаючи на високу точність, яка в середньому сягає 90 – 95 відсотків, технологія все ще не є абсолютно бездоганною. Іноді вона може пропускати окремі слова або помилятися в контексті, особливо коли йдеться про специфічні терміни. 

Є випадки, коли програма замінювала вузькоспеціалізовані абревіатури, як-от "NASes" (National Agency for Network and Electronic Services), на звичайні слова, подібні за звучанням, наприклад, "nurses". 

24 Канал протестував технологію особисто. Ми також помітили подібні випадки. Наприклад, в одному з тестів система самостійно додала на початку ім'я людини в якості звертання, хоча нічого подібного в сказаній фразі не було. 


Тестування Wispr Flow: в оригінальній озвученій фразі імені не було / Скриншот 24 Каналу

Проте для більшості завдань – від написання повідомлень в месенджерах і електронних листів до створення чернеток великих статей – її можливостей цілком достатньо, щоб значно підвищити продуктивність. Сервіс чудово розуміє слова і видає набагато кращий результат, ніж вбудовані можливості Gboard. Як активні користувачі голосового диктування в складі Gboard, ми можемо це підтвердити власним досвідом.

Популярність зростає

Наразі невідома кількість користувачів Wispr Flow, проте, судячи з численних дописів у соцмережах, які дослідив 24 Канал, щонайменше IT-сфера масово тестує його й залишає схвальні відгуки. Деякі автори зазначають, що тепер не друкують, а лише говорять, економлячи купу часу.

Wispr Flow став одним із моїх найчастіше використовуваних додатків на iPhone та Mac, 
– пише користувач Threads @hiro.report.

Інший зазначає: "Wispr Flow – це безперечно найкраще програмне забезпечення для диктування, яке я коли-небудь використовував. Я ніколи не міг сказати "Переведіть це у велику літеру", і воно б це зробило".

Два тижні використання Wispr Flow. 51 504 слова, продиктовані голосом. Приблизно одна глава книги. Я використовую його для всього – кодування, розробки стратегій, ідей, повідомлень. Тепер я просто говорю, замість того, щоб друкувати. Голос у 3 – 4 рази швидший за друкування. Цей інструмент нарешті робить це практичним", – каже Чарльз Огаросіус у Threads.

Як розвивається компанія і які в неї перспективи?

Проєкт Wispr Flow вже залучив 81 мільйон доларів інвестицій від провідних фондів, зазначає TechCrunch, а його ринкову вартість оцінюють у 700 мільйонів доларів.

  • На етапі раннього доступу для Android додаток пропонують використовувати безкоштовно та без будь-яких обмежень за обсягом слів.
  • У випадку реєстрації через браузер на комп'ютері вам дадуть пробну версію Pro на 14 днів.
  • У безплатній версії є обмеження в 1000 слів на тиждень, за даними 9to5Google.

Ці пропозиції – це суттєва перевага, оскільки на інших платформах повноцінна версія коштує 12 доларів на місяць або 144 долари на рік. 

Для багатьох фахівців – журналістів, юристів, розробників та студентів – цей застосунок може стати тим самим інструментом, який нарешті зробить голос основним засобом створення контенту, витіснивши традиційне друкування на другий план.