Что такое Wispr Flow и почему он нужен вам немедленно?

Wispr Flow – это не просто очередная программа для преобразования речи в текст. Это сервис на базе искусственного интеллекта, который уже успел зарекомендовать себя на платформах Mac, Windows и iOS, а теперь открыл свои двери и для огромной аудитории пользователей Android. Основная идея разработчиков заключается в том, чтобы предоставить людям возможность общаться со своими устройствами так же естественно, как они думают, не отвлекаясь на изнурительную механическую работу пальцев, пишет 24 Канал.

Смотрите также Прощай, Photoshop: Canva соединила три дизайнерские платформы в одну и сделала ее бесплатной

В отличие от версии для iPhone, где Wispr Flow функционирует как отдельная клавиатура, на Android приложение получило совсем другой интерфейс. Теперь это плавающая кнопка-пузырь, которая может свободно перемещаться по экрану и появляться поверх любой другой программы. Это позволяет пользователю не отказываться от любимой Gboard или Samsung Keyboard, а использовать мощность искусственного интеллекта только тогда, когда нужно надиктовать большой объем информации.

Достаточно нажать на пузырек, выразить свои мысли, и программа мгновенно вставит готовый, профессионально отредактированный текст в нужное поле.

Как работает Wispr Flow
Как работает Wispr Flow / Скриншот 24 Канала

Большие возможности

Система работает значительно интеллектуальнее стандартных инструментов диктовки, к которым мы привыкли в, например, клавиатуре Gboard. Она способна распознавать и самостоятельно удалять лишние слова-паразиты, исправлять пунктуацию и даже структурировать текст в зависимости от контекста программы.

Например, если человек дает команду создать список, программа автоматически добавит маркеры или пункты. Кроме того, искусственный интеллект понимает, когда пользователь исправляется непосредственно во время речи, и оставляет на экране только финальную, правильную версию фразы.

Согласно данным, указанным на сайте разработчиков Wispr Flow, скорость такого ввода достигает 220 слов в минуту, что в четыре раза быстрее средней скорости печатания на клавиатуре, которая составляет около 45 слов в минуту.

Недавнее обновление инфраструктуры позволило увеличить скорость обработки голоса еще на 30 процентов, что делает процесс почти мгновенным. Поддержка более 100 языков, в том числе и украинского, а также возможность перевода в реальном времени делают этот инструмент универсальным для международной коммуникации.

Украинский язык выбирается автоматически при настройке
Украинский язык выбирается автоматически при настройке / Скриншот 24 Канала

Особое внимание уделили индийскому рынку, создав специальную модель для Hinglish – смеси хинди и английского языка, которая отражает реальный стиль общения миллионов людей.

Работа еще не завершена

Несмотря на высокую точность, которая в среднем достигает 90 – 95 процентов, технология все еще не является абсолютно безупречной. Иногда она может пропускать отдельные слова или ошибаться в контексте, особенно когда речь идет о специфических терминах.

Есть случаи, когда программа заменяла узкоспециализированные аббревиатуры, например "NASes" (National Agency for Network and Electronic Services), на обычные слова, подобные по звучанию, например, "nurses".

24 Канал протестировал технологию лично. Мы также заметили подобные случаи. Например, в одном из тестов система самостоятельно добавила в начале имя человека в качестве обращения, хотя ничего подобного в сказанной фразе не было.

Тестирование Wispr Flow
Тестирование Wispr Flow: в оригинальной озвученной фразе имени не было / Скриншот 24 Канала

Тем не менее для большинства задач – от написания сообщений в мессенджерах и электронных писем до создания черновиков больших статей – ее возможностей вполне достаточно, чтобы значительно повысить производительность. Сервис прекрасно понимает слова и выдает гораздо лучший результат, чем встроенные возможности Gboard. Как активные пользователи голосовой диктовки в составе Gboard, мы можем это подтвердить собственным опытом.

Популярность растет

Пока неизвестно количество пользователей Wispr Flow, однако, судя по многочисленным сообщениям в соцсетях, которые исследовал 24 Канал, по меньшей мере IT-сфера массово тестирует его и оставляет положительные отзывы. Некоторые авторы отмечают, что теперь не печатают, а только говорят, экономя кучу времени.

Wispr Flow стал одним из моих самых часто используемых приложений на iPhone и Mac,
– пишет пользователь Threads @hiro.report.

Другой отмечает: "Wispr Flow – это определенно лучшее программное обеспечение для диктовки,, которое я когда-либо использовал. Я никогда не мог сказать "Переведите это с большой буквы", и оно бы это сделало".

Две недели использования Wispr Flow. 51 504 слова, продиктованные голосом. Примерно одна глава книги. Я использую его для всего – кодирования, разработки стратегий, идей, сообщений. Теперь я просто говорю, вместо того, чтобы печатать. Голос в 3 – 4 раза быстрее печатания. Этот инструмент наконец делает это практичным", – говорит Чарльз Огаросиус в Threads.

Как развивается компания и какие у нее перспективы?

Проект Wispr Flow уже привлек 81 миллион долларов инвестиций от ведущих фондов, отмечает TechCrunch, а его рыночную стоимость оценивают в 700 миллионов долларов.

  • На этапе раннего доступа для Android приложение предлагают использовать бесплатно и без каких-либо ограничений по объему слов.
  • В случае регистрации через браузер на компьютере вам дадут пробную версию Pro на 14 дней.
  • В бесплатной версии есть ограничение в 1000 слов в неделю, по данным 9to5Google.

Эти предложения – это существенное преимущество, поскольку на других платформах полноценная версия стоит 12 долларов в месяц или 144 доллара в год.

Для многих специалистов – журналистов, юристов, разработчиков и студентов – это приложение может стать тем самым инструментом, который наконец сделает голос основным средством создания контента, вытеснив традиционное печатание на второй план.