Одними из самых перспективных партнеров на этом рынке ИИ-компании считают издателей новостей. Их материалы имеют преимущества над обычными текстами в интернете, поскольку придерживаются определенных правил, структуры, грамотности. Кроме того, это позволит алгоритмам научиться работать с новостным контентом, уменьшив количество "галлюцинаций", то есть случаев дезинформации, когда ИИ просто выдумывает те или иные факты.

Смотрите также ШИ, буря в Twitter и изменение климата – главные события мира технологий в 2023 году: часть первая

Сколько будет платить OpenAI

Интересно, что некоторые издатели новостей заключают соглашения с компаниями, занимающимися искусственным интеллектом, чтобы обучить собственные модели работать с новостными сюжетами. Другие же просто запрещают любое использование своих текстов для обучения ИИ, но разработку своей технологии не планируют. В целом индустрия боится одного: что искусственный интеллект однажды станет настолько искусственным в написании новостей, что просто захватит весь рынок и сделает нынешние издания никому не нужными.

Но сопротивление не останавливает разработчиков. The Information сообщает, что OpenAI предлагает от 1 до 5 миллионов долларов в год за лицензию на использование защищенных авторским правом новостных статей для обучения своих ИИ-моделей. Это одно из первых свидетельств того, сколько ИИ-компании планируют платить за лицензионные материалы. Это происходит наряду с недавним отчетом о том, что Apple ищет партнеров в медиа для использования их контента для обучения своего необъявленного ИИ, предлагая по меньшей мере 50 миллионов долларов на много лет вперед.

Заключение партнерских соглашений позволяет AI-компаниям избегать проблем с авторским правом. В последнее время это становится все более распространенной практикой, ведь первые версии нейросетей обучались преимущественно на информации из интернета, которая начала заканчиваться. Некоторые модели искусственного интеллекта не раскрывают, как они получили свои учебные данные. Они создают веб-сканеры, которые собирают данные в сети. Такая практика сталкивается с серьезными проблемами. Например, The New York Times и материнская компания The Verge, Vox Media, заблокировали доступ к данным для ChatGPT, утверждая, что обучение на их данных является нарушением авторских прав. The New York Times также подала в суд на OpenAI и Microsoft за нарушение авторских прав, утверждая, что ChatGPT и Copilot могут генерировать исходные данные почти дословно к ее работам.

Смотрите также От Солнца до TikTok – главные темы, которые мы обсуждали в 2023 году: часть вторая

Вместе с тем такие издательства, как Axel Springer – материнская компания Politico и Business Insider – и The Associated Press подписали соглашения с OpenAI о лицензировании их материалов для обучения моделей вроде GPT-4 и разработки технологий для сбора новостей.

OpenAI и Apple – не единственные разработчики ИИ, которые надеются на сотрудничество с новостными организациями. Как сообщается, Google продемонстрировал руководителям The New York Times, The Wall Street Journal и The Washington Post инструмент ИИ под названием Genesis, который собирает факты и выдает новости.