Марк Цукерберг похвастался своей огромной библиотекой контента, которая включает все ваши посты, ролики и комментарии. Профили пользователей теперь является одним из самых ценных наборов данных в мире, и Meta утверждает, что они принадлежат ей.
Смотрите также Apple купит ИИ-стартап с впечатляющей технологией конфиденциальности
Детали
В Facebook и Instagram сотни миллиардов общедоступных изображений и десятки миллиардов общедоступных видео. По нашим оценкам, [это] больше, чем набор данных Common Crawl, а люди также делятся большим количеством публичных текстовых сообщений в комментариях к нашим сервисам,
– заявил генеральный директор Meta во время телефонного звонка с инвесторами на прошлой неделе.
Это следующая большая игра Meta. Instagram и Facebook зависят от пользователей в течение последних 20 лет, пытаясь монетизировать каждого из нас с помощью рекламодателей на каждом шагу. Теперь они просматривают ваши старые посты, ваши особые моменты и важные жизненные события и используют это для создания инструментов искусственного интеллекта стоимостью в миллиарды долларов. В результате мы получим языковые модели, чат-ботов, ИИ-помощников или что-нибудь другое, что придумает Meta, обученное на публикациях о вашем отпуске, впечатлениях от фильма, шутках, публичных переписках с друзьями, и всем остальным, что вы написали за годы пользования сервисами.
Может ли соцсеть автоматически владеть вашими данными для создания искусственного интеллекта? Публичная дискуссия о социальных сетях и их пользователях относительно искусственного интеллекта еще не завершена. Однако Сара Сильверман и другие книгоиздатели уже судятся с Meta за кражу их идей. Meta годами зарабатывала на данных своих пользователей, но никогда не делала этого в таких масштабах. Илон Маск делает то же самое с X, используя весь Twitter для тренировки Grok от xAI.
Чтобы понять, насколько в этом плане Meta имеет преимущество: набор данных Common Crawl, на который ссылается Цукерберг, насчитывает более 250 миллиардов веб-страниц, собранных за 17 лет. Это одна из крупнейших интернет-баз данных человеческого контента, и она считается золотым стандартом для обучения больших языковых моделей. Но данные Meta еще лучше – они больше и более личные, более человекоцентричные.
Цукерберг фактически нашел золотую жилу, лежавшую на полке. Библиотека Meta, которая насчитывает примерно два десятилетия постов с Facebook и Instagram, теперь является одним из самых ценных активов компании. Без всяких громких объявлений или сообщений пользователям, Meta фактически заявила о праве собственности на публичный профиль пользователя в социальных сетях и будет использовать его для получения миллиардов долларов.
Большая языковая модель Meta под названием Llama является одной из лучших моделей искусственного интеллекта в мире. Компания использует ее для обучения таких продуктов, как Meta AI, Imagine и других. В ближайшие годы Meta надеется внедрить эти ИИ-продукты во все свои сервисы и проекты.