Марк Цукерберг похвалився своєю величезною бібліотекою контенту, яка включає всі ваші пости, ролики та коментарі. Профілі користувачів тепер є одним з найцінніших наборів даних у світі, і Meta стверджує, що вони належать їй.

Дивіться також Apple купить ШІ-стартап із вражаючою технологією конфіденційності

Деталі

У Facebook та Instagram сотні мільярдів загальнодоступних зображень і десятки мільярдів загальнодоступних відео. За нашими оцінками, [це] більше, ніж набір даних Common Crawl, а люди також діляться великою кількістю публічних текстових повідомлень у коментарях до наших сервісів,
– заявив генеральний директор Meta під час телефонного дзвінка з інвесторами минулого тижня.

Це наступна велика гра Meta. Instagram та Facebook залежні від користувачів протягом останніх 20 років, намагаючись монетизувати кожного з нас за допомогою рекламодавців на кожному кроці. Тепер вони переглядають ваші старі пости, ваші особливі моменти та важливі життєві події і використовують це для створення інструментів штучного інтелекту вартістю в мільярди доларів. В результаті ми отримаємо мовні моделі, чат-ботів, ШІ-помічників чи будь-що інше, що придумає Meta, навчене на публікаціях про вашу відпустку, враженнях від фільму, жартах, публічних листуваннях із друзями, та всім іншим, що ви написали за роки користування сервісами.

Чи може соцмережа автоматично володіти вашими даними для створення штучного інтелекту? Публічна дискусія про соціальні мережі та їхніх користувачів щодо штучного інтелекту ще не завершена. Однак Сара Сільверман та інші книговидавці вже судяться з Meta за крадіжку їхніх ідей. Meta роками заробляла на даних своїх користувачів, але ніколи не робила цього в таких масштабах. Ілон Маск робить те ж саме з X, використовуючи весь Twitter для тренування Grok від xAI.

Щоб зрозуміти, наскільки в цьому плані Meta має перевагу: набір даних Common Crawl, на який посилається Цукерберг, налічує понад 250 мільярдів вебсторінок, зібраних за 17 років. Це одна з найбільших інтернет-баз даних людського контенту, і вона вважається золотим стандартом для навчання великих мовних моделей. Але дані Meta ще кращі – вони більші та більш особисті, більш людиноцентричні.

Цукерберг фактично знайшов золоту жилу, що лежала на полиці. Бібліотека Meta, яка налічує приблизно два десятиліття постів з Facebook та Instagram, тепер є одним з найцінніших активів компанії. Без жодних гучних оголошень чи повідомлень користувачам, Meta фактично заявила про право власності на публічний профіль користувача в соціальних мережах і використовуватиме його для отримання мільярдів доларів.

Велика мовна модель Meta під назвою Llama є однією з найкращих моделей штучного інтелекту у світі. Компанія використовує її для навчання таких продуктів, як Meta AI, Imagine та інших. У найближчі роки Meta сподівається впровадити ці ШІ-продукти у всі свої сервіси та проєкти.