Ширяться чутки, що Microsoft використовує ваші документи для навчання ШІ: ось чому це не так

Основні тези

Microsoft не використовує дані клієнтів з програм Microsoft 365 для навчання моделей штучного інтелекту.
Плутанина виникла через невдале формулювання налаштувань конфіденційності в Microsoft Office, яке вмикає "необов'язковий підключений досвід".

У мережі з'явилися повідомлення, начебто компанія Microsoft без жодних дозволів використовує приватні документи Office, завантажені в хмару користувачами, для навчання штучного інтелекту Copilot. Хоча ситуація не набула широкого розголосу, корпорація вирішила не чекати великого скандалу й уже зробила з цього приводу заяву.

Ні, це не правда

За словами компанії, вона не використовує дані клієнтів з програм Microsoft 365 для навчання моделей штучного інтелекту. Таким чином користувачам не потрібно хвилюватися про конфіденційність їхніх документів Word, Excel чи інших, пише 24 Канал з посиланням на коментар Microsoft. Але звідки ж узялися ці дивні чутки?

Дивіться також Генератор відео Sora від OpenAI злили в мережу заради помсти

Роз'яснення компанії стосується повідомлень, що циркулювали в інтернеті протягом останніх кількох тижнів. У них стверджувалося, що Microsoft "вимагає від користувачів Word і Excel відмовитися від участі в навчанні систем штучного інтелекту компанії".

Плутанина виникла через налаштування конфіденційності в Microsoft Office, яке вмикає "необов'язковий підключений досвід" – функцію, яка допомагає користувачам "шукати зображення в інтернеті" або "знаходити інформацію, доступну в інтернеті", як стверджують у Microsoft. Цей перемикач увімкнений за замовчуванням і не згадує про навчання ШІ в розкритті інформації. Аналогічно, навчальний документ Microsoft, опублікований 21 жовтня 2024 року, схоже, зробив свій внесок у плутанину, описавши довгий список взаємопов'язаних функцій в Office, які "аналізують ваш вміст", без явного виключення навчання ШІ на основі великих мовних моделей.

У програмах M365 ми не використовуємо дані клієнтів для навчання LLM. Цей параметр вмикає лише функції, які потребують доступу до інтернету, наприклад, співавторство в документі,
– заявили в обліковому записі Microsoft 365 X у відповідь на претензії.

Керівник відділу комунікацій Microsoft Френк Шоу також зробив заяву на Bluesky, щоб спростувати ці твердження: "Як зазначалося кілька тижнів тому, це не відповідає дійсності, і перехід за посиланням для отримання додаткової інформації дає це зрозуміти", – сказав Шоу.

Adobe зіткнулася зі схожою реакцією на початку цього року після того, як її умови користування були хибно витлумачені як такі, що передбачають навчання генеративного ШІ на роботах користувачів. Adobe швидко оновила формулювання у своїх умовах надання послуг, щоб пояснити, що це не так.

Інциденти з Adobe і Microsoft свідчать про те, що люди дедалі більше занепокоєні тим, що їхні персональні дані використовуються технологічними компаніями для навчання моделей штучного інтелекту без їхнього прямого дозволу.

Це цілком зрозуміле занепокоєння, враховуючи, що такі компанії, як Meta, X і Google, за замовчуванням підключають своїх користувачів до навчання штучного інтелекту, а також величезні обсяги онлайн-контенту, що вилучаються для цієї мети.

Пов'язані теми:

Техно

Microsoft

Штучний інтелект Microsoft Copilot