Ще у 2004 році виявили, що Excel може перетворювати до 30% назв генів та білків у дати. У новому дослідженні вчені проаналізували понад 10 тисяч біологічних наукових робіт, які містили назви генів у таблицях Microsoft Excel. Усі роботи були опубліковані в період з 2014 по 2020 роки. Виявилося, що у понад 30% статей містяться помилки у назвах генів. Помилки виникли через некоректну інтерпретацію значення тексту автокоректором.

Цікаво Вийшла остання тестова версія Android 12, а з нею стали відомі перші подробиці наступної ОС

Помилка автокоректора
Приклад помилки автокоректора / Фото Tech Xplore

Невірна інтерпретація тексту "Екселем"

В електронних таблицях використовується "інтелектуальний текст", щоб вгадати, які дані потрібні користувачеві. Якщо ви введете номер телефону, що починається з нуля, програма розпізнає його як числове значення та видалить початковий нуль. Якщо ви введете "= 8/2", результат буде показуватися як "4". Та якщо набрати на клавіатурі "8/2", то алгоритм "подумає", що це дата.

Тому для наукових даних просте відкриття файлу в Excel з базовими налаштуваннями може привести до пошкодження та викривлення інформації через автокорекції. Можна уникнути таких проблем, якщо комірки попередньо відформатовані перед вставкою тексту або імпортом даних. Але такі методи "цифрової гігієни" даних широко не застосовуються.

Ця проблема така важлива, що у 2016 році Human Gene Name Consortium перейменував деякі проблемні гени. Наприклад, гени MARCH1 та SEPT1 були перейменовані на MARCHF1 та SEPTIN1 відповідно.

Ця проблема стосується не лише галузі генетики. У 2012 році потужний банківський холдинг США JP Morgan втратив 6 мільярдів доларів. А все через помилки у формулах в таблицях Excel.

Читайте на сайті Легендарна скріпка Clippy може повернутися у Microsoft 365 в новій ролі

Що робити?

Налаштування Microsoft Excel за замовчуванням такі, щоб задовольнити масового користувача, а не вузькоспеціалізовану наукову спільноту. Таблиці підійдуть для "простих" даних.

Наука ж сьогодні наскільки перенасичена інформацією та даними, що Microsoft Excel банально з цим не справляється на автоматичному рівні. Тому потрібно його самостійно налаштувати. Або ж користуватися специфічним програмним забезпеченням.