Как это работает

Ученые проанализировали данные о состоянии здоровья и привязанности к рынку труда 6 миллионов датчан с 2008 по 2020 год с помощью модели, получившей название Life2vec. Набор данных о здоровье содержит записи о посещении медицинских учреждений, диагнозы, тип пациента и степень неотложности. Также включена информация о доходах, зарплате, стипендии, типе работы, отрасли, социальных льготах.

Смотрите также Искусственный интеллект впервые совершил научное открытие, которого не было в его учебных данных

Модель изучила закономерности в данных. Она превзошла другие сложные нейронные сети и научилась точно предсказывать такие результаты, как личностные характеристики и вероятное время смерти. Ученые в этом случае рассматривали человеческую жизнь как длинную последовательность событий с определенной логикой и закономерностью, аналогичную построению предложения из слов, где то или иное слово с определенной вероятностью может использоваться после предыдущего, учитывая особенности языка.

Прогнозы Life2vec являются ответами на общие вопросы, например, возможна ли смерть в течение четырех лет. Ее результаты согласуются с имеющимися открытиями в области социальных наук. Так, при прочих равных условиях люди, занимающие руководящую должность или имеющие высокий доход, имеют больше шансов прожить дольше. В то же время исследования свидетельствуют о более высоком риске смерти у мужчин, квалифицированных специалистов или людей с психическими диагнозами.

Life2vec кодирует данные в большую систему векторов — математическую структуру, которая упорядочивает различные данные. Модель сама решает, где разместить данные о времени рождения, учебе, образовании, зарплате, жилье и здоровье.

Авторы статьи отмечают, что Life2vec вызывает ряд этических вопросов, например, по защите конфиденциальности данных и предвзятости. Прежде чем использовать эту модель, необходимо устранить эти проблемы. В перспективе Life2vec может использоваться для оценки риска заражения определенным заболеванием или других событий, которые можно предотвратить. Такие технологии прогнозирования событий уже используются в технологических компаниях для отслеживания поведения пользователей в социальных сетях, создания точных профилей и прогнозирования дальнейших действий.

Следующим шагом будет интеграция дополнительных типов информации — текстов, изображений и данных о социальных связях. Это откроет новые возможности для взаимодействия между социальными науками и науками о здравоохранении.