ИИ от Microsoft диагностирует сложные медицинские случаи в четыре раза лучше, чем люди
- Microsoft представила систему искусственного интеллекта MAI-DxO, которая диагностирует сложные медицинские случаи с точностью 85%, по сравнению с 20% у врачей.
- MAI-DxO может взаимодействовать с другими моделями ИИ, улучшая их производительность, и работает в пределах бюджетных ограничений, предотвращая чрезмерное назначение тестов.
Компания Microsoft представила революционную систему искусственного интеллекта MAI-DxO, которая демонстрирует впечатляющие результаты в диагностике сложных медицинских случаев. ИИ правильно определяет диагнозы в 85% случаев, тогда как врачи-практики достигают лишь 20% точности.
Прорыв в медицинской диагностике
Система Microsoft AI Diagnostic Orchestrator показала неожиданно высокие результаты при тестировании на сложных клинических случаях, описанных в New England Journal of Medicine (NEJM). Эти медицинские кейсы известны своей диагностической сложностью и интеллектуальной требовательностью, поскольку обычно требуют участия нескольких специалистов и проведения множественных диагностических тестов, сообщает 24 Канал со ссылкой на Microsoft.
Смотрите также Anthropic уничтожила миллионы печатных книг, чтобы создать свои модели искусственного интеллекта Claude
MAI-DxO способна задавать дополнительные вопросы, назначать анализы и устанавливать диагнозы. Но ее дополнительным плюсом является то, что она может взаимодействовать со сторонними моделями ИИ от других разработчиков. Отмечается, что новая система значительно улучшила диагностическую производительность всех протестированных сторонних моделей, а лучшие результаты были достигнуты в сочетании с o3 от OpenAI.
- Используя модель o3, MAI-DxO правильно решила 85,5% тестовых случаев из NEJM.
- Для сравнения, Microsoft привлекла 21 практикующего врача из США и Великобритании с опытом работы от 5 до 20 лет. На тех же задачах медики показали среднюю точность только 20%.
Для дальнейшей оценки возможностей Microsoft разработала особый тест под названием Sequential Diagnosis Benchmark (SD Bench) – специальное испытание для ИИ, которое превращает 304 случая, описанные в NEJM, в поэтапные диагностические сценарии. Модели могут задавать вопросы и назначать обследования, обновляя свои выводы по мере поступления новой информации.
Кроме диагностических функций, система может работать в пределах определенных бюджетных ограничений, предотвращая чрезмерное назначение тестов.
Microsoft видит потенциал этих инструментов в кардинальной трансформации здравоохранения, давая пациентам возможность самостоятельно управлять рутинными аспектами лечения и обеспечивая врачей передовой поддержкой принятия решений в сложных случаях.
Несмотря на многообещающие результаты, исследования является лишь первым шагом. Перед безопасным внедрением генеративного ИИ в медицинскую практику необходимо собрать дополнительные доказательства из реальных клинических сред. Также нужны соответствующие системы управления и регуляторные рамки для обеспечения надежности и безопасности моделей. Для достижения этих целей Microsoft сотрудничает с медицинскими организациями для тестирования и валидации подходов перед широким внедрением.