Об этом разработчики сообщили в статье, которую представят на конференции CVPR 2018.
Читайте также: Ученые случайно создали "психопата"
Поскольку алгоритмы компьютерного зрения уже достаточно точные, их стали применять для автоматизации наблюдения и выявления преступлений. В некоторых странах системы видеонаблюдения в общественных местах используются вместе с подобными алгоритмами, которые помогают распознавать людей в толпе и сверять их с базой розыска. Кроме того, есть разработки, которые позволяют не только выявлять людей, но и анализировать их действия, например, существует алгоритм, который обнаруживает забытые вещи.
Группа исследователей из Великобритании и Индии решила использовать для сбора данных дрон, который может летать над людьми. Стоит отметить, что авторы уже представляли подобную систему в 2014 году, но она имела гораздо меньшую точность, а распознавание велось не в реальном времени.
Сравнение точности распознавания с предыдущим алгоритмом
Разработчики выбрали квадракоптер Parrot AR, оснащенный камерой, который записывает видео с разрешением 720p и частотой 30 кадров в секунду. Поскольку анализ такого видеопотока в реальном времени невозможно проводить на бортовом компьютере, данные пересылаются через интернет на облачный сервер с гораздо большей вычислительной мощностью.
Читайте также: Ученые определили, какие объятия с роботом больше нравятся людям
Обработка изображения происходит в три этапа. Сначала кадры видео передаются разработанной в Facebook нейросети FPN, которая использует пирамиды изображений и созданные на их основе пирамиды признаков для эффективного распознавания людей в кадре независимо от их размера и фона. Затем части изображения, на которых система распознала людей, передаются сверхточной нейросети, которая определяет на изображении человека 14 точек, из которых создается упрощенная модель скелета. После этого алгоритм, который использует метод опорных векторов, анализирует вычисленное на предыдущем этапе положение частей тела и сопоставляет его с положениями, соответствующими насильственному поведению.
Превращение кадра из видео в модель скелета
Для того, чтобы нейросеть научилась определять положение частей тела и понимать, что на кадре происходит насилие, исследователи создали датасет, состоящий из двух тысяч размеченных снимков, снятых с дрона. На снимках изображены несколько человек, примерно половина из которых вовлечены в насильственные действия: бьют или душат другого человека или направляют на него пистолет или нож. У каждого человека на снимке размечена модель скелета и подписано их действие.
Читайте также: Ученые развенчали миф о пользе секс-роботов для здоровья
Демонстрация работы дрона, который выявляет насилие – смотрите видео
Больше публикаций, касающихся новостей из мира технологий, гаджетов и искусственного интеллекта, читайте в разделе Техно.