Нова розробка покликана оптимізувати роботу громадського транспорту в густонаселених мегаполісах. Про це повідомляє пресреліз на сайті EurekAlert! з посиланням на дослідження вчених Університету Софії, опубліковане в науковому журналі IEEE Access.
Дивіться також Гуманоїдний робот підкорив вулкан висотою понад 6 кілометрів, але є важливий нюанс
Як учені навчили штучний інтелект керувати поїздом?
У міру того, як міста по всьому світу продовжують стрімко розростатися, залізничний транспорт стає дедалі важливішим елементом міської мобільності. Порівняно з автомобілями та авіацією, поїзди є надзвичайно екологічними та енергоефективними, що робить їх основою для створення екологічно сталих транспортних систем майбутнього. Саме тому фахівці активно шукають нові технології, здатні зробити залізничні перевезення ще комфортнішими, точнішими та дешевшими.
Професор Масафумі Міятаке з Департаменту інженерії та прикладних наук у співпраці з докторантом Мін'ю Лю з Вищої школи науки і технологій Університету Софії дослідив новий підхід до регулювання швидкості поїздів. Наукова праця була опублікована 25 березня 2026 року у 14-му томі авторитетного видання IEEE Access.
В основі розробки лежить технологія навчання з підкріпленням (Reinforcement learning). Простими словами, навчання з підкріпленням – це метод навчання штучного інтелекту, схожий на те, як дресирують собаку або як дитина вчиться на власних помилках. ШІ-агент робить певну дію в середовищі, і якщо вона правильна – отримує "нагороду" (віртуальні бали), а якщо помилкова – "покарання". Шляхом тисяч спроб і помилок алгоритм сам розуміє, яка стратегія є найкращою для досягнення мети.
Наш алгоритм на основі навчання з підкріпленням виявився здатним адаптувати керування рухом поїзда до широкого спектра умов колії та рухомого складу,
– прокоментував Масафумі Міятаке, професор Університету Софії.
Однак у реальному житті керувати поїздом за допомогою звичайного ШІ складно. Залізнична система має багато невідомих чинників: затримки гальмування, інерцію важкого потяга, мінливі погодні умови та суворі вимоги безпеки. Щоб подолати ці виклики, вчені створили рекурентну структуру навчання з підкріпленням на основі алгоритму Recurrent Soft Actor-Critic (RSAC).
RSAC – це просунутий алгоритм ШІ, який не просто оцінює ситуацію "тут і зараз", а має своєрідну пам'ять. Він аналізує попередні дії, історію гальмування та затримки в реакції двигунів, що дозволяє йому передбачати поведінку поїзда наперед і приймати набагато точніші рішення навіть тоді, коли інформація про поточний стан колії є неповною.
Дивіться також Революційна розробка дасть змогу ШІ-агентам учитися безперервно та без втручання людей
У чому полягає унікальність алгоритму RSAC для залізниці?
На відміну від класичних методів штучного інтелекту, запропонований підхід використовує рекурентну нейромережу. Вона здатна утримувати інформацію про минулі стани поїзда. Це дозволило системі враховувати часові затримки тяги, історію гальмування та ефекти інерції. Крім того, розробники застосували хитрий підхід до навчання: спочатку ШІ тренувався на прикладах поведінки досвідчених машиністів-людей (експертному водінні). Завдяки вивченню цих оптимізованих шаблонів на ранніх етапах, штучний інтелект зміг навчатися набагато швидше, приймати кращі рішення та виробити стабільнішу й ефективнішу поведінку.
Важливою частиною системи став інтегрований фільтр безпеки (safety filter). Він виконує роль суворого контролера: якщо ШІ генерує потенційно небезпечну команду, фільтр миттєво блокує її та коригує відповідно до встановлених обмежень швидкості та технічних можливостей гальмування. Це гарантує безпеку навіть у абсолютно нових для алгоритму ситуаціях.
Ефективність нової системи перевірили за допомогою комп'ютерного моделювання міських залізничних операцій на ділянках довжиною близько двох кілометрів між станціями. Симуляція детально відтворювала реальні умови: підйоми та спуски колій, обмеження швидкості, що постійно змінюються, та чіткі вимоги щодо часу прибуття поїзда.
Серед усіх протестованих методів розроблена нами система навчалася швидше та працювала краще, ніж усі інші підходи,
– додав Масафумі Міятаке.
Розробку порівняли з іншими популярними алгоритмами навчання з підкріпленням, такими як Deep Deterministic Policy Gradient (DDPG), Proximal Policy Optimization (PPO), Twin Delayed Deep Deterministic Policy Gradient (TD3) та стандартним Soft Actor-Critic (SAC). Нова система показала найкращі результати, навчаючись швидше за всі інші протестовані методи.
Також дослідження продемонструвало високу енергоефективність. Хоча метод динамічного програмування дає теоретично мінімальне споживання енергії в ідеальних умовах, розроблена ШІ-система досягла майже таких самих показників, але при цьому вона здатна працювати в режимі реального часу. Натомість звичайні алгоритми навчання з підкріпленням демонстрували нестабільну роботу й значно вище споживання енергії.
Які перспективи має впровадження ШІ на залізниці?
Розроблена японськими вченими система відкриває нові можливості для розвитку екологічного та зручного громадського транспорту. Завдяки здатності швидко адаптуватися до мінливих умов колії та стану рухомого складу, цей алгоритм дозволяє здійснювати точне та енергоефективне керування поїздами з відносно низькими фінансовими витратами.
У перспективі впровадження таких технологій допоможе посилити роль залізниць як екологічно безпечного виду транспорту. Це безпосередньо сприятиме пом'якшенню наслідків зміни клімату та підтримає сталий розвиток сучасних мегаполісів.
Крім того, результати дослідження чітко демонструють потенціал інтеграції штучного інтелекту в транспортну інфраструктуру "розумних міст" майбутнього, роблячи перевезення безпечнішими, зеленішими та значно надійнішими для мільйонів пасажирів щодня.


