Международное соревнование FLATLAND
Заказчик
НИУ ВШЭ Санкт-ПерербургИсполнитель
Центр анализа данных и машинного обучения НИУ ВШЭРуководитель проекта
Шпильман Алексей АлександровичЦель исследования
Разработка децентрализованного метода контроля железнодорожного трафикаРезультат
Для решения данной задачи мы адаптировали алгоритм Proximal Policy Optimization для решения задачи децентрализованного мультиагентного управления поездами. Преимуществом данного подхода является то, что он масштабируется значительно легче, чем существующие эвристические подходы, так как принимаемое алгоритмом решение основывается только на том, что происходит рядом с ним. Полученный алгоритм позволил нам занять 1-е место в RL направлении и 8-е место в общем зачете в международном соревновании Flatland на конференции NeurIPS 2020Публикации
Shpilman A. et. al. Flatland Competition 2020: MAPF and MARL for EfficientTrain Coordination on a Grid World // Proceedings of Machine Learning Research, 2020
Рисунки
Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.