© Беликова Анастасия, ЭФ МГУ
В статье рассматривается модель следования машин в городском траффике. В качестве основной парадигмы используется агентский подход. Поведение отдельного водителя строится при помощи нейросети на основе алгоритма обратного распространения ошибки. Нейросеть обучается на данных о следовании автомобиля в потоке других машин, затем используется для выделения правил поведения водителя при заданных условиях окружающих условиях (траффик и следование машин). Полученная модель сравнивается с классической Gazis–Herman–Rothery (GHR) моделью следования автомобилей. По результатам эмпирического исследования авторов на данных с расширением менее 10Hz агентская нейросетевая модель дает лучшие результаты, чем GHR, и описывает поведение водителя с 95% точностью по траектории перемещения.
Моделирование действий водителей в условиях городского траффика является важной частью моделирования поведения автомобилей на микроуровне и позволяет изучать такие вопросы, как индивидуальное поведение водителей, взаимодействие между ведущей и следующей за ней машиной, а также траффик на макроуровне. Качество модели следования автомобилей зависит от индивидуальных параметров водителей. В результате, оценка этих параметров становится одним из важнейших вопросов. Классические модели определяют экзогенно правила поведения водителей. Разные модели следования автомобилей выделяют разные критерии для принятия того или иного действия. Однако в реальности такие модели оказываются очень ограниченными и могут неверно описывать поведение водителей в связи со сложностью и нестабильность человеческого процесса принятия решений.
В предложенном авторами подходе предлагается вместо использования заранее заданных правил поведения водителей определить эти правила при помощи нейросетевой модели. Таким образом, не требуется делать предположения о виде функции, связывающей состояние на дороге с действиями водителей, однако необходимо иметь массивные данные о состоянии на дорогах и действиях водителей. Авторы использовали обширный набор данных «Изучение вождения грузовиков» (NDTS), включающий опросные данные о действиях водителей в той или иной дорожной ситуации. Эти данные использовались как для построения нейросетевой агентской модели, так и для оценки параметров классической GHR модели.
Модели следования автомобилей активно разрабатываются последние 50 лет. Большинство из них предполагают, что поведение машины, следующей за автомобилем-«лидером», определяется некоторым наблюдаемым сигналом от «лидера» согласно предопределенным правилам. Таким образом, требуется заранее заданная функция этого правила. В модели GHR в качестве сигнала используются разница в скорости и расстояние между машинами, этот сигнал определяет ускорение следующей машины. Определение параметров в моделях следования является важнейшим шагом в моделировании. Параметры зависят от водителя и остаются неизменными при различных ситуациях, образуя задачу оптимизации по поиску параметров, минимизирующих отклонение модельной траектории передвижения автомобиля от реальных случаев. В результате должен быть получен оптимальный набор параметров, который согласно предположению модели наилучшим образом описывает реальное поведение водителей.
Данные, используемые для построения моделей следования, весьма разнообразны и включаются в себя как макро-, так и микроданные. Макронаблюдения получают с дорожных детекторов –скорость на свободной дороге, плотность траффика, скорость при загруженности дорог. Однако такие наблюдения описывают среднее, а не индивидуальное поведение. Микроданные включают в себя данные по траектории движения, включая скорость передвижения и дистанцию между автомобилями, а также некоторые другие наблюдения. Сбор микроданных ведется при помощи индивидуальных датчиков автомобилей, данных с камер наблюдения и сопряжен с большими затратами. Развитие современных технологий постепенно снижает эти затраты, что дает возможность использовать на практике агентский подход.
В предложенной модели агент обучается поведению водителя на основе предыдущих совершенных действий при различных дорожных ситуациях, далее разумно действуя как «клон» этого водителя. Поведение, рассматриваемое в рамках данной агент-ориентированной модели, включает в себя ответ на аварийную ситуацию, взаимодействие между пассажирскими и грузовыми автомобилями, поведение водителей при въезде в зону дорожных работ. Следуя Бонабё (Bonabeau) АОМ покажет хорошие результаты, если агенты гетерогенные, взаимодействия между ними сложны, нелинейны или не непрерывны, агенты имеют сложную модель поведения, включая обучение и адаптацию, что в целом согласуется с описываемой моделью ситуацией.
В АОМ для описания водителя и ситуаций следования автомобилей с точки зрения водителя используется симулятор агента на основе данных о состояниях на дороге, встреченных этим водителем. Обучение водителя производится при помощи нейросети. Агент проходит обучение с учителем, основанное на характеристиках вождения и пары ситуация-действие, полученных на основе реальных данных по траекториям движения. После обучения агент повторяет реальный процесс совершения выбора действия водителем. В качестве действия изучается ускорение автомобиля.
Модель GHR представляет собой общую форму ранних моделей следования автомобилей. Действие водителя, в нашем случае это ускорение, рассматривается как функция от скорости, разницы скоростей между ведущей и следующей машинами и расстояния между ними. Формально, модель имеет вид:
Качество модели зависит от параметров калибровки и способа их оценки.
Перейдем непосредственно к модели нейро-агента (neural agent model). В предложенной модели агент наблюдает окружающую обстановку – состояние на дороге, что похоже на восприятие реального водителя. Далее, аналогично, агент выбирает действие в зависимости от обстановки. В отличие от классических моделей следования автомобилей для построения нейросети не требуется выбирать функцию для описания реакции водителя. Вместо этого, нейросеть связывает обстановку и действия на основе реальных наблюдений. На ограниченном множестве наблюдений нейросеть может выработать правила для определения действий на всем пространстве состояний. Для оценки весов в нейросетевой модели используется алгоритм обратного распространения ошибки. Не будем приводить этот алгоритм. Читателю, желающему уточнить некие подробности этого алгоритма, можно порекомендовать обратиться к классическому труду Хайкина Нейронные сети: полный курс, 2е, 2008 или же обратиться к оригинальной статье. Структура модели описывается следующим образом:
Агент обучается на основе следующих данных: скорость его автомобиля, расстояние между ним и ведущей машиной, разница в скоростях этих автомобилей. Данные получены при помощи радара и спидометра. Стоит отметить, что этот выбор данных обоснован никак не практической ценностью, а лишь необходимость сравнить агентскую нейросетевую модель с классической GHR, для чего требуется построение моделей на одном и том же наборе данных. Структура нейросети включает три входных нейрона с вышеописанными входными данными, один скрытый слой с четырьмя нейронами и неполной связью с предыдущем слоем, один выходной слой – ускорение автомобиля. Нейросеть имеет только направленные вперед связи.
Данные, используемые для оценки двух моделей, включали в себя данные по траектории движения в качестве разрешения 1 и 10 HZ. Для обоих наборов нейросетевая АОМ показала лучший результат по сравнению с GHR, однако ее качество лучше на данных большего разрешения. Напомним, что качество оценивалось по разнице между модельным и реальным действием (ускорение) водителя. Выборка состоит из 10 эпизодов для одного водителя, выбранных из 1133 эпизодов всего из базы NDTS, и включает 10732 состояний на дороге. Выборка разделена на 60% обучающей (train), 20% для оценивания подгонки (validation) и 20% для оценивания работы модели на ранее не наблюдаемых событиях (test). Один из эпизодов, длящийся 48 секунд, проиллюстрирован на графике. Нейросетевая АОМ хорошо описывает поведение водителя, R^2 для разницы в модельном и реальном ускорении равен 95%, в то время как точность GHR модели в терминах R^2 составляет всего 57%.
Заключение. Была предложена нейросетевая агент-ориентированная модель для описания поведения водителей на дороге. Было произведено сравнение данной модели с классической GHR-моделью. Модели строились на основе одних и тех же данных из базы NDTS. По результатам сравнения моделей нейросетевая АОМ показала лучшие результаты, чем GHR. По результатам оценивания непосредственно нейросетевой АОМ модель хорошо описывает поведение водителя при корректном выборе обучающей выборки. В качестве направления для будущих исследований предлагается сравнить предложенную модель с другими моделями следования автомобилей, а также рассмотреть различные спецификации нейросети, обучающей агента. Таким образом, нейро-агент хорошо описывает поведения водителя в различных дорожных ситуациях. Поскольку нейро-агент может обучаться действиям при различных обстановках, предложенная модель в общем виде может охватить гетерогенность действий агента, получающего различные сигналы о ситуации на дороге (что невозможно в рамках классических моделей), однако для этого требуется доработка модели. Например, представляет интерес включение фактора смены полосы. Также стоит отметить, что данные по траффику становятся все более доступными и полными. Включение новых доступных данных также позволит улучшить модель. Несмотря на то, что в данной модели авторы рассматривали лишь движение по прямой, нейросетевая АОМ может быть использована и при наличии в модели поворотов и смены полосы, что выгодно выделяет ее на фоне классического подхода. Кроме того, в статье были рассмотрены эпизоды лишь для одного водителя, в то время как модель позволяет включить и большее число различных водителей, что может быть реализовано на основе имеющихся данных в рамках расширения предложенного подхода.
Оригинал статьи: [Linsen Chong, Montasir Abbas, Alejandra Medina, Simulation of driver behavior with agent-based back-propagation neural network, Transportation Research Record: Journal of the Transportation Research Board, 2011, MIT].