摘要
本文提出一种基于分层深度强化学习方法解决潮汐车道交通信号控制问题,通过构造上层和下层策略来控制整个潮汐车道交叉口信号,高层策略设置了正常信号控制和潮汐车道信号控制两个选项,在低层策略中利用深度强化学习奖励值来优化选项中的相位控制,最终得到整体相位控制策略,最后利用双深度Q网络和经验回放算法进行拟合。在交通仿真软件sumo中进行实验,结果表明:所提方法和算法在与传统深度强化学习相比具有更高的奖励值和更高的车均速度。徐东伟[1]提出了基于深度强化学习(Deep Reinforcement Learning,DRL)的单交叉口信号和多交叉口协调控制模型和研究结果,以及用于评估交通信号控制模型的仿真环境。
出处
《中国储运》
2024年第12期167-168,共2页
China Storage & Transport