基于强化学习的多时隙铁路空车实时调配研究

谭雪; 张小强; 石红国; 成嘉琪

首页> 中文期刊> 《交通运输工程与信息学报》 >基于强化学习的多时隙铁路空车实时调配研究

基于强化学习的多时隙铁路空车实时调配研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

铁路空车调配计划是进行运输组织的基础和重要条件,空车供求关系的时空变化特性和运输生产的动态性,使求解多时隙空车实时调配最优策略变得困难.强化学习中的Q-learning时序差分算法能较好地解决不完全信息下的大规模序列决策问题,故本文将决策周期划分为若干个时隙,提出多时隙空车实时调配模型:首先利用空车实际调配的局部马尔科夫特性改进Q-learning算法,进行"单一空车调配策略评估"以量化单一空车在决策周期内所有时空状态下采取不同行动的长期回报;然后提出空车实时优先调配算法,求解决策周期全局最优的调配策略.算例表明模型可以兼顾实时调配长期回报最大、空走距离小、即时需求响应程度高,求解出每时隙下最优且决策周期全局最优的实时调配策略,以使运输部门快速适应变化的货运市场需求、提供科学合理的空车实时调配策略是可行的.

著录项

来源
《交通运输工程与信息学报》 |2020年第4期|53-60|共8页
作者
谭雪; 张小强; 石红国; 成嘉琪;
展开▼
作者单位

西南交通大学交通运输与物流学院成都 611756;

西南交通大学交通运输与物流学院成都 611756;

综合交通运输智能化国家地方联合工程实验室成都 611756;

西南交通大学交通运输与物流学院成都 611756;

综合交通运输智能化国家地方联合工程实验室成都 611756;

上海市政工程设计研究总院(集团)有限公司上海 200000;

展开▼
原文格式 PDF
正文语种 chi
中图分类日常铁路运输计划编制与调整;
关键词
铁路运输; 空车实时调配; 强化学习; 空车; 多时隙;

相似文献

中文文献
外文文献
专利

1. 基于磁吸效应的铁路日班计划中空车调配算法的研究 [J] . 蒋灵明 ,刘永壮 ,燕翔 . 铁路通信信号工程技术 . 2019,第011期
2. 基于成本与时效的铁路空车调配优化模型研究 [J] . 闫建文 ,魏玉光 . 山东科学 . 2017,第004期
3. 基于企业效益与客户满意度的铁路空车调配优化研究 [J] . 王菲 . 物流技术 . 2015,第012期
4. 基于时间满意度的铁路枢纽空车调配随机机会约束模型及算法研究 [J] . 刘星材 ,何世伟 ,孙杨 . 铁道学报 . 2013,第009期
5. 基于vba编程调用Lingo的铁路空车调配研究 [J] . 许斌 ,林柏梁 ,纪丽君 . 铁路计算机应用 . 2011,第001期
6. 基于区域阈值的铁路空车调配算法研究 [C] . Jin Fucai ,金福才 . 第十三届中国智能交通年会 . -1
7. 铁路空车调配优化研究及其在紧急状态下铁路空车调配问题的应用 [A] . 庞尔国 . 2016

基于强化学习的多时隙铁路空车实时调配研究

摘要

著录项

相似文献

相关主题

期刊订阅