改进Q-learning算法在路径规划中的应用摘要:Q-learning算法是环境未知条件下的有效强化学习算法,该算法在路径规划中被广泛应用
针对Q-learning算法在离散状态下存在运行效率低、学习速度慢等问题,提出一种改进的Q-learning算法,在栅格环境下进行仿真实验,并成功地应用在多障碍物环境下移动机器人路径规划,结果证明了算法的可行性
改进Q-learning算法可以以更快的速度收敛、学习次数明显减少、效率最大可提高20%
同时该算法框架对解决同类问题具有较强的通用性
关键词:路径规划;改进Q-learning算法;强化学习;栅格法;机器人中图分类号:TP391文献标志码:AApplicationofimprovedQ-learningalgorithminpathplanningAbstract:Q-learningalgorithmisaneffectivereinforcementlearningalgorithmundertheconditionofunknownenvironment,whichiswidelyusedinpathplanning
AimingattheproblemoflowefficiencyandslowlearningindiscretestateofQ-learningalgorithm,animprovedQ-learningalgorithmisproposedtosimulateingridenvironment
Ithasbeen收稿日期:2018年月日
基金项目:吉林省重点科技攻关计划项目(20170204052GX)
大学生创新创业训练项目(2016A65288)
作者简介:千承辉(1975年),女,高工,博士
研究方向:智能仪器与微弱信号采集技术
E-mail:qianch@jlu
cnsuccess