收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于改进Q-学习的导航知识获取算法研究

贺振东  
【摘要】: 本文在分析了移动机器人导航控制的基础上,根据反应式导航与强化学习模型的相似性,将强化学习应用到智能导航上,重点研究了基于Q-学习的导航知识获取算法。 研究了强化学习的时间差分算法、自适应启发评价算法、Q-学习算法等主要算法。分析了强化学习中主要存在的探索利用之间的平衡问题、连续状态动作空间问题、信度分配问题以及不完整信息等问题,并给出了解决这些问题一些方法。文中还对分布式强化学习作了简要的介绍,其中包括分布式强化学习的主要算法和存在的主要问题及问题的主要解决方法。 基本Q-学习算法总是利用当前最优策略进行动作的选取,这样容易陷入局部最优。本文分析了解决此问题的一些方法,但是这些方法存在盲目探索及找到最优路径后的重复学习。对此,在基于模拟退火强化学习基础上提出了基于探索区域扩张的Q-学习,加入原地探索策略,提高了找到目标的效率;引入了探索区域扩张策略,避免了初始时在整个环境中加入探索的盲目性,提高了学习效率;加入算法的自主学习结束条件,避免了找到最优路径后的重复学习,节省了学习时间。仿真实验验证了算法的有效性。 针对强化学习中连续状态动作空间问题,分析了目前强化学习中用到的泛化方法,虽然也提出了连续状态的强化学习,但是目前国内还没有提出连续动作的强化学习,本文提出了基于神经网络的连续状态动作空间的Q-学习。既解决了强化学习的维数灾难,又为强化学习应用到实际机器人奠定了基础。仿真实验验证了算法的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 义;华东水利学院第四期水文預报訓练班已胜利結业[J];水文;1965年02期
2 宋淑红;;注重学习过程进行机电专业项目式教学[J];中国科教创新导刊;2008年34期
3 陈鹏飞;;工程制图学习过程中常遇到的三种问题的分析及解决方法[J];中国教育技术装备;2010年36期
4 韩兆德;;学习毛主席著作的收获和体会[J];中国建材;1960年13期
5 杨祖闹;;中职学生如何学好《汽车自动变速器》[J];经营管理者;2009年15期
6 王明红;;论探究性学习在生物教学中的应用[J];中国电力教育;2010年04期
7 鞠慧敏;崔武子;孙力红;;程序设计课程中合作学习的设计与实践[J];北京联合大学学报(自然科学版);2007年03期
8 蒋友宝;贺艺华;杨春侠;;结构稳定性课程采用五星教学模式的探索[J];高等建筑教育;2008年01期
9 屈克英;张晓伟;;高职学生学习的自我监控能力调查[J];山东电力高等专科学校学报;2008年03期
10 崔建刚;卞卡;魏东;;浅谈如何提高施教能力[J];中国新技术新产品;2009年12期
11 王钢;;师范生专业实践能力的培养——现代认知心理学的视角[J];常熟理工学院学报;2009年06期
12 相燕;;浅谈如何调动学生的学习主动性[J];中国水运(理论版);2007年11期
13 于会;张墨华;李伟华;于鑫;;战术决策中基于Petri网的知识表示与权值训练[J];火力与指挥控制;2008年07期
14 宋艳;透视美术教学中的探究性学习[J];郑州铁路职业技术学院学报;2005年02期
15 方福康;;神经系统中的复杂性研究[J];上海理工大学学报;2011年02期
16 马央平;;非英语专业学生英语自主学习能力的调查和分析——以宁波工程学院为例[J];宁波工程学院学报;2010年01期
17 顾超雄;;催眠让孩子从此开始迷上学习——专访北京海普诺斯(催眠)疗法研究中心主任马春树博士[J];中国防伪报道;2010年10期
18 周航;阮秋琦;;基于SBB算法的复杂背景手势输入系统[J];铁道学报;2007年05期
19 晨光;;职工学习要树立“四种意识”[J];水利天地;2010年07期
20 王悦;;法国鸵鸟抬头了吗?[J];汽车商业评论;2010年06期
中国重要会议论文全文数据库 前10条
1 苏凯敏;韩关德;;中学生学习过程中的心理疲劳现象分析与疏导[A];中国心理卫生协会青少年心理卫生专业委员会第八届全国学术会议论文集[C];2002年
2 秦启康;奚仲廉;;“开潜教育”的心理学研究[A];中国民办教育家优秀论文集[C];2006年
3 陈绍清;;复习课中深入学生学习过程,提高学习结果[A];国家教师科研基金“十一五”成果集(中国名校卷)(五)[C];2009年
4 杨丽霞;;重视学生学习物理的过程[A];国家教师科研基金“十一五”成果集(中国名校卷)(五)[C];2009年
5 李权康;陈义明;;“活性评价”在学生学习过程中的应用[A];国家教师科研基金“十一五”成果集(中国名校卷)(三)[C];2009年
6 黄水琴;吴晓敏;;小学语文课堂三个“不等式”[A];江苏省教育学会2005年小学语文优秀论文集[C];2005年
7 陈绍清;;复习课中深入学生学习过程,提高学习结果[A];国家教师科研基金十一五阶段性成果集(四川卷)[C];2010年
8 杨丽霞;;重视学生学习物理的过程[A];国家教师科研基金十一五阶段性成果集(四川卷)[C];2010年
9 陶文娟;赵雪玉;;“点”燃学生智慧的火花[A];江苏省教育学会2006年年会论文集(文科专辑)[C];2006年
10 哈尔滨市继红小学课题组;;构建“综合实践学习教学模式” 努力提高学生的综合素质课题研究报告[A];走进新教育:黑龙江省教育学会“十五”教育科学研究规划项目成果集[C];2006年
中国博士学位论文全文数据库 前10条
1 周琰;大学生认识信念研究[D];南京师范大学;2011年
2 李娟;促进教师观察了解儿童学习与发展水平的研究[D];华东师范大学;2011年
3 陈坤;在线核学习建模算法及应用研究[D];浙江大学;2011年
4 覃姜维;迁移学习方法研究及其在跨领域数据分类中的应用[D];华南理工大学;2011年
5 陈德品;基于迁移学习的跨领域排序学习算法研究[D];中国科学技术大学;2010年
6 刘艳;期望价值、学习目地和学习行为:汉语作为第二语言学习动机研究[D];南京大学;2012年
7 杜伟宇;复杂陈述性知识学习的研究[D];华东师范大学;2005年
8 王广斌;基于流形学习的旋转机械故障诊断方法研究[D];中南大学;2010年
9 程凡;基于排序学习的信息检索模型研究[D];中国科学技术大学;2012年
10 吕佳;基于局部学习的半监督分类问题研究[D];内蒙古大学;2012年
中国硕士学位论文全文数据库 前10条
1 刘彩姣;论学习的实践属性[D];华中师范大学;2011年
2 奚莹;欧洲先前学习认证研究[D];兰州大学;2012年
3 卢江;基于智能手机的大学生移动学习调查研究[D];山西师范大学;2014年
4 徐振恒;初中生数学学习习惯现状的调查与研究[D];华中师范大学;2014年
5 关红蕾;美国高校服务学习的理念及实践研究[D];河北大学;2014年
6 郝艳丽;高中数学学习优秀生的数学学习知识结构研究[D];天津师范大学;2014年
7 刘力玮;“泛在学习”与高校网络思想政治教育创新研究[D];电子科技大学;2012年
8 章静;农村初中生学习拖延特点及干预研究[D];湖南师范大学;2013年
9 杨帆;基于知识点的移动学习课程资源设计研究[D];西南交通大学;2014年
10 王娟;高中语文学习动力探究[D];信阳师范学院;2014年
中国重要报纸全文数据库 前10条
1 通讯员 黄慧文;吉隆全体党员开展“比学促学”活动[N];日喀则报;2008年
2 冀灵渊 朔城区四中;为学生创设快乐的学习情境[N];朔州日报;2010年
3 山东省临沭县白旄中学 张秀伟;如何培养中学生学习历史的习惯[N];学知报;2011年
4 本报记者 靳晓燕;哦,学习是能倒着来的[N];光明日报;2011年
5 郭佳 编译;21世纪的学习什么样[N];中国教师报;2011年
6 李林 余承武;努力把基层学习抓实抓深[N];战士报;2011年
7 剑河民族中学 刘明;刍议性格与学习的关系[N];贵州民族报;2011年
8 民乐县逸夫小学 宋晓华;用爱心培养学生主动学习的兴趣[N];张掖日报;2005年
9 河北省邯郸县第6中学 王建彬;学习着,并快乐着[N];学知报;2011年
10 姜堰市东桥中心小学 杨爱军;在课文课堂中渗透心理教育[N];成才导报.教育周刊;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978