收藏本站
《哈尔滨工程大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

具有认知能力的智能机器人行为学习方法研究

王作为  
【摘要】:行为学习是智能机器人设计中的关键技术之一。目前,机器人行为学习方法只限于学习反射式行为。人为给出任务的知识表示结构,根据训练样本来不断调整参数,一旦任务改变则需要重新编程。具有该行为学习能力的系统不具备认知能力,无法产生复杂的智能行为。研究具有认知能力的机器人系统已经成为机器人学研究的重要方向,研究涉及认知心理学、认知科学以及动物行为学等领域。 本文着重研究了机器人的认知机制,深入分析了认知模型对于机器人智能发展的重要性。提出了具有认知能力的智能机器人体系结构,并对认知模型中的知识表示以及学习方法进行深入研究,最后利用该研究成果实现了环境的空间认知,自底向上突现出了多任务规划行为。论文的主要工作如下: 首先,本文从智能产生的角度重新对机器人的范式进行分类。新的范式分类不仅涵盖了传统的系统范式,而且完善了智能机器人的认知层次,区分了不同的智能等级,明确了认知能力在机器人系统范式中的地位。在此基础上,本文提出了具有认知能力的智能机器人体系结构。该体系结构具有自主学习的能力,只需要给出基本的反射式行为,所有的高级认知能力都可以通过自主学习得到,不需重新编程。各模块之间互相依赖并且可以同时学习,具有实时的学习能力。 其次,研究了环境特征的自组织提取,利用“主动感知行为”和“感知-运动协调”来获得环境特征。给出基于变化检测和激活强度的活性神经元设计方法,并利用动态增长自组织特征图(GDSOM)实现了路标的自组织提取和路标识别。实验表明该路标提取和识别方法无需精确定位控制和传感器度量模型,具有较好的鲁棒性和计算速度,并且有效解决了“感知变化性”问题,为认知能力打下基础。 再次,研究了时空经验的知识表示和学习方法。讨论了认知数学模型——观测驱动马尔科夫决策过程(ODMDP)并提出了相应的求解策略。借鉴生物神经元的特性,提出一种新的生物神经网络模型—时空联想记忆网络(STAMN)。该网络实现了状态和行动的增量学习并且解决了ODMDP的状态定位问题。利用STAMN实现了环境的空间认知,实验表明该网络可以用于解决循环环境的同时全局定位和标图(SLAM)问题。 最后,研究了具有认知能力的强化学习方法。针对机器人所面临的多任务学习问题,提出了具有认知能力的强化学习模型,并提出了适合多任务学习的k步记忆和k步预测的Sarsa((k-M)(k-P) Sarsa)算法。该强化学习模型解决了ODMDP的策略学习问题,并且具有较好的收敛速度。迷宫环境实验验证了智能机器人的多任务学习的有效性。
【学位授予单位】:哈尔滨工程大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP242

【引证文献】
中国期刊全文数据库 前1条
1 王作为;张汝波;;基于二维GDSOM的路标动态自组织提取方法[J];模式识别与人工智能;2012年06期
【参考文献】
中国期刊全文数据库 前9条
1 高颖;陈东岳;张立明;;一种带有实时视觉特征学习的自主发育机器人探索[J];复旦学报(自然科学版);2005年06期
2 危辉,何新贵;表象式直接知识表示[J];计算机学报;2001年08期
3 刘娟,蔡自兴,涂春鸣;一种基于连接机制和时空经验的认知地图学习与导航方法(英文)[J];控制理论与应用;2003年02期
4 蔡自兴,贺汉根,陈虹;未知环境中移动机器人导航控制研究的若干问题[J];控制与决策;2002年04期
5 危辉,栾尚敏;基于连通结构与动力学过程的知觉记忆层次模型[J];软件学报;2004年11期
6 聂爱情,郭春彦;情节记忆的神经科学研究综述[J];首都师范大学学报(社会科学版);2004年05期
7 于化龙;朱长明;刘海波;顾国昌;沈晶;;发育机器人研究综述[J];智能系统学报;2007年04期
8 刘景钊;内隐认知与意会知识的深层机制[J];自然辩证法研究;1999年06期
9 李恒威;黄华新;;表征与认知发展[J];中国社会科学;2006年02期
中国博士学位论文全文数据库 前1条
1 刘娟;基于时空信息与认知模型的移动机器人导航机制研究[D];中南大学;2003年
【共引文献】
中国期刊全文数据库 前10条
1 韩强;;基于广义Hough变换的手写文档整词定位[J];安徽电子信息职业技术学院学报;2011年05期
2 程刚;郑小华;阳锋;徐祖舰;;三维全景视觉技术在农业机器人中的应用[J];安徽农业科学;2010年34期
3 孙升阳;沈新玉;胡柯;戴小华;孙建华;;基于粒子群算法的单机架冷轧硅钢负荷分配的优化方法[J];安徽冶金;2010年01期
4 张四方;;兼顾板形的单机架UCM冷轧机负荷分配的优化方法[J];安徽冶金;2010年04期
5 邵康;张长征;陈肖肖;;两种染色方法对小脑浦肯野细胞显示效果的比较[J];安庆师范学院学报(自然科学版);2007年04期
6 何海燕;施培蓓;;基于改进AdaBoost算法的行人检测方法[J];安庆师范学院学报(自然科学版);2009年03期
7 张峰;王金超;陈雪波;;机器人队形控制中的二叉树方法[J];辽宁科技大学学报;2010年05期
8 王华叶,林岭;学校体育对心理发展的促进作用及其机制剖析——北师大附中学校体育案例的启示与思考[J];安徽体育科技;2005年04期
9 吴慧兰;刘国栋;刘炳国;胡涛;浦昭邦;;ICF实验靶定位技术研究[J];半导体光电;2008年05期
10 张冬梅;刘强;;一种基于强化学习的传感器网络应用重构决策方法[J];北京交通大学学报;2010年03期
中国重要会议论文全文数据库 前10条
1 李美生;张红慧;王青云;;起搏器控制下的非全同神经元之间的同步问题[A];第十三届全国非线性振动暨第十届全国非线性动力学和运动稳定性学术会议摘要集[C];2011年
2 吴强;王煦法;;“数字水利”及其关键技术[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 刘善磊;张亮;;基于相位相关和SURF算法的关键帧实时匹配研究[A];江苏省测绘学会2011年学术年会论文集[C];2011年
4 隋树林;孙立宏;姚文龙;袁健;;融合改进UKF/SIFT信息的自主光学导航方法[A];第二十六届中国控制会议论文集[C];2007年
5 汪力;叶桦;夏良正;;利用特征点定位嘴巴[A];第二十六届中国控制会议论文集[C];2007年
6 ;Loop-closing By Using SIFT Features for Mobile Robots[A];第二十六届中国控制会议论文集[C];2007年
7 王红;周越;;移动机器人的分层式运动规划方法研究[A];第二十七届中国控制会议论文集[C];2008年
8 仲朝亮;刘士荣;吕强;;RobSim:一种多移动机器人仿真系统[A];第二十七届中国控制会议论文集[C];2008年
9 毛剑琳;向凤红;冯丽辉;;一种改进的IEEE802.15.4自适应实时带宽分配策略[A];第二十七届中国控制会议论文集[C];2008年
10 马丽;刘惟一;;多个交通路口调度博弈模型及其均衡求解的增强学习算法[A];第二十七届中国控制会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 王玉全;基于全景视觉的移动机器人同时定位与地图创建方法研究[D];哈尔滨工程大学;2010年
2 张子迎;多机器人协作及环境建模技术研究[D];哈尔滨工程大学;2009年
3 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
4 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
5 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
6 毛宇峰;水下机器人系统体系结构及避障控制技术研究[D];哈尔滨工程大学;2010年
7 肖洁;视觉注意模型及其在目标感知中的应用研究[D];华中科技大学;2010年
8 朱清波;序列图像三维重建方法研究[D];华中科技大学;2010年
9 田文;多视图图像的快速三维场景重建[D];华中科技大学;2010年
10 涂虬;智能视觉监视中目标检测与跟踪算法研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘思情;鳅超科鱼类若干基因的进化及分子系统发育分析[D];华中农业大学;2010年
2 何慧娟;基于多传感器的移动机器人障碍物检测与定位研究[D];安徽工程大学;2010年
3 汪步云;水下作业机械手抓取力伺服控制的研究[D];安徽工程大学;2010年
4 宋抗;压缩机活塞圆度误差数字检测系统研究[D];河南理工大学;2010年
5 陈忠翔;基于立体视觉的三维重建方法研究[D];南昌航空大学;2010年
6 李瑞波;图像阴影的检测与去除算法研究[D];山东科技大学;2010年
7 雒燕飞;地质灾害应急地理信息数据库设计及其应用[D];山东科技大学;2010年
8 唐红梅;基于辐射与空间信息的遥感图像检索[D];山东科技大学;2010年
9 倪希亮;基于尺度不变特征的多源遥感影像配准[D];山东科技大学;2010年
10 贾伟洁;SAR影像与光学影像配准研究[D];山东科技大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 廖晓峰,虞厥邦;延迟双向联想记忆神经网络的周期振荡现象研究[J];电子科学学刊;1999年01期
2 王炎,廖晓峰,吴中福,虞厥邦;一个带时延神经网络的分岔现象研究[J];电子科学学刊;2000年06期
3 高颖;陈东岳;张立明;;一种带有实时视觉特征学习的自主发育机器人探索[J];复旦学报(自然科学版);2005年06期
4 朱淼良,吴春明,张友军,金毅,李捷;基于多智能体的实时并发式智能机器人结构[J];高技术通讯;1995年10期
5 廖晓峰,吴中福,秦拯;依赖时延BAM神经网络的全局吸引性分析[J];计算机研究与发展;2000年07期
6 吴卫国,陈辉堂,王月娟,张秀华;基于彩色图像的移动机器人定位[J];机器人;1999年05期
7 危辉,何新贵;基于视中枢神经机制的层次网络计算模型[J];计算机学报;2000年06期
8 张铃;支持向量机理论与基于规划的神经网络学习算法[J];计算机学报;2001年02期
9 王珏,袁小红,石纯一,郝继刚;关于知识表示的讨论[J];计算机学报;1995年03期
10 王卫华,陈卫东,席裕庚;基于彩色图像的机器人视觉声纳实现[J];计算机自动测量与控制;2000年04期
【相似文献】
中国期刊全文数据库 前10条
1 ;连线[J];互联网周刊;2005年36期
2 ;仿生、反恐排爆机器人[J];中国制造业信息化;2005年11期
3 雄;;变形金刚热 电玩机器人大检阅[J];数码世界(B版);2007年10期
4 ;机器人时代来临[J];少年读者;2009年09期
5 晓燕;;机器人研究新进展[J];科学之友;1997年05期
6 Zobot;生命的模仿还是进化——从电子宠物看机器人世界[J];大众硬件;2003年02期
7 ;引领智能互联网时代小i机器人再获风投[J];个人电脑;2007年04期
8 胡坤;;非凡的军用机器人[J];党员干部之友;2000年06期
9 ;双龙SL积木式轮式智能机器人[J];信息技术教育;2005年10期
10 安林;;可穿戴型助残助老机器人[J];老同志之友;2009年07期
中国重要会议论文全文数据库 前10条
1 张汝波;顾国昌;张国印;;智能机器人行为学习方法研究[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
2 陈晓军;陈丽;;小学机器人课堂教学活动形式与方法研究[A];信息技术环境构建与教学应用[C];2009年
3 潘英俊;;智能机器人触觉传感技术的研究进展[A];大珩先生九十华诞文集暨中国光学学会2004年学术大会论文集[C];2004年
4 闫天瑜;杜刚;刘敏;;移动声源平面定位系统设计[A];北京高教学会实验室工作研究会2009年学术研讨会论文集[C];2009年
5 王菁华;崔世钢;罗云林;;基于Matlab的智能机器人路径规划仿真[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年
6 王健;赵雁南;孙发杰;王家钦;郝悍勇;;大型复杂曲面水火弯板智能机器人控制系统的研究和设计[A];2001年中国智能自动化会议论文集(上册)[C];2001年
7 吉俊杰;李保全;袁佳宁;;智能机器人局部路径规划器的设计[A];1999中国控制与决策学术年会论文集[C];1999年
8 杨淮清;;一种新型行走轨迹规划方法及其在移动机器人中的应用[A];1999年中国智能自动化学术会议论文集(下册)[C];1999年
9 孙增圻;李实;;RoboCup与智能自动化技术[A];1999年中国智能自动化学术会议论文集(上册)[C];1999年
10 简鼎立;邹治华;郭智宏;吴圣伦;;植基于多机器人之智慧型保全系统[A];第二十七届中国控制会议论文集[C];2008年
中国重要报纸全文数据库 前10条
1 记者 魏东 通讯员 张劲 徐攀;电力智能机器人工程技术研究中心通过验收[N];科技日报;2009年
2 记者 秦羽 通讯员 杨迪 褚惠强;杭州湾大桥“体检” 智能机器人“把脉”[N];宁波日报;2010年
3 记者 向杰;中航集团将造家用智能机器人[N];科技日报;2010年
4 尹传红;人类真能造出智能机器人吗?[N];工人日报;2011年
5 辛闻;能上网发邮件智能机器人问世[N];中华合作时报;2003年
6 本报记者 李蕾 丁波 实习生 陈盈娱;智能机器人灵巧惊煞人[N];解放日报;2009年
7 记者 吴苡婷;智能机器人沪上打擂台[N];上海科技报;2009年
8 记者 张梦然;智能机器人学会了欺骗人类[N];科技日报;2010年
9 唐新培;航天惯控开造智能机器人[N];中国航天报;2011年
10 王莹;33所 研究智能机器人构筑技术融合平台[N];中国航天报;2011年
中国博士学位论文全文数据库 前10条
1 王作为;具有认知能力的智能机器人行为学习方法研究[D];哈尔滨工程大学;2010年
2 袁夏;基于激光雷达的智能机器人环境理解关键技术研究[D];南京理工大学;2010年
3 赵德安;静电喷涂机器人变量喷涂轨迹优化关键技术研究[D];江苏大学;2012年
4 吕世增;空心非球型手腕喷涂机器人设计及关键技术研究[D];天津大学;2012年
5 李正义;机器人与环境间力/位置控制技术研究与应用[D];华中科技大学;2011年
6 刘海波;智能机器人神经心理模型研究[D];哈尔滨工程大学;2005年
7 唐振民;智能移动机器人及群体关键技术研究[D];南京理工大学;2002年
8 马宏波;基于视觉传感的机器人铝合金脉冲TIG焊接过程MLD建模方法研究[D];上海交通大学;2011年
9 陈东岳;具有感知和认知能力的智能机器人若干问题的研究[D];复旦大学;2007年
10 宁宇;基于数字化工厂的轿车地板焊装线的混流设计与规划[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 王琦;基于规则的智能机器人的决策子系统研究与实现[D];北方工业大学;2010年
2 陈巧敏;专家系统在核电站智能机器人中的应用研究[D];华北电力大学(北京);2011年
3 王作为;基于进化算法的智能机器人行为学习研究[D];哈尔滨工程大学;2006年
4 王帅;基于虚拟机的教育机器人软件设计[D];华南理工大学;2010年
5 黄思姬;地面武装机器人机械系统设计与实验研究[D];南京理工大学;2011年
6 刘亮;标记机器人的关键技术研究[D];上海交通大学;2011年
7 张婧慧;机器人滚边技术及其应用研究[D];合肥工业大学;2010年
8 王玮;白车身机器人焊装自动线关键装备技术的研究[D];合肥工业大学;2010年
9 冯晓波;机器人准确制孔技术研究[D];浙江大学;2011年
10 朱潜;群体机器人的设计与实现[D];上海交通大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026