收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

目标明确的释放型操作示教与增强学习研究

耿鹏  
【摘要】:机器人技术发展迅速,但是机器人操作一直以来依赖传统规划方式,没有智能性与自主决策能力,对于一些复杂操作任务以及无法准确建立环境动力学模型的场景无法胜任。机器人学习方法为机器人操作开辟了一条新道路,通过自主学习避免直接环境建模,获得完成任务的能力,是一个非常热门的研究方向。在各种机器人操作中,释放型操作作为这些操作中的一个典型,具备大部分操作的轨迹生成阶段、轨迹重现阶段以及轨迹优化阶段。本研究最终以释放型操作作为一个典型例子对示教学习以及增强学习在机器人操作方面的应用做进一步的研究。具体是用一个四自由度的WAM机械臂推动一个圆柱体到目标区域。希望能够借助这一研究,将示教学习与增强学习方法的应用推进一步。首先需要示教学习方法提供一个初始解。机器人的运动可以由一个通用的动力学模型来大致表示,然后复现出来,并且可以通过调节模型的参数来对运动进行适当的调整,用来适应环境和目标的轻微变化。动态运动基元法由一个二阶弹簧阻尼系统来适应环境和机器人的动力学模型,并且在系统中加入一个拟合项模仿机器人运动轨迹。从而将复杂的动力学模型转换为参数较少,更加简单的模型。为机器人学习操作提供了初始解。本文结合自己的实践,对传统的虚拟二阶弹簧阻尼系统进行改进,加入多虚拟弹簧阻尼系统,将示教学习轨迹信息与目标信息解耦,将时变转换为时不变,提高了示教的灵活性。得到初始解后,再由增强学习方法优化。基于路径积分的策略提升方法将动态运动基元得到的轨迹进行代价值量化,高代价对应轨迹具有较低的概率,以此更新动态运动基元模型参数,直到机器人能够很好的完成操作任务。


知网文化
【相似文献】
中国期刊全文数据库 前5条
1 陈怡帆;李欣;;基于体感交互的仿人服务机器人增强示教学习的研究[J];信息通信;2017年12期
2 丁辉;适用于模糊综合评判系统的一种机器学习方法[J];微机发展;2003年03期
3 蒋平,李自育,陈阳泉;迭代学习神经网络控制在机器人示教学习中的应用(英文)[J];控制理论与应用;2004年03期
4 项莹莹;;一种连接器自动插针机控制系统设计[J];数字技术与应用;2018年07期
5 李亦菲;自适应学习的理论与实践[J];中小学教学研究;2005年01期
中国博士学位论文全文数据库 前2条
1 金卓军;逆向增强学习和示教学习算法研究及其在智能机器人中的应用[D];浙江大学;2011年
2 胡晋;机械臂运动的示教学习方法与应用研究[D];浙江大学;2018年
中国硕士学位论文全文数据库 前4条
1 耿鹏;目标明确的释放型操作示教与增强学习研究[D];中国科学院大学(中国科学院深圳先进技术研究院);2018年
2 左思翔;基于深度强化学习的无人驾驶智能决策控制研究[D];哈尔滨工业大学;2018年
3 庞皓元;面向装配示教学习的物体跟踪与手势识别[D];浙江大学;2015年
4 沈珑斌;冗余灵巧臂的示教学习[D];浙江大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978