一种仿生发育算法在两轮机器人中的研究
【摘要】:针对两轮机器人的自平衡控制与路径规划的问题进行研究,借鉴发展心理学中内在动机的概念作为智能体发育模型中的内部奖励,提出一种基于内在动机的仿生发育算法。该算法利用不同的学习框架,受发展心理学所启发,将内在动机作为内部奖励,最终提高机器人在未知环境下的学习效率,驱动机器人的学习过程。论文取得的主要研究成果如下:1)基于内在动机的强化学习算法论文在有关发展心理学、机器人学和生物神经科学的研究基础上,提出了一种基于内在动机的强化学习算法。将该算法应用在两轮自平衡机器人上,使其渐进的学会了行为与奖赏信号或惩罚信号之间的对应关系,从而使机器人完成了自平衡控制。2)基于内在动机的学习自动机算法针对机器人在未知环境中学习自适应能力差问题,结合心理学内在动机思想,提出了一种基于内在动机的学习自动机算法。该算法使机器人通过与环境进行“感知-动作-感知”的交互过程,并由内在动机机制作用,使机器人学会了动作与奖励信号之间的对应关系,从而完成了路径规划任务。3)基于小脑-基底核-大脑皮层回路的机器人认知发育算法针对机器人连续行为学习问题,模拟人或动物神经系统结构及其神经信息演化规律,根据生理学中感觉运动系统的相关知识,引入心理学中的内在动机机制驱动学习,提出一种基于小脑-基底核-大脑皮层回路的机器人认知发育算法。该算法能够成功的使机器人学会平衡控制技能,具有一定的鲁棒性,表现出了良好的自组织、自适应和自学习能力。