收藏本站
《太原理工大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于视觉听觉语义相干性的强化学习系统的研究

李誌  
【摘要】:学习支持系统是近年来人工智能在教育中应用的研究热点之一,它是教育学、认知科学和计算机科学的交叉研究领域。多Agent系统的理论与技术,为分布式开放系统的分析、设计和实现提供了一条崭新的途径,因此也被广泛应用于学习支持系统。随着计算机与网络的发展,人们日渐依赖于通过网络进行交互,人们的学习方式也发生了变化,这就要求学习支持系统相应改变,从而对实现它的技术有了更高要求。 本文从分析新形势下人类教育理念的转变和新学习方式入手,对多Agent强化学习系统展开研究,包括单Agent的强化学习算法和多Agent强化学习算法,并对实际应用所需要的用户个性化描述、个性化学习内容呈现等问题进行了探索,主要完成了以下几项研究工作: (1)以历史发展为线索总结了计算机辅助教学的智能化历程,分析了智能教学系统的优势与不足,认为适应性学习支持系统是当前数字化学习支持平台的发展趋势。 (2)在对经典强化学习算法TD算法和Q学习算法进行深入研究的基础上,提出了一种基于偏向信息的强化学习算法,利用预置的偏向信息或先验知识来指导Agent行为选择策略,引导Agent探测状态空间的方向,同时在学习的过程中,不断修改、完善已有的知识,达到提高算法收敛速度的目的。 (3)提出了适合于连续状态空间下的多Agent分层强化学习的半马氏博弈模型SMG,同时给出了此模型对应的MAHRL协同框架,分别对协作子任务和非协作子任务进行形式化描述,阐述了多Agent分层强化学习系统的工作流程并给出了MAHRL(?)(?)同框架的核心-基于Pareto(?)与优解的分层强化学习算法。仿真实验验证了文中所提到的SMG模型、MAHRL(?)办同框架和基于Pareto占优解的分层强化学习算法的有效性和优越性。 (4)根据卡特尔16项个性因素测验法,提出通过心理测验获得受训者量化的关键个性属性值的算法。 (5)提出了恐怖场景个性化呈现算法,结合本文提出的强化学习算法实现了技能学习,可根据受训者的知识技能掌握情况调整操作难度和知识测试点,既防止难度过大使受训者迷茫而失去信心,又避免枯燥重复的操作和测试使其厌烦而失去兴趣。 最后,本文以煤矿救援培训为实例实现了基于视觉听觉语义相干性的训练系统原型,该系统可以根据用户的个性化特征信息,获取与之相适应的素材,组合在一起提供给用户,实现了个性化培训。
【学位授予单位】:太原理工大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP18;TP391.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 李志强,胡晓峰,张斌,董忠林;基于强化学习的指挥控制Agent适应性仿真研究[J];系统仿真学报;2005年11期
2 刘升贵;朱旦晨;;一种基于DFS的Agent强化学习策略研究[J];计算机与现代化;2010年12期
3 唐亮贵;刘波;唐灿;程代杰;;基于神经网络的Agent增强学习模型[J];计算机科学;2007年11期
4 王文玺;肖世德;孟祥印;陈应松;张卫华;;基于Agent的递阶强化学习模型与体系结构[J];机械工程学报;2010年02期
5 黄付亮;张荣国;陈大川;刘焜;;基于联合博弈的多Agent学习[J];计算机与数字工程;2011年06期
6 张尚炜;李世其;;基于强化学习的机械臂避碰研究[J];机械设计与制造;2007年08期
7 王文玺;肖世德;孟祥印;张卫华;;模糊神经网络下基于强化学习的自主式地面车辆路径规划研究[J];中国机械工程;2009年21期
8 程显毅;朱倩;;一种改进的强化学习方法在RoboCup中应用研究[J];广西师范大学学报(自然科学版);2010年03期
9 仲宇,张汝波,顾国昌;分布式强化学习系统的体系结构研究[J];计算机工程与应用;2003年11期
10 李宁,高阳,陆鑫,陈世福;一种基于强化学习的学习Agent[J];计算机研究与发展;2001年09期
中国重要会议论文全文数据库 前10条
1 ;A Note on Two-agent Single-machine Scheduling Problem with Deteriorating Jobs[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 盛惠强;;基于内容和移动Agent的网络计费系统的设计[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 杨海明;程龙;赵佛晓;徐娟;;基于分布式Agent的网格任务调度模型研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 颜宇甲;程国建;毛书君;;基于多Agent系统的生态系统建模和仿真[A];第十二届中国青年信息与管理学者大会论文集[C];2010年
5 李志凌;焦丽萍;;一种改进型Agent体系结构研究[A];第七届中国通信学会学术年会论文集[C];2010年
6 鲍翊平;姚莉;王长缨;尹晓虎;;一种多Agent协作的Q学习算法及其试验研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 郭瑞鹏;王永军;董平;;基于Agent分布式国民经济动员决策支持系统研究[A];Well-off Society Strategies and Systems Engineering--Proceedings of the 13th Annual Conference of System Engineering Society of China[C];2004年
8 陈红英;;基于Agent的GIS服务共享系统的研究[A];第二十七届中国控制会议论文集[C];2008年
9 ;Coordinated Control of Second-Order Multi-Agent Systems With Quantized-Observer[A];中国自动化学会控制理论专业委员会D卷[C];2011年
10 高春蓉;贲可荣;;基于Agent的行为模型在通信对抗仿真中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 Hotsky;昨日重现[N];中国电脑教育报;2003年
7 王宏;从我为网活 到网为我用[N];中国计算机报;2003年
8 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
9 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
10 河北 周建军;用Agent步入新闻组[N];电脑报;2001年
中国博士学位论文全文数据库 前10条
1 焦俊;基于多Agent系统的智能车辆自主行驶控制研究[D];合肥工业大学;2010年
2 贺利坚;多Agent系统中信任和信誉模型的研究[D];北京交通大学;2011年
3 王文玺;基于多Agent系统的自主式地面车辆关键技术研究[D];西南交通大学;2010年
4 高嘉爽;基于Agent及FEA的焊接加工过程协同设计系统研究[D];哈尔滨工业大学;2009年
5 赵欣培;一种基于Agent的软件过程建模方法研究[D];中国科学院研究生院(软件研究所);2005年
6 黄红兵;基于涌现视角的多Agent系统分析研究[D];国防科学技术大学;2009年
7 兰少华;多Agent技术及其应用研究[D];南京理工大学;2002年
8 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
9 赵剑冬;基于Agent的产业集群企业竞争模型与仿真研究[D];华南理工大学;2010年
10 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 黄付亮;联合博弈框架下的多Agent强化学习算法研究[D];太原科技大学;2011年
2 周新华;基于多Agent的信息家电智能化研究[D];湖南师范大学;2009年
3 胡涛;基于多Agent的海洋数据采集与传输系统的研究[D];东华大学;2010年
4 顾陈琳;基于信任度模型的多Agent全局协调[D];南京航空航天大学;2010年
5 吴雪峰;基于Agent的易视监控审计系统设计及应用[D];南京理工大学;2010年
6 谢作坤;基于多Agent的车载信息管理系统[D];浙江工商大学;2010年
7 吕桃霞;基于Agent技术的网络安全审计模型研究与实现[D];山东师范大学;2011年
8 韩珍;驾驶员—车辆Agent微观换道行为的建模[D];中国科学技术大学;2011年
9 洪梅;基于Agent的对等分布式协同入侵检测技术的研究[D];山东大学;2010年
10 莫勇权;多Agent在网络管理中的应用研究[D];兰州大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026