收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

强化学习在个性化信息Agent的应用研究

卢方国  
【摘要】: 20世纪90年代以来,Internet得到了飞速发展,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。如何从数以亿计的页面中迅速、准确地搜索到满足用户需求的信息成了人们迫切需求解决的问题。传统的搜索引擎虽然在一定程度上解决了资源定位问题,但仍不能满足人们对信息质量日益增长的需求。因此,很多研究工作者们正在试图把人工智能的理论运用到信息检索中来,以提高检索的查全率和查准率。本文对信息Agent所涉及的关键技术进行了比较深刻的研究,把强化学习算法引入到搜索引擎的动态调度中来,实现了搜索引擎的智能化调度。作者在研究和借鉴国内外Web检索技术的基础上开发出了一个智能化、个性化的信息Agent。 在本文中,我们的主要工作集中在以下几个方面: 1.比较全面地研究了信息Agent所涉及的领域知识,对信息过滤,兴趣学习,元搜索引擎技术进行了详细的介绍。 2.对强化学习算法的理论、主要算法和提高强化学习速度的方法进行了比较深刻的研究,并运用强化学习算法的建模方法建立起了一个搜索引擎调度模型,在实际应用中取得了比较好的效果。 3.采用了基于加权向量空间法的信息过滤技术,对成员搜索引擎返回的结果进行过滤。 4.采用了基于向量空间法的隐式兴趣学习方法,能够在没有用户的直接干预下学习到用户的兴趣。 我们开发的信息Agent由四大功能模块组成,分别是用户接口Agent、搜索Agent、兴趣学习Agent、结果处理Agent。各个模块彼此独立,又相互协作,构成了一个有机的整体,较好地实现了系统的智能性和自适应性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 夏丽丽;;连续状态-连续行动强化学习[J];电脑知识与技术;2011年19期
2 祝宇虹;毛俊鑫;;基于人工情感与Q学习的机器人行为决策[J];机械与电子;2011年07期
3 刘卫红;周义莲;;强化学习方法在Web服务组合中的应用比较研究[J];计算机应用与软件;2011年07期
4 黄付亮;张荣国;陈大川;刘焜;;基于联合博弈的多Agent学习[J];计算机与数字工程;2011年06期
5 张文柱;邵丽娜;;异构无线网络中基于强化学习的频谱管理算法[J];西安电子科技大学学报;2011年04期
6 李昭阁;;强化学习,更新观念,发挥校园网作用[J];学周刊;2011年12期
7 许培;薛伟;;基于Q-learning的一种多Agent系统结构模型[J];计算机与数字工程;2011年08期
8 常晓军;;基于联合强化学习的RoboCup-2D传球策略[J];计算机工程与应用;2011年23期
9 冯爱平;;浅谈提高计算机教学的方式和方法[J];才智;2011年21期
10 冯侦探;尤佳莉;倪宏;;P2P VOD系统邻居节点查找算法[J];计算机工程与应用;2011年24期
11 王世进;;面向制造任务动态分配的改进合同网机制[J];计算机集成制造系统;2011年06期
12 刘一松;李倩倩;;一种最优规划程序设计语言OPPLFC[J];计算机应用研究;2011年08期
13 蔡建羡;阮晓钢;;基于遗传算法的Skinner操作条件反射学习模型[J];系统工程与电子技术;2011年06期
14 左敏;曾广平;涂序彦;魏伟;;基于平行进化的机器人智能控制研究[J];计算机仿真;2011年08期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
2 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
3 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
4 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
5 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
6 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
7 涂自然;王维;梁以业;禹建丽;;基于强化学习的自适应变步长机器人路径规划算法[A];2003年中国智能自动化会议论文集(上册)[C];2003年
8 叶道年;陈卫东;;机器人团队协作的强化学习[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
9 方宝富;王浩;姚宏亮;杨静;周晋;;Q学习在机器人足球中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
10 潘凌寒;程显毅;;RoboCup仿真比赛中机器学习问题的研究[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 徐明亮;强化学习及其应用研究[D];江南大学;2010年
3 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
4 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
5 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
6 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
7 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
8 庄晓东;多移动机器人运动控制策略的强化学习研究[D];中国海洋大学;2005年
9 孙碧波;基于学习行为的噪声交易者情绪演化研究[D];复旦大学;2005年
10 祖丽楠;多机器人系统自主协作控制与强化学习研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
2 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
3 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
4 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
5 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
6 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
7 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
8 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
9 袁继彬;大规模Markov系统基于性能势学习的NDP优化方法研究[D];合肥工业大学;2005年
10 汪向利;基于多Agent的生产计划与调度系统研究与开发[D];浙江工业大学;2006年
中国重要报纸全文数据库 前10条
1 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
2 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
3 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
4 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
5 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
6 陈滟澎 张玮(作者单位:市交通局公路处);强化学习提高机关办事效能[N];廊坊日报;2006年
7 记者王旭燕、实习生张娜;强化学习抓好落实 确保完成全年目标任务[N];铜川日报;2009年
8 关真付;唐山市文化局强化学习狠抓落实[N];中国文化报;2003年
9 记者 刘莉 实习记者 刘慕欣;兵团党委“保先”教育活动督导组强化学习[N];兵团日报(汉);2005年
10 朱玉亭 孙良景 鞠允国;强化学习重结合认真整改谋发展[N];人民公安报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978