收藏本站
《扬州大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于用户兴趣的概念查询扩展研究

罗建利  
【摘要】:本文主要根据目前网络信息检索存在的查全率和查准率低的特点,采用自动的查询扩展方法提高网络信息检索的性能。查询扩展作为解决词的不匹配问题的一种解决方案,已经引起了国内外很多学者的研究。然而目前查询扩展方法仍然存在很大的缺陷,即无法同时解决自然语言中词汇的同义性和歧义性问题,本文在分析传统查询扩展方法不足的基础上,提出了基于用户兴趣的概念查询扩展方法。该方法首先利用特定的分类目录(如Yahoo分类层次目录),构建特定领域的Ontology知识库,利用概念的查询扩展代替传统的基于关键词的查询扩展,从而消除词的同义现象和歧义现象;其次,该方法利用数据挖掘技术、机器学习等方法自主学习用户的兴趣模型,如根据用户的IE浏览历史记录、用户收藏夹、日志文件等挖掘用户的浏览习惯,构建个性化的查询扩展方法,从而消除查询扩展词的歧义性。本论文通过对查询扩展方法的进一步研究,对于提高Web信息检索的性能具有重大的现实意义。论文的主要工作包括以下方面: 基础理论研究:研究了现有的查询扩展方法的特点以及不足,提出了基于用户兴趣的概念查询扩展方法。通过构建特定领域的ontology知识库和挖掘用户的兴趣主题相结合来消除查询词及扩展词的同义性和歧义性,从而提高网络信息检索的性能。 特定领域Ontology知识库的构建:从Yahoo目录层次中对每一个目录下的文档进行分析,抽取关键词,然后根据特定的关键词集与其对应的文档集形成一个概念,这一概念中的关键词就可以被用来进行扩展。另外,为了防止不同用户对同一概念的不同描述,即同义词现象,可以采用WORDNET中的同义词对概念进行扩充。 用户兴趣建模:消用上述方法建立的ontology知识库为训练样本,对SVM分类器进行训练,然后对用户收藏夹和用户IE浏览历史文件进行分类,从而挖掘用户的兴趣模型。 查询扩展机制:研究在用户初始化查询的基础上,通过结合用户兴趣主题和知识库,提出两种具体的查询扩展方法。 实验结果及评估:简单介绍了为实现基于用户兴趣的概念查询扩展的原型系统的
【学位授予单位】:扬州大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP311.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 杨瑞朋;刘凤荣;彭祥新;;智能Agent技术在个性化信息检索中的应用[J];兵工自动化;2008年01期
2 和海莲;曾玉华;;向量空间模型中的用户模型建立方法探讨[J];福建电脑;2007年07期
3 吕铁强,于满泉,孟庆发,周立德;基于网页分块的个性化信息采集的研究与设计[J];微电子学与计算机;2005年10期
4 罗伟;李陶深;;一种基于本体的个性化搜索引擎模型[J];广西科学院学报;2006年04期
5 范玉霞;;基于用户兴趣的分组模型在电子图书馆检索中的应用研究[J];商场现代化;2010年16期
6 陆娟;;浅析当前网络信息检索与过滤技术[J];科技情报开发与经济;2006年23期
7 董立奇;;Internet智能信息检索技术研究[J];商丘职业技术学院学报;2007年02期
8 郭琳;基于IF的数字图书馆个性化服务系统[J];图书馆理论与实践;2005年04期
9 李健;李雪梅;;基于用户兴趣和工作背景的信息收集个性化实现方案[J];图书馆论坛;2007年02期
10 陈基漓;牛秦洲;;基于用户反馈的兴趣模型在信息检索中的应用[J];信息技术;2008年02期
中国重要会议论文全文数据库 前10条
1 罗伟;李陶深;;一种基于本体的个性化搜索引擎模型[A];广西计算机学会2006年年会论文集[C];2006年
2 梁婷婷;张志强;谢晓芹;;搜索引擎评估算法综述[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
3 孙金立;李路路;王栋;;生物信息检索教学网的建设[A];向数字化转型的图书馆工作[C];2004年
4 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
5 孙金立;李路路;董明强;;建立生物信息检索教学网的研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
6 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
7 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
8 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
9 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
10 于志刚;杨金生;;农业机械网络书签[A];第十三次全国农机维修学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 希安;微软试水信息检索[N];经济日报;2004年
2 叶静;开辟信息检索的新天地[N];人民邮电;2001年
3 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年
4 刘静一;个人档案信息检索[N];建筑报;2000年
5 潘竑;智能搜索:让政府网站从被动走向主动[N];金融时报;2006年
6 刘光强;搜索个人、企业、垂直三大搜索新进展[N];中国计算机报;2007年
7 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年
8 刘立新;信息社会技术前瞻[N];学习时报;2006年
9 常燕杰;商用搜索 须打智慧牌[N];中国计算机报;2006年
10 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 左家莉;信息检索中Markov网络图模型研究[D];江西财经大学;2011年
2 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
3 谢兴;社会网络中兴趣发现与信息组织的研究[D];复旦大学;2011年
4 张召;在线论坛用户兴趣图谱发现与个性化信息推荐[D];华东师范大学;2012年
5 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年
6 董道国;高维数据索引结构研究[D];复旦大学;2005年
7 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
8 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
9 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
10 林古立;互联网信息检索中的多样化排序研究及应用[D];华南理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 邱春艳;基于粗糙集理论的智能信息检索方法的研究[D];东北师范大学;2005年
2 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
3 和雪芳;基于移动Agent的个性化信息检索技术研究[D];西安理工大学;2005年
4 张敏;基于Web挖掘的个性化信息检索研究[D];山东科技大学;2004年
5 张璇;基于用户兴趣的个性化搜索引擎技术研究[D];湖南大学;2010年
6 栾悉道;互联网公开情报收集与处理技术研究[D];国防科学技术大学;2003年
7 刘春旭;大规模数据发送中基于复合控制原理的用户兴趣的自适应模型[D];四川大学;2001年
8 冯子威;用户兴趣建模的研究[D];哈尔滨工业大学;2010年
9 肖坤;面向用户兴趣的校园网聚类搜索引擎的研究与实现[D];国防科学技术大学;2010年
10 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026