收藏本站
《内蒙古大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语言模型的信息检索中负反馈技术的研究与实现

宋海林  
【摘要】:21世纪是网络经济的时代,伴随着互联网的迅速发展,internet上的信息量在不断增加,然而如何从浩瀚的信息海洋中得到所需要的信息就显得更加有意义。 在信息检索中,搜索引擎使用排序算法对被检索文档根据与查询的相关性大小进行排序,研究者们提出了关于相关性的数学检索模型。语言模型是目前性能较好的模型。对于困难查询(difficult query)来说,检索结果较差并且排序靠前的文档很少有与用户需求相关的,怎样在语言模型下使用那些不相关的信息来提高检索精度呢?就提出了相关反馈技术的特殊情形即负反馈技术。 本文主要提出了基于语言模型的信息检索中正相关反馈和负反馈相结合的方法,在语言模型框架下应用类似于向量空间模型中的Rocchio反馈方法的反馈算法,对查询进行扩展和查询词的概率进行修改。本文主要考虑初次检索结果的前十个文档,作为查询扩展的局部文档情形,一般传统地认为这十个文档都是相关文档,用来进行伪相关性反馈。本文是将前十个文档分开考虑,根据与标准的相关性判断文件的比较,将它们分为与查询相关的文档集和与查询不相关的文档集,分别与原查询生成正模型和负模型,即在正模型中出现又在负模型中出现的词加到查询中对查询进行扩展,并且适当地增加在相关文档中出现的查询词的概率,减少在不相关文档中出现的查询词的概率,即把相关性反馈和负反馈相结合来提高扩展后查询的精确度,从而使得新查询模型的检索结果性能较伪相关性反馈后的查询和原查询都有很大的提高。
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.3

【相似文献】
中国期刊全文数据库 前10条
1 于兴艳;孔真;;浅析基于web的跨语言信息检索之现状[J];信息通信;2011年04期
2 吴思萍;;高等院校图书馆的个性化服务研究[J];华章;2011年13期
3 王真;刘海燕;;搜索引擎的比较及在网络信息检索中的作用[J];黑龙江科技信息;2011年18期
4 刘姝;;知识可视化在信息检索中的实际应用[J];图书馆杂志;2011年06期
5 张文慧;张冉;;基于中文分词的农业信息检索平台设计[J];安徽农业科学;2011年20期
6 李琦;;本体用于信息检索的研究浅析[J];情报探索;2011年07期
7 顾国庆;周艳;黄江娓;;搜索引擎——图书馆的新工具[J];景德镇高专学报;2011年02期
8 杨永健;;浅议图书馆新型OPAC系统发展趋势——以汇文OPAC系统为例[J];四川图书馆学报;2011年03期
9 俞平;;信息检索中文献漏检误检因素分析[J];情报科学;2011年08期
10 李亚楠;;高校图书馆与大学生素质教育的关系研究[J];现代阅读(教育版);2011年15期
中国重要会议论文全文数据库 前10条
1 张伟;马建庆;钟亦平;;基于滑动窗口提取和IDF过滤方法的专家搜索系统研究[A];第五届全国信息检索学术会议论文集[C];2009年
2 韩中元;李生;杨沐昀;齐浩亮;;面向信息检索的近邻语言模型[A];第六届全国信息检索学术会议论文集[C];2010年
3 孙金立;李路路;王栋;;生物信息检索教学网的建设[A];向数字化转型的图书馆工作[C];2004年
4 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
5 刘全升;姚天昉;;基于关联度模型的文本倾向性检索研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 孙金立;李路路;董明强;;建立生物信息检索教学网的研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
7 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
9 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
10 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国重要报纸全文数据库 前10条
1 希安;微软试水信息检索[N];经济日报;2004年
2 叶静;开辟信息检索的新天地[N];人民邮电;2001年
3 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年
4 清华大学 刘加;识别语音的几种依据[N];计算机世界;2006年
5 刘静一;个人档案信息检索[N];建筑报;2000年
6 刘光强;搜索个人、企业、垂直三大搜索新进展[N];中国计算机报;2007年
7 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年
8 刘立新;信息社会技术前瞻[N];学习时报;2006年
9 常燕杰;商用搜索 须打智慧牌[N];中国计算机报;2006年
10 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 张俊林;基于语言模型的信息检索系统研究[D];中国科学院研究生院(软件研究所);2004年
2 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
3 蒲强;基于独立分量分析的语义聚类技术在信息检索中的应用研究[D];电子科技大学;2010年
4 胡熠;面向信息检索的文本内容分析[D];上海交通大学;2007年
5 徐军;面向金融信息检索的体裁分类与情感分析技术研究[D];哈尔滨工业大学;2011年
6 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年
7 董道国;高维数据索引结构研究[D];复旦大学;2005年
8 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
9 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
10 林古立;互联网信息检索中的多样化排序研究及应用[D];华南理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 王银丽;限定领域内智能问答系统的研究与实现[D];内蒙古大学;2008年
2 宋海林;基于语言模型的信息检索中负反馈技术的研究与实现[D];内蒙古大学;2011年
3 李新生;基于改进语言模型的相关反馈方法的检索系统设计[D];北京邮电大学;2011年
4 潘奇;基于语言模型的XML信息检索的研究与实现[D];内蒙古大学;2010年
5 吴光远;依存语言模型在信息检索中的应用研究[D];天津大学;2004年
6 张润延;海量语言模型的研究及其在机器翻译中的应用[D];厦门大学;2009年
7 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年
8 杨才峰;基于自动分类的元搜索引擎的研究与应用[D];华北电力大学(河北);2005年
9 郭磊;P2P系统中的信息检索理论及应用研究[D];山东师范大学;2011年
10 管玉娟;基于智能Agent的个性化信息检索技术研究[D];西安建筑科技大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026