收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于互信息的语义查询扩展技术研究

王水利  
【摘要】:在信息检索系统的运用过程中,由于一般用户无法提出完整规范信息的查询式,很容易导致查询漂移的产生。为了解决这个问题,查询扩展技术应运而生,但是发展到今天该技术还没有真正成熟。其根本原因是以往的扩展方法只是机械的通过共现或者仅仅利用某种资源对查询中的关键词进行孤立的扩展,没有从根本上解决问题。只有从语义的层面上对原查询进行分析,根据分析结果来进行查询扩展才能从根本上解决根本问题。 本课题对现有的查询扩展方法进行了深入研究和分析,结合前人研究成果本文提出了一种基于互信息的语义查询扩展算法。此方法结合大规模通用语料库的统计信息和根据语言学知识基于语义的扩展词构造两种扩展方式,从来源于生活的文档和人工生成的语义词典两种资源选取扩展词,结合扩展词与原查询词在语义词典的相似度以及在文档集中的的互信息给扩展词赋综合权值,根据权值的大小设定阈值作为扩展词的选择依据,最终得到新的查询式。 由于一般用户只对搜索引擎中的前若干条返回信息感兴趣,所以提高返回文档的前若干条的查准率有一定的实用价值,于是在本课题中加入了基于文档重构的返回文档重排序模块。 最后,实现了本课题的算法,并做了相应的实验。由对比实验结果可知,利用本课题提出的算法检索性能MAP(Mean Average Precision)和Prec@20都有明显提高。本文算法在多数情况下,提高了检索质量,本文提出的算法有一定的实用价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 洪智勇;王天擎;刘灿涛;;一种新的互信息特征子集评价函数[J];计算机工程与应用;2011年22期
2 韩月阳;邓世昆;贾时银;李远方;;基于字分类的中文分词的研究[J];计算机技术与发展;2011年07期
3 常青;马营涛;;基于片词模糊匹配技术的在线考试系统[J];煤炭技术;2011年09期
4 吴谋硕;;基于用户信息的信息检索效果提高策略[J];电脑知识与技术;2011年21期
5 黄名选;马瑞兴;兰慧红;;面向查询扩展的特征词频繁项集挖掘算法[J];现代图书情报技术;2011年04期
6 黄名选;朱家安;陈燕红;;面向查询扩展的词间正负关联规则挖掘算法[J];计算机工程与应用;2011年26期
7 郭崇慧;张艳昌;;基于率失真理论的模糊聚类模型与算法[J];情报学报;2011年08期
8 韩敏;梁志平;;改进型平均移位柱状图估算概率密度并对互信息作相关分析[J];控制理论与应用;2011年06期
9 朱颢东;李红婵;;基于互信息和粗糙集理论的特征选择[J];计算机工程;2011年15期
10 张永兴;孙四明;张峰;;基于本体的信息检索系统研究[J];微计算机信息;2011年07期
11 龙志祎;程葳;;基于词聚类的热点话题检测算法[J];计算机工程与设计;2011年06期
12 霍亚格;黄广君;;基于最大熵的汉语短语结构识别方法[J];计算机工程;2011年16期
13 赵珊;高国红;赵倩;;结合边缘信息的图像检索技术[J];小型微型计算机系统;2011年07期
14 沈友文;赵新建;徐俊;;一种改进的集中度和分散度文本特征选择算法[J];计算机应用与软件;2011年09期
15 王丽娟;章辉;;通讯访问约束条件下线性随机系统的状态可估计性[J];控制理论与应用;2011年09期
16 张净;孙志挥;宋余庆;倪巍伟;晏燕华;;基于信息论的高维海量数据离群点挖掘[J];计算机科学;2011年07期
17 何敏;章兢;王炼红;晏敏;陈华;;基于信息熵和组合纹理特征的熟料状态检测[J];仪器仪表学报;2011年08期
18 黄名选;朱家安;冯平;;基于正负关联规则融合的信息检索模型[J];情报理论与实践;2011年07期
19 方志龙;;文本特征选择算法MI的改进[J];计算机与现代化;2011年07期
20 许光;;一种综合考虑目标检测与估计的波形设计方法[J];现代雷达;2011年07期
中国重要会议论文全文数据库 前10条
1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
2 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
3 龙旭霞;李洪东;范伟;许青松;梁逸曾;;基于互信息的模型集群分析变量选择方法研究[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年
4 宗仁鹤;朱祥胜;刘良成;曾钢燕;;基于互信息的医学图像配准[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
5 王芳;万常选;;基于互信息的中文完整词自动识别模型[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 邵兵;关毅;王强;王晓龙;任瑞春;;基于上下文平均互信息的问句查询扩展模型[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 安镇文;张乃玲;;地震活动的互信息研究[A];中国地震学会第九次学术大会论文摘要集——纪念李善邦先生百年诞辰[C];2002年
8 陈忆群;曹瑾音;印鉴;;查询扩展树:关系数据库中的文本检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
9 马云龙;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
10 周斌;刘茂福;陈建勋;;IR4QA系统中基于维基百科的查询扩展[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国硕士学位论文全文数据库 前10条
1 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年
2 贾淑芳;基于用户日志聚类的查询扩展[D];北京邮电大学;2010年
3 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
4 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
5 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年
6 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
7 于水;专利术语知识库的建立与应用[D];沈阳航空工业学院;2010年
8 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
9 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
10 赵春辉;基于关联规则挖掘的查询扩展[D];河南大学;2011年
中国重要报纸全文数据库 前10条
1 水兵;助力珠峰攀登[N];中国计算机报;2003年
2 本报记者 王人墨;泉州市晋光小学构建新型教学模式[N];福建日报;2000年
3 高岚;打造统一平台 管理安全信息[N];中国计算机报;2003年
4 本报记者 杨磊;被告葛兰素史克[N];21世纪经济报道;2003年
5 尹伯成;风险管理“指引”楼市理性化[N];文汇报;2004年
6 应晓敏 窦文华;技术架构[N];计算机世界;2003年
7 继东;联想笔记本“四剑”齐发[N];经理日报;2004年
8 王政;奥运:带来的不仅是商机[N];中国计算机报;2004年
9 晓东;联想笔记本“四剑”齐发 “奥运品质”飞入寻常百姓家[N];中国经营报;2004年
10 赵亚丽 西广成 刘艳骄;相关系数法探讨齿痕舌特点[N];中国医药报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978