收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义词典和局部分析的查询扩展研究

杨海南  
【摘要】:自互联网出现之后,互联网在各领域发展迅猛,知识与信息呈指数增长。同时,互联网的知识泛滥使得互联网用户备受困扰。为了解决信息过载的问题,许多商用搜索引擎成为了信息检索的重要手段。用户通过搜索引擎,输入相关关键词就会得到包含关键词的信息。但是文档与查询词之间的不精确匹配影响了信息检索的效果。为了解决词不匹配问题,可以采用查询扩展的方法,根据统计信息或语义识别技术对关键词进行扩展。 查询扩展常用技术方法如下:基于全局分析的查询扩展、基于局部分析的查询扩展、基于局部分析的查询扩展、基于语义词典的查询扩展等。全局分析和局部分析都是以查询词为中心机械匹配的查询方法,不能从根本上消除用户查询意图与检索的语义偏差;利用语义知识词典的查询扩展方法能消除语义偏差而且不需要大规模语料库的支持,缺点是非即时性,特别是在时效性比较强的领域表现的较为明显。通过吸收语义扩展和统计扩展的长处,本文章对查询扩展问题展开了一系列研究。 本文的创新点在于以下2个方面: 1.提出了一种新的计算词语相关度的算法,并在此基础上,设计了一种基于语义词典和局部分析的查询扩展算法。算法通过语义词典WordNet和局部分析技术获得扩展词之后,运用权重调节技术,将两种扩展词加以融合,得到更多的扩展词。另外,本文也解决了多查询词的问题,使得此算法的实用价值更高。 2.设计了一种可以迭代计算词的相关度和短文本的相关度的算法并分析了算法的时间复杂度。在实验分析部分,通过计算相关系数,验证了算法对词、文本相关度的判断更符合人的判断。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王丽君,高迎,王锡钢;中文检索系统中查询的扩展[J];小型微型计算机系统;2002年07期
2 王明文,聂建云;基于Dempster-Shafer理论的查询扩展模型(英文)[J];江西师范大学学报(自然科学版);2005年03期
3 章旭;石进;谢立;;基于相似性叙词表的模糊集合模型[J];计算机科学;2008年09期
4 闭剑婷;苏一丹;;基于潜在语义分析的跨语言查询扩展方法[J];计算机工程;2009年10期
5 申丽平;;WordNet在查询扩展中的应用研究[J];科技信息;2009年14期
6 李东园;白宇;蔡东风;;面向中文问答的信息检索系统及评测[J];沈阳航空工业学院学报;2009年03期
7 贾可亮;庞秀玲;林培光;;基于集合论的中文问答系统查询扩展(英文)[J];江西师范大学学报(自然科学版);2008年02期
8 王会进,陈超华,李清;基于动态知识库搜索引擎的技术[J];暨南大学学报;2004年01期
9 牟力科;张蕾;张晓孪;;基于概念图的用户兴趣查询扩展模型的研究[J];计算机工程与应用;2008年06期
10 陈晓金;王兵;;信息检索扩展技术研究[J];图书情报工作;2008年12期
11 李小琳;陆汝占;;基于日志挖掘的查询概念图扩展[J];计算机应用与软件;2010年03期
12 吴丹;何大庆;王惠临;;基于伪相关反馈的跨语言查询扩展[J];情报学报;2010年02期
13 徐建民;刘清江;;基于同义词关系的局部查询扩展[J];郑州大学学报(理学版);2010年01期
14 王水利;黄广君;霍亚格;;基于语义分析的查询扩展方法[J];计算机工程;2011年16期
15 冯兰萍,张继国;基于本体的中文信息检索模型[J];河海大学常州分校学报;2004年04期
16 聂卉;;基于本体的查询扩展与规范[J];现代图书情报技术;2007年03期
17 陈晓金;王兵;;智能信息检索扩展方法研究[J];图书情报知识;2008年04期
18 李波;邱锡鹏;曹均阔;;查询扩展在开放领域问答系统中的应用[J];计算机应用与软件;2009年07期
19 王昭龙;李霞;许瑞芳;;多关键字查询中LCA剪枝概念树的查询扩展技术研究[J];计算机科学;2010年04期
20 罗建利;;基于用户兴趣的局部上下文分析方法[J];计算机应用研究;2007年04期
中国重要会议论文全文数据库 前10条
1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
2 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
3 陈忆群;曹瑾音;印鉴;;查询扩展树:关系数据库中的文本检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 马云龙;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
5 周斌;刘茂福;陈建勋;;IR4QA系统中基于维基百科的查询扩展[A];第五届全国青年计算语言学研讨会论文集[C];2010年
6 钟敏娟;万常选;;基于伪反馈的XML查询扩展[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
7 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
8 邵兵;关毅;王强;王晓龙;任瑞春;;基于上下文平均互信息的问句查询扩展模型[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
10 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
2 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
3 王俊义;正负相关反馈与查询扩展技术的研究[D];内蒙古大学;2012年
4 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
5 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
6 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
7 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年
8 刘春辰;基于本体的企业搜索优化技术研究[D];吉林大学;2012年
9 王秉卿;基于机器学习的查询优化研究[D];复旦大学;2012年
10 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
中国硕士学位论文全文数据库 前10条
1 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年
2 贾淑芳;基于用户日志聚类的查询扩展[D];北京邮电大学;2010年
3 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
4 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年
5 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
6 于水;专利术语知识库的建立与应用[D];沈阳航空工业学院;2010年
7 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
8 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
9 赵春辉;基于关联规则挖掘的查询扩展[D];河南大学;2011年
10 胡珍新;面向用户的查询扩展研究与实现[D];江西师范大学;2004年
中国重要报纸全文数据库 前10条
1 柯象中;从斯密到凯恩斯[N];中国财经报;2002年
2 陈涵;审计师千万别"管中窥豹"[N];中国财经报;2005年
3 中国科学院、中国工程院院士潘家铮;关于南水北调的九点看法[N];光明日报;2002年
4 金冲及;中国传统文化三题[N];人民政协报;2005年
5 建行上海分行 朱萌珍;国有银行信贷管理不足与对策[N];上海金融报;2002年
6 毛继东;从观摩课看语文课程改革[N];中国教育报;2006年
7 记者 滕艳 李晓明;第六届国际地质和环境材料分析大会召开[N];地质勘查导报;2006年
8 本报记者 李晓明 滕艳;地质分析技术要立足创新与应用[N];地质勘查导报;2006年
9 丁全利;第六届国际地质和环境材料分析大会在京召开[N];中国国土资源报;2006年
10 华融资产管理公司 李晓鹏;资产管理可以成为经济结构调整的动力[N];中国煤炭报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978