收藏本站
《扬州大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于文档查询信息的检索系统研究与实现

杭月芹  
【摘要】:随着Internet技术的飞速发展,人们越来越多地依赖网络这个巨大的知识平台。作为用户利用网络信息的重要接口,搜索引擎的发展自Web诞生之日起就一直没有停息。同时,计算机的日益普及和人们运用电脑阅读要求的提高使得数字图书馆及相关技术得以兴起和成长。人们从文档中获得查询并提交给搜索引擎成为现代检索信息、获取知识的一种常见模式。目前这两种获取信息的方式基本是被分离开来使用的。如果能够将文本浏览器和搜索引擎有效结合起来,对于用户及时而有效地获取信息,具有极其重要的意义。 然而,目前的搜索引擎无法很好地满足用户的信息需求。主要原因是用户提交的查询信息不足,降低了查询精度。查询扩展优化是解决查询词歧义性的一个有效办法。本文总结和分析了国内外查询扩展优化技术的相关理论和技术,根据用户进行检索的情境,提出了基于文档上下文查询信息抽取算法,并在此基础上实现了一个有效的基于单文档上下文的交互式查询扩展系统。本文的主要贡献如下: (1)在文本浏览器中嵌入一个信息检索系统。通过VisuH C++中的动态连接库(DLL),在Word浏览器中嵌入基于单文档上下文的交互式查询扩展系统的功能插件。 (2)提出了基于文档上下文查询信息抽取算法。该算法将全局分析和局部分析结合起来从单文档中抽取用户选定查询的上下文信息。通过全局分析提取用户一定的查询兴趣,利用局部分析消除查询词的歧义性。 (3)交互式查询扩展用户界面的设计。设计出一个便于用户选择和更正查询扩展词的交互式友好界面,以提高检索的精度。 (4)为了利用网络上其他形式的数据库信息,运用了多线程式的并行元搜索引擎方法,并对其中涉及的难点问题进行了探讨和实现。 本文基于不同知识领域内的英文电子文档对系统进行了测试,试验结果表明,利用上述的处理技术后,系统在信息检索的用户操作环境、查准率、查全率等方面均有很大程度的提高。
【学位授予单位】:扬州大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP391.3

【引证文献】
中国期刊全文数据库 前3条
1 朱杰;吴树芳;王妍;刘永利;;信息检索概述[J];大众科技;2009年04期
2 张中夏;周兴社;王海鹏;;基于本体与上下文感知矩阵的查询扩展算法[J];电子设计工程;2011年07期
3 焦玉英;宋晓晴;;基于VSM的文档信息检索改进[J];情报理论与实践;2007年01期
中国硕士学位论文全文数据库 前3条
1 张敏;基于Flex平台的信息可视化开发工具的设计与实现[D];华中科技大学;2009年
2 李淑丽;信息可视化工具的比较研究[D];黑龙江大学;2006年
3 郭昊;基于LUCENE的舆情信息搜索引擎的研究与实现[D];解放军信息工程大学;2012年
【参考文献】
中国期刊全文数据库 前1条
1 崔航,文继荣,李敏强;基于用户日志的查询扩展统计模型[J];软件学报;2003年09期
【共引文献】
中国期刊全文数据库 前10条
1 孙素芬;罗长寿;张峻峰;于峰;张树亮;;农业信息资源整合系统研究与应用[J];安徽农业科学;2007年22期
2 季元叶;;服务发现体系架构发展现状及新架构的研究[J];办公自动化;2012年10期
3 李玉鑑;操卫平;周兰珍;;结构化向量空间模型及其在Web信息检索中的应用[J];北京工业大学学报;2008年04期
4 余正涛,樊孝忠,宋丽荣;基于特定问题类别的汉语问答系统查询扩展[J];北京理工大学学报;2005年10期
5 李红梅;丁振国;周水生;周利华;;元搜索引擎结果合成算法[J];北京邮电大学学报;2008年05期
6 吴锐;丁树良;甘登文;;一种新的项目反应理论等值准则——余弦准则[J];江西师范大学学报(自然科学版);2008年02期
7 陈治昂;张毅;李大学;;基于Web智能的网络广告监测器研究与设计[J];重庆邮电大学学报(自然科学版);2009年01期
8 丛荣华;;网络教育中的数据收集技术[J];长春师范学院学报;2006年10期
9 尚冬娟;张敏;;信息过滤系统中的混合式过滤算法[J];重庆工学院学报(自然科学版);2008年01期
10 杜友福;程彩凤;赵鸣;;搜索引擎中智能代理技术及启发式搜索策略研究[J];长江大学学报(自然科学版)理工卷;2009年02期
中国重要会议论文全文数据库 前10条
1 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
2 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
3 王凯;刘代志;李东旭;齐玮;;地球物理环境情报搜集系统研究[A];国家安全地球物理丛书(四)——地球物理环境探测和目标信息获取与处理[C];2008年
4 张赪军;刘祥瑞;李军;黄红梅;;基于本体的语义检索技术研究[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
5 张赪军;黄红梅;王晨熙;李军;;构建智能信息检索系统[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
6 顾寄南;陈晓燕;;检索系统专业化和智能化的研究与实现[A];走中国特色农业机械化道路——中国农业机械学会2008年学术年会论文集(下册)[C];2008年
7 张威;张博刚;廖飞雄;陈月宁;;基于软件运行记录的交互测试研究[A];第六届中国测试学术会议论文集[C];2010年
8 王洪俊;赖志国;施水才;肖诗斌;;基于查询日志的查询建议挖掘[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 盛俊;王明文;余俊英;;一种基于潜在语义的Markov网络信息检索模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
10 徐小琴;章成志;;Web信息检索中相关词提示技术与评测[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
2 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
3 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
4 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
5 卢克斌;炼钢—连铸生产计划与调度的优化方法研究及应用[D];东北大学;2010年
6 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
7 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年
8 吕凝;基于内容的视频数据库多模式检索方法研究[D];吉林大学;2005年
9 李智;机器学习方法及其在基金项目评审中的应用研究[D];天津大学;2004年
10 南凯;面向关系型数据共享的数据网格中间件研究[D];中国科学院研究生院(计算技术研究所);2006年
中国硕士学位论文全文数据库 前10条
1 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
2 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
3 岳广飞;基于二次搜索的搜索引擎技术研究[D];山东科技大学;2010年
4 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
5 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
6 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
7 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年
8 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
9 朱莹婷;基于迁移学习理论的Markov检索模型[D];江西师范大学;2010年
10 丛肖为;敏感信息监管系统的设计与实现[D];华东师范大学;2010年
【同被引文献】
中国期刊全文数据库 前7条
1 钱揖丽,郑家恒;中文文本词性自动校对系统的实现[J];电脑开发与应用;2004年01期
2 周珍娟;张字平;陆玲;;基于Lucene2.0的电子文献全文检索系统[J];电脑知识与技术(学术交流);2007年23期
3 温艳鸿;;基于lucene的文件搜索引擎的设计与扩展[J];福建电脑;2007年08期
4 王娟琴;三种检索模型的比较分析研究——布尔、概率、向量空间模型[J];情报科学;1998年03期
5 陈继红,青晓;四种搜索引擎的比较研究[J];情报科学;2003年10期
6 张自然,金燕;知识检索与信息检索的检索效率比较[J];情报科学;2005年04期
7 张小芳;;几种常见信息检索模型的分析与评价[J];情报杂志;2008年03期
中国博士学位论文全文数据库 前2条
1 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
2 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 孙登峰;XML文档信息检索技术研究与实现[D];中国人民解放军国防科学技术大学;2002年
2 刘红星;分布式系统中的文本信息检索技术研究[D];清华大学;2004年
3 周亮;基于OWL-S的Web服务发现[D];南京理工大学;2005年
4 姜华;基于Lucene面向主题搜索引擎的研究与设计[D];华东师范大学;2007年
5 王钦;基于数据挖掘的智能答疑系统的研究与设计[D];济南大学;2007年
6 王蓉;医学网站站内搜索引擎研究与实现[D];南昌大学;2007年
7 张维维;搜索引擎的研究与实现[D];长春理工大学;2008年
8 高洪杰;互联网舆情监测分析系统实现[D];复旦大学;2009年
9 李玉华;面向主题的舆情采集搜索爬虫的设计与实现[D];山东大学;2009年
10 陈丽萍;校园BBS舆情数据收集与提取系统的设计与实现[D];华中科技大学;2009年
【二级引证文献】
中国期刊全文数据库 前4条
1 胡哲;朱强;;基于本体的查询扩展研究[J];电脑知识与技术;2010年05期
2 朱耀华;郝文宁;陈刚;;可视化技术简述[J];电脑知识与技术;2012年06期
3 门秀萍;;基于多领域的元搜索引擎[J];广东石油化工学院学报;2011年06期
4 王宁;黄红雨;仲秋雁;王延章;;基于知识元的突发事件衍生网络仿真平台的设计与实现[J];情报杂志;2012年11期
中国博士学位论文全文数据库 前1条
1 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨海南;基于语义词典和局部分析的查询扩展研究[D];武汉理工大学;2010年
2 陈利东;宁波市数字图书馆若干关键技术的研究与应用[D];浙江工业大学;2010年
3 张卓;多级网络安全态势地图研究[D];国防科学技术大学;2010年
4 白冰;基于多层向量空间的语义信息检索研究[D];重庆大学;2011年
5 姜鹏;Kullback-Leibler距离检索框架下文摘在检索中的应用[D];昆明理工大学;2011年
6 冯斌;基于Lucene小型搜索引擎的研究与实现[D];武汉理工大学;2008年
7 张志田;无监督关系抽取方法研究[D];哈尔滨工业大学;2007年
8 梁琪;结合仿射空间和正交分解的类中心分类法研究[D];重庆大学;2009年
9 董立平;两种信息可视化工具在学科知识领域应用的比较研究——人胚胎干细胞文献分析[D];中国医科大学;2010年
10 杨冬黎;基于Web的智能信息检索机制研究[D];大庆石油学院;2010年
【相似文献】
中国期刊全文数据库 前10条
1 王丽君,高迎,王锡钢;中文检索系统中查询的扩展[J];小型微型计算机系统;2002年07期
2 王明文,聂建云;基于Dempster-Shafer理论的查询扩展模型(英文)[J];江西师范大学学报(自然科学版);2005年03期
3 章旭;石进;谢立;;基于相似性叙词表的模糊集合模型[J];计算机科学;2008年09期
4 闭剑婷;苏一丹;;基于潜在语义分析的跨语言查询扩展方法[J];计算机工程;2009年10期
5 申丽平;;WordNet在查询扩展中的应用研究[J];科技信息;2009年14期
6 张超盟;李战怀;温宗臣;;局部上下文分析剪枝概念树的查询扩展[J];计算机工程;2009年14期
7 李东园;白宇;蔡东风;;面向中文问答的信息检索系统及评测[J];沈阳航空工业学院学报;2009年03期
8 王会进,陈超华,李清;基于动态知识库搜索引擎的技术[J];暨南大学学报;2004年01期
9 牟力科;张蕾;张晓孪;;基于概念图的用户兴趣查询扩展模型的研究[J];计算机工程与应用;2008年06期
10 陈晓金;王兵;;信息检索扩展技术研究[J];图书情报工作;2008年12期
中国重要会议论文全文数据库 前10条
1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
2 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
3 陈忆群;曹瑾音;印鉴;;查询扩展树:关系数据库中的文本检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 钟敏娟;万常选;;基于伪反馈的XML查询扩展[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
5 马云龙;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 周斌;刘茂福;陈建勋;;IR4QA系统中基于维基百科的查询扩展[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
8 邵兵;关毅;王强;王晓龙;任瑞春;;基于上下文平均互信息的问句查询扩展模型[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
10 李东园;白宇;蔡东风;;基于用户日志分析的查询扩展研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国重要报纸全文数据库 前1条
1 彭遂莅 李涛;成都公开保险营销员信用信息[N];中国保险报;2011年
中国博士学位论文全文数据库 前10条
1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
2 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
3 王俊义;正负相关反馈与查询扩展技术的研究[D];内蒙古大学;2012年
4 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
5 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
6 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
7 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年
8 刘春辰;基于本体的企业搜索优化技术研究[D];吉林大学;2012年
9 王秉卿;基于机器学习的查询优化研究[D];复旦大学;2012年
10 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
中国硕士学位论文全文数据库 前10条
1 贾淑芳;基于用户日志聚类的查询扩展[D];北京邮电大学;2010年
2 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年
3 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
4 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年
5 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
6 于水;专利术语知识库的建立与应用[D];沈阳航空工业学院;2010年
7 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
8 周剑烽;基于语义本体的信息检索方法的研究[D];杭州电子科技大学;2010年
9 赵春辉;基于关联规则挖掘的查询扩展[D];河南大学;2011年
10 胡珍新;面向用户的查询扩展研究与实现[D];江西师范大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026