收藏本站
《中国科学院研究生院(软件研究所)》 2001年 博士论文
收藏 | 手机打开
二维码
手机客户端打开本文

中文结构化信息检索系统的研究与实现

张毅波  
【摘要】:本文研究的主题包含中文信息检索与结构化信息检索两个方面,分别从中 文信息检索系统中文档与查询条件相似性计算、查询扩展、查询条件的翻译及 结构化信息检索等四点进行了研究与探讨。本文的主要贡献如下: (1) 论述了基于中文语词的索引方法是中文信息检索系统中必然采取的索 引方法。系统地阐述了一种新的计算检索词间关联关系的方法-基于PM 的检 索词对权重计算方法,并将其引入到文档与查询条件的相似性计算中。 (2)研究了中文信息检索系统中检索词对的邻近关系值与互信息值对系统 检索性能的影响,实验结果表明当检索词对互信息计算的精度较低时,检索词 对的邻近关系值比互信息值对系统的检索性能的提高更有帮助。 (3)提出了基于局部信息中检索词间关联矩阵的查询扩展方法。在由初始查 询条件得到的前列文档集中,采用基于第二级关联假设自动主题词表的构建思 想计算得到前列检索词及其权重值,并加入到初始查询条件中实现查询扩展。 (4)提出了基于检索词间互信息的查询条件翻译方法,为查询条件中检索词 的译项选择提供了新的方法,并间接地通过检索词的关联序列较好地保存了查 询条件中的短语信息,构造出了检索词带有权重信息的目标语种的查询条件。 (5)分析了利用XML 文档中的结构信息来提高传统信息检索系统检索性能 的方法。通过引入文档结构索引库、元素索引库及属性索引库实现了面向XML 文档的结构化查询,设计出了中文结构化信息检索系统CSIR,并实现了其主要 的一些功能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈晓金;王兵;;智能信息检索扩展方法研究[J];图书情报知识;2008年04期
2 陈宇;陈治平;;基于混沌神经网络模型的查询扩展[J];计算机应用;2007年08期
3 张晶;;基于语义的信息检索的查询扩展模型[J];河南科学;2009年12期
4 黄名选;黄发良;;一种基于词间关联规则挖掘的查询扩展方法[J];图书情报工作;2008年03期
5 黄名选;张师超;严小卫;;基于查询行为和关联规则的相关反馈查询扩展[J];计算机工程;2009年10期
6 张晗;崔雷;;遗传算法在信息检索中的应用[J];医学信息学杂志;2008年11期
7 张鼐;周年喜;张英;;一种基于关联规则和本体的语义查询扩展方法研究[J];情报科学;2009年11期
8 张永兴;孙四明;张峰;;基于本体的信息检索系统研究[J];微计算机信息;2011年07期
9 冯运;陈治平;;基于局部类别分析的查询扩展[J];计算机应用;2007年01期
10 黄名选;严小卫;张师超;;基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J];软件学报;2009年07期
11 冯平;黄名选;;特征词抽取和相关性融合的伪相关反馈查询扩展[J];现代图书情报技术;2011年01期
12 黄名选;严小卫;张师超;;完全加权关联规则挖掘及其在查询扩展中的应用[J];计算机应用研究;2008年06期
13 林国俊;叶飞跃;耿冬;郑国良;;基于语义的概念查询扩展[J];计算机工程与设计;2009年06期
14 李东园;白宇;蔡东风;;面向中文问答的信息检索系统及评测[J];沈阳航空工业学院学报;2009年03期
15 申丽平;;WordNet在查询扩展中的应用研究[J];科技信息;2009年14期
16 徐建民;刘清江;;基于同义词关系的局部查询扩展[J];郑州大学学报(理学版);2010年01期
17 章旭;石进;谢立;;基于相似性叙词表的模糊集合模型[J];计算机科学;2008年09期
18 牟力科;张蕾;张晓孪;;基于概念图的用户兴趣查询扩展模型的研究[J];计算机工程与应用;2008年06期
19 吴丹;何大庆;王惠临;;基于伪相关反馈的跨语言查询扩展[J];情报学报;2010年02期
20 马晖男;吴江宁;潘东华;;一种修正的向量空间模型在信息检索中的应用[J];哈尔滨工业大学学报;2008年04期
中国重要会议论文全文数据库 前10条
1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
2 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
3 吕碧波;赵军;;基于相关文档池建模的查询扩展[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 陈忆群;曹瑾音;印鉴;;查询扩展树:关系数据库中的文本检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 马云龙;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 周斌;刘茂福;陈建勋;;IR4QA系统中基于维基百科的查询扩展[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 钟敏娟;万常选;;基于伪反馈的XML查询扩展[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
9 徐晋;赵军;吕碧波;徐波;;TREC中提高检索鲁棒性的技术研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 倪耀群;许洪波;谭婧霞;唐慧丰;程学旗;孟丹;;基于优化维汉双语词典的多语言信息检索系统[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
2 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
3 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
4 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
5 黎志升;地理信息检索若干技术研究[D];中国科学技术大学;2009年
6 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
7 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
8 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
9 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
10 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 王倩;基于概念格的个性化搜索引擎查询扩展研究[D];北京邮电大学;2008年
2 许威;基于概念格的查询扩展系统及建格算法研究[D];北京邮电大学;2008年
3 贾淑芳;基于用户日志聚类的查询扩展[D];北京邮电大学;2010年
4 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年
5 陈锐;基于概念图的信息检索查询扩展模型研究与实现[D];西北大学;2009年
6 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
7 黄名选;基于完全加权关联规则挖掘的查询扩展研究[D];广西师范大学;2007年
8 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年
9 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
10 于水;专利术语知识库的建立与应用[D];沈阳航空工业学院;2010年
中国重要报纸全文数据库 前10条
1 ;整合信息资源 提升服务能力[N];中国计算机报;2005年
2 记者 刘安;“全国档案报刊文献及科技成果信息检索系统”通过鉴定[N];中国档案报;2002年
3 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
4 本报记者 武天敏包国俊 本报特约记者 郭瑞宏;在浩瀚信息海洋“导航”[N];解放军报;2007年
5 徐莲芝;24团 农企联手打造无公害农产品基地[N];农民日报;2008年
6 李立红;承钢持续推进多项信息化建设与应用[N];中国冶金报;2008年
7 王伟 史忠植;通用与专业[N];计算机世界;2006年
8 张建华;淄博局企业备案实现100%[N];中国国门时报;2008年
9 通讯员 陈班雄 邹俊 本报记者 于莘明;通向科技巅峰的无名台阶[N];科技日报;2009年
10 ;建设企业网站应该注意的问题[N];财经时报;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978