收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文结构化信息检索系统的研究与实现

张毅波  
【摘要】:本文研究的主题包含中文信息检索与结构化信息检索两个方面,分别从中 文信息检索系统中文档与查询条件相似性计算、查询扩展、查询条件的翻译及 结构化信息检索等四点进行了研究与探讨。本文的主要贡献如下: (1) 论述了基于中文语词的索引方法是中文信息检索系统中必然采取的索 引方法。系统地阐述了一种新的计算检索词间关联关系的方法-基于PM 的检 索词对权重计算方法,并将其引入到文档与查询条件的相似性计算中。 (2)研究了中文信息检索系统中检索词对的邻近关系值与互信息值对系统 检索性能的影响,实验结果表明当检索词对互信息计算的精度较低时,检索词 对的邻近关系值比互信息值对系统的检索性能的提高更有帮助。 (3)提出了基于局部信息中检索词间关联矩阵的查询扩展方法。在由初始查 询条件得到的前列文档集中,采用基于第二级关联假设自动主题词表的构建思 想计算得到前列检索词及其权重值,并加入到初始查询条件中实现查询扩展。 (4)提出了基于检索词间互信息的查询条件翻译方法,为查询条件中检索词 的译项选择提供了新的方法,并间接地通过检索词的关联序列较好地保存了查 询条件中的短语信息,构造出了检索词带有权重信息的目标语种的查询条件。 (5)分析了利用XML 文档中的结构信息来提高传统信息检索系统检索性能 的方法。通过引入文档结构索引库、元素索引库及属性索引库实现了面向XML 文档的结构化查询,设计出了中文结构化信息检索系统CSIR,并实现了其主要 的一些功能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 彭奇志;;基于.NET的引文信息检索系统的研究与实现[J];现代情报;2007年01期
2 魏树铭;介绍一个多文种兼容的科技文献计算机管理和检索系统[J];图书馆工作与研究;1986年04期
3 余乃言,孙伯庆,陈北柳;《中国化工文摘》计算机编辑排版及检索系统[J];现代化工;1987年01期
4 本刊编辑部;《物理》已成为世界六大检索系统的“座上客”[J];物理;1991年07期
5 王占文;档案微机通用检索系统[J];郑州航空工业管理学院学报;1995年01期
6 阳世青;有色金属科技信息检索系统研究[J];世界有色金属;1997年09期
7 杨力,张青;浅析ChinaInfo之优势[J];中国信息导报;1998年08期
8 李法勇;在线信息检索系统市场策略探讨[J];情报理论与实践;1999年01期
9 邵仁志;基于Win32平台的通用文献数据库系统的研制[J];现代图书情报技术;2000年06期
10 于爱君;;电子期刊在文献检索中的应用[J];贵图学刊;2001年02期
11 吕淑萍;CrossFire Beilstein数据库及其检索[J];现代图书情报技术;2004年09期
12 李顺新,陈建勋;基于特征的钢结构标准件检索系统的研究与开发[J];计算机与现代化;2005年08期
13 ;天津大学学报期刊群简介[J];天津大学学报;2006年04期
14 任平;;SciFinder Scholar的检索及其特点[J];现代图书情报技术;2006年02期
15 高炯;;高校学报进入Ei收录刊源的几点措施[J];大连海事大学学报;2006年02期
16 ;《纳米技术与精密工程》进入EI检索系统[J];燃烧科学与技术;2006年03期
17 李明;;中科院声学所推出基于哼唱旋律或口说歌词的歌曲检索系统[J];应用声学;2006年04期
18 杨东波;廖祥文;;构建一个大规模、可扩展的数字图书馆检索系统架构[J];现代图书情报技术;2006年08期
19 阮伟娟;;ISI Web of Science数据库检索系统浅析[J];科技情报开发与经济;2006年24期
20 魏春燕;孟祥增;;面向基础教育的多媒体资源检索系统[J];内江科技;2007年05期
中国重要会议论文全文数据库 前10条
1 黄永光;刘挺;车万翔;胡晓光;;面向变异短文本的快速聚类算法[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
2 吴坚;;上海市高校自然科学学报被“SCI”等检索系统收录情况分析[A];学报编辑论丛(第十集)[C];2002年
3 罗先碧;蒋红;彭雪雪;朱和平;;国际重要检索系统及其对科技期刊的影响[A];科技编辑出版研究文集(第六集)[C];2001年
4 尹承恕;;论建立我国自主权威的论文评价体系[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年
5 王克黎;;美国5种著名检索系统[A];第7届中国科技期刊青年编辑学术研讨会暨中国科技期刊的经营与发展论坛文集[C];2007年
6 杨光复;;论年鉴的检索系统和信息开发[A];创新与发展——云南省年鉴论文选(续集)[C];2006年
7 陈光宇;顾凤南;;《数学年刊》走向世界与国际接轨的探索[A];学报编辑论丛(第六集)[C];1996年
8 张秀峰;;国际医学英文文献检索系统的介绍及思考[A];学报编辑论丛(第七集)[C];1998年
9 谢狄霖;许勇波;;核磁共振碳谱谱峰检索系统[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
10 王春林;;我国科技期刊也应优生优育[A];学报编辑论丛(第五集)[C];1994年
中国博士学位论文全文数据库 前10条
1 王君泽;基于大规模问答语料的问题检索系统[D];华中科技大学;2010年
2 易文晟;图像语义检索和分类技术研究[D];浙江大学;2007年
3 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
4 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
5 黄涛;知识服务的语义匹配机制研究[D];华中师范大学;2007年
6 权胜赫;基于形状特征三维模型检索的一些关键技术实现研究[D];吉林大学;2007年
7 王小凤;基于内容的音乐检索关键技术研究[D];西北大学;2008年
8 高明霞;问答式OWL知识检索技术[D];北京工业大学;2008年
9 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年
10 袁宝玺;超大规模指纹库的索引结构和检索方法[D];北京邮电大学;2013年
中国硕士学位论文全文数据库 前10条
1 王旭;国内数字图书馆集成检索系统发展对策研究[D];湘潭大学;2013年
2 赵健;基于领域本体的RDF检索模型研究[D];吉林大学;2009年
3 胡长春;基于Lucene的中文自然语言搜索引擎[D];上海交通大学;2009年
4 王玉娟;农业知识文本库检索系统关键技术研究[D];湖南农业大学;2012年
5 李洋;基于本体的智能电网知识检索系统[D];北京理工大学;2011年
6 张伟;基于聚集模型的企业专家检索系统研究[D];复旦大学;2010年
7 陶启立;基于语义的科技文档信息资源检索系统的设计与实现[D];西北大学;2011年
8 孙激光;麦迪斯顿麻醉知识检索系统的设计与实现[D];北京工业大学;2012年
9 吴凡;基于Hadoop平台的树种检索系统的研究与实现[D];北京林业大学;2013年
10 李璟洁;基于参数统计量的图片检索系统[D];天津大学;2012年
中国重要报纸全文数据库 前10条
1 艾文;让检索系统更人性化[N];中国计算机报;2004年
2 柯文;找音乐?会哼几句就行[N];人民日报;2006年
3 致蓝;知识管理的利器[N];科技日报;2001年
4 俞晓燕 刘景武;电子档案检索系统的探索[N];中国档案报;2003年
5 陈玉荣;更多、更快、更新的检索系统[N];中国企业报;2000年
6 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
7 章言;炎黄在线信息检索系统建立[N];中国质量报;2001年
8 梅青;《中国野生动物保护检索系统》通过鉴定[N];中国绿色时报;2006年
9 记者 刘洁;陕西:群众查找“红头文件”不再难[N];中国纪检监察报;2007年
10 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978