收藏本站
《中国科学院研究生院(软件研究所)》 2001年
收藏 | 手机打开
二维码
手机客户端打开本文

中文结构化信息检索系统的研究与实现

张毅波  
【摘要】:本文研究的主题包含中文信息检索与结构化信息检索两个方面,分别从中 文信息检索系统中文档与查询条件相似性计算、查询扩展、查询条件的翻译及 结构化信息检索等四点进行了研究与探讨。本文的主要贡献如下: (1) 论述了基于中文语词的索引方法是中文信息检索系统中必然采取的索 引方法。系统地阐述了一种新的计算检索词间关联关系的方法-基于PM 的检 索词对权重计算方法,并将其引入到文档与查询条件的相似性计算中。 (2)研究了中文信息检索系统中检索词对的邻近关系值与互信息值对系统 检索性能的影响,实验结果表明当检索词对互信息计算的精度较低时,检索词 对的邻近关系值比互信息值对系统的检索性能的提高更有帮助。 (3)提出了基于局部信息中检索词间关联矩阵的查询扩展方法。在由初始查 询条件得到的前列文档集中,采用基于第二级关联假设自动主题词表的构建思 想计算得到前列检索词及其权重值,并加入到初始查询条件中实现查询扩展。 (4)提出了基于检索词间互信息的查询条件翻译方法,为查询条件中检索词 的译项选择提供了新的方法,并间接地通过检索词的关联序列较好地保存了查 询条件中的短语信息,构造出了检索词带有权重信息的目标语种的查询条件。 (5)分析了利用XML 文档中的结构信息来提高传统信息检索系统检索性能 的方法。通过引入文档结构索引库、元素索引库及属性索引库实现了面向XML 文档的结构化查询,设计出了中文结构化信息检索系统CSIR,并实现了其主要 的一些功能。
【学位授予单位】:中国科学院研究生院(软件研究所)
【学位级别】:博士
【学位授予年份】:2001
【分类号】:TP391.3

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 黄名选;严小卫;张师超;;查询扩展技术进展与展望[J];计算机应用与软件;2007年11期
中国博士学位论文全文数据库 前3条
1 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
2 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
3 于小兵;基于数据仓库和移动Agent的智能电子商务研究与应用[D];武汉理工大学;2010年
中国硕士学位论文全文数据库 前8条
1 成少梅;利用IRF模型丰富文档的语义代表[D];武汉理工大学;2010年
2 李新生;基于改进语言模型的相关反馈方法的检索系统设计[D];北京邮电大学;2011年
3 陈治纲;基于向量空间模型的文本分类系统研究与实现[D];天津大学;2005年
4 陈丽珍;维文网络中不良文本信息检索、监控系统的研究[D];新疆大学;2006年
5 公爱国;基于web的XML中文检索模型的研究与实现[D];山东大学;2006年
6 李森;层次化文本分类方法的研究[D];山东大学;2007年
7 黄名选;基于完全加权关联规则挖掘的查询扩展研究[D];广西师范大学;2007年
8 刘清松;基于数据仓库的电信企业经营分析的算法实现[D];东北林业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 叶东海,刘凌波,丁大可;应用移动Agent技术构建B2B电子商务平台[J];安徽农业大学学报(社会科学版);2005年01期
2 李军;;Web 2.0应用五大法宝[J];办公自动化;2006年15期
3 张仰森;郭江;;四种统计词义消歧模型的分析与比较[J];北京信息科技大学学报(自然科学版);2011年02期
4 李源,何清,史忠植;基于概念语义空间的联想检索[J];北京科技大学学报;2001年06期
5 张克君;杨炳儒;赵耿;曲文龙;李欣;;一种分布式Web使用模式挖掘模型及算法[J];北京科技大学学报;2006年09期
6 王任华,霍宏涛,游先祥;人工神经网络在遥感图像森林植被分类中的应用[J];北京林业大学学报;2003年04期
7 张浩;孟祥瑞;洪琼;;电子商务网站动态模糊综合评价模型及实例[J];北京邮电大学学报(社会科学版);2008年01期
8 陈建成;马文扬;;商业银行零售管理及目标客户流失概率预测研究[J];金融论坛;2007年12期
9 晏妮娜,黄小原;电子商务营销绩效的模糊综合评价[J];东北大学学报;2004年09期
10 徐琪;;Design of Multi-agent Supply Chain System to Support Quick Response in Textile-Apparel Industry[J];Journal of Donghua University(English Edition);2007年06期
中国重要会议论文全文数据库 前1条
1 施水才;肖诗斌;王弘蔚;王洪俊;苏东庄;;TRS中文文本信息检索技术的发展——从全文检索到基于自然语言处理的知识检索[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国博士学位论文全文数据库 前5条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 张俊林;基于语言模型的信息检索系统研究[D];中国科学院研究生院(软件研究所);2004年
3 杨志峰;稳定的信息检索方法及其在分布式环境下的应用[D];中国科学院研究生院(计算技术研究所);2003年
4 何丽;基于Web挖掘的决策支持系统模型研究[D];天津大学;2005年
5 王硕;电子商务概论[D];合肥工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 谭义红;关联规则挖掘及其在概念检索中的应用研究[D];湖南大学;2003年
2 胡珍新;面向用户的查询扩展研究与实现[D];江西师范大学;2004年
3 王国琴;基于语义检索的概念空间研究[D];南京理工大学;2004年
4 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
5 叶凌;基于语义的中文搜索引擎[D];吉林大学;2005年
6 黄发良;基于知识粒度的Web文档聚类研究[D];广西师范大学;2005年
7 沈斌;基于分词的中文文本相似度计算研究[D];天津财经大学;2006年
8 徐鹏涛;商品房销售量预测模型研究[D];西安建筑科技大学;2006年
9 王圆;文本内容过滤的关键技术研究[D];东北师范大学;2006年
10 李自强;库存管理中需求预测系统的研究与开发[D];东南大学;2005年
【二级引证文献】
中国期刊全文数据库 前10条
1 卞咸杰;;基于LINQ技术的数字档案检索研究[J];档案学研究;2012年02期
2 李泽军;;基于矩阵加权关联规则的空间粒度聚类算法[J];电脑知识与技术;2010年02期
3 孔峰;王丽君;吴俊华;;基于独立分量分析的文本特征提取算法[J];电子技术;2012年02期
4 郭毅;;中小企业客户关系管理数据仓库的构建研究[J];中国管理信息化;2012年05期
5 张达夫;;基于依存关系匹配的长难查询处理[J];电脑知识与技术;2012年19期
6 孟祥娜;秦玉平;;一种基于分类和语义查询扩展的信息检索方法[J];信息技术;2010年09期
7 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[J];杭州电子科技大学学报;2008年05期
8 黄名选;严小卫;张师超;;基于完全加权关联规则的局部反馈查询扩展[J];计算机工程与应用;2008年07期
9 陈艳秋;熊耀华;;新型快速中文文本分类器的设计与实现[J];计算机工程与应用;2009年22期
10 黄名选;陈燕红;;基于q→t_i和q→﹁t_j挖掘的查询扩展算法[J];计算机工程与应用;2012年09期
中国重要会议论文全文数据库 前2条
1 郭文;史晓东;陈毅东;;跨语言信息检索中的查询扩展[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
2 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前4条
1 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
2 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
3 茹昭;企业信息检索中的对象检索方法研究[D];北京邮电大学;2008年
4 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年
中国硕士学位论文全文数据库 前10条
1 许坤;基于本体的应急信息管理系统的研究与设计[D];郑州大学;2010年
2 孟庆海;基于社会书签的个性化查询词扩展技术研究[D];哈尔滨工程大学;2010年
3 姜国新;支持多语言标签优先的元搜索引擎结果聚类研究[D];浙江工商大学;2011年
4 张东;基于语义相似度的地理信息检索技术研究[D];山东农业大学;2011年
5 李芳芳;个人数据空间管理系统中数据抽取及语义关联构建[D];北京交通大学;2011年
6 王畅;基于形式概念分析与关键词加权的用户查询词扩展研究[D];西华大学;2011年
7 李帅;基于语义相似度的查询扩展优化[D];杭州电子科技大学;2011年
8 魏爽;基于移动Agent的Web分布式聚类挖掘算法的研究[D];华中师范大学;2011年
9 熊霞;基于叙词表词间关系的领域信息检索[D];中国农业科学院;2011年
10 余伟;基于云计算的分布式搜索技术研究[D];武汉科技大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 陈晓金;王兵;;智能信息检索扩展方法研究[J];图书情报知识;2008年04期
2 陈宇;陈治平;;基于混沌神经网络模型的查询扩展[J];计算机应用;2007年08期
3 张晶;;基于语义的信息检索的查询扩展模型[J];河南科学;2009年12期
4 黄名选;黄发良;;一种基于词间关联规则挖掘的查询扩展方法[J];图书情报工作;2008年03期
5 黄名选;张师超;严小卫;;基于查询行为和关联规则的相关反馈查询扩展[J];计算机工程;2009年10期
6 张晗;崔雷;;遗传算法在信息检索中的应用[J];医学信息学杂志;2008年11期
7 张鼐;周年喜;张英;;一种基于关联规则和本体的语义查询扩展方法研究[J];情报科学;2009年11期
8 张永兴;孙四明;张峰;;基于本体的信息检索系统研究[J];微计算机信息;2011年07期
9 冯运;陈治平;;基于局部类别分析的查询扩展[J];计算机应用;2007年01期
10 黄名选;严小卫;张师超;;基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J];软件学报;2009年07期
中国重要会议论文全文数据库 前10条
1 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
2 张志强;孟庆海;谢晓芹;;个性化的社会标签查询扩展技术研究[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
3 吕碧波;赵军;;基于相关文档池建模的查询扩展[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 陈忆群;曹瑾音;印鉴;;查询扩展树:关系数据库中的文本检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 马云龙;林鸿飞;;基于权重标准化SimRank方法的查询扩展技术研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 周斌;刘茂福;陈建勋;;IR4QA系统中基于维基百科的查询扩展[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 钟敏娟;万常选;;基于伪反馈的XML查询扩展[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
9 徐晋;赵军;吕碧波;徐波;;TREC中提高检索鲁棒性的技术研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 倪耀群;许洪波;谭婧霞;唐慧丰;程学旗;孟丹;;基于优化维汉双语词典的多语言信息检索系统[A];第六届全国信息检索学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 ;整合信息资源 提升服务能力[N];中国计算机报;2005年
2 记者 刘安;“全国档案报刊文献及科技成果信息检索系统”通过鉴定[N];中国档案报;2002年
3 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
4 本报记者 武天敏包国俊 本报特约记者 郭瑞宏;在浩瀚信息海洋“导航”[N];解放军报;2007年
5 徐莲芝;24团 农企联手打造无公害农产品基地[N];农民日报;2008年
6 李立红;承钢持续推进多项信息化建设与应用[N];中国冶金报;2008年
7 王伟 史忠植;通用与专业[N];计算机世界;2006年
8 张建华;淄博局企业备案实现100%[N];中国国门时报;2008年
9 通讯员 陈班雄 邹俊 本报记者 于莘明;通向科技巅峰的无名台阶[N];科技日报;2009年
10 ;建设企业网站应该注意的问题[N];财经时报;2001年
中国博士学位论文全文数据库 前10条
1 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
2 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
3 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
4 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
5 黎志升;地理信息检索若干技术研究[D];中国科学技术大学;2009年
6 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
7 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
8 王一川;基于内容的海量文本探索式查询导引中若干关键技术的研究[D];北京邮电大学;2011年
9 刘向威;NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
10 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 王倩;基于概念格的个性化搜索引擎查询扩展研究[D];北京邮电大学;2008年
2 许威;基于概念格的查询扩展系统及建格算法研究[D];北京邮电大学;2008年
3 贾淑芳;基于用户日志聚类的查询扩展[D];北京邮电大学;2010年
4 王水利;基于互信息的语义查询扩展技术研究[D];河南科技大学;2011年
5 陈锐;基于概念图的信息检索查询扩展模型研究与实现[D];西北大学;2009年
6 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
7 黄名选;基于完全加权关联规则挖掘的查询扩展研究[D];广西师范大学;2007年
8 方勇;基于语义的信息检索方法研究与应用[D];浙江大学;2010年
9 刘清江;同义词在文本特征提取与查询扩展中的应用[D];河北大学;2010年
10 于水;专利术语知识库的建立与应用[D];沈阳航空工业学院;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026