收藏本站
《安徽大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于场论的信息检索模型的研究

杨为民  
【摘要】: 在当前“信息爆炸”的时代,信息过量几乎成为每个人都需要面对的问题。海量信息的复杂性以及信息处理的时效性严重影响了人们对信息的获取。如何便捷、准确地检索到所需信息已成为人们关注的焦点问题。信息检索就是研究如何对各种形式信息(如文本、图像、语音以及视频等)进行高效检索的学科。 在信息检索中,文本的特征表示可以采用基于词语、短语和语义概念的表示方法。这些方法分别对应于文本的词语级、句法级和文档级的信息表示,并且信息的粒度由细到粗。从理论上来说,短语(句法级)优于词语(词语级),语义概念(文档级)优于短语。但针对不同的检索需求,有必要在相应的粒度上进行信息处理,并实现不同粒度间的信息转换。 本文针对不同的检索需求对文本信息从不同粒度的角度进行分析,研究文本的特征表示,进一步地对文档进行标引、分类。本文提出了基于场论的信息检索模型,并将其应用于文档的检索中,实验结果显示它的文档相关性的定义能够更好地描述文档间的关系。 本文主要的研究内容有: (1)文档商空间讨论粒度计算的三类理论和方法;采用商空间的理论在文档信息的三个层次上构建了信息商空间,实现了对文档信息在不同粒度上的分析,并讨论了相应信息粒度上的信息检索的方式;对三个层次的信息商空间提出了运用粗糙集方法对信息从细粒度到粗粒度进行转换;并根据商空间的保真原理和保假原理提出了文档信息检索的两种搜索的策略; (2)文档自动标引在帕欧理论的指导下,构建文档标引词候选集,运用集对理论分析了文档标引词间的相关性,通过标引词相关度对候选标引词进行筛选及文档标引词扩展,从而实现文档的自动标引; (3)文本分类运用粗糙集方法对标引词相关性进行知识约简,构建了文档类别的三层特征标引词相关度集;在此基础上通过对核心标引词相关度的加权,实现了基于标引词相关度的文本分类; (4)基于场论的信息检索模型分析经典信息检索模型,采用标引词的NTF-NIDF权重度量方法,运用场论的知识,结合信息检索的特点,设计了基于场论的信息检索模型。 本文的主要创新点有: (1)在深入研究文献计量学理论的基础上,提出了文档标引词选择的新方案。这该方案以帕欧理论为依据,减少了自动标引过程中预处理信息量,从而降低了文本标引的复杂度; (2)在对标引词的相关性进行全面分析的基础上,提出了一种新的文本分类的模型——基于标引词相关度的文本分类。该模型运用了粗糙集的方法,对标引词的相关性进行约简,建立了文档类别的三层特征标引词相关度集。在此基础上通过对核心标引词相关度的加权,实现了基于标引词相关度的文本分类; (3)在分析了各种信息检索模型的基础上,提出了一种新的信息检索模型——基于场论的信息检索模型。该模型是将物质间的作用具体表现在文档上,通过文档间的作用描述文档的相关性,从而进行信息的检索; (4)在分析了面向检索需求的信息粒度选择之后,在文档词语级信息空间上,构建句法级信息商空间和文档级信息商空间。通过商空间的粒度分析,运用粗糙集方法将文档信息从细粒度向粗粒度的转换,从而实现了不同粒度上的信息检索。
【学位授予单位】:安徽大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP391.3

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 何建军;复杂网络节点重要性评价研究[D];湖南大学;2010年
2 王小旭;基于语义信息检索关键技术的研究与实现[D];西安电子科技大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 袁家政;须德;鲍泓;;基于结构与文本关键词相关度的XML网页分类研究[J];计算机研究与发展;2006年08期
2 赵晖,荣莉莉;基于支持向量的文本特征评估和系统优化[J];计算机工程与应用;2005年10期
3 鲁松,白硕;自然语言处理中词语上下文有效范围的定量描述[J];计算机学报;2001年07期
4 李素建,王厚峰,俞士汶,辛乘胜;关键词自动标引的最大熵模型应用研究[J];计算机学报;2004年09期
5 翟林,刘亚军;支持向量机的中文文本分类研究[J];计算机与数字工程;2005年03期
6 何新贵,彭甫阳;中文文本的关键词自动抽取和模糊分类[J];中文信息学报;1999年01期
7 王崇德;来玲;;汉语文集的齐夫分布[J];情报科学;1989年02期
8 李有梅;基于词义的关键词抽取方法研究[J];情报理论与实践;2000年02期
9 杨为民;李龙澍;;基于Agent的文本分类系统[J];计算机技术与发展;2007年02期
10 钟敏娟,林亚平,陈治平;基于分类和关键词组抽取的信息检索算法[J];系统仿真学报;2004年05期
中国博士学位论文全文数据库 前1条
1 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 汪海东;曾志兴;;基于集对分析的高性能再生混凝土性能优化[J];四川建筑科学研究;2012年03期
2 卞真旭;;一种关键词抽取方法研究[J];安徽电气工程职业技术学院学报;2011年S1期
3 吴雅菊;高晓亮;;基于集对分析的安全防范系统动态效能评估[J];安防科技;2011年11期
4 王万军;基于同异反AHP的综合评价模型研究[J];安徽工程科技学院学报(自然科学版);2005年03期
5 韩小虎;马乾;;基于集对分析理论的土石坝风险分析[J];安徽建筑;2011年06期
6 邓京虎;游黎;周就猫;;运用集对分析法对土地整治项目综合评价研究[J];安徽农学通报(上半月刊);2011年17期
7 王付洲;杜红伟;李建文;;基于集对分析的灌区运行状况综合评价研究[J];安徽农业科学;2008年19期
8 孙丽萍;吴光;李华东;;基于SPA的区域水资源与经济协调发展评价[J];安徽农业科学;2008年20期
9 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
10 时雷;席磊;虎晓红;段其国;;基于支持向量机的农业数据分类研究[J];安徽农业科学;2009年05期
中国重要会议论文全文数据库 前10条
1 卞真旭;;一种关键词抽取方法研究[A];2011年安徽省智能电网技术论坛论文集[C];2011年
2 李文君;暴柱;邢焕政;郭勇;于卉;;基于改进集对分析法的北方水源地水库富营养化评价[A];2011中国环境科学学会学术年会论文集(第一卷)[C];2011年
3 周泽南;贺仲雄;;SP(C+E+G+J)模型在市场经济控制与决策中的应用[A];第二十六届中国控制会议论文集[C];2007年
4 徐怡;李龙澍;李学俊;;扩充的基于集对联系度的粗糙集模型[A];第二十六届中国控制会议论文集[C];2007年
5 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 罗景峰;许开立;;基于集对分析的应急指挥决策方案优选[A];中国职业安全健康协会2010年学术年会论文集[C];2010年
7 李陶;付强;刘东;;基于集对分析的井灌水稻需水量预测[A];寒区水科学及国际河流研究系列丛书2·寒区水循环及冰工程研究——第2届“寒区水资源及其可持续利用”学术研讨会论文集[C];2009年
8 高军省;;集对分析法在湖泊富营养化评价中的应用[A];2010中国环境科学学会学术年会论文集(第三卷)[C];2010年
9 庞宗强;封化民;邱鹍;宋国森;;基于Web的中文新闻视频内容分析[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
10 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
中国博士学位论文全文数据库 前10条
1 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
2 张静;深圳湾水环境综合评价及环境容量研究[D];大连海事大学;2010年
3 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
4 陈少雄;桉树中大径材培育理论及关键技术研究[D];中南林业科技大学;2010年
5 卓莹;基于拓扑·流量挖掘的网络态势感知技术研究[D];国防科学技术大学;2010年
6 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
7 鲍新华;吉林—长春—四平城市经济带表土环境质量评价与生态地球化学分区[D];吉林大学;2011年
8 覃晖;流域梯级电站群多目标联合优化调度与多属性风险决策[D];华中科技大学;2011年
9 张燕君;组织情境下人—组织匹配对个体绩效的影响研究[D];中南大学;2011年
10 杨丙丰;环境质量遥感评价的熵模型研究[D];南京师范大学;2010年
中国硕士学位论文全文数据库 前10条
1 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
2 吕晨;搜索竞价广告关键词优化问题研究[D];山东科技大学;2010年
3 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
4 程国斌;基于指示词语义扩展的词义识别方法的研究[D];哈尔滨工程大学;2010年
5 耿倩;基于文本相似度计算的文本聚类算法研究与实现[D];哈尔滨工程大学;2010年
6 陈晶;基于词片网格的语音文档主题分类[D];哈尔滨工程大学;2010年
7 孙群虎;基于空间分布和信息熵的特征词提取方法[D];大连理工大学;2010年
8 桑媛媛;基于非负稀疏表示的文本分类算法研究[D];大连理工大学;2010年
9 熊超;基于潜在语义对偶空间的跨语言文本分类研究[D];江西师范大学;2010年
10 杨芹;基于最大熵模型的中文网页分类器设计和实现[D];苏州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
2 解(亻刍);汪小帆;;复杂网络中的社团结构分析算法研究综述[J];复杂系统与复杂性科学;2005年03期
3 蔡月红;朱倩;程显毅;杨天明;;基于句义三维模型的汉语句子相似度计算[J];广西师范大学学报(自然科学版);2009年01期
4 王忻;权太范;;信息融合系统改进型BA模型及网络动力学特性[J];哈尔滨工业大学学报;2007年05期
5 郭艳华,周昌乐;一种汉语语句依存关系网分析策略与生成算法研究[J];浙江大学学报(理学版);2000年06期
6 林贤明,李堂秋,陈毅东;句子相似度的动态规划求解及改进[J];计算机工程与应用;2004年35期
7 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
8 赫南;李德毅;淦文燕;朱熙;;复杂网络中重要性节点发掘综述[J];计算机科学;2007年12期
9 夏天;;汉语词语语义相似度计算研究[J];计算机工程;2007年06期
10 裴婧;包宏;;汉语句子相似度计算在FAQ中的应用[J];计算机工程;2009年17期
中国重要会议论文全文数据库 前1条
1 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前5条
1 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
2 章忠志;复杂网络的演化模型研究[D];大连理工大学;2006年
3 梅翔;语义检索中若干关键问题的研究[D];北京邮电大学;2007年
4 李鑫;问题回答系统中的问题分类研究[D];复旦大学;2007年
5 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
中国硕士学位论文全文数据库 前3条
1 林鹏;汉语疑问句理解系统研究与实现——虚拟信息顾问系统之问题理解子系统[D];重庆大学;2004年
2 张玉娟;基于《知网》的句子相似度计算的研究[D];中国地质大学(北京);2006年
3 章程;受限域中文问答系统问句分析研究[D];昆明理工大学;2008年
【二级引证文献】
中国期刊全文数据库 前2条
1 马寨璞;安秋丹;刘庆朝;;城市生态系统指标相互影响的定量研究[J];河北大学学报(自然科学版);2013年01期
2 马润年;文刚;蔡巍;;基于网络抗毁性的链路赋权网络节点重要性比较[J];科学技术与工程;2013年08期
中国博士学位论文全文数据库 前1条
1 朱天;社会网络中节点角色以及群体演化研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前2条
1 章雅娟;基于多头绒泡菌仿生算法的复杂网络节点中心度研究[D];西南大学;2013年
2 安秋丹;城市生态系统的网络模型及其定量研究[D];河北大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 吴微,陈维强,刘波;用BP神经网络预测股票市场涨跌[J];大连理工大学学报;2001年01期
2 司卫国,赵捧未;移动Agent在信息检索中的应用研究[J];电子科技;2004年11期
3 韩立新,陈贵海,谢立;一个面向Internet的个性化信息检索系统模型[J];电子学报;2002年02期
4 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
5 孔俊,吴微,赵卫海;识别数学符号的神经网络方法[J];吉林大学自然科学学报;2001年03期
6 苏伟峰,李绍滋,李堂秋;一个基于概念的中文文本分类模型[J];计算机工程与应用;2002年06期
7 吴涛,张旻,张燕平,张铃;交叉覆盖网络的球形领域构造与功能函数[J];计算机工程与应用;2003年16期
8 赵晖,荣莉莉;基于支持向量的文本特征评估和系统优化[J];计算机工程与应用;2005年10期
9 贺海军,王建芬,周青,曹元大;基于决策支持向量机的中文网页分类器[J];计算机工程;2003年02期
10 李晓黎,刘继敏,史忠植;基于支持向量机与无监督聚类相结合的中文网页分类器[J];计算机学报;2001年01期
中国重要会议论文全文数据库 前1条
1 李正学;吴微;;引入技术指标的BP网络在沪市综合指数涨跌预测中的应用[A];Data Analysis, Econo-physics and Risk Management--Proceedings of CCAST (World Laboratory) Workshop[C];2001年
中国博士学位论文全文数据库 前6条
1 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
2 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
3 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
4 邵郅邛;连续感知器学习算法的有限收敛性及连续距离转换神经网络[D];大连理工大学;2005年
5 张持健;商空间下模糊系统与模糊控制的问题求解[D];安徽大学;2005年
6 王海贤;有限混合模型、非线性二维主成分分析及其在模式分类中应用[D];安徽大学;2005年
中国硕士学位论文全文数据库 前1条
1 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 柳巧玲;米天胜;;基于语义网的智能信息检索研究[J];科技管理研究;2008年08期
2 赖茂生;屈鹏;;相关性基础理论及其在检索建模中的作用研究[J];情报理论与实践;2008年06期
3 乔亚男;齐勇;侯迪;;高阶信息检素问题相关研究进展[J];中国科技论文在线;2009年01期
4 刘静;;关于知识检索的思考[J];内江科技;2009年06期
5 李娟;;基于本体论的个性化信息检索[J];黑龙江科技信息;2009年35期
6 马文峰;杜小勇;;知识检索研究[J];情报理论与实践;2006年02期
7 丁政建;李飞;;基于本体的信息检索技术的研究[J];科学技术与工程;2008年13期
8 樊红侠;;基于粗糙—模糊集的Web信息检索改进模型[J];现代图书情报技术;2008年08期
9 杨毅超;黄璜;;基于Agent的农业信息检索系统应用研究[J];安徽农业科学;2009年11期
10 虞为;曹加恒;曾承;黄敏;陈俊鹏;;基于语义索引词的语义网信息检索模型[J];计算机工程;2007年03期
中国重要会议论文全文数据库 前10条
1 梅伟;刘惟一;;基于可信度的信息检索模型[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 邓志鸿;张铭;陈捷;杨冬青;唐世渭;;基于本体的Web信息检索模型初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
3 马少平;张敏;;信息检索研究:过去三十年中我们走了多远[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 石敏;康耀红;;关于广义向量空间模型中布尔运算的修正[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 沈勇;汤兆石;;基于信息隐藏技术的音频标注与检索[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 普东航;唐常杰;元昌安;廖勇;张天庆;于中华;;一种基于相邻地址的信息检索模型AAM[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 盛俊;王明文;余俊英;;一种基于潜在语义的Markov网络信息检索模型[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 张玉连;陈琳娜;陈金森;;基于本体的个性化服务用户模型研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
9 吴晨;张全;缪建明;韦向峰;;自然语言语义理解下的信息检索模型[A];第三届学生计算语言学研讨会论文集[C];2006年
10 郭稷;骆卫华;;一种基于索引模型融合的面向问答的信息检索方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前10条
1 程凡;基于排序学习的信息检索模型研究[D];中国科学技术大学;2012年
2 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
3 宋峻峰;面向语义Web的领域本体表示、推理、集成及其应用研究[D];国防科学技术大学;2006年
4 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
5 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
6 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
7 高琰;基于多特征的Web社区发现关键技术研究[D];中南大学;2007年
8 江开忠;上下文感知的Web搜索关键技术研究[D];华东师范大学;2008年
9 胡志华;基于免疫系统的协同进化机制及其应用研究[D];东华大学;2009年
10 徐建民;基于术语关系的贝叶斯网络信息检索模型扩展研究[D];天津大学;2007年
中国硕士学位论文全文数据库 前10条
1 汪晨;基于本体的信息检索系统研究[D];合肥工业大学;2007年
2 丁志刚;基于类别意图的信息检索模型[D];北京邮电大学;2009年
3 唐俊;基于概念格的个性化信息检索研究[D];西华大学;2006年
4 王程;语义网络环境下的信息检索模式研究[D];黑龙江大学;2006年
5 赵嫣;信息检索中结构化文档相关度计算方法的研究[D];山东大学;2007年
6 刘春泳;中文问答系统中信息检索模型的研究[D];重庆大学;2007年
7 李立;中文信息检索系统研究[D];华中师范大学;2008年
8 贾文杰;基于多Agent的个性化信息检索技术的研究[D];哈尔滨工业大学;2007年
9 顾雅枫;基于用户兴趣模型的信息检索研究[D];兰州大学;2009年
10 赵爽;基于贝叶斯网络的结构化文档检索[D];河北大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026