收藏本站
《重庆大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于文本分类的本体匹配及其应用研究

欧灵  
【摘要】: 语义Web不是一种全新的Web,而是对当前Web的扩展,其中的信息被赋予明确的含义,使机器和人能更好地的协同工作。语义Web的基础之一是本体,为了让机器能够理解Web的内容,需要建立本体,并利用本体中定义的概念作元数据来标记Web的内容。 语义概念的相似性度量一直以来都是人工智能领域的研究热点。人工智能领域的相似性度量模型致力于从特定的知识表述中计算出概念间的相似性。本论文以文本分类的机器学习理论为基础,提出了本体概念匹配的整体框架,借助改进的贝叶斯(Bayes)分类器和支持向量机分类器分析本体中的个体实例特征,建立了一个基于实例的本体概念相似性度量模型,给出了基于文本分类的概念相似性度量算法,并提出了概念匹配后概念的可满足性和本体一致性的检测策略。最后,本文将提出的本体匹配理论用于网络教育的概念型知识学习系统,使论文的研究成果体现在该系统中。现将论文的主要研究内容概括如下: ①介绍和综述论文的理论基础。主要包括语义网、本体论、文本分类技术、描述逻辑推理及其研究现状。 ②基于Bayes的文本分类模型的研究。朴素贝叶斯分类算法是一个简单、有效而且在实际使用中很成功的分类算法,其性能可以与其他典型分类算法相媲美,在某些场合还优于其他分类器。本文在引入互信息等因素后,提出了基于特征相关性的朴素贝叶斯文本分类改进模型,对于大部分类别的资源,改进后的朴素贝叶斯算法都能得到较高的准确率和召回率,同时该分类器对各类别资源分类性能提高的效果不一样。事实上,该模型引入了语义特征,建立了传统特征与概念、概念与类别的映射关系。 ③基于支持向量机(SVM)的文本分类模型研究。基于统计学习理论的支持向量机算法具有坚实的数学理论基础和严格的理论分析,具有理论完备、全局优化、适应性强、推广能力好等优点,是机器学习中的一种新方法和研究的新热点。它使用结构风险最小化原则,综合了统计学习、机器学习和神经网络等方面的技术,在最小化经验风险的同时,有效地提高了算法泛化的能力。它与传统的机器学习方法相比,具有良好的潜在应用价值和发展前景。本文针对基于二叉树的多分类支持向量机自身存在的问题,提出了改进二叉树结构生成的思想,最后对这种改进的树结构算法进行了设计及分析。改进后的BT-SVM多分类方法有比较高的分类准确率,它用于多类文本分类达到了预期的效果。 ④本体概念相似度计算算法。在分析了目前常用的本体匹配技术的基础上,提出了基于文本分类技术的本体概念匹配的框架。算法的主要思想是利用本体中概念的文本实例集,通过训练获得概念的文本分类特征。再对本体概念的文本数据集进行交叉学习分类和计算并获取了两个本体所有概念对的相似度评估矩阵。为了充分利用多种分类器的优势,在概念匹配过程中,给出了利用概念对相似度的突出度策略,克服了单一文本分类器对某些文本数据不敏感的问题,同时还给出了利用本体半结构信息来帮助分类的策略。根据对真实Web数据集的测试结果,表明本文提出的本体概念匹配算法具备很好的匹配精度。 ⑤基于描述逻辑及其推理机方法。它能够实现本体一致性和可满足性的全面测试和分析。然而要使用推理机实现本体测试的前提是需要完成实例数据的匹配和关联的处理,这将对本体匹配方案的评估带来巨大的工作量,本文提出了面向语义的本体匹配评估策略,进一步拓展了本体概念之间的关系,并对实际工程应用具有重要的参考意义。 ⑥概念型智能学习系统模型(CILSM: Conceptural Intelligence Learning System Model)。目前,网络教学系统促进了教育的发展,但其本质是传统教学的扩展,而不能完全适应信息社会终身学习的需要,因为它们只是一个新型的学历教育系统。由于Web是当前最丰富的学习资源,所以本文提出的CILSM系统则是广泛利用Web的资源,并将这些资源(知识)的固有属性和教学属性,采用计算机可处理(可读、可推理)的方式进行组织,形成“知识空间”(Knowledge Space)。知识空间用资源描述框架(RDF/RDFS)元数据描述,并用Web本体语言(OWL)描述的本体组织知识。知识空间包括多个本体,而本体匹配是系统亟待解决的问题,本文提出的本体匹配框架和算法在一定程度上解决了该问题。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前7条
1 李蓉 ,叶世伟 ,史忠植;SVM-KNN分类器——一种提高SVM分类精度的新方法[J];电子学报;2002年05期
2 史忠植,董明楷,蒋运承,张海俊;语义Web的逻辑基础[J];中国科学E辑;2004年10期
3 廖华明,程伯羽,刘新周,虎嵩林,刘欣;信息网格中元数据层次化结构模型的研究和应用[J];计算机研究与发展;2003年12期
4 李善平,尹奇韡,胡玉杰,郭鸣,付相君;本体论研究综述[J];计算机研究与发展;2004年07期
5 刘志刚,李德仁,秦前清,史文中;支持向量机在多类分类问题中的推广[J];计算机工程与应用;2004年07期
6 李波,李新军;一种基于粗糙集和支持向量机的混合分类算法[J];计算机应用;2004年03期
7 王秀娟,郭军,郑康锋;文本分类中一种新的特征选择方法[J];计算机应用;2005年03期
中国博士学位论文全文数据库 前2条
1 韩永国;知识网格及其教育应用的关键技术研究[D];电子科技大学;2006年
2 邱明;语义相似性度量及其在设计管理系统中的应用[D];浙江大学;2006年
中国硕士学位论文全文数据库 前1条
1 梁晓涛;基于语义Web的本体映射[D];安徽大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 何庆;汤庸;黄永钊;;基于本体的法律知识库的研究与实现[J];计算机科学;2007年02期
2 陈祥松,邓苏,黄宏斌;GLAV集成方法中的模式匹配研究[J];安徽工程科技学院学报(自然科学版);2004年04期
3 曲宏毅;韩锡斌;张明;武祥村;;网络教学平台的研究进展[J];中国远程教育;2006年05期
4 万力勇;赵鸣;赵吴领;;利用RSS技术构建分布式学习资源网[J];中国远程教育;2006年06期
5 吴砥;程文青;杨宗凯;;国际教育信息化技术标准领域的工作[J];中国远程教育;2006年09期
6 宇缨;;支持向量机及其在自然语言处理中的应用[J];东莞理工学院学报;2007年01期
7 钟志贤;多元智能理论与教育技术[J];电化教育研究;2004年03期
8 赵呈领,万力勇;学习内容管理系统:e-Learning的第二次革命[J];电化教育研究;2005年07期
9 焦尚彬;刘丁;;基于最小二乘支持向量机的高压绝缘子污秽程度评定[J];电力系统自动化;2006年06期
10 张强,杨子龙,盛纲;浅谈SVM及其与KNN的联系[J];电脑知识与技术;2005年05期
中国重要会议论文全文数据库 前10条
1 王育红;蒋捷;;基础地理信息的客户更新服务问题[A];中国地理信息系统协会第八届年会论文集[C];2004年
2 谢秋玲;;应用于心电图分类的KNN-SVM分类器研究[A];2006中国控制与决策学术年会论文集[C];2006年
3 佟冰;张忠平;宋丽;;一种改进的多源模式匹配算法[A];2005年全国理论计算机科学学术年会论文集[C];2005年
4 孟祥国;马军;段昕;;基于统计学习理论的支持向量机算法研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
5 刘通;刘国华;刘欣;王聪;;ISMD:一种基于副本的完整模式匹配算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
6 钱颖;刘国华;张忠平;沈兵红;张凌宇;;基于聚类的模式匹配方法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
7 蒋琦;庄毅;谢东;;基于SVM分类器的SYN Flood攻击检测规则生成方法的研究[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 宋晓峰;钱志余;姜斌;;支持向量机SMO算法训练过程分析[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
9 姚文琳;王莉;王璀民;;基于Ontology的知识检索系统的设计与实现[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
10 何召卫;陈俊亮;;本体相似研究综述[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 严亚兰;基于语义Web的知识处理研究[D];武汉大学;2005年
2 张琦;使命空间功能描述理论和方法研究[D];国防科学技术大学;2005年
3 杨立;基于领域知识的知识发现研究[D];中国科学院研究生院(软件研究所);2005年
4 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
5 蒋建文;基于多Agent的信息家居系统研究[D];合肥工业大学;2003年
6 杨汉成;Agent理论及其在水利水电系统中的应用研究[D];河海大学;2003年
7 曾海泉;时间序列挖掘与相似性查找技术研究[D];复旦大学;2003年
8 宋晓峰;优生演进优化和统计学习建模[D];浙江大学;2003年
9 周伟;基于多智能体协作的虚拟企业任务调度和冲突消解研究[D];中南大学;2004年
10 阮备军;Web使用挖掘若干关键问题研究[D];复旦大学;2004年
中国硕士学位论文全文数据库 前10条
1 李志;基于数据集成中本体自动构建的研究[D];中南大学;2005年
2 杨彬;网格环境下异构数据资源的交换和集成研究[D];福州大学;2006年
3 连惠群;语义Web服务发现和组合的研究与应用[D];福州大学;2006年
4 张宝山;WEB服务合成方法的研究与应用[D];河北大学;2006年
5 杨俊柯;RDF推理机制的研究与应用[D];湖南大学;2006年
6 秦玄铮;基于本体的个性化信息检索系统的设计与实现[D];北京邮电大学;2006年
7 庞美玉;基于TAP的上下文知晓框架研究[D];太原理工大学;2006年
8 付渊;运用神经网络聚类方法推进构建本体的自动化[D];太原理工大学;2006年
9 徐天伟;基于过程的知识管理环境与知识流的研究[D];云南师范大学;2006年
10 宋淼;迁移工作流系统中的服务机制研究[D];山东大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 李文斌,刘椿年,黄佳进;基于数据挖掘的垃圾E-mail过滤方法[J];北京工业大学学报;2003年02期
2 杨欣斌,孙京诰,黄道;基于Bayesian网络的缺损数据处理方法[J];华东理工大学学报;2002年S1期
3 王娟,慈林林,姚康泽;特征选择方法综述[J];计算机工程与科学;2005年12期
4 陈治平;王雷;;基于自学习K近邻的垃圾邮件过滤算法[J];计算机应用;2005年S1期
5 肖明;殷锋;张楠;;垃圾邮件过滤技术及发展[J];西南民族大学学报(自然科学版);2007年01期
6 周水庚,关佶红,胡运发;无需词典支持和切词处理的中文文档分类[J];高技术通讯;2001年03期
7 陈文亮;朱靖波;朱慕华;姚天顺;;基于领域词典的文本特征表示[J];计算机研究与发展;2005年12期
8 陈杰;蒋祖华;;领域本体的概念相似度计算[J];计算机工程与应用;2006年33期
9 申红;吕宝粮;内山将夫;井佐原均;;文本分类的特征提取方法比较与改进[J];计算机仿真;2006年03期
10 杨秋芬,陈跃新;Ontology方法学综述[J];计算机应用研究;2002年04期
中国重要会议论文全文数据库 前1条
1 黄冬梅;朱慧;;粗糙形式概念分析在海洋本体构建中的应用[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
中国博士学位论文全文数据库 前7条
1 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
2 黄涛;知识服务的语义匹配机制研究[D];华中师范大学;2007年
3 齐红;基于形式概念分析的知识发现方法研究[D];吉林大学;2005年
4 沈夏炯;概念格同构生成方法研究及IsoFCA系统实现[D];上海大学;2006年
5 程勇;基于本体的不确定性知识管理研究[D];中国科学院研究生院(计算技术研究所);2005年
6 梁吉业;基于粗糙集与概念格的智能数据分析方法研究[D];中国科学院研究生院(计算技术研究所);2004年
7 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
中国硕士学位论文全文数据库 前9条
1 迟学芝;基于自学习机制的信息过滤模型研究与实践[D];山东师范大学;2005年
2 刘妍;基于内容的垃圾邮件过滤技术的研究与实现[D];哈尔滨工程大学;2007年
3 甘健侯;基于本体的语义Web知识发现及其应用的研究[D];云南师范大学;2004年
4 陈韵霞;一种基于分类结构的本体匹配方法[D];哈尔滨工程大学;2006年
5 季丽丹;基于本体的主动数据仓库语义匹配[D];浙江工商大学;2007年
6 张羽;基于支持向量机理论的垃圾邮件过滤模型[D];电子科技大学;2006年
7 徐红升;基于形式概念分析的本体构建、合并与展现[D];河南大学;2007年
8 王美方;信息过滤系统中特征选择算法的研究[D];山东师范大学;2008年
9 金梁;概念格Chein构造算法的改进[D];河南大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 黄玉基;魏伟杰;曾文;;基于事例推理系统中检索策略的分析与研究[J];东北大学学报(自然科学版);2006年01期
2 肖健华,吴今培,杨叔子;基于启发式知识的属性约简方法及其在评价体系中的应用[J];系统工程;2002年01期
3 金芝,陆汝钤,David A.Bell;多范例自动需求建模和分析:一种基于本体的方法[J];中国科学E辑;2003年04期
4 徐志伟,李伟;织女星网格的体系结构研究[J];计算机研究与发展;2002年08期
5 张纲,李晓林,游赣梅,徐志伟;基于角色的信息网格访问控制的研究[J];计算机研究与发展;2002年08期
6 廖华明,程伯羽,刘新周,虎嵩林,刘欣;信息网格中元数据层次化结构模型的研究和应用[J];计算机研究与发展;2003年12期
7 李伟,徐志伟;一种网格资源空间模型及其应用[J];计算机研究与发展;2003年12期
8 王瑜,胡运发,张凯;基于粗集理论的知识含量度量研究[J];计算机研究与发展;2004年09期
9 邓志鸿,唐世渭,杨冬青;基于本体的多Agent分布式数字图书馆资源信息发现服务模型之研究[J];计算机工程;2002年06期
10 姜少飞,潘双夏,冯培恩,徐有忠;面向CAD/CAPP集成的零件特征组合描述及其应用[J];计算机辅助设计与图形学学报;2002年08期
中国博士学位论文全文数据库 前2条
1 夏建涛;基于机器学习的高维多光谱数据分类[D];西北工业大学;2002年
2 甘永成;虚拟学习社区中的知识建构和集体智慧研究[D];华东师范大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 李虎;张啸;仲茜;侯磊;王志春;;流程可定制本体匹配框架:RiMOM2[J];计算机科学;2011年04期
2 潘阳威;徐汀荣;靳涛;;语义Web本体匹配算法研究[J];计算机与现代化;2008年11期
3 沈国海,穆斌,胡学钢;语义Web本体及本体库系统设计技术[J];微机发展;2004年07期
4 史忠植,董明楷,蒋运承,张海俊;语义Web的逻辑基础[J];中国科学E辑;2004年10期
5 周中成,孙荣胜;基于语义的Web服务自动发现、匹配及执行平台[J];计算机应用;2005年01期
6 胡鹤,刘大有,王生生;Web本体语言的分析与比较[J];计算机工程;2005年04期
7 蒋运承;史忠植;汤庸;王驹;;一种分布式动态描述逻辑[J];计算机研究与发展;2006年09期
8 李善平,尹奇韡,胡玉杰,郭鸣,付相君;本体论研究综述[J];计算机研究与发展;2004年07期
9 杜小勇,李曼,王大治;语义Web与本体研究综述[J];计算机应用;2004年10期
10 姚绍文,余江,周明天;面向语义Web的逻辑描述原语扩展[J];电子学报;2002年S1期
中国重要会议论文全文数据库 前10条
1 钟福金;穆斌;;语义Web挖掘研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 张辉;朱俊武;;基于P2P的语义Web服务发现模型研究[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
3 李选如;何洁月;;一种新的自动本体映射算法(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
4 王长宁;穆斌;王浩;;加强Web服务描述的语义性[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
5 康达周;徐宝文;陆建江;李言辉;;支持语义web模糊本体的描述逻辑(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
6 蔡畅;李宏伟;李勤超;;语义层次的知识推理研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
7 宋雨;郑怿;吴燕;;RDFa语义标注技术综述[A];2009全国计算机网络与通信学术会议论文集[C];2009年
8 马可方;李陶深;;语义Web和UDDI集成的研究[A];广西计算机学会2006年年会论文集[C];2006年
9 何召卫;陈俊亮;;本体相似研究综述[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
10 宋华珠;钟珞;王辉;李锐弢;;基于语义web在线学习资源管理的本体和元数据(英文)[A];全国语域web与本体能研讨会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 清华大学计算机系 徐剑军 张钋 李涓子 王克宏;智能化应用的基石[N];计算机世界;2004年
2 郭韦钰 丁连红;语义Web和语义网格[N];中国计算机报;2004年
3 小林子;语义网:让网络学会思考[N];电脑报;2004年
4 陈余年 方美琪;基于网络中心的分布计算[N];计算机世界;2003年
5 Neil McAllister《Infoworld》;十大热门技术风光不再[N];计算机世界;2005年
6 ;9种技术将改变未来生活[N];计算机世界;2003年
7 清华大学计算机系 杨文军 马路 丁峰 王克宏;从“自动化”到“智能化”[N];计算机世界;2004年
8 记者 胡英;IDC: 今年IT开支将增长6%[N];计算机世界;2005年
9 清华大学 李涓子 徐鹏 王克宏;Java技术势头正劲[N];计算机世界;2004年
10 王克宏;基于XML的Web服务技术——强强联合铸造未来[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 欧灵;基于文本分类的本体匹配及其应用研究[D];重庆大学;2007年
2 梁晟;基于语义Web的服务自动组合技术的研究[D];中国科学院研究生院(软件研究所);2004年
3 黄涛;知识服务的语义匹配机制研究[D];华中师范大学;2007年
4 陈华钧;Web语义查询与推理研究[D];浙江大学;2004年
5 严亚兰;基于语义Web的知识处理研究[D];武汉大学;2005年
6 韩毅;语义网格环境下数字图书馆知识组织策略与应用研究[D];吉林大学;2008年
7 刘晓强;E-Learning知识共享与适应性应用环境研究[D];东华大学;2003年
8 陈向东;网络环境下的跨学科知识共享[D];华东师范大学;2005年
9 林茂松;科学计算可视化的应用研究[D];西南交通大学;2006年
10 张量;基于语义Web服务的虚拟物流企业组建关键技术研究[D];大连海事大学;2009年
中国硕士学位论文全文数据库 前10条
1 戴锋;基于XML主题地图的知识导航技术研究与实现[D];国防科学技术大学;2003年
2 刘秋艳;面向语义Web的本体映射研究[D];沈阳工业大学;2010年
3 周亮;基于OWL-S的Web服务发现[D];南京理工大学;2005年
4 姜久雷;Semantic Web Services实例研究[D];西北大学;2006年
5 肖潇;基于OWL的本体映射方法和相似度计算研究[D];湖南大学;2007年
6 袁洋;产品知识管理中的本体映射方法研究[D];浙江大学;2004年
7 关懿新;基于主题地图的构件库导航系统的研究与实现[D];国防科学技术大学;2004年
8 杨学明;基于本体的数字校园系统语义化研究与设计[D];国防科学技术大学;2005年
9 傅妮娅;语义Web服务发现架构研究[D];东华大学;2006年
10 倪欢;语义门户网站本体查询技术研究[D];河海大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026