收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于模糊相似度的异构本体映射、合并及校验方法的研究

钱鹏飞  
【摘要】: 本体是对特定领域概念及其关系的清晰描述,它可作为不同信息系统之间信息交换的基础。然而,由于信息系统是由不同组织在不同时间和不同需求背景下开发的,因此,这些系统所依赖的本体之间不可避免存在异构性,这种异构性为不同系统之间的互操作带来了极大的障碍。为了解决这一问题,需要识别不同本体间存在的异构或冲突,然后根据识别结果,在本体间对等概念和关系上建立对应联系(即:本体映射)或进行不同本体间的合并(即:本体合并)。 为了克服人工进行本体映射和本体合并中工作量大,效率低的问题,并满足在不确定环境下进行信息系统之间动态和实时互操作的要求,国内外已进行了许多关于自动(或半自动)本体映射、合并的研究,这些研究虽然已取得了很大的突破和进展,但在准确率和效率等许多方面与实际需求还有较大差距。本文从信息集成的实际出发,针对过去研究中存在的不足,就进一步提高本体映射和合并的准确率和效率进行了深入和广泛的研究,并同时展开了对映射及合并结果进行形式化校验的方法研究以验证这些结果逻辑上的正确性。 本文的创新性工作可以归纳为下面几点: (1)提出了模糊化的相似度表示方法 本体概念的特征信息一般分为两类:文本特征信息(名称和实例等),结构特征信息(对象属性、分类关系及依赖函数关系等)。在传统本体映射中,本体概念间的相似度计算,一般是通过基于不同文本特征信息的多个相似度中间结果的复合叠加、多种结构特征信息的顺序迭代或者两者综合等方法来实现,其相似度结果(中间结果或最终结果)均为单一数值,并以该数值(最终结果)来判别两个概念是否相似。由于概念间的相似度本身存在着固有的模糊特性(所谓模糊特性是指两个概念间的相似度以一定的概率密度函数分布于某一数值区间),因此,在映射计算过程中,如果过早用确定数值代替概率密度函数来描述相似度,将可能丢失一些可用于后续决策的信息,从而加大决策(映射)的风险。此外,对于本体的两类特征信息,许多传统方法采用了“先按文本信息进行映射,再用结构信息完成校验迭代”的串行手段来进行处理,其中,基于结构信息的迭代是以基于文本信息的映射结果为先验知识而进行的,从而有可能过于强化了文本信息的作用弱化了结构信息对相似度计算的贡献。为了解决这两个问题,本文引入了模糊相似度,提出了基于各类特征信息的不同相似度的模糊化表示方法,从而在概念相似度的计算过程中引入了模糊特性,进而既避免了过早对相似度模糊特性做出裁决的风险,又使文本和结构信息能并行参与映射计算,提高了匹配效果。 (2)提出了基于属性值联合分布的映射方法 概念中的实例信息可用于本体映射,传统的基于实例的本体映射方法一般是将实例中的数值属性取值直接合并为长文本信息。这种方法简单地假定概念的各个数值属性是完全独立的,而没有考虑它们之间可能存在的对应概率依赖关系。因此,该方法未能充分利用概念中与实例有关的重要信息,影响了映射结果的准确性。为此,本文提出了一种能有效利用上述关系的基于实例属性值联合分布的映射方法,提高了映射效果。 此外,在实际应用中,本体概念的表达经常会发生变更(如:添加或删除属性),这就导致了更改后的概念表达与原有概念实例对应属性集之间的冲突,因此,相关本体概念匹配过程中经常会出现某些实例属性值缺失的现象,这直接影响了属性值联合分布计算的准确性。为此,本文引入粗糙集理论来拟合属性值缺失的样本实例空间,提高了基于属性值联合分布的映射效果。 (3)提出了新型的本体合并结果及映射结果的形式化校验方法 在本体合并和映射过程中,一般会产生一系列本体合并结果(新本体)和映射结果,为了保证这些结果在逻辑上的正确性,则需对其进行形式化校验。目前,有关本体模型的形式化校验很多是围绕单个概念或关系来进行,而多个概念和关系之间的结构及约束信息却未得到充分利用,且对于本体映射结果校验目前也没有系统有效的形式化方法。为此,本文引入面向对象中的OCL(Object Constraint Language)规则,并针对本体应用环境进行了相应扩展,实现了本体模型结构及约束、映射约束规则等逻辑描述的形式化表示,进而提出了采用本体定义元模型和映射元模型来辅助进行形式化校验的方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 任江洪,曹长修;遗传算法在数据挖掘多种分类器合并中的应用[J];微机发展;2004年01期
2 陈英萍;;高校合并后图书馆管理模式初探[J];高校图书情报论坛;2003年03期
3 任广辉,朱浩然;脉冲量数据采集系统[J];自动化技术与应用;1997年01期
4 林闯,魏丫丫;随机进程代数与随机Petri网[J];软件学报;2002年02期
5 王慧;合并后高校图书馆分馆的建设和服务[J];高校图书馆工作;2003年05期
6 楚蓓蓓,刘蓬辉,王非非;AutoCAD图到MapInfo图转换过程中区域对象的处理[J];信息工程大学学报;2003年04期
7 周鑫;;LSI与Agere合并 明确冲击消费电子平台[J];电子设计技术;2007年01期
8 于林娜;;合并多个Word文档我有捷径[J];电脑爱好者(普及版);2008年12期
9 胡舜良;;Excel电子表格关联合并[J];电脑编程技巧与维护;2010年16期
10 邹宁,李庆,柳健;基于Kohonen神经网络的深度图像分割方法[J];红外与激光工程;2000年01期
11 夏薇;高校合并后资料室的建设与发展[J];图书馆学研究;2000年05期
12 何霞;全球信息业的兼并对我们的启示[J];中国数据通讯网络;2000年05期
13 江兴智,赵宇明,施鹏飞;手写体信函地址汉字切分[J];上海交通大学学报;2001年09期
14 彭虎;高校合并中图书馆整合的几个问题[J];河北科技图苑;2001年05期
15 何平,李敬友,朱丽娜;计算机图形学中几何造型的集合运算[J];齐齐哈尔大学学报;2001年03期
16 刘传森;论高校系(所)资料室的建设与发展[J];阴山学刊;2001年02期
17 刘海萍;;以并促建——合并对高校馆产生的积极效应[J];大学图书馆学报;2001年S1期
18 魏凌云;陈昕;;构筑新型的大学图书馆——高校合并后图书馆工作思考[J];大学图书馆学报;2001年S1期
19 竺海康;赵继海;;高校图书馆合并模式的实践与思考[J];大学图书馆学报;2001年S1期
20 葛晓霞;;浅谈高校图书馆合并后的业务机构重组与用人制度改革[J];大学图书馆学报;2001年S1期
中国重要会议论文全文数据库 前10条
1 徐立恒;刘洋;来斯惟;刘康;田野;王渝丽;赵军;;基于多特征表示的本体概念挂载[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 董兴海;周志新;;新型微机保护校验方法的研究[A];2008年云南电力技术论坛论文集[C];2008年
3 缪嘉嘉;李爱平;刘志忠;吴泉源;贾焰;;一种面向语义信息集成的本体扩展方法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
4 张玲;;242例B-地贫复合a-地贫同时合并G6PD缺陷症结果分析[A];中华医学会第八次全国检验医学学术会议暨中华医学会检验分会成立30周年庆典大会资料汇编[C];2009年
5 陈子澎;王斌;;基于ARC/INFO的数字海图线要素数据压缩优化处理研究与实现[A];第二十一届海洋测绘综合性学术研讨会论文集[C];2009年
6 徐一帆;黎放;杨建军;;基于模糊相似度的混合型多属性决策方法[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
7 张德政;刘洁卉;;基于图分析的领域知识获取技术[A];着力提高高等教育质量,努力增强高校创新与服务能力——北京市高等教育学会2007年学术年会论文集(上册)[C];2008年
8 李帆;夏士雄;张磊;王志愿;;基于语义划分的多层关联规则冗余处理方法[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
9 杜永平;;五防闭锁与计算机监控系统合并合理性分析[A];华东六省一市电机(电力)工程学会输配电技术研讨会2005年年会论文集[C];2005年
10 曾少立;;基于数据采集卡的周期信号校验方法[A];全国第四届核反应堆用核仪器学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 钱鹏飞;基于模糊相似度的异构本体映射、合并及校验方法的研究[D];上海交通大学;2008年
2 米杨;基于顶级本体整合的医学领域语义标注研究[D];吉林大学;2012年
3 姜赢;维度本体及其应用[D];武汉大学;2009年
4 云红艳;设备功能视点下的海洋生态本体构建及应用研究[D];中国海洋大学;2012年
5 杨志和;教育资源云服务本体与技术规范研究[D];华东师范大学;2012年
6 冯莎莎;本体逻辑差的研究[D];吉林大学;2011年
7 饶国政;基于语义WIKI的本体知识库研究[D];天津大学;2009年
8 陈雯;基于本体框架的交通出行语义轨迹建模、标记及数据库研究[D];华东师范大学;2011年
9 陈立;物流信息语义匹配研究[D];北京交通大学;2011年
10 钟美;基于Web的空间本体构建方法研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前10条
1 王娜;基于Silverlight技术的本体编辑器的设计与实现[D];中国海洋大学;2010年
2 范轶;基于本体推理的心电图辅助诊断系统研究[D];吉林大学;2010年
3 徐济成;面向农业领域的本体学习建模研究[D];安徽农业大学;2010年
4 李琼;基于机器学习的本体概念映射研究[D];西安工业大学;2010年
5 王刚;本体构建研究及其在火车订票系统中的应用[D];江苏科技大学;2010年
6 张义飞;基于改进的PI演算的本体演化形式化描述方法[D];吉林大学;2010年
7 孙娅彬;基于本体的物流资源检索技术研究[D];山东师范大学;2010年
8 朱颖;本体技术在陶瓷产品配置系统中的研究与应用[D];景德镇陶瓷学院;2010年
9 王松;高效的异构本体匹配技术研究[D];南开大学;2011年
10 王志俊;语义Web中基于OKQT的本体知识路由实现机制[D];太原理工大学;2010年
中国重要报纸全文数据库 前10条
1 ;日本安田、日产保险公司合并[N];中国保险报;2002年
2 钟水浩;美国银保协会大合并[N];中国保险报;2001年
3 周琼 肖萍;佛山,力度最大的城市合并[N];中华建筑报;2002年
4 唐世平 陈校园 张愚;主动+被迫 观发达国家医药企业重组[N];国际商报;2000年
5 吴言 港;合并潮势不可挡[N];国际经贸消息;2000年
6 本报驻巴黎记者 马与雄;威望迪与西格兰合并 欧盟准了[N];中华工商时报;2000年
7 刘丽娜;美国两大银行合并[N];中国经营报;2001年
8 本报记者 陈清清 李顺祥;合并:行业结构调整的重大举措[N];中国财经报;2000年
9 ;日本三大银行合并[N];中国经营报;2000年
10 本版撰稿/伍兵;全球并购重组完全报告[N];中国企业报;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978