基于模糊相似度的异构本体映射、合并及校验方法的研究
【摘要】:
本体是对特定领域概念及其关系的清晰描述,它可作为不同信息系统之间信息交换的基础。然而,由于信息系统是由不同组织在不同时间和不同需求背景下开发的,因此,这些系统所依赖的本体之间不可避免存在异构性,这种异构性为不同系统之间的互操作带来了极大的障碍。为了解决这一问题,需要识别不同本体间存在的异构或冲突,然后根据识别结果,在本体间对等概念和关系上建立对应联系(即:本体映射)或进行不同本体间的合并(即:本体合并)。
为了克服人工进行本体映射和本体合并中工作量大,效率低的问题,并满足在不确定环境下进行信息系统之间动态和实时互操作的要求,国内外已进行了许多关于自动(或半自动)本体映射、合并的研究,这些研究虽然已取得了很大的突破和进展,但在准确率和效率等许多方面与实际需求还有较大差距。本文从信息集成的实际出发,针对过去研究中存在的不足,就进一步提高本体映射和合并的准确率和效率进行了深入和广泛的研究,并同时展开了对映射及合并结果进行形式化校验的方法研究以验证这些结果逻辑上的正确性。
本文的创新性工作可以归纳为下面几点:
(1)提出了模糊化的相似度表示方法
本体概念的特征信息一般分为两类:文本特征信息(名称和实例等),结构特征信息(对象属性、分类关系及依赖函数关系等)。在传统本体映射中,本体概念间的相似度计算,一般是通过基于不同文本特征信息的多个相似度中间结果的复合叠加、多种结构特征信息的顺序迭代或者两者综合等方法来实现,其相似度结果(中间结果或最终结果)均为单一数值,并以该数值(最终结果)来判别两个概念是否相似。由于概念间的相似度本身存在着固有的模糊特性(所谓模糊特性是指两个概念间的相似度以一定的概率密度函数分布于某一数值区间),因此,在映射计算过程中,如果过早用确定数值代替概率密度函数来描述相似度,将可能丢失一些可用于后续决策的信息,从而加大决策(映射)的风险。此外,对于本体的两类特征信息,许多传统方法采用了“先按文本信息进行映射,再用结构信息完成校验迭代”的串行手段来进行处理,其中,基于结构信息的迭代是以基于文本信息的映射结果为先验知识而进行的,从而有可能过于强化了文本信息的作用弱化了结构信息对相似度计算的贡献。为了解决这两个问题,本文引入了模糊相似度,提出了基于各类特征信息的不同相似度的模糊化表示方法,从而在概念相似度的计算过程中引入了模糊特性,进而既避免了过早对相似度模糊特性做出裁决的风险,又使文本和结构信息能并行参与映射计算,提高了匹配效果。
(2)提出了基于属性值联合分布的映射方法
概念中的实例信息可用于本体映射,传统的基于实例的本体映射方法一般是将实例中的数值属性取值直接合并为长文本信息。这种方法简单地假定概念的各个数值属性是完全独立的,而没有考虑它们之间可能存在的对应概率依赖关系。因此,该方法未能充分利用概念中与实例有关的重要信息,影响了映射结果的准确性。为此,本文提出了一种能有效利用上述关系的基于实例属性值联合分布的映射方法,提高了映射效果。
此外,在实际应用中,本体概念的表达经常会发生变更(如:添加或删除属性),这就导致了更改后的概念表达与原有概念实例对应属性集之间的冲突,因此,相关本体概念匹配过程中经常会出现某些实例属性值缺失的现象,这直接影响了属性值联合分布计算的准确性。为此,本文引入粗糙集理论来拟合属性值缺失的样本实例空间,提高了基于属性值联合分布的映射效果。
(3)提出了新型的本体合并结果及映射结果的形式化校验方法
在本体合并和映射过程中,一般会产生一系列本体合并结果(新本体)和映射结果,为了保证这些结果在逻辑上的正确性,则需对其进行形式化校验。目前,有关本体模型的形式化校验很多是围绕单个概念或关系来进行,而多个概念和关系之间的结构及约束信息却未得到充分利用,且对于本体映射结果校验目前也没有系统有效的形式化方法。为此,本文引入面向对象中的OCL(Object Constraint Language)规则,并针对本体应用环境进行了相应扩展,实现了本体模型结构及约束、映射约束规则等逻辑描述的形式化表示,进而提出了采用本体定义元模型和映射元模型来辅助进行形式化校验的方法。
|
|
|
|
1 |
任江洪,曹长修;遗传算法在数据挖掘多种分类器合并中的应用[J];微机发展;2004年01期 |
2 |
陈英萍;;高校合并后图书馆管理模式初探[J];高校图书情报论坛;2003年03期 |
3 |
任广辉,朱浩然;脉冲量数据采集系统[J];自动化技术与应用;1997年01期 |
4 |
林闯,魏丫丫;随机进程代数与随机Petri网[J];软件学报;2002年02期 |
5 |
王慧;合并后高校图书馆分馆的建设和服务[J];高校图书馆工作;2003年05期 |
6 |
楚蓓蓓,刘蓬辉,王非非;AutoCAD图到MapInfo图转换过程中区域对象的处理[J];信息工程大学学报;2003年04期 |
7 |
周鑫;;LSI与Agere合并 明确冲击消费电子平台[J];电子设计技术;2007年01期 |
8 |
于林娜;;合并多个Word文档我有捷径[J];电脑爱好者(普及版);2008年12期 |
9 |
胡舜良;;Excel电子表格关联合并[J];电脑编程技巧与维护;2010年16期 |
10 |
邹宁,李庆,柳健;基于Kohonen神经网络的深度图像分割方法[J];红外与激光工程;2000年01期 |
11 |
夏薇;高校合并后资料室的建设与发展[J];图书馆学研究;2000年05期 |
12 |
何霞;全球信息业的兼并对我们的启示[J];中国数据通讯网络;2000年05期 |
13 |
江兴智,赵宇明,施鹏飞;手写体信函地址汉字切分[J];上海交通大学学报;2001年09期 |
14 |
彭虎;高校合并中图书馆整合的几个问题[J];河北科技图苑;2001年05期 |
15 |
何平,李敬友,朱丽娜;计算机图形学中几何造型的集合运算[J];齐齐哈尔大学学报;2001年03期 |
16 |
刘传森;论高校系(所)资料室的建设与发展[J];阴山学刊;2001年02期 |
17 |
刘海萍;;以并促建——合并对高校馆产生的积极效应[J];大学图书馆学报;2001年S1期 |
18 |
魏凌云;陈昕;;构筑新型的大学图书馆——高校合并后图书馆工作思考[J];大学图书馆学报;2001年S1期 |
19 |
竺海康;赵继海;;高校图书馆合并模式的实践与思考[J];大学图书馆学报;2001年S1期 |
20 |
葛晓霞;;浅谈高校图书馆合并后的业务机构重组与用人制度改革[J];大学图书馆学报;2001年S1期 |
|