语义Web中本体映射的研究
【摘要】:
语义Web是Web发展的一个新兴方向,自Tim Berners-Lee提出语义Web的概念之后,就一直成为人们讨论与研究的热点。随着语义Web的发展,基于本体的应用也越来越广泛,对本体的研究日益成为计算机领域中一个热门的方向。
本体被定义为共享概念模型的形式规范说明。本体具有强大的知识共享和重用的能力。应用本体的主要目的是为了知识共享和复用。然而,在分布式应用环境(如语义web)中,一个孤立的本体是不能满足要求的,往往需要继承多个本体以支持不同本体之间的共享和交流。科研人员从实际出发提出多种构造本体的标准,其中最有影响的是T.R. Gruber提出的5个准则:明确性和客观性、一致性、完全性、最大单调可扩展性、最小承诺。但由于目前本体的构造并没有一个统一的标准,本体的创建者和建模方法也不尽相同,这都会导致大量不同本体的出现,本体的异构问题日显突出。
在语义Web中,为了获取其他应用所拥有的信息,或者联合多个应用以实现更强大的功能,不同应用系统之间的信息交互非常普遍和频繁。然而,如果不同的系统采用的本体是异构的,他们之间的信息交互便无法正常进行。实际的语义Web应用中,本体异构造成了大量的信息共享和交互问题。因此,解决本体异构,消除应用系统间的互操作障碍,是语义Web发展面临的关键问题之一。
为了解决上述问题,这就需要在不同的本体元素间建立联系,本体映射的目的就是找出这些本体之间的语义联系。通过一定的方法在已有的不同本体之间建立映射,以便在已存在的和新的领域之间进行交流时有通用的接口和共同的理解。
目前,关于本体映射方面的研究有很多。已提出的本体映射方法按本体定义模型进行分类,主要有:(1)基于语法的方法;(2)基于概念实例的方法;(3)基于概念定义的方法;(4)基于概念结构的方法,这些方法都参照了本体定义的不同部分。按映射采用的技术分类可以分为:(1)基于规则的方法;(2)统计学的方法;3)机器学习的方法。需要说明的是,每个映射方法往往是多种技术和多种参照对象的结合。然而,这些方法大都存在相似度计算不完善,相似度计算量过高,映射计算过于片面等问题。
本文中使用一种多策略综合的本体映射方法,初步实现用OWL DL作为描述语言的异构本体之间的映射。首先对语义Web和本体映射的相关概念和方法进行了介绍,分析了当前语义Web技术的一些新发展以及有关本体映射的国内外研究现状。针对现有方法的不足,对原有方法进行改进,提出了一种新的多策略综合映射机制,并通过理论分析和实验结果验证算法的可行性和有效性。本体映射关系的发现、表达和执行是目前语义Web发展应用中面临的重要问题,而映射本身是一件复杂而又艰难的过程,所以本文中主要侧重语义相似度的计算和映射关系的发现。最后结合基于语义Web的广西旅游信息服务平台来详细说明多策略综合映射机制的具体应用。
本文的主要工作总结如下:
第一,介绍本体映射的研究背景和目前的研究现状、语义web的相关技术和体系结构,语义本体的概念以及分类。
第二,介绍本体映射的有关概念和方法,对现有的本体映射方法进行介绍分析,选择合适的算法作为本课题研究的主要方法。
第三,在现有映射方法的基础上设计出新的映射方法—多策略综合的本体映射方法,以完善目前本体映射方法存在的缺陷和不足。对多策略综合方法中的实例、结构、类公理
等三个相似度分量计算的映射方法进行了详细的介绍说明和实验验证。验证本文提出方法的可行性和有效性。
第四,应用改进的本体映射方法实现异构本体的映射。给出本体映射的体系框架,分析其模型功能系统,实验结合广西区旅游信息服务平台的构建,结果表明,改进的方法不仅能够很好的解决由于本体异构而产生不相容问题,能较好的满足数据共享的需求,提高共享能力,同时又能克服目前匹配方法单一,不全面的问题,从而能有效的提高本体匹配的精确度,提高其信息搜索的准确率。
第五,对所做的工作进行总结,展望了未来所要做的工作,并陈述了本体和本体映射的研究方向及发展前景。
基于语义Web的本体映射研究还处于起步阶段,还有很多地方需要更进一步的改进,本文下一步的工作将主要研究更加合理、效率更高的本体映射算法,以提高系统的效率。