数据集成中本体映射的研究
【摘要】:在异构数据源的集成中,解决语义异构一直是一个难题。本体能够明确表示一定领域的概念和概念之间的关系,利用这一特点,基于本体的数据集成能够解决这个问题。
在基于本体的数据集成中,多个应用本体间不可避免地出现语义冲突,如何解决这些冲突正是本体映射的研究内容。研究表明,可以通过计算概念间的语义相似度来发现映射关系。同时,概念的实例、概念的定义和概念的结构层次关系都在一定程度上体现了概念间的关系。
目前已有映射方法都是针对具体的应用本体的,不能适应环境的变化。因此本文提出一种基于概念的实例、概念的定义和概念的结构层次关系的综合语义相似度的计算模型。在该模型中,用概念实例的联合分布概率计算实例相似度;结合统计学模型和图形学方法计算概念定义的相似度;并在一定语义半径范围内找出概念的语义邻居,利用计算概念定义相似度的方法计算对应邻居的相似度,从而得到概念结构相似度;然后将三个相似度分量加权综合得到概念间的综合语义相似度。
基于该模型进行了模拟实验,实验表明,该模型能够用来计算概念间的语义相似度,从而应用于本体映射,综合语义相似度更能体现概念间的语义关系,比单个的相似度分量更为有效。同时,该模型具有很好的适应性,可以在计算模型基本不变的情况下,通过调节三个相似度分量的权值来适应应用环境的变化。