基于本体的数据集成及其应用
【摘要】:
随着计算机技术的发展与广泛应用,许多企业在其建设的过程中需要将一些分布的、异构的数据根据应用需求集成起来,以实现数据共享。传统的数据集成方法常常忽略了对数据的形式化语义的描述,使得集成过程中的语义失配问题得不到解决。本文主要的研究内容就是利用本体,来探讨一种解决语义异构、实现信息集成的方法。
本文探讨了信息集成中的方法和技术,指出语义异构问题是当前异构数据集成的主要问题。通过对现有数据集成方式的分析,结合Wrapper/Mediator和扩展的混合本体方法,利用本体技术,设计了科技信息集成框架(SIIF, Scientific Information Integration Framework)的三层体系结构,包括应用层、查询处理层、信息资源层。通过采用XML作为中间统一语言,将底层数据源转化成XML的数据模式进行集成,以XML Schema作为基础模式进行构建本体,屏蔽了底层数据源语法的异构性。凭借本体在领域概念描述上的优势,利用OWL本体语言对本体进行描述,构建全局本体、局部本体以及定义全局本体与局部本体、局部本体与数据源之间的映射规则,从而解决信息集成中的语义问题。
文章首先介绍了信息集成的理论和技术,接着对本体的基本概念及其相关理论进行了阐述。随后着重对科技信息集成框架各层次的功能进行了介绍,并分析了该框架的特点。对实现科技信息集成框架的关键技术进行讨论,以科技信息的具体记录作为实例详细介绍了系统对于信息集成的过程。
文章最后介绍了SIIF系统原型实现,并在此基础上对原型系统进行了测试,从而验证了基于本体的科技信息集成框架的可行性。