基于Linked Open Data的语义关联发现及其应用
【摘要】:
语义网(Semantic Web)的目标是通过在网页内容上附加形式化的语义信息,让机器也能够理解网页的内容。随着语义网技术逐渐成熟,人们根据互联数据(Linked Data)的原则在语义网上发布、连接结构化数据,最终产生互联数据。开放互联数据社区的成立极大地促进了互联数据的发布。已经发布的互联数据集覆盖领域广泛,有地理信息、人口资料信息、在线社区、科学出版物、音乐等。互联数据为从分布式数据源中发现事物之间潜在的关系提供了巨大的可能。随着越来越多的互联数据的发布,如何在互联数据上进行语义关联发现成为研究的关键问题。
语义关联是语义数据模型中实体之间二维关系的知识表示形式。语义关联发现基于现有的语义关联,使用算法推导出更深层次的语义关系。然而现有的语义关联发现方法都是基于集中式的知识库的,这不符合互联数据的分布式特点,也使得现有的方法可扩展性较差。因此,研究设计一种符合互联数据分布式特点,可扩展性较好的语义关联发现方法是非常必要的。
针对上述问题,论文提出并设计实现了一个多代理协作的分布式语义关联发现框架。具体内容包括:①提出一种新的知识表示模型,介绍了假设、证据、证据图等知识元素的表示方法,该知识表示模型有助于多个代理之间进行知识交换。②提出了一种新的多代理协作式语义关联发现机制。③设计实现了两类代理:目录代理和挖掘代理,并对代理提供的服务给出了详细的规范定义。④设计实现了语义关联发现的核心算法,并研究分析了算法可以采用的不同策略。⑤对该语义关联发现框架进行模拟实验,并做性能分析。并将它应用于DBLP和DBPedia数据集,结果表明多代理之间协作进行语义关联发现是可行的。