RDF图数据管理的关键技术研究
【摘要】:
语义Web使跨应用、企业和团体的数据共享与重用成为可能,而RDF是语义Web的基础,其数据模型是RDF图。与已有数据模型不同,RDF图是有向超图,能够表达隐含语义,富含文本信息,且规模庞大。这些特点造成RDF图数据管理中存在存储设计难度大,查询处理复杂且效率低,查询结果排序困难等问题。针对以上问题,本文对RDF图数据管理中的若干关键技术展开研究。
首先,本文研究了隐含数据查询过程中的自反传递闭包计算问题,提出了一种基于有向图素数编码标记机制的方法:PLSD。PLSD将任意有向图上结点间可达关系(属性的自反传递性)计算转化为标记中整数的整除关系计算。与传统基于forward chaining和backward chaining的推理相比,PLSD能够更有效地实现RDF图中自反传递闭包的计算。实验表明PLSD优于同类其它标记机制。
其次,针对RDF图的有向超图特点,本文提出了一种原生的RDF图存储方法:PI。该方法能够有效避免由数据模型不一致而导致的数据模型转换开销。它还具有降低存储空间开销,易于实现各种图论算法,聚簇存储RDF图有向边等特点。PI存储上结合PLSD等推理策略的语义查询系统,在LUBM测试基准实验中综合性能指标要高于对比系统。
对于RDF图中的文本信息,本文提出以资源文档为索引和查询基本单位的细粒度关键词查询方法。克服了以RDF文档为单位的粗粒度关键词查询方法难与语义查询结合的问题,提高了语义查询和关键词查询的综合查全率和查准率。
最后,在查询结果排序方面,提出在本体层次上对概念与关系重要性的排序方法CARRank。基于CARRank实现了实例数据层资源全局重要性排序和结合查询结果相似度与资源全局重要性的综合排序。CARRank算法利用本体中概念和关系相互增强的迭代方式计算概念重要性和关系权重,避免了对资源统计信息的依赖。并给出了其收敛性的理论证明和实验检验。实验验证了基于CARRank算法的概念重要性排序与关系权重的合理性。
原型系统在中文新闻等领域的成功应用验证了本文工作的价值和意义。
|
|
|
|
1 |
王乐;张建军;;OWL本体存储的分析与应用[J];科学技术与工程;2008年07期 |
2 |
张辉;朱俊武;;一种基于本体的多Agent语义挖掘模型[J];微电子学与计算机;2009年10期 |
3 |
吕艳辉;;RDF(S)模型到关系数据库模式的转换[J];计算机工程;2011年09期 |
4 |
何娟;高志强;陆青健;瞿裕忠;;基于词汇相似度的元素级本体匹配[J];计算机工程;2006年16期 |
5 |
蒋运承;汤庸;王驹;周生明;;面向语义Web的描述逻辑[J];模式识别与人工智能;2007年01期 |
6 |
宋岚;雷莉霞;王洪;;基于本体的智能化语义信息处理系统研究[J];华东交通大学学报;2009年05期 |
7 |
汪锦岭,金蓓弘,李京;一种高效的RDF图模式匹配算法[J];计算机研究与发展;2005年10期 |
8 |
沈国海,穆斌,胡学钢;语义Web本体及本体库系统设计技术[J];微机发展;2004年07期 |
9 |
史忠植,董明楷,蒋运承,张海俊;语义Web的逻辑基础[J];中国科学E辑;2004年10期 |
10 |
周中成,孙荣胜;基于语义的Web服务自动发现、匹配及执行平台[J];计算机应用;2005年01期 |
11 |
胡鹤,刘大有,王生生;Web本体语言的分析与比较[J];计算机工程;2005年04期 |
12 |
梅婧;刘升平;林作铨;;语义Web的逻辑基础[J];模式识别与人工智能;2005年05期 |
13 |
张大陆;王炫召;;一种基于语义的服务发现算法[J];计算机工程;2006年03期 |
14 |
蒋运承;史忠植;汤庸;王驹;;一种分布式动态描述逻辑[J];计算机研究与发展;2006年09期 |
15 |
宋岚;黄兆华;;基于本体的语义推理研究[J];华东交通大学学报;2007年02期 |
16 |
潘阳威;徐汀荣;靳涛;;语义Web本体匹配算法研究[J];计算机与现代化;2008年11期 |
17 |
董慧;王菲;姜赢;高巾;翁丹丹;曾杰;;基于数字图书馆的本体应用环境研究[J];中国图书馆学报;2009年05期 |
18 |
李善平,尹奇韡,胡玉杰,郭鸣,付相君;本体论研究综述[J];计算机研究与发展;2004年07期 |
19 |
杜小勇,李曼,王大治;语义Web与本体研究综述[J];计算机应用;2004年10期 |
20 |
吴刚;张阔;李涓子;王克宏;;利用相互增强关系迭代计算本体中概念与关系的重要性[J];计算机学报;2007年09期 |
|