收藏本站
收藏 | 论文排版

面向异构信息网的多维分析技术研究

刘秀美  
【摘要】:随着计算机技术的发展和信息的爆炸式增长,数据的表示手段和表现形式越来越丰富,数据对象之间的关联关系也越来越复杂。信息网络数据模型较传统的关系数据模型在数据信息语义表达能力与数据对象间关联关系表示能力上更具优势,被广泛应用到具有复杂关联关系和内部拓扑结构的数据建模中。信息网络根据实体类型的数量和关系类型的数量被分为两类:同构信息网络和异构信息网络。相比于同构信息网络,异构信息网络能够更加自然和准确地表达和存储现实世界中实体以及实体之间的关联信息,包含更加丰富的语义。对异构信息网络进行多维分析,能够挖掘其中潜在的有价值的知识,具有重要的研究意义和价值。目前对于信息网络多维分析的研究,偏向于同构信息网络,不能直接用于异构信息网络。本文针对异构信息网络的多维分析问题展开相关研究,主要工作如下。提出了一种基于图正则表达式的异构信息网查询语言。首先,提出了图匹配模式的概念,可用来准确描述用户的查询语义。然后,设计了一种新颖的图正则表达式来描述图匹配模式,其中,路径正则表达式(Path regular Expression,PRE)描述线性图匹配模式与环形图匹配模式,图正则表达式(Graph Regular Expression,GRE)描述更复杂也更普遍的星型图匹配模式和混合型图匹配模式。图正则表达式既能提供良好的查询语义表达能力,又有很好的查询处理和查询优化性能。最后,提出了基于图正则表达式的异构信息网查询语言(Regular Expression Graph Query Language,ReQL),支持对异构信息网络的实体属性、子图结构和信息聚合的查询分析。提出了基于图正则表达式的三层结构图立方体模型。首先,定义了两种异构信息网多维分析的维度,分别为属性维和结构维,并分别介绍了二者的维度层次结构。其中,属性维用于从顶点或边的角度查看数据,结构维用于从拓扑结构角度查看数据。其次,基于不同的聚合方式与所表达的内容,定义了内容度量、数值度量和图度量这三种异构信息网络度量方式。然后,基于维度与度量,提出了一个三层的异构信息网络图立方体模型,以支持对异构信息网络全方位多层次的数据分析,最外层包含初始图和四个子立方体(线性结构图立方体、环形结构图立方体、星型结构图立方体、混合型结构图立方体),中间层是结构维图立方体,最内层是属性维图立方体。最后,分别给出了子立方体内的OLAP操作和子立方体间的OLAP操作,重新定义了OLAP基础操作上卷和下钻的操作语义,用以支持对图立方体的多维查询。给出了ReQL的查询处理与优化。首先,设计并实现了ReQL解析器,对ReQL依次进行词法分析、语法分析和语义分析,识别ReQL表达的查询语义。然后,给出了ReQL查询处理过程,并重点介绍了PRE/GRE的查询处理过程,提出了两种PRE/GRE查询处理方式,Navigation查询和HashJoin查询。接着,提出了两种PRE/GRE查询优化技术,包括索引技术与基于代价模型的查询优化技术。最后,通过实验验证了基于代价模型的查询优化技术的可行性和有效性。设计并实现了异构信息网络多维分析系统。首先,介绍了系统的架构设计。其次,给出了数据存储方案。然后,介绍了系统采用的物化策略。接下来,给出了系统OLAP操作的实现,包括OLAP操作的实现框架、上卷操作与下钻操作的实现。最后,通过实验验证了系统多维分析的有效性并进行了OLAP操作实现方法的对比实验。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 池云;;异构信息网络的分类研究[J];计算机应用与软件;2014年06期
2 何喜军;董艳波;武玉英;蒋国瑞;马珊;郑瑶;;基于异构信息网络嵌入的专利技术主体间交易推荐模型[J];情报学报;2020年01期
3 李亚莹;;基于异构信息网络表征学习的推荐方法[J];现代计算机;2020年04期
4 杨丹;陈默;王刚;孙良旭;;异构信息空间中时间感知的查询时实体识别与数据融合[J];计算机科学;2017年03期
5 杨丹;陈默;王刚;孙良旭;;异构信息空间中时间感知的跨类型实体推荐[J];计算机科学;2017年05期
6 曲建升;刘红煦;;知识发现中异构信息标准化处理研究——以资源环境领域文献为例[J];图书情报工作;2016年06期
7 董明哲,张同军;基于信息语义的异构信息集成方法[J];计算机工程;2005年02期
8 汤小康;曹步文;;异构信息网络中基于图的半监督学习[J];小型微型计算机系统;2017年10期
9 张彪;李川;徐洪宇;李艳梅;杨宁;罗谦;;基于特征子图的异构信息网络节点相似性度量[J];电信科学;2014年11期
10 尹丹;高宏;;异构信息网挖掘:概念、技术与未来[J];智能计算机与应用;2016年06期
11 陈丽敏;杨静;张健沛;;一种基于嵌入技术的异构信息网络的快速聚类算法[J];电子与信息学报;2015年11期
12 卢诚;;公安交通多源异构信息的采集技术分析[J];中国交通信息化;2014年03期
13 卓嵩;黄瑞金;蒋红兵;杨正银;;在线交互空间异构信息的设计与实现[J];地理空间信息;2014年01期
14 刘钰峰;李仁发;;基于查询—文档异构信息网络的半监督学习[J];通信学报;2014年08期
15 童浩;余春艳;;基于排名分布的异构信息网络协同聚类算法[J];小型微型计算机系统;2014年11期
16 王仁武;陈家训;;基于本体的异构信息互操作研究[J];情报杂志;2007年02期
17 刘存涛;赵文栋;杨华;;一种基于概念逻辑树的异构信息结构化描述模型[J];通信技术;2019年11期
18 李艾丹;薛中玉;李春梅;;异构信息知识挖掘与可视化分析系统架构模型解析[J];中国科技论坛;2012年10期
19 王乐,强晓远,孙莉;基于本体模型异构信息交互的研究[J];微型机与应用;2005年01期
中国重要会议论文全文数据库 前9条
1 梁屹;蒋卫国;黄祟福;;多源异构信息的融合方法及其在应急监控预警中的应用[A];风险分析和危机反应中的信息技术--中国灾害防御协会风险分析专业委员会第六届年会论文集[C];2014年
2 张蕾;刘辰;杨正球;;信息化环境下电子政务应用技术创新研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
3 向家国;郑申华;;基于Web Service的电力行业异构信息系统集成方法探讨[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
4 王晓玲;董逸生;;面向Web的异构信息系统集成方案[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
5 杜垚琼;;智能驾驶量产方案[A];第十一届中国包头·稀土产业论坛专家报告集[C];2019年
6 伍国权;杨少青;;基于客户投诉的大数据多维分析研究[A];2017广东通信青年论坛优秀论文集[C];2017年
7 杨震;徐苗;;类型与机制:封闭住区的多维分析[A];规划60年:成就与挑战——2016中国城市规划年会论文集(06城市设计与详细规划)[C];2016年
8 刘云峰;王倩宜;杨旭;欧阳荣彬;;一种支持大数据集成架构的多维分析系统[A];中国高等教育学会教育信息化分会第十二次学术年会论文集[C];2014年
9 王亦兵;杨树强;王晓伟;;一个面向数据流的多维分析系统的研究与实现[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
中国博士学位论文全文数据库 前8条
1 吴继冰;基于张量分解的异构信息网络聚类分析方法[D];国防科技大学;2017年
2 谢芳;基于异构信息网的Web服务推荐方法研究[D];武汉大学;2019年
3 战红君;传染病异构信息整合分析与综合管理研究[D];大连海事大学;2018年
4 王小刚;异构信息集成环境中基于语义的查询研究[D];华中科技大学;2006年
5 李朋;异构信息网络分析模型及其应用研究[D];重庆大学;2013年
6 刘钰峰;异构信息网络检索技术研究[D];湖南大学;2014年
7 尹丹;异构信息网查询和分析研究[D];哈尔滨工业大学;2016年
8 黄冬;面向网络金融知识服务的模型与方法研究[D];哈尔滨工业大学;2015年
中国硕士学位论文全文数据库 前10条
1 刘秀美;面向异构信息网的多维分析技术研究[D];东南大学;2019年
2 王学萍;基于异构信息融合的致病基因预测算法研究[D];哈尔滨工业大学;2019年
3 陈长赓;异构信息网络下基于元路径的节点重要性度量和社区发现[D];云南大学;2019年
4 高小霞;异构信息网络中基于深度学习的推荐方法研究[D];燕山大学;2019年
5 邴嘉欣;基于多层异构生物网络的药物—基因关系预测方法研究[D];厦门大学;2018年
6 赵桓幜;基于异构信息网络的引文推荐方法研究[D];安徽大学;2019年
7 李晨;基于异构信息网络的电影数据挖掘分析[D];浙江工业大学;2018年
8 曲之赫;大规模异构信息网络上动态重叠社区检测算法研究[D];北京邮电大学;2019年
9 叶丹娜;动态异构信息网络的表示学习研究[D];北京邮电大学;2019年
10 董思凡;基于异构信息网络的糖尿病饮食推荐系统研究[D];兰州理工大学;2019年
中国重要报纸全文数据库 前7条
1 陈友梅;DB2信息集成提速异构信息管理[N];中国计算机报;2003年
2 齐向真;我市两项目获科技部863计划批复[N];太原日报;2012年
3 李明;远舟公司承担的“863”课题通过阶段检查[N];中国船舶报;2004年
4 ;对“超前”之举的多维分析[N];工人日报;2006年
5 本报记者 罗丽;研究大数据的基础 关键是主题应用[N];吕梁日报;2018年
6 经报记者 普腾中木;多维分析 研判“十三五”经济发展阶段[N];云南经济日报;2015年
7 仪孝法;景区游客管理的多维分析[N];中国旅游报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978