收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

不确定数据聚集查询的分布式处理算法

周逊  
【摘要】: 不确定数据近年来受到广泛关注。在诸如经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在。不确定数据管理技术,尤其是不确定查询技术的研究成为热点问题。 目前不确定数据查询技术的相关研究涵盖了查询的语义,查询处理及优化等诸多方面。在不确定数据上进行的查询包括等值查询,区域查询等简单查询,以及Top-k,(k)NN,Skyline等基于排序的聚集查询。这些查询在诸如地理信息系统,移动对象跟踪查询以及定位等应用中有着非常重要的作用。 不过目前为止多数不确定数据管理和查询技术都是在集中式数据库或数据流上进行的。事实上数据不确定性在传感器网络,分布式Web Server及P2P系统等分布式系统中广泛存在。从这些系统中收集所有数据进行集中式查询将带来巨大的通信开销、时间延迟和存储代价。同时,由于分布式系统的特殊性,大多数集中式不确定查询算法在分布式环境下并不适用。 本文对三种在分布式系统应用中常见的不确定聚集查询:不确定最大(小)值查询、不确定Top-k查询和不确定kNN查询进行了研究,给出了三种聚集查询的形式化定义,分别提出了以减小分布式聚集查询通信开销为目标的过滤策略,并分别设计了支持这三种查询的数据存储和基于过滤策略的分布式聚集算法。这一系列算法的主要思想是根据概率计算和数据分布,将不可能成为最终查询结果的数据抛弃,并通过设计相应的机制保证查询结果的正确性。实验结果表明,在真实数据和生成的不确定数据上,以及多种系统环境下本文的过滤算法都能够正确地得到查询结果并显著降低系统的数据通信开销。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李芳,韩元杰;基于证据理论的知识发现分类算法[J];桂林电子工业学院学报;2004年03期
2 潘世瑞;张阳;李雪;王勇;;针对不确定正例和未标记学习的最近邻算法(英文)[J];计算机科学与探索;2010年09期
3 汪金苗;张龙波;邓齐志;王凤英;王勇;;不确定数据频繁项集挖掘方法综述[J];计算机工程与应用;2011年20期
4 杨金伟;王丽珍;陈红梅;赵丽红;;基于距离的不确定数据异常点检测研究[J];山东大学学报(工学版);2011年04期
5 申德荣;于戈;寇月;聂铁铮;;可能世界内数值型不确定数据匹配模型[J];计算机应用研究;2008年09期
6 王博;贾焰;杨树强;周斌;;适用于不确定文本分类的特征选择算法[J];通信学报;2009年08期
7 孙平平;刘方爱;;不确定数据库中减小可能世界的RPW-kBest查询[J];计算机技术与发展;2011年10期
8 张新猛;蒋盛益;;一种基于相似度概率的不确定分类数据聚类算法[J];山东大学学报(工学版);2011年03期
9 崔斌;卢阳;;基于不确定数据的查询处理综述[J];计算机应用;2008年11期
10 郑继刚;杨春华;曾庆红;赵若男;;基于Weka平台的不确定数据挖掘[J];保山学院学报;2010年05期
11 王悦;唐常杰;杨宁;张悦;李红军;郑皎凌;朱军;;在不确定数据集上挖掘优化的概率干预策略[J];软件学报;2011年02期
12 赵娟;王明春;李小亮;;基于不确定数据决策树分类算法的软件外包评价模型[J];天津职业技术师范大学学报;2011年03期
13 洪玫,沈琳;关系数据库中不确定值的处理[J];四川大学学报(工程科学版);1998年01期
14 李芳;李一媛;王冲;;不确定数据的决策树分类算法[J];计算机应用;2009年11期
15 付世昌;董一鸿;唐燕琳;陈华辉;钱江波;;基于事件的位置不确定移动对象连续概率Skyline查询[J];自动化学报;2011年07期
16 张徵;杨卫东;朱皓;;不确定数据库上的top-k关键字查询[J];计算机科学与探索;2011年09期
17 周逊;李建中;石胜飞;;不确定数据上两种查询的分布式聚集算法[J];计算机研究与发展;2010年05期
18 梁瑜;张剡;周嵩;柏文阳;;基于不确定数据的top-k概率相互最近邻查询[J];计算机应用研究;2011年07期
19 王爽;王国仁;;基于不确定数据的分布式Top-k查询算法[J];东北大学学报(自然科学版);2010年02期
20 李传文;谷峪;李芳芳;于戈;;一种障碍空间中不确定对象的连续最近邻查询方法[J];计算机学报;2010年08期
中国重要会议论文全文数据库 前10条
1 孙永佼;王国仁;;P2P环境中不确定数据Top-k查询处理算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 陆叶;王丽珍;张晓峰;;从不确定数据集中挖掘频繁Co-location模式[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
3 周帅印;李晨;王勇;张阳;;FDTU:针对不确定数据的快速决策树生成算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
4 周逊;李建中;石胜飞;;不确定数据上聚集查询的分布式处理算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
5 张潮;李晨;王勇;张阳;;uPOSC4.5:一种针对不确定数据的PU学习决策树算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
6 高聪;申德荣;于戈;聂铁铮;寇月;;一种基于不确定数据的挖掘频繁集方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
7 李玉强;贺国平;;鲁棒线性规划[A];中国企业运筹学学术交流大会论文集[C];2008年
8 王晓伟;黄九鸣;贾焰;;分布式不确定数据上的概率Skyline计算[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
9 艾文凯;张剡;柏文阳;;基于用户偏好的不确定数据阈值轮廓查询算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
10 信俊昌;王国仁;公丕臻;吴俊杰;;不确定数据库中的阈值轮廓查询处理[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前8条
1 汤克明;不确定数据流中频繁数据挖掘研究[D];南京航空航天大学;2012年
2 高明;不确定数据的世系管理和相似性查询[D];复旦大学;2011年
3 张晨;数据流聚类分析与异常检测算法[D];复旦大学;2009年
4 安玉娥;应用于大规模动力系统中的基于SVD-Krylov的模型简化方法[D];上海大学;2010年
5 董俊;不确定数据中数据挖掘方法的研究[D];燕山大学;2012年
6 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
7 齐红;基于形式概念分析的知识发现方法研究[D];吉林大学;2005年
8 朱卫东;面向互联网基于证据理论的智能决策支持系统研究[D];合肥工业大学;2003年
中国硕士学位论文全文数据库 前10条
1 王雪;基于不确定数据的组移动模式挖掘算法的设计与实现[D];黑龙江大学;2014年
2 阚斌;不确定数据近邻搜索算法的设计与实现[D];黑龙江大学;2014年
3 刘明建;不确定数据的代价敏感决策树分类器研究[D];西北农林科技大学;2012年
4 何佳珍;不确定数据的PU学习贝叶斯分类器研究[D];西北农林科技大学;2012年
5 魏小艳;基于DRA的不确定数据的查询研究[D];哈尔滨工程大学;2012年
6 朱倩;属性不确定数据关联分类算法研究[D];大连理工大学;2011年
7 张星;不确定数据的PU学习决策树研究[D];西北农林科技大学;2012年
8 何丽娟;无线传感器网络中不确定数据处理的研究[D];安徽工程大学;2011年
9 高聪;Deep Web下不确定数据处理的研究[D];东北大学;2008年
10 阮文杰;不确定数据k近邻查询算法的相关研究[D];暨南大学;2013年
中国重要报纸全文数据库 前2条
1 编译 刘光强 许继楠;风险管理智能了,金融创新不怕了[N];中国计算机报;2010年
2 杭讯;低碳烯烃和芳烃石化产品的注册联合体在正轨上运行[N];中国国门时报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978