收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于概率数据库的偏好查询研究

王晓伟  
【摘要】:在商业数据管理、金融数据分析、传感器、RFID、地理信息系统等许多重要的现代应用中,数据普遍带有不确定性特征,查询和分析的精确度对应用是否成功具有决定性影响。传统的数据库技术建立在确定性理论的基础上,无法有效处理此类不确定数据。概率数据库技术能够直接管理不确定数据,是近年来数据库领域的研究热点。概率数据库的应用层通过偏好查询满足用户的个性需求,其中最重要的偏好查询是概率skyline和概率top-k查询。 本文针对基于概率数据库的偏好查询技术,从提高查询效率和通用性出发,对概率skyline查询和概率top-k查询的若干关键问题展开研究,主要工作包括: 1、概率skyline查询的非索引算法。现有的概率skyline算法普遍基于R树索引,而R树索引技术在通用性方面存在限制。非索引算法不需要任何预处理或索引结构,具有最广泛的适用性,是索引算法的必要补充。基本思想是从已访问的对象中提取概率信息,来估计未来访问对象的skyline概率。分别提出了基于内存R树和有序链表的两种非索引算法。实验结果表明,两种算法均明显优于朴素的非索引算法,且在对数据维度的适应性方面互为补充。 2、概率skyline查询的分布式算法。现实应用中,数据通常分散于多个分布节点,分布式概率skyline查询的延迟主要取决于通信开销。以降低通信开销为主要目标,提出了基于概要共享的分布式概率skyline算法框架,然后分别提出了两种具体算法。其中,VOS算法将虚对象集合作为间接表示数据分布的概要,用基于距离的虚对象集合压缩方法来降低共享虚对象导致的额外通信开销;GRID算法着眼于克服VOS算法对数据分布的依赖性,将对象映射到固定宽度的网格中,提出网格概要的压缩方法来减少共享网格带来的额外通信开销。实验结果表明,VOS和GRID均优于现有算法。其中前者适于处理具有独立分布特征或维度较高的数据,后者更适合处理具有反相关特征的数据。 3、支持多种概率top-k查询的层次索引。概率top-k查询需要同时考虑评分函数值和存在概率值,因此具有不同语义。每种语义都有专门的查询处理方法,缺少能应用于一类重要语义的索引技术。提出两种层次索引,能应用于满足特定性质的一类概率top-k查询。首先提出基于skyline的SL索引,为了提高SL索引的鲁棒性,进一步提出了基于支配频率的FL索引,并提出了高效的索引建立算法。实验结果表明,SL索引和FL索引均能显著减少需要访问的对象数量,其中FL索引具有更好的鲁棒性。 4、概率逆top-k查询。前述研究成果都是从用户角度出发的查询优化问题,逆top-k查询能够帮助生产者分析产品影响的用户群体,在商业分析等领域有重要应用。现有逆top-k算法针对确定数据,在现实应用中,数据往往由于数据集成等原因带有不确定性。提出了概率逆top-k查询的合理定义,并提出了基于物化视图的查询算法。该算法将数据空间划分为网格,预先计算网格顶点的查询结果,后续查询利用物化视图避免对偏好集合的全盘访问。实验结果表明,基于物化视图的查询算法能够有效减少需要计算的偏好数量。 综上所述,本文针对基于概率数据库的两类偏好查询,提出了较为高效和通用的的解决方法,对于概率数据库的研究和应用具有一定的理论意义和应用价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张欣,陈峰,乐嘉锦;WebView在线物化选择方案的研究[J];计算机研究与发展;2004年10期
2 王新军,洪晓光,王海洋,马绍汉;数据仓库中多数据源物化视图的一种有效更新算法[J];计算机研究与发展;2004年05期
3 孙建青,李风云;多源物化视图更新的一种流水线并行算法[J];山东师范大学学报(自然科学版);2004年01期
4 张柏礼,孙志挥,孙翔;物化视图选择的预处理算法[J];计算机研究与发展;2004年10期
5 车忠志;初洪龙;;ORACLE物化视图的技术应用[J];中国科技信息;2008年07期
6 王斌,徐泉林 ,李建华,魏晶;一种物化视图维护算法[J];山东电子;2003年03期
7 岳国华;提高ORACLE8i数据库响应速度的若干技术对策[J];计算机应用与软件;2004年05期
8 吴爱华,张谧,乔健,汪卫,施伯乐;使用模式树和物化视图进行XML查询[J];计算机工程;2004年15期
9 王新军,洪晓光,董国庆,王海洋;数据库视图增量保持的并行主动触发机制[J];计算机工程与应用;2003年28期
10 范永刚;数据仓库物化视图的增量视图算法的实现[J];中国科技信息;2005年19期
11 胡雅颖;齐鸿志;朱方;张健楠;;基于物化视图的查询系统研究与实现[J];计算机工程与科学;2008年10期
12 王新军,洪晓光,孙明,王海洋;物化视图增量保持的改进算法[J];计算机工程;2003年21期
13 张岩,杨冬青,唐世渭;Web仓储中的单视图一致性[J];计算机研究与发展;2004年01期
14 林华兵;傅清祥;;在小型搜索引擎中优化查询的一种新策略[J];福建电脑;2006年03期
15 田原;;基于并行处理和物化视图的性能优化研究[J];电脑知识与技术(学术交流);2006年20期
16 曲俊华;刘璞;;Oracle物化视图技术在电力营销数据抽取中的应用[J];中国电力教育;2007年S1期
17 朱文;毛琴辉;薛燕;苏森;张柏礼;;数据仓库中物化视图维护算法的分析和比较[J];现代计算机(专业版);2008年04期
18 齐鸿志;胡雅颖;张玉新;;基于物化视图的查询重写技术研究与应用[J];河北农业大学学报;2008年05期
19 吴卫高;詹茂森;;数据仓库构建过程中数据整合技术的研究[J];电脑知识与技术;2009年17期
20 梁银;张虹;;空间区域聚集查询方法研究[J];计算机工程与应用;2009年25期
中国重要会议论文全文数据库 前10条
1 刘剑;张应裕;王东博;周正玉;余建平;;基于Skyline的数字三维国土资源辅助决策系统设计与研发[A];广东省测绘学会第九次会员代表大会暨学术交流会论文集[C];2010年
2 葛洪涛;;基于Skyline的三维地理信息系统研究与设计[A];第二届“测绘科学前沿技术论坛”论文精选[C];2010年
3 李金玖;熊贇;朱扬勇;;不确定数据集上的k-Skyline查询[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
4 廖再飞;罗雄飞;吕新杰;李新;刘伟;王宏安;;一种面向不完整数据流上的k-支配skyline查询算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 唐桢;张新长;曹凯滨;;基于Skyline的三维技术在城市规划中的应用研究[A];广东省测绘学会第九次会员代表大会暨学术交流会论文集[C];2010年
6 付强;王新军;;概率数据库查询结果分级中的数据模型改进[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 吴元锡;杨婧;李翠平;陈红;;DC-Tree:一种数据流上的Skyline查询算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
8 赵连钧;;基于Skyline的高速公路3D GIS系统开发[A];中国公路学会计算机应用分会2010年学术年会论文集[C];2010年
9 杨永滔;王意洁;;基于约束分析的Skyline属性相对重要性发现算法[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年
10 王晓伟;黄九鸣;贾焰;;分布式不确定数据上的概率Skyline计算[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
中国博士学位论文全文数据库 前10条
1 王晓伟;基于概率数据库的偏好查询研究[D];国防科学技术大学;2011年
2 王金宝;云计算系统中索引与查询处理技术研究[D];哈尔滨工业大学;2013年
3 张旭峰;ETL若干关键技术研究[D];复旦大学;2006年
4 梁银;空间数据仓库中查询优化技术研究[D];中国矿业大学;2009年
5 班鹏新;标记立方体技术研究[D];华中科技大学;2012年
6 赵海峰;网络化制造模式下MES系统研究与实现[D];东北大学;2008年
7 冷芳玲;支持高效查询的数据立方构建技术研究[D];东北大学;2008年
8 史恒亮;云计算任务调度研究[D];南京理工大学;2012年
9 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
10 甘亮;面向网络安全监控的流数据处理技术研究[D];国防科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 胡清兰;路网中基于位置的多源Skyline查询研究[D];华南理工大学;2012年
2 张强;一种不确定数据集合上的概率Skyline查询算法[D];兰州大学;2013年
3 柳晴;反skyline查询及变体处理研究[D];浙江大学;2013年
4 祁亚斐;不确定数据流上Skyline查询处理技术研究[D];国防科学技术大学;2010年
5 王媛;云计算环境下的容错并行Skyline查询技术研究[D];国防科学技术大学;2011年
6 罗帅伟;基于Skyline的城市三维地理信息系统的设计与实现[D];西安科技大学;2012年
7 吕玲红;无线传感器网络中的Skyline查询研究[D];宁波大学;2012年
8 宋世凯;基于Skyline的城市三维地理信息系统的设计与研究[D];河北师范大学;2012年
9 程荣峰;数据广播环境下基于位置的Skyline查询算法研究[D];天津理工大学;2013年
10 黎明江;分布式概率Skyline查询研究[D];华东师范大学;2011年
中国重要报纸全文数据库 前10条
1 周青 编译;CDP:与快照相得益彰[N];计算机世界;2006年
2 河北省安国市职教中心 张敬;Word 2003批量填写通知书[N];中国电脑教育报;2007年
3 郭平;数据归档软件HT FileStore[N];计算机世界;2006年
4 ;网络未来7人谈[N];网络世界;2007年
5 北京 谢古今;在VFP中利用API实现批量邮件发送[N];电脑报;2001年
6 冯国庆;开发区国税局各项税收业务工作齐头并进[N];承德日报;2006年
7 ;数据仓库应用的前提条件[N];中国高新技术产业导报;2000年
8 ;挖掘潜力[N];计算机世界;2002年
9 ;数据分类 一步到位[N];网络世界;2005年
10 ;大庆联谊将扭亏为盈[N];证券日报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978