收藏本站
《复旦大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

高维数据索引结构研究

董道国  
【摘要】:随着互联网和多媒体技术的迅速发展,人们可以访问到的多媒体数据急剧增长,如何实现多媒体数据对象的相似检索成为一个非常重要的研究课题。通常,人们利用特征提取算法从多媒体数据对象中提取出特征矢量,然后利用特征矢量之间距离表示多媒体对象之间相似度。相似性检索的实现就是通过计算查询矢量与数据库中矢量之间距离以找出满足条件的对象。当数据库中矢量很多时,简单的顺序扫描搜索将导致极大查询代价,无法满足用户需求。为了有效实现快速相似性检索,就必须借助于高效的高维数据索引结构。 在最近几十年中,人们提出了很多高维数据索引结构,其中大多是树形结构,如R-Tree、R~*-Tree等,这些索引结构在维数升高时性能会急剧下降,即所谓的“维数灾难”,为此,有人提出了通过近似压缩矢量来减少磁盘I/O代价的VA-File,但仍不能为高维数据的相似性检索提供良好的查询性能。针对高维数据索引结构的现状,我们在该领域进行了深入研究,取得了一定的成果。 首先,我们提出了四种新的索引结构:1) Angle-Tree:用高维空间中单位超球面上的超弧对空间进行划分,并借助于树形结构实现索引,可有效支持以矢量之间夹角余弦为相似度度量的查询方式;2) VAR-Tree:将VA-File与R-Tree有机结合起来,用R-Tree来管理和组织近似矢量数据,并借助R-Tree类相似查询算法实现基于VAR-Tree的查询;3) VA-Trie:利用Tile结构来索引VA-File中近似矢量,有效实现了高维数据的相似性检索;4) OVA-File:将VA-File中近似矢量插入到近似文件中合适位置,使得在高维空间中相邻数据尽量存放在近似文件的相近位置上,从而在查询过程中仅访问部分近似矢量,就可快速得到质量很高的相似查询结果。 其次,在高维数据索引结构研究基础上,本文分别给出了基于VA-File和OVA-File的、以高维矢量序列为查询对象的视频片断相似查询方法,以有效利用高维索引结构同时支持视频信息检索中的镜头检索和视频片断检索。 最后,结合一个实际的多媒体信息检索系统,进一步阐述高维索引结构在实际系统中的应用。我们利用OVA-File管理来自于海量视频数据的高维矢量,基于镜头和视频片断相似查询模型实现了视频数据的快速相似性检索。
【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP391.3

【引证文献】
中国博士学位论文全文数据库 前2条
1 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
2 曲吉林;时间序列挖掘中索引与查询技术的研究[D];天津大学;2006年
中国硕士学位论文全文数据库 前5条
1 宋瑜;视频数据组织模型与降维算法研究[D];吉林大学;2008年
2 朱良峰;主题网络爬虫的研究与设计[D];南京理工大学;2008年
3 叶力洪;CBIR算法测试平台及其相关技术研究[D];华南理工大学;2010年
4 郭娟;基于自适应聚类距离边界的高维检索算法研究[D];浙江工业大学;2012年
5 孙春菊;云环境下数据模型和索引技术研究[D];南京邮电大学;2013年
【共引文献】
中国期刊全文数据库 前10条
1 刘荣;周宏军;田为春;;两种空间索引结构在供水信息系统中的应用和对比[J];东华理工大学学报(自然科学版);2008年04期
2 周迪斌;胡斌;张量;黄勇;蒋健明;;基于CUDA的高维空间检索排序[J];杭州师范大学学报(自然科学版);2011年05期
3 梅承力,周源华;高维数据空间索引的研究[J];红外与激光工程;2002年01期
4 ;Efficient visualization techniques for high resolution remotely sensed data in a network environment[J];Science in China(Series E:Technological Sciences);2008年S1期
5 ;Fast filtering false active subspaces for efficient high dimensional similarity processing[J];Science in China(Series F:Information Sciences);2009年02期
6 谭郁松,杨利,周兴铭;SMDPA:基于访问频率的多维数据空间放置算法[J];计算机研究与发展;1999年12期
7 肖友能,薛向阳;压缩域中叠化镜头的快速检测算法[J];计算机研究与发展;2004年11期
8 于亚新;王国仁;林利增;李淼;朱歆华;;M~(2+)-树:一种支持医学病例多度量空间检索的高效索引[J];计算机研究与发展;2010年04期
9 吴大瑞,何钦铭;一种简单的基于固定网格的空间直线索引算法[J];江南大学学报;2005年04期
10 栾丽华,吉根林;树型空间索引及其在聚类中的应用研究[J];计算机工程与应用;2005年19期
中国重要会议论文全文数据库 前4条
1 涂丹丹;向琳;左德承;杨孝宗;;移动对象数据库管理技术[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
2 周项敏;王国仁;于戈;;度量空间中索引方法的研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 于利胜;张倩;王珊;张延松;;RR_tree:多维索引的关系模式实现新方法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
4 李佳佳;王波涛;陈东;喜连川优;王国仁;;分组移动对象的区域偏离监视算法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
中国博士学位论文全文数据库 前10条
1 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
2 许浒;时空数据库聚集查询算法研究[D];华中科技大学;2010年
3 刘润涛;基于序的空间数据索引及查询算法研究[D];哈尔滨理工大学;2009年
4 高赞;基于内容的视频分析关键技术[D];北京邮电大学;2011年
5 张翀;基于对等计算的分布式时空索引技术研究[D];国防科学技术大学;2011年
6 郑毅;LIDAR数据的城区建筑物提取技术研究[D];华中科技大学;2011年
7 何云峰;视频内容组织与索引技术研究[D];华中科技大学;2011年
8 曹玉东;图像检索中的特征表示和索引方法的研究[D];北京邮电大学;2011年
9 罗德安;一种基于关系数据库的空间数据模型及其特殊应用[D];西南交通大学;2001年
10 樊昀;基于内容图像检索的一些关键技术研究[D];国防科学技术大学;2001年
中国硕士学位论文全文数据库 前10条
1 刘利军;面向港口调度管理的时空数据库索引技术研究[D];哈尔滨工程大学;2010年
2 路瑞强;基于均值和标准差的空间索引方法研究[D];哈尔滨工程大学;2010年
3 修建新;基于VAR~*树的反向最近邻查询技术的研究[D];哈尔滨理工大学;2010年
4 于波;分布式并行空间索引机制的研究[D];哈尔滨理工大学;2010年
5 李广翠;视频检索中的场景摘要技术研究[D];江苏大学;2010年
6 刘燊;空间网络环境下基于Voronoi图的时空轨迹查询研究[D];浙江大学;2011年
7 张栋;移动对象反向k近邻查询研究[D];浙江大学;2011年
8 陈功照;城市地理信息检索服务研究[D];福建师范大学;2010年
9 赵洁;基于对象语义的图像检索[D];杭州师范大学;2010年
10 张利刚;基于内容的视频拷贝检测算法的研究[D];西安电子科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 顾红飞;张佑生;江巨浪;;基于颜色布局的压缩图像检索研究[J];合肥工业大学学报(自然科学版);2006年01期
2 王文岩;郝忠孝;;基于星形模型的方向关系表示及R树的方向查询[J];哈尔滨理工大学学报;2008年02期
3 张茂元;张金隆;卢正鼎;邹春燕;;基于特征相关学习的网页信息提取方法[J];华中科技大学学报(自然科学版);2007年07期
4 柯珂,张世英;ARCH模型的诊断分析[J];管理科学学报;2001年02期
5 蒋嵘;基于形态表示的时间序列相似性搜索[J];计算机研究与发展;2000年05期
6 俞蓓,王军,叶施仁;基于近邻方法的高维数据可视化聚类发现[J];计算机研究与发展;2000年06期
7 蔡智,岳丽华,王熙法;时序模式发现算法研究[J];计算机研究与发展;2000年09期
8 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
9 杨志荣,李磊;用SOM聚类实现多级高维点数据索引[J];计算机研究与发展;2003年01期
10 李建中,张兆功;超平面树:度量空间中相似性搜索的索引结构[J];计算机研究与发展;2003年08期
中国博士学位论文全文数据库 前10条
1 冯红伟;数据挖掘技术的研究及应用[D];西北工业大学;2002年
2 周海燕;空间数据挖掘的研究[D];中国人民解放军信息工程大学;2003年
3 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
4 曾海泉;时间序列挖掘与相似性查找技术研究[D];复旦大学;2003年
5 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年
6 王达;时间序列数据挖掘研究与应用[D];浙江大学;2004年
7 兰秋军;金融时间序列隐含模式挖掘方法及其应用研究[D];湖南大学;2005年
8 吕凝;基于内容的视频数据库多模式检索方法研究[D];吉林大学;2005年
9 王晨;结构数据挖掘与处理的若干问题的研究[D];复旦大学;2005年
10 崔江涛;高维索引技术中向量近似方法研究[D];西安电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 江浩;面向相似性的时间序列表示与搜索方法研究[D];华中科技大学;2004年
2 陆声链;孤立点挖掘及其内涵知识发现的研究与应用[D];广西师范大学;2005年
3 陈海珠;空间查询优化研究[D];重庆大学;2005年
4 陈杰;主题搜索引擎中网络蜘蛛搜索策略研究[D];浙江大学;2006年
5 王思力;面向大规模信息检索的中文分词技术研究[D];中国科学院研究生院(计算技术研究所);2006年
6 刘玮玮;搜索引擎中主题爬虫的研究与实现[D];南京理工大学;2006年
7 冯月;基于专业搜索引擎网络蜘蛛搜索策略研究[D];电子科技大学;2007年
8 张厅;空间索引技术研究[D];中南大学;2007年
9 任瑞娟;一种改进的基于LLE图像滤波的研究[D];西安电子科技大学;2008年
10 陈水平;基于节点服务能力的自适应P2P模型研究[D];重庆大学;2010年
【二级引证文献】
中国期刊全文数据库 前5条
1 秦文;;基于Voronoi图的时间序列线性模式查询算法[J];计算机工程与应用;2008年31期
2 李正欣;张凤鸣;李克武;;多元时间序列模式匹配方法研究[J];控制与决策;2011年04期
3 王二红;寿永熙;马志强;李静;;多线程搜索器的设计与实现[J];内蒙古农业大学学报(自然科学版);2010年03期
4 郭小芳;李锋;王卫东;;基于k-近邻的多元时间序列局部异常检测[J];江苏科技大学学报(自然科学版);2012年05期
5 周庆兰;陈然;周鹏;;时间序列相似性度量的面积距离方法的研究[J];软件导刊;2011年06期
中国重要会议论文全文数据库 前1条
1 邱均平;王菲菲;;时间序列相似性查询与索引方法研究[A];2009年中国索引学会年会暨学术研讨会论文集[C];2009年
中国博士学位论文全文数据库 前2条
1 张可;矩阵型灰色关联分析建模技术研究[D];南京航空航天大学;2010年
2 李星毅;基于相似性的交通流分析方法[D];北京交通大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘军伟;基于正交变换的时间序列索引[D];大连理工大学;2010年
2 孔令卫;基于内容的图像皮肤区域特征研究[D];华南理工大学;2010年
3 严兆斌;序列模式挖掘在公路隧道交通中的应用研究[D];西安电子科技大学;2009年
4 王佳;支持Ajax技术的主题网络爬虫系统研究与实现[D];北京交通大学;2011年
5 魏龙;GML时空序列模式挖掘研究[D];江西理工大学;2011年
6 周庆兰;多元时间序列异常检测的研究[D];西南交通大学;2011年
7 荣梅;基于地磁的智能交通检测技术[D];湘潭大学;2011年
8 单大甫;基于网络评论的文本倾向性分类技术的研究与实现[D];国防科学技术大学;2010年
9 李蓉;面向主题的搜索引擎的设计与实现[D];华东交通大学;2011年
10 邢敏玲;基于网页分块的主题爬虫方法研究[D];重庆大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 姚全珠;丁晓剑;任雪利;张志锋;;一种新的基于XML的索引机制[J];计算机工程;2006年15期
2 董道国;刘振中;薛向阳;;VA-Trie:一种用于近似k近邻查询的高维索引结构[J];计算机研究与发展;2005年12期
3 林馨;任仲晟;;一种新的XML信息检索索引[J];福建电脑;2008年09期
4 王宏生;于晓巍;;基于本体语义标引中的存储与检索研究[J];微计算机信息;2010年18期
5 李胜;胡和平;;语义桌面环境下一种基于概念图的文档检索方法[J];计算机工程与科学;2009年08期
6 丁晓锋;卢炎生;潘鹏;洪亮;魏琼;;基于U-tree的不确定移动对象索引策略[J];软件学报;2008年10期
7 肖燕;20世纪我国信息检索研究的历史回顾[J];图书馆学研究;1999年06期
8 叶鹰,马景娣,黄晨,朱聪,胡晓珍,刘琼;信息检索网上自助教学探索[J];大学图书馆学报;2000年02期
9 李慧敏,方敏,张雪梅;高校信息检索教育课教学改革构想[J];山东图书馆季刊;2001年02期
10 吴良凯;大学生信息检索教育的现状与对策[J];图书馆论坛;2003年05期
中国重要会议论文全文数据库 前10条
1 孙金立;李路路;王栋;;生物信息检索教学网的建设[A];向数字化转型的图书馆工作[C];2004年
2 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
3 孙金立;李路路;董明强;;建立生物信息检索教学网的研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
6 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
7 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 于志刚;杨金生;;农业机械网络书签[A];第十三次全国农机维修学术会议论文集[C];2007年
9 ;前言[A];第四届全国信息检索与内容安全学术会议论文集(下)[C];2008年
10 田田;马军;李跃军;;应用多本体进行信息检索的研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国重要报纸全文数据库 前10条
1 希安;微软试水信息检索[N];经济日报;2004年
2 叶静;开辟信息检索的新天地[N];人民邮电;2001年
3 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年
4 刘静一;个人档案信息检索[N];建筑报;2000年
5 刘光强;搜索个人、企业、垂直三大搜索新进展[N];中国计算机报;2007年
6 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年
7 刘立新;信息社会技术前瞻[N];学习时报;2006年
8 常燕杰;商用搜索 须打智慧牌[N];中国计算机报;2006年
9 沈建苗 编译;实现多重标准搜索[N];计算机世界;2006年
10 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 董道国;高维数据索引结构研究[D];复旦大学;2005年
2 王彪;信息检索中信息需求域的研究[D];内蒙古大学;2012年
3 左家莉;信息检索中Markov网络图模型研究[D];江西财经大学;2011年
4 王兴中;铁路调度指挥系统中数据存储体系及索引结构的研究[D];中国铁道科学研究院;2011年
5 王鑫印;无结构和半结构信息检索相关技术研究[D];复旦大学;2007年
6 齐鸣;共享内存并行系统上空间数据检索及优化研究[D];中国科学技术大学;2012年
7 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
8 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年
9 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
10 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 吴媛媛;移动终端上个人信息检索核心子系统的设计与实现[D];北京邮电大学;2011年
2 陈金森;XML搜索引擎中索引技术的研究[D];燕山大学;2006年
3 袁亮;一个基于WEB的信息组织与检索模型(WIORS)研究[D];武汉大学;2005年
4 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年
5 杨才峰;基于自动分类的元搜索引擎的研究与应用[D];华北电力大学(河北);2005年
6 郭磊;P2P系统中的信息检索理论及应用研究[D];山东师范大学;2011年
7 宋海林;基于语言模型的信息检索中负反馈技术的研究与实现[D];内蒙古大学;2011年
8 管玉娟;基于智能Agent的个性化信息检索技术研究[D];西安建筑科技大学;2005年
9 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年
10 刘壁松;策略可扩展的搜索引擎研究和实现[D];清华大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026