收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

时间序列与聚类挖掘相关技术研究

刘兵  
【摘要】:数据挖掘及其应用已经渗透到多个学科,并在人工智能与机器学习、数据库、模式识别、生物信息学、神经计算等领域取得了丰硕的成果。同时,数据挖掘也不仅是科学家的兴趣所在,更多地得到了政府、工业界的密切关注。通过引入数据挖掘,可以大大提高生产力,取得社会的更大进步。世界上许多国家和地区的政府及工业界都希望掌握数据挖掘技术,提升国家和企业的科技含量,并最终取得领先的地位。 数据挖掘涉及的研究范围较为广泛,本文主要讨论了序列数据与聚类挖掘相关技术,主要的主要的研究成果如下: (1)给出小波变换在时间序列相似性查找中对距离上下界的一个严格估计,同时说明传统的算法只是本文下界的一部分。根据本文给出的小波变换的下界,相对于传统的算法,可以排除更多的不相似序列。根据给出的上界,可以直接判断出两条序列是否相似,进一步减少需要验证的原始序列的个数。 (2)在使用小波变换缩减维度解决高维时间序列查询时,传统的算法均使用变换后小波序列的前k个系数作为原始时间序列的一个近似估计。但是由于选择前k个系数不一定能很好地近似原始序列集合,可能对于中间某些系数的选取,可以更好的给出原始序列集合的一个表示。因此给出相关定理,说明选择小波系数集合的列平方和最大的k列,可以更好近似原始序列集合。 (3)对允许时间偏移的序列间相似性搜索,由于可以处理异常数据以及允许不同长度的时间序列间进行匹配,因此应用日益广泛。但是大部分研究都是基于两条时间序列间的全相似性匹配。给出了基于动态规划的子序列相似性搜索算法,对于给定的查询序列,可以搜索到长序列中和给定的查询序列最为相似的一段子序列。并进一步给出了两种优化算法,以减少子序列相似性搜索中距离矩阵需要计算的项的个数。 (4)时间序列的相似性搜索可以看成度量空间搜索的一种特例。提出一种新的度量空间索引数据结构,简称为bu-tree,它是基于自底向上的分层聚类来构造索引结构,而传统的度量空间数据结构大部分是基于自顶向下构造的方法。相对于传统的构造方法,bu-tree可以在更小的索引半径内包含更多的对象,这样有利于查询的筛选。给出了bu-tree的构造算法以及相应的范围查询算法。 (5)数据概要被用来压缩大规模的数据库,以便进行后续的分层聚类分析。bu-tree中每个节点也可以看成是一种数据概要。讨论了另一种常用的数据概要:数据泡。详细研究了递增数据泡的质量度量标准(数据概要指标)。当更新数据库时,我们指出哪些因素会影响数据概要指标的期望与均方差。基于这些因素,给 出一个对数据泡进行递增维护的一个动态算法。 (6)讨论了系统级故障诊断中对测试序列的聚类分析算法。在基于聚类的集团理论的基础上,利用贪婪算法中不同贪婪准则提出了四个针对系统及故障的概率诊断算法。每种算法在较少的测试数情况下,均表现出较高的诊断正确率,且时间复杂度不高。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 谢挺;楼巍;;基于J2EE平台应用时序挖掘算法对纺织品出口风险预测的研究[J];微计算机信息;2006年27期
2 郑诚;舒坚;;多尺度时间序列异常事件检测[J];计算机工程与应用;2006年31期
3 孙梅玉;方建安;;一种高效的基于相似性查找时间序列的位符号化表示方法[J];计算机应用研究;2008年08期
4 谷赫;;时间序列的数据挖掘在证券预测分析中的应用[J];现代情报;2008年09期
5 张军,陈汉武,马志民;一种时间序列相似性的快速搜索算法[J];南京师范大学学报(工程技术版);2005年03期
6 孙锋;;数据挖掘在给水管网安全中的应用[J];电脑知识与技术(学术交流);2006年32期
7 曾海泉;胡勤友;周水庚;胡运发;;基于互关联后继树的时序模式挖掘[J];模式识别与人工智能;2003年03期
8 苏圣超;张正道;朱大奇;;基于时间序列数据挖掘的旋转机械故障预报[J];南京航空航天大学学报;2006年S1期
9 王阅;高学东;武森;陈敏;;时间序列周期模式挖掘的周期检测方法[J];计算机工程;2009年22期
10 李斌,谭立湘,章劲松,庄镇泉;面向数据挖掘的时间序列符号化方法研究[J];电路与系统学报;2000年02期
11 国宏伟;高学东;王宏;;基于异时间窗划分的时间序列聚类[J];计算机工程;2007年21期
12 战立强;刘大昕;;小波滤波在时间序列频繁模式挖掘中的应用[J];哈尔滨工程大学学报;2008年01期
13 曹文平;宁彬;;基于异常因子的异常模式探测算法[J];计算机工程与设计;2009年16期
14 朱天;白似雪;王柏;吴斌;;基于时间段的时序规则发现[J];通信学报;2009年08期
15 孙兵;刘雯;田地;宋桐;富妍;;基于时间序列的数据挖掘在证券中的应用[J];吉林大学学报(信息科学版);2010年03期
16 秦亮曦,史忠植;多时间序列跨事务关联分析研究[J];计算机工程与应用;2005年27期
17 郭四稳;何维;王鹏;;基于小波技术的网络时序数据挖掘[J];计算机工程;2007年02期
18 孙焕良;邱邦华;魏溯华;;一种优化的自底向上时间序列分段算法[J];沈阳建筑大学学报(自然科学版);2007年06期
19 王金龙;徐从富;徐娇芬;骆国靖;;利用销售数据的商品影响关系挖掘研究[J];电子科技大学学报;2007年06期
20 杨敏,王志坚,尹燕敏;时间序列相似性搜索算法研究[J];山东师大学报(自然科学版);2001年04期
中国重要会议论文全文数据库 前10条
1 徐涛;;时间序列优化分割模型和提取算法[A];2006中国控制与决策学术年会论文集[C];2006年
2 张荣明;王勇;;基于ANN和最小二乘法的时序挖掘方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
3 曲文龙;吴春尧;杨炳儒;张海军;;基于小波和支持向量机的多尺度时间序列预测[A];2005中国控制与决策学术年会论文集(下)[C];2005年
4 侯建荣;黄沛;黄丹;;基于小波-分形的营销序列模式相似性研究[A];中国市场学会2006年年会暨第四次全国会员代表大会论文集[C];2006年
5 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
6 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
7 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
8 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
9 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
10 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
中国博士学位论文全文数据库 前10条
1 刘兵;时间序列与聚类挖掘相关技术研究[D];复旦大学;2006年
2 董晓莉;时间序列数据挖掘相似性度量和周期模式挖掘研究[D];天津大学;2007年
3 张保稳;时间序列数据挖掘研究[D];西北工业大学;2002年
4 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
5 黄超;基于特征分析的金融时间序列挖掘若干关键问题研究[D];复旦大学;2005年
6 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
7 杨正瓴;时间序列中的混沌判定、预报及其在电力系统中的应用[D];天津大学;2003年
8 王达;时间序列数据挖掘研究与应用[D];浙江大学;2004年
9 张晓伟;水文动力系统自记忆特性及其应用研究[D];西安理工大学;2009年
10 姜朝阳;作物冠层传输过程中的时间序列分析与阻力估算[D];中国科学院研究生院(上海生命科学研究院);2003年
中国硕士学位论文全文数据库 前10条
1 田政雄;基于小波变换的时间序列挖掘研究[D];天津大学;2008年
2 张雷;多层次分布式智能决策支持系统及应用研究[D];西北工业大学;2006年
3 谷赫;时间序列的数据挖掘在证券预测分析中的应用研究[D];吉林大学;2005年
4 廖超;基于粗糙集理论的时间序列数据分析[D];中南大学;2005年
5 颜镝;时间序列数据挖掘的研究以及在交通流预测上的应用[D];北京工业大学;2005年
6 郭小芳;时间序列数据挖掘中的若干问题研究[D];西北大学;2008年
7 李新萍;基于比特序列变化模式聚类的时间序列相似搜索[D];华中科技大学;2007年
8 杜曙光;电信网络告警相关性分析方法研究[D];华侨大学;2005年
9 刘荣其;基于聚类和时序分析的林分生长模型[D];福建农林大学;2009年
10 张特来;基于时间序列的数据挖掘方法在电力负荷预测中的应用研究[D];辽宁工程技术大学;2006年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 张立明;数据挖掘之道[N];网络世界;2003年
4 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
5 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978