收藏本站
《天津大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

时间序列数据挖掘中相似性和趋势预测的研究

王晓晔  
【摘要】:时间序列存在于社会的各个领域,对于时间序列数据挖掘的研究目前主要集中在相似性搜索和模式挖掘上。在相似性搜索研究中存在的主要问题是时间序列数据量过大,一个有效的解决办法是对时间序列进行重新描述,减小数据量。在模式挖掘方面,趋势预测是一个比较新的思路,它从时间序列数据中抽取决定时间序列的行为发展趋势的静态属性,组成静态数据库,然后将泛化性能较强的分类技术应用于静态数据库中挖掘分类规则,对行为发展趋势做出预测。 相似性研究中有效的数据描述是提高相似性搜索效率的关键,本文第二章提出了一种结构自适应的时间序列分段线性化表示方法,该方法可以自动地产生线性化的段数K。大大压缩了相似性的计算量。同时在分段线性化表示的基础上提出了一种相似性计算方法,该方法对于时间序列的多种变形都不敏感。 本文拟从时间序列数据库中挖掘到表征时间序列发展趋势的分类规则,首先必须对时间序列进行静态模式的抽取,得到分类属性。本文就此在第三章深入阐述了静态模式的抽取方法。 以股票为主要的时间序列研究对象,抽取的静态模式往往含有较多的干扰,因此需要分类工具必须有较强的泛化性能,为了解决这一问题在第四章采用正则最小二乘学习算法训练的前馈神经网络,对时间序列的静态模式进行分类。该方法将正则化和网络裁剪相结合,既提高了泛化性能又精简了网络结构,降低了不相关属性对分类的影响。 属性约简和规则抽取是粗集理论在数据挖掘中的一个重要应用。由于神经网络固有的不能得到显式知识的缺陷,第五章将粗集理论应用于神经网络得到的知识中,从中抽取分类规则将是一种极为有效的解决方法。 K-最近邻分类算法(K-NN),在许多领域都有成功的应用,对训练样本进行浓缩是提高算法计算效率的有效方法。本文在第六章采用简化的CURE聚类算法首先对训练样本中的每一类样本集进行聚类,用聚类后形成的子类代表点代替属于该子类的所有样本集,再采用一般的K-NN法, 这样大大减小了训练样本的数量,提高了计算速度。该法可以有效的排除孤立点(噪声),从而也大大提高了算法的分类精度。 数据分布随时间而变化的数据(这里称为时变数据)也是客观存在的,现有的数据挖掘方法对时变数据很难处理。本文第七章提出了一种带移动窗的神经网络数据分类算法,网络中存储的分类知识能够随时更新,较好地处理了这类问题。 第八章总结了全文研究内容,并对今后的研究前景进行了展望。
【学位授予单位】:天津大学
【学位级别】:博士
【学位授予年份】:2003
【分类号】:F224

【相似文献】
中国期刊全文数据库 前10条
1 徐晓静;裴海峰;史开泉;;模糊等价关系基础上的粗集分解[J];系统工程与电子技术;2007年04期
2 邹先霞,杜威,魏长华;一种基于粗集理论的概念格构造方法[J];华中师范大学学报(自然科学版);2001年02期
3 蔡井伟;陈世联;;集值映射的近似算子及其性质[J];昆明理工大学学报(理工版);2006年01期
4 古发明;尹成;丁峰;;应用粗集理论优选地震属性的方法研究[J];西南石油大学学报;2007年S2期
5 李长坡;许淑娜;;基于粗集的城镇土地定级模型研究[J];安徽农业科学;2010年14期
6 张千宏;;基于相似关系的不完备决策表属性约简[J];邵阳学院学报(自然科学版);2006年04期
7 范国华;陈顺玲;吴智;;基于粗集理论的简易就业情况VB查询系统[J];中国西部科技;2008年11期
8 李小霞,陈绵云;粗集理论中知识的简化及其相互关系[J];华中科技大学学报(自然科学版);2003年08期
9 梁剑,左洪福,常继百,赵红华,周左成;基于统计粗集模型的航空发动机维修等级预测方法研究[J];应用科学学报;2005年02期
10 朱荣刚;许浒;姜长生;;粗集理论中不相容规则的一种修正算法[J];电光与控制;2006年02期
中国重要会议论文全文数据库 前10条
1 吴炎;杜栋;;改进BP神经网络及其对江苏省粮食产量的仿真预测[A];决策科学与评价——中国系统工程学会决策科学专业委员会第八届学术年会论文集[C];2009年
2 张玉峰;贾成刚;张文喜;;应用时间序列评估人工增雨效果[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
3 王永忠;曾昭磐;;混沌时间序列点预测方法研究[A];1999中国控制与决策学术年会论文集[C];1999年
4 王波;张斌;;一种基于云模型的时间序列特征表示方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
5 王有良;周文国;;基于时间序列的基坑水平变形预测模型[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
6 王玉涛;程国辉;周建常;王师;;神经网络在高炉铁水硅含量预报中的应用[A];1998中国控制与决策学术年会论文集[C];1998年
7 许伦辉;傅惠;徐建闽;;基于分形维数的交通流预测模型及算法研究[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 胡坤;刘思峰;;时间序列灰色定权聚类模型[A];2004年中国管理科学学术会议论文集[C];2004年
9 蒋斌松;韩立军;贺永年;;时间序列Lyapunov指数的估算及预测[A];矿山建设工程新进展——2005全国矿山建设学术会议文集(下册)[C];2005年
10 何全军;曹静;张月维;;基于MODIS的广东省植被指数序列构建与应用[A];中国气象学会2007年年会生态气象业务建设与农业气象灾害预警分会场论文集[C];2007年
中国重要报纸全文数据库 前10条
1 ;《时间序列与金融数据分析》[N];中国信息报;2004年
2 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
3 本报记者 刘松柏;“超级月球”引发地震不成立[N];经济日报;2011年
4 权证一级交易商 国信证券;正股走势及时间序列主导下半年权证市场运行结构[N];证券时报;2006年
5 房鹏;数码书信寄真情[N];中国电脑教育报;2005年
6 刘丽萍;时间序列季节调整描述经济活动的利器[N];中国信息报;2000年
7 西南证券高级研究员 董先安德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年
8 国泰君安期货 吴泱 郑腾;基金持仓与期货价格关系的实证研究[N];期货日报;2008年
9 倪成群;人民币升值背景下中外金价和黄金投资收益关联性研究[N];期货日报;2008年
10 中期研究院 王璐 吕圳;重标极差法的期货品种收益波动性研究[N];期货日报;2008年
中国博士学位论文全文数据库 前10条
1 杨正瓴;时间序列中的混沌判定、预报及其在电力系统中的应用[D];天津大学;2003年
2 张晓伟;水文动力系统自记忆特性及其应用研究[D];西安理工大学;2009年
3 倪丽萍;基于分形技术的金融数据分析方法研究[D];合肥工业大学;2010年
4 刘大同;基于Online SVR的在线时间序列预测方法及其应用研究[D];哈尔滨工业大学;2010年
5 张永林;车辆道路数值模拟与仿真研究[D];华中科技大学;2010年
6 崔亚强;沪深300股指内在复杂性分析及预测研究[D];天津大学;2010年
7 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年
8 杨谈;网络混沌行为及其控制的研究[D];北京邮电大学;2009年
9 李星毅;基于相似性的交通流分析方法[D];北京交通大学;2010年
10 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 Ashraf Fetoh Eata;[D];厦门大学;2001年
2 王丽敏;两类模糊随机时间序列预测方法[D];河北大学;2001年
3 王琦;时间序列在油田效益审计中的应用[D];吉林大学;2009年
4 韩冬梅;基于P2P的教学信息资源负载均衡调度算法的研究[D];哈尔滨工程大学;2010年
5 张雷;多层次分布式智能决策支持系统及应用研究[D];西北工业大学;2006年
6 王金翠;基于实测数据的风电场风速和风功率短期预测研究[D];东北电力大学;2010年
7 赵松雷;基于频谱仪的无线自动测试系统与信号特性分析[D];北京邮电大学;2010年
8 姚兰;中国民办高等教育市场空间研究[D];河南大学;2007年
9 吴烨清;时间序列理论在软件可靠性建模中的应用和研究[D];华中农业大学;2009年
10 曹晓琴;非线性优化的混合算法及其应用[D];燕山大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026