收藏本站
《合肥工业大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于经验模态分解及动态数据挖掘的商务数据分析方法研究

刘慧婷  
【摘要】: 随着计算机技术的发展和普及,企业生成、收集、存储及处理数据的能力大大提高,数据量与日俱增。大量丰富的数据使得传统的数据分析方式陷入了困境,数据挖掘技术应运而生,它是一个新兴的边缘学科,涉及机器学习、模式识别、数据库、统计、人工智能等多门学科。商务数据挖掘是数据挖掘中的一个重要研究方面,目前关于商务数据中的静态数据分析模型已经慢慢变得成熟,但是经验模态分解算法及动态数据挖掘在商务数据分析中的应用研究,仍处在起步阶段。 经验模态分解(Empirical Mode Decomposition,EMD)被认为是不同于以傅里叶变换为基础的线性和稳态谱分析方法的一种时频分析方法。本文以基于经验模态分解方法及动态数据挖掘的商务数据分析为目标,研究了经验模态分解方法的基本原理和算法思想;针对其端点效应等不足,提出了新的数据延拓技术;针对EMD算法的精度和速度上的不足,提出了相应的改进措施;并研究了EMD分解、构造性神经网络覆盖算法以及K-means聚类等方法各自独特的特点,以及这些方法与其他理论的结合点,为动态数据挖掘中遇到的一些问题提供新的解决方案,并把它们应用在商务数据的分析中。主要工作包括: 1.论述了本论文的研究背景;综述了时频分析方法的发展:介绍了EMD方法及其国内外研究现状,以及动态数据挖掘的研究内容;最后,阐述了本文的研究内容、总体框架和创新之处。 2.介绍了基于EMD时频分析方法的一些基本概念;阐述了基于EMD的希尔伯特变换的基本原理和算法;在此基础上,用基于EMD的时频分析方法对仿真信号进行了分析验证,结果表明把该方法引入非线性非平稳序列的分析是理想的。 3.介绍了EMD算法端点效应的机理;然后系统地研究了基于神经网络预测的数据序列延拓技术和镜像延拓技术的特点及性能:最后,对各种延拓技术进行了比较研究,分析了各种延拓技术的优缺点,并提出了基于多项式拟合的数据延拓技术。 4.从提高速度与精度两方面着手,对EMD算法进行了系统研究。首先研究埃尔米特Hermite插值和三次样条插值哪个更适合获取序列的上、下包络线,结果表明三次样条插值效果较好;接着研究利用三次样条插值获得序列数据包络线的效果,结果表明该方法是理想的;然后阐述了样条插值获得包络线存在的问题,以及已有的解决方法——基于高次(高于三次)样条插值的EMD算法并考察了效果,表明高次样条插值能提高EMD算法精度,但耗时增加;最后根据EMD算法的特点,提出了基于极值点均值的EMD算法,并对该算法的效果进行了系统地研究,结果表明该算法优于原有的EMD方法。 5.研究了动态数据挖掘中的时间序列相似性匹配问题。首先利用交叉覆盖算法对序列进行分类,进而完成序列匹配;直接利用覆盖算法进行匹配虽然是有效的,可是有时存在两个序列趋势是相似的,但由于某几维相差较大而没有被归为一类,增加了“拒识点”的个数。为了提高匹配的准确性,提出了基于EMD和交叉覆盖算法的序列匹配算法,实验证明该方法可以减少“拒识点”,提高匹配算法的准确度。 6.研究了动态数据挖掘中的聚类问题。由于参加聚类的序列往往维度较高,所以首先研究了数据维度的约简问题。本章提出了基于EMD和自底向上(Bottom-Up)分段算法的维度约简方法,并把该维度约简方法和K-means算法相结合,有效完成了数据序列的聚类。 7.结合国家高技术研究发展计划(863计划)专题课题(2007AA04Z116)——“面向制造业售后服务的商务智能关键技术研究”,把第五章提出的基于EMD和交叉覆盖算法的序列匹配算法用于个人信用的评估,即把客户的信用历史数据序列利用EMD方法提取趋势后,再利用交叉覆盖算法进行分类,通过对历史上每个类别的若干样本进行学习,从己知的数据中找出违约及不违约者的特征,从而总结出分类的规则,用于测量借款人的违约风险,为消费信贷决策提供依据;把第六章提出的聚类算法用于超市顾客行为的聚类,通过超市的交易数据对顾客进行聚类,将顾客划分到不同的簇(或称市场分段),并用市场分段中购买率较高的商品作为该分段的描述,实现对每个市场分段分别地进行促销和广告。
【学位授予单位】:合肥工业大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP311.13

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 赵乌吉斯古楞;;数据挖掘的研究热点和发展趋势的浅谈[J];电脑知识与技术;2019年08期
2 王彬;;数据挖掘构成要素的侦查视角分析[J];河南警察学院学报;2019年02期
3 程志;张玉彤;贾彪;;远距离光纤通信传输故障数据挖掘方法[J];激光杂志;2019年04期
4 邵兴江;;数据挖掘在教育信息化中的应用空间分析[J];浙江现代教育技术;2004年03期
5 于春香;;数据挖掘技术简介[J];福建信息技术教育;2005年01期
6 周致丞;;大数据下一种规则的快速挖掘技术研究[J];河南科技;2018年25期
7 蔡萌萌;张巍巍;王泓霖;;大数据时代的数据挖掘综述[J];价值工程;2019年05期
8 张泽;吕新;侯彤瑜;;数据挖掘在农业信息化中的应用进展探析[J];信息记录材料;2019年01期
9 张俊杰;;恰当的水务大数据才符合数据挖掘的需求[J];城乡建设;2019年02期
10 周洋;;数据挖掘在电力调度自动化系统中的应用解析[J];科技创新与应用;2017年35期
中国重要会议论文全文数据库 前10条
1 马钰超;;浅析大数据和数据挖掘及其在烟草行业中的应用[A];中国烟草学会2015年度优秀论文汇编[C];2015年
2 唐杰;梅俏竹;;数据挖掘学科发展研究[A];2012-2013控制科学与工程学科发展报告[C];2014年
3 王时光;;大数据时代规划数据挖掘的创新思考[A];新常态:传承与变革——2015中国城市规划年会论文集(04城市规划新技术应用)[C];2015年
4 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
6 许珂;姜山;;数据挖掘方法在科技产出分布可视化研究中的运用[A];第二届中国科技哲学及交叉学科研究生论坛论文集(硕士卷)[C];2008年
7 雷宇;;论行业信息资源的数据挖掘[A];中国烟草行业信息化研讨会论文集[C];2004年
8 吴以凡;吴铁军;欧阳树生;;面向生产过程质量控制的动态数据挖掘方法[A];05'中国自动化产业高峰会议暨中国企业自动化和信息化建设论坛论文集[C];2005年
9 彭怡;;从数据挖掘文章聚类分析看其发展趋势[A];现代工业工程与管理研讨会会议论文集[C];2006年
10 张建锦;刘小霞;;密度偏差抽样及其在海量数据挖掘中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
中国重要报纸全文数据库 前10条
1 陆天歌 王兆亮;数据挖掘:帮你读懂未来战争[N];解放军报;2018年
2 本报记者 戴丽昕;在人才工作中展现数据挖掘力量[N];上海科技报;2019年
3 本报记者 张佳星;把扎克伯格拉下水,大数据挖掘犯错了吗[N];科技日报;2018年
4 本报记者 张佳星;数据挖掘大战 机器怎么做到“见信如面”[N];科技日报;2018年
5 记者 张潇;打造数据挖掘领域的“响尾蛇模式”[N];西安日报;2018年
6 上海市浦东卫生发展研究院 孙雪松 王晓丽;数据挖掘在医学大数据研究中的应用[N];中国信息化周报;2018年
7 本报记者 叶曜坤;全国人大代表邓晓辉:推翻阻碍数据挖掘的“三座大山”[N];人民邮电;2017年
8 本报记者 牛福莲;贵州争夺“大数据挖掘”制高点[N];中国经济时报;2017年
9 中国联合商报记者 刘末;大数据挖掘 让金融业未来更加多彩[N];中国联合商报;2017年
10 南方日报记者 彭颖;日化巨头借力大数据挖掘线下市场[N];南方日报;2017年
中国博士学位论文全文数据库 前10条
1 姜彦;正则化方法在数据挖掘中的应用与研究[D];湖南大学;2015年
2 马昱欣;结合可视化与数据挖掘的数据分析方法探究[D];浙江大学;2017年
3 李雄;单核苷酸多态性数据挖掘方法及其应用研究[D];湖南大学;2015年
4 董瑶;基于统计分析与数据挖掘的智能优化预测研究及应用[D];兰州大学;2015年
5 王达;时间序列数据挖掘研究与应用[D];浙江大学;2004年
6 马昕;粗糙集理论在数据挖掘领域中的应用[D];浙江大学;2003年
7 王立宏;信息系统的约简与粒度分析及其在数据挖掘中的应用[D];上海大学;2004年
8 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年
9 李秋丹;数据挖掘相关算法的研究与平台实现[D];大连理工大学;2004年
10 李力;数据挖掘方法研究及其在中药复方配伍分析中的应用[D];西南交通大学;2003年
中国硕士学位论文全文数据库 前10条
1 蔡楚华;基于数据挖掘的心脏疾病诊断研究[D];福州大学;2017年
2 高鹏;基于JBPM的大数据挖掘服务流程引擎的研究与实现[D];福州大学;2017年
3 顾海霞;数据挖掘在精准帮扶数据分析中的应用研究[D];贵州大学;2018年
4 郑张;数据挖掘在CDMA网络分析中的应用[D];福州大学;2017年
5 林志群;基于Spark MLlib统一数据挖掘服务平台的研究与实现[D];福州大学;2017年
6 朱小舟;数据挖掘方法在股票选择中的应用研究[D];对外经济贸易大学;2018年
7 张楠;基于数据挖掘的实时短文本处理技术的研究[D];中国电子科技集团公司电子科学研究院;2018年
8 李华;基于数据挖掘的消防电子生产企业客户关系管理研究[D];燕山大学;2018年
9 巩阳光;基于数据挖掘技术的金融数据分析系统设计与实现[D];湖北工业大学;2018年
10 余晓婧;基于数据挖掘的高速公路防逃费系统的设计与应用[D];湖北工业大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026