收藏本站
《中南林业科技大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘在股市趋势预测的应用研究

李坤然  
【摘要】:信息技术的日新月异,使得数据的大规模增长,如何充分利用这些海量数据进行分析处理,挖掘并析取其背后蕴藏的价值信息,对于我们揭示事物发展规律变化的内部规律,发现不同事物之间的相互关系,为人们正确认识事物和科学决策提供依据具有重要的实际意义。数据挖掘技术为人们提供了强大的武器。聚类分析是数据挖掘研究的一个重要内容之一,基于聚类的各种数据挖掘算法的研究历来也是研究重点,并且对聚类的各种数据挖掘算法应用也非常广泛。但是,目前大多数的聚类分析算法的数据对象只是针对于静态数据集,对于动态数据集却只能采取对整个数据集重新进行聚类的方式,因此随着数据量的不断增大以及对数据集实时数据挖掘的需求不断加大,这样处理的结果是效率低下而且重复性高。现实股票市场中存在着许多不确定因素,这些不确定因素使股票交易者很难对股票价格做出准确、客观的预测。 本文的数据对象是采用来自互联网的1990年3月27日到2005年3月27日每日恒生指数的数据,数据格式采用国际上通常讲的股票历史数据格式,即是每一“交易日”为一条数据记录单元。通过随机选取的一个股票对象的属性进行对整个恒生指数的概述,其中每个属性都经过了数值化变换。要得到的聚类结果为:股市走势类别分组聚类。这个问题可以转换成股票走势特征极大化。基于聚类的下降迭代增量式数据挖掘继承了已有聚类的执行成果,通过对新增数据的考查,迭代求取最佳可能值,根据实例数据对象特征以及本文提出挖掘算法的聚类特点,在实际实验结果的验证下,可以得出本文课题是可行和有效的。同时本课题提出的算法可在很大程度上避免大量的重复计算,减少了计算量,节省了系统开支,提高了效率,尤其数据量越大时,下降迭代增量式的数据挖掘技术就越能体现出其优越性,也更能为有数据挖掘需求的用户提供及时、快捷、有价值的信息内容。 股票的趋势是一个受政治局势、灾害、军事局势、企业经营、股票历史数据等多方面因素影响的非线性问题,本课题基于股票市场产生的大量数据,利用基于聚类的下降迭代增量式的数据挖掘技术对股票趋势进行预测。模拟结果再现了股票市场尖峰肥尾,弱自相关性,波动聚集性以及多重分形性等特征,并与恒生指数实际数据进行了比较。
【学位授予单位】:中南林业科技大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:F830.91;TP311.13

【参考文献】
中国期刊全文数据库 前10条
1 王培珍;一种基于遗传算法的混合聚类技术[J];安庆师范学院学报(自然科学版);1999年04期
2 江效尧,江伟;决策树在数据挖掘中的应用研究[J];安庆师范学院学报(自然科学版);2003年01期
3 黄晓芳;数据挖掘中决策树算法及其应用[J];兵工自动化;2005年02期
4 李民,邹捷中,李俊平,梁建武;用ARMA模型预测深沪股市[J];长沙铁道学院学报;2000年01期
5 李碧,雍正正;一种改进的基于遗传算法的聚类分析方法[J];电路与系统学报;2002年03期
6 李广原,李文敬;一个基于属性相似性的聚类分析方法[J];电脑与信息技术;2002年04期
7 李菁菁,邵培基,黄亦潇;数据挖掘在中国的现状和发展研究[J];管理工程学报;2004年03期
8 张维,潘福铮;一种基于遗传算法的模糊聚类[J];湖北大学学报(自然科学版);2002年02期
9 张宁,贾自艳,史忠植;数据仓库中ETL技术的研究[J];计算机工程与应用;2002年24期
10 王静莲,刘弘,李少辉;基于决策树的遗传算法在数据挖掘领域的应用[J];计算机工程与应用;2005年28期
中国硕士学位论文全文数据库 前1条
1 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
【共引文献】
中国期刊全文数据库 前10条
1 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
2 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
3 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
4 江效尧,胡林生;基于粗糙集的RDT决策树生成算法的研究及应用[J];安徽工程科技学院学报(自然科学版);2004年03期
5 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
6 汪军;王传玉;;基于协议分析的并行聚类入侵检测模型[J];安徽工程科技学院学报(自然科学版);2009年04期
7 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
8 陈志民;李亭;杨敬锋;彭晓琴;;珠海市斗门区水产品病害网络诊断与防治系统算法设计[J];安徽农业科学;2010年17期
9 沈雪达;;水产类上市公司利用资本市场融资与投资效益分析[J];安徽农业科学;2010年30期
10 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年
3 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
4 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
5 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
6 赵云鹏;石丽;刘莹;;基于数据挖掘的高校规模分析及应用研究[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
7 张士玉;马丽仪;何勤;;基于熵理论的社会数据分析方法探讨[A];第十三届中国管理科学学术年会论文集[C];2011年
8 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
9 王皓;曹永锋;孙洪;;基于流域变换的聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 田松;侯妙乐;王晏民;郭宏;;基于面向属性归纳决策树的馆藏壁画病害信息提取[A];第二届“测绘科学前沿技术论坛”论文精选[C];2010年
中国博士学位论文全文数据库 前10条
1 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
2 范建华;股票市场稳定性与货币政策关系研究[D];华中科技大学;2010年
3 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
4 徐红波;基于空间填充曲线高维空间查询算法研究[D];哈尔滨理工大学;2010年
5 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
6 韩明华;基于情境分析的集群企业知识转移机理与模型研究[D];浙江工商大学;2011年
7 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
8 王冬丽;基于可扩展的支持向量机分类算法及在信用评级中的应用[D];东华大学;2011年
9 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
10 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
2 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
3 李翠;基于车辆自动识别的智能计重监控系统的研究与设计[D];郑州大学;2010年
4 刘春燕;教学网络DIDS数据分析方法的研究与改进[D];郑州大学;2010年
5 王林吉;基于CIELAB均匀颜色空间和聚类算法的混纺测色研究[D];浙江理工大学;2010年
6 梁大圣;空间数据仓库的设计与构建[D];山东农业大学;2010年
7 史文财;省级政务网安全检测系统的设计与实现[D];哈尔滨工程大学;2010年
8 曾祥莉;ETL在经济普查信息发布系统中的应用研究[D];哈尔滨工程大学;2010年
9 葛迪;ETL技术在交通信息资源整合工程中的应用研究[D];哈尔滨工程大学;2010年
10 杨海陆;公路收费系统数据分析与挖掘[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 余正环,过泉生,俞蓓华,陈又申,陈晴;自备电厂的火电厂值长监视与管理平台系统[J];宝钢技术;1997年04期
2 贾克斌;信息系统设计中聚类分析方法的研究[J];北京工业大学学报;1999年03期
3 肖利,金远平,徐宏炳,王能斌;一个新的挖掘广义关联规则算法[J];东南大学学报;1997年06期
4 郭红丽;基于数据仓库的证券投资分析系统的分析与设计[J];电脑开发与应用;2002年05期
5 侯木舟,韩旭里;基于MATLAB的神经网络在股市预测中的应用[J];系统工程;2003年02期
6 ;词作家李昕[J];歌曲;2003年09期
7 叶施仁,史忠植;基于CBR的中心渔场预报[J];高技术通讯;2001年05期
8 程岩,黄梯云;粗糙集中定量关联规则的发现及其规则约简的方法研究[J];管理工程学报;2001年03期
9 徐燕,单波,王颖;对一种矢量量化聚类算法的改进及应用[J];华北电力大学学报;2001年03期
10 吴晓丹,王云峰,朱昭贤,李杰;单元制造系统理论与方法研究综述[J];河北工业大学学报;1999年03期
中国硕士学位论文全文数据库 前1条
1 门志勇;CRM系统及应用研究[D];首都经济贸易大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 龚振中;黄敏;;关于建立税务数据仓库的思考[J];财会月刊;2007年20期
2 张新兰;曲江;;企业数据仓库系统在管理决策中的应用[J];中国管理信息化(会计版);2006年10期
3 万伟明;;用决策树方法挖掘寿险数据中的投资风险规则[J];科技创新导报;2011年23期
4 周赵宏,冯艳;电子商务数据挖掘技术研究和应用探讨[J];湖南经济管理干部学院学报;2001年04期
5 惠轶;数据挖掘在信用风险管理中的应用[J];价值工程;2004年02期
6 杨云生;数据挖掘技术在客户关系管理中的应用[J];价值工程;2004年03期
7 林伟林,林有;数据挖掘在上市公司财务状况分析中的应用[J];市场周刊.财经论坛;2004年10期
8 李爱齐;数据挖掘在科技论文分析工作中的应用[J];宁波大学学报(理工版);2005年03期
9 吴文兴;;智能化物流预测模型的Agent设计[J];商场现代化;2006年08期
10 张俊平;;基于数据仓库的高校信息决策系统的设计研究[J];浙江工贸职业技术学院学报;2006年02期
中国重要会议论文全文数据库 前10条
1 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
5 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
6 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
7 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
8 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
2 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
3 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
4 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
5 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
6 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
7 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
8 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
9 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
10 余红;网络时政论坛舆论领袖研究[D];华中科技大学;2007年
中国硕士学位论文全文数据库 前10条
1 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
2 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年
3 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
4 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
5 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
6 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
7 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
8 颜昌沁;基于数据挖掘的电信客户离网预测研究与应用[D];昆明理工大学;2009年
9 黎卫英;数据挖掘在中职幼教课程改革中的应用[D];福建师范大学;2009年
10 张煜辉;数据挖掘和SPC在生产过程质量控制中应用研究[D];上海交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026