收藏本站
《西南财经大学》 2014年
收藏 | 手机打开
二维码
手机客户端打开本文

基于数据挖掘组合模型的股价预测研究

何裕  
【摘要】:改革开放以来,随着我国经济的快速发展,股票市场也应运而生。我国股市自成立以来,历经了风风雨雨之后,获得了快速的成长,逐步发展壮大。一方面在推动实体经济发展,完善市场经济机制,合理分配社会资源,促进生产要素重新组合与合理流动等方面发挥着越来越积极的作用;另一方面随着人民生活水平的日益提高,人们剩余的闲置的资金也越来越多,股票也成为了人们投资、财富保值增值的重要手段。股票市场由于其高风险高回报的特性,长期以来,不断吸引人们投入到其中,逐渐成为许多人投资的重要手段之一。越来越多的人将手头的闲置资金投入到股市,以期获得较为可观的回报。但是,股票市场是一个极其复杂的、不断变化的经济系统,它受到宏观经济运行、政策变化、行业发展周期、投资者群体等多种因素的综合影响,使得人们很难准确地找到股票价格走势的规律和逻辑。由于专业知识的缺乏、信息的不对称性等等原因,人们对于股市的投资往往带有盲目性、投机性,很难获得较好的收益。因此,对于股票市场,寻求一套有效的方法,降低人们投资的风险,同时提高人们投资的收益就显得尤为重要。 目前常用的股票投资的分析方法主要有如下两种:基本面分析法和技术分析法,其中基本面分析主要着眼于投资标的股票的选择上,而技术分析则主要在具体投资买卖操作的时间和空间判断上起作用,试图用以提高投资分的析可靠性和准确性。对于中小投资者来说,在做基本面分析时常常会受到资料不足、分析工具不全面、个人知识面不够和分析能力欠缺的制约。技术分析以传统的证券分析理论为基础,以股票市场交易价格走势作为主要研究对象,以预测股票价格走势趋势为主要目的,往往从股票过去交易的图表和数据入手,试图找到股票市场波动规律并用以指导投资操作。比较著名和常用的有波浪理论、江恩理论、道氏理论等。 在股票市场中,时刻都会产生大量的交易数据,上市公司也会定期发布大量的财务数据,如何有效地利用这些数据,减少投资者的投资风险,从而给投资者带来较高的回报便成为了一个非常值得分析和研究的问题。上市公司定期发布的财务报告数据具有很重要的信息含量,这些信息含量包括各种财务比率指标。综合这些财务指标,能够一定程度上反映公司整体的经营运行状况和赚取利润的能力,有利于投资者判断公司的内在价值,从而有助于投资者更好地判断上市公司股票价格的未来变化。对于中长期的投资者来说,如何利用这些信息来判断股票的未来投资价值,显得尤为重要。 而本文试图通过数据挖掘技术,来研究上市公司财务比率指标的动态变化和股票价格变化趋势的内在联系,期望挖掘出财务数据中有用的信息,从而对股票的投资决策做出更好的判断。传统的统计模型对于数据有较高的要求,对于数据的假定较多,要求过于严格,实际中的数据往往很难达到这种要求,而数据挖掘技术对于数据的要求相对较低,能够相对较好地处理非正态、非平稳、高噪声的数据。数据挖掘通过结合统计学、机器学习和人工智能等技术对于处理海量数据和高频数据往往能够达到不错的效果。另外数据挖掘还能够对不断获得的新数据进行模型的动态更新,非常适合应用于新环境。数据挖掘是当今国际上统计学、人工智能和数据库研究方面最富活力的新兴领域,从大型数据库中挖掘有效信息的问题已经成为近年来数据分析研究领域中的一个新热点。股票投资风险与机遇并存,如何把握风险,使投资回报最大化?是投资者追求的目标。在上市公司公布的财务数据以及股票行情数据库中积累了大量的历史数据,如何充分利用这些历史数据,为投资者提供决策依据,把数据挖掘方法运用于股市投资研究和探索变得很有意义。因此,本文尝试用数据挖掘中的方法来以及组合模型对上市公式财务数据进行分析,目的是发现公司财务数据的变化和股票未来价格变化的联系,为投资者提供参考。 本文基于国内外相关方面研究成果,介绍了数据挖掘的相关理论,并且引入数据挖掘的相关方法对上市公司两年间的财务比率指标的变化量和股票价格变化之间的关系进行了研究分析,最后运用组合模型对数据挖掘的几种方法进行组合和优化。文章中用到的数据挖掘技术包括决策树分类、神经网络模型以及logistic回归模型三种方法,将三种方法运用于股票价格预测分析中,通过三种方法来研究上市公司公布的财务比率指标两年之间的变化量与股票当年的价格涨跌之间的内在联系,并试图寻找哪些财务指标对于上市公司的股价的变化有较大的影响,并且对三种方法取得的结果进行评估和对比分析,比较各种模型在进行实证分析时取得的效果,评价各个模型在预测精确度和稳定性方面的优劣。组合模型是基于几个单一模型,希望能够在一定程度上避开它们的缺点的组合方法,通过几种单一模型达到它们性能的结合于互补,克服它们各自的缺点。希望能够在最终的模型中使得股票分类预测变得更加精确、稳健并更容易理解。本文试图通过决策树模型来挑选上市公司的有效财务指标,剔除冗余指标对预测结果的干扰,并且利用logistic回归计算出分类的概率p值。将挑选出来的有效指标和p值作为输入层建立混合神经网络模型,最后得出组合模型的预测结果。本文以上市公司公布的财务比率指标计算出两年的动态变化量作为输入变量,以个股相对收益率作为被解释变量,并结合历史数据建立模型。从而更好判断股票的投资价值。文中建立模型时以上市公司公布的两年财务指标差额作为输入变量,为便于不同上市公司的比较,财务指标均选取财务比率指标。并为了综合反映公司的运行状况,从公司盈利能力、偿债能力、发展能力、运营能力以及现金流五个大的方面来选取指标,以更为准确的反映公司的内在价值。此外,以个股相对收益率作为目标变量建立模型。其中个股相对收益率为二元变量,当股票一年期的涨跌幅大于大盘指数的涨跌幅时取“1”,否则便取“0”。文章的思路便是以综合反映上市公司运行状况的财务比率指标的变化量为输入变量,以个股相对收益率为目标变量,来研究分析上市公司公布的财务比率指标和上市公司个股相对收益率是不是存在关系,如果存在关系,哪些财务比率指标对个股赢率的影响较大以及哪种模型预测效果较好,这些都是文章中要研究和解决的问题。
【学位授予单位】:西南财经大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:F832.51;F224

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 赵宇龙;会计盈余披露的信息含量——来自上海股市的经验证据[J];经济研究;1998年07期
2 朱绍文,胡宏银,王泉德,张大斌,黄浩,陆玉昌;决策树采掘技术及发展趋势[J];计算机工程;2000年10期
【共引文献】
中国期刊全文数据库 前10条
1 邵瑞萍;随机漫步、效率市场与证券市场分析[J];安徽大学学报;2002年06期
2 李瑞琪;程乃伟;郭燕;;基于蚁群神经网络火灾信息处理技术研究[J];安防科技;2011年07期
3 贺艳辉;袁永明;张红燕;龚贇翀;王红卫;;BP人工神经网络在罗非鱼价格预测中的应用[J];安徽农业科学;2010年35期
4 于雷;;数字岩心领域中的公式发现研究[J];信息安全与技术;2011年12期
5 李继红;李琳;毕宗岳;张敏;;基于BP神经网络的连续油管焊接热影响区性能预测[J];兵器材料科学与工程;2012年03期
6 孙爱军,陈小悦;关于会计盈余的信息含量的研究——兼论中国股市的利润驱动特性[J];北京大学学报(哲学社会科学版);2002年01期
7 郭迎宾;;反应过度与反应不足:论文综述[J];北方经济;2010年08期
8 贾花萍;;基于神经网络的特征选择与提取方法研究[J];办公自动化;2008年14期
9 崔敏;;论遗传算法在旅行商问题中的应用[J];办公自动化;2011年08期
10 刘启浩;朱才斌;;基于组合预测的风险值研究[J];北京工业大学学报(社会科学版);2008年03期
中国重要会议论文全文数据库 前10条
1 祁生文;伍法权;;基于模糊数学的TBM施工岩体质量分级研究[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(中)[C];2012年
2 李琨;王晓东;刘会景;张云生;苗琦;;瓦斯“冒大数”及其神经网络滤波器的研究[A];第二十七届中国控制会议论文集[C];2008年
3 王剑平;黄红霞;李宏彪;张云生;;基于支持向量机模型的瓦斯涌出量预测[A];第二十七届中国控制会议论文集[C];2008年
4 王春林;;灰熔点预测建模研究[A];中国自动化学会控制理论专业委员会B卷[C];2011年
5 曹波伟;薛青;牛金涛;龚长虹;刘磊;;基于神经网络和专家系统的装备智能故障诊断的研究[A];中国自动化学会控制理论专业委员会C卷[C];2011年
6 欧建文;姚金波;梁小平;吴畏;;羽毛角蛋白提取工艺参数的BP网络评价法[A];铜牛杯第九届功能性纺织品及纳米技术研讨会论文集[C];2009年
7 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
8 胡松峰;彭显刚;;电网短期负荷预测方法综述[A];武汉(南方九省)电工理论学会第22届学术年会、河南省电工技术学会年会论文集[C];2010年
9 陈高才;蒋义宏;;会计信息的治理有用性检验[A];中国会计学会高等工科院校分会2006年学术年会暨第十三届年会论文集[C];2006年
10 刘雄飞;郭子静;陆琪;;人工神经网络在高温合金性能预测中的应用[A];2010年“航空航天先进制造技术”学术交流论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 张帆;全景视觉图像质量优化方法研究[D];哈尔滨工程大学;2010年
2 汪木兰;神经网络硬化实现的共性技术在电力传动中应用研究[D];合肥工业大学;2010年
3 邓红平;网络会计信息披露真实度评价及影响因素研究[D];华中科技大学;2010年
4 李进营;财务报告透明度与投资者保护[D];南开大学;2010年
5 陈文正;保险公司债券投资研究[D];南开大学;2010年
6 李琨;监控技术与涌现性分析在煤矿瓦斯灾害防治中的应用研究[D];昆明理工大学;2009年
7 张晓东;中国上市公司财务报告人为操控的实证研究[D];东北财经大学;2010年
8 孙翯;公允价值信息的价值相关性[D];东北财经大学;2010年
9 杨娜;基于云参数干旱遥感监测模型与集合卡尔曼滤波的土壤湿度同化研究[D];武汉大学;2010年
10 迟雷;基于过程控制优化的重组大肠杆菌高密度发酵研究[D];西北大学;2011年
中国硕士学位论文全文数据库 前10条
1 陈少华;基于Hopfield神经网络控制系统的研究[D];山东科技大学;2010年
2 李娜;基于神经网络的非线性系统H_∞控制[D];广西师范学院;2010年
3 赵凤义;上市公司季报披露信息与股价的关系研究[D];浙江理工大学;2010年
4 丛强;基于模糊关联规则Web挖掘算法的研究[D];哈尔滨工程大学;2010年
5 梁怀志;基于嵌入式的车型分类系统的设计与实现[D];大连理工大学;2010年
6 庞中华;微流控芯片注塑成型工艺规范的试验研究与质量预测[D];大连理工大学;2010年
7 马岩尉;基于前馈神经网络的电子鼻模式识别方法[D];大连理工大学;2010年
8 李慧;基于粗糙集理论的连续属性离散化算法研究[D];辽宁师范大学;2010年
9 杨克强;LVQ神经网络在齿轮箱故障诊断中的研究[D];安徽农业大学;2010年
10 王宏云;基于数据挖掘的煤矿安全监测系统研究[D];辽宁工程技术大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 杨辉;数据挖掘及其在商业银行中的应用[J];中国金融电脑;1998年11期
2 刘桂霞,崔永铎,高平和;关于数据挖掘的研究[J];工业技术经济;2000年03期
3 何东峰;数据挖掘要适当[J];互联网周刊;2000年Z1期
4 石艳芬;数据挖掘,你做了没有?[J];企业活力;2001年12期
5 宋海岚;浅叙数据挖掘在商业中的应用[J];计划与市场;2002年03期
6 吴载斌,王斌会;数据挖掘中的预测及其应用[J];统计与预测;2002年01期
7 洪崎;数据集中与数据挖掘[J];中国金融电脑;2002年10期
8 刘锡京,宣慧玉;客户关系管理与数据挖掘[J];中外管理导报;2002年10期
9 朱慧云,钱颖;数据挖掘在客户关系管理中的应用[J];江苏商论;2003年04期
10 ;数据挖掘的发展与电信行业的应用[J];通信企业管理;2003年08期
中国重要会议论文全文数据库 前10条
1 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
2 李久丹;陈剑;覃涛;;数据挖掘技术理论研究[A];广西计算机学会2010年学术年会论文集[C];2010年
3 张秋彤;;数据挖掘与高校图书馆个性化信息服务[A];第九届中国不确定系统年会、第五届中国智能计算大会、第十三届中国青年信息与管理学者大会论文集[C];2011年
4 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
5 毛定祥;;数据挖掘与实证经济学[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年
6 段培俊;周东岱;;数据挖掘研究综述[A];2003年中国智能自动化会议论文集(下册)[C];2003年
7 雷宇;;论行业信息资源的数据挖掘[A];中国烟草行业信息化研讨会论文集[C];2004年
8 吴以凡;吴铁军;欧阳树生;;面向生产过程质量控制的动态数据挖掘方法[A];05'中国自动化产业高峰会议暨中国企业自动化和信息化建设论坛论文集[C];2005年
9 孙明;康红梅;莫一;;数据挖掘在科技奖励管理系统专家库中的应用[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年
10 邵红全;杨菊梅;潘建雄;;数据挖掘的策略与实现技术[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
中国博士学位论文全文数据库 前10条
1 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年
2 巩建光;面向电信领域的数据挖掘关键技术研究[D];哈尔滨工程大学;2012年
3 李建强;基于数据挖掘的电站运行优化理论研究与应用[D];华北电力大学(河北);2006年
4 余小高;电子商务环境中分布式数据挖掘的研究[D];武汉理工大学;2007年
5 李国旗;本体辅助的先验知识融入生物信息数据挖掘的方法研究[D];上海交通大学;2007年
6 翟坤;基于数据挖掘的成本管理方法研究[D];大连理工大学;2012年
7 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
8 刘洪波;汉语认知脑数据挖掘相关算法及应用研究[D];大连理工大学;2006年
9 朱廷劭;数据挖掘及其在汉语文语转换中应用的研究[D];中国科学院研究生院(计算技术研究所);1999年
10 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
中国硕士学位论文全文数据库 前10条
1 杨毅超;基于Web数据挖掘的作物商务平台分析与研究[D];湖南农业大学;2008年
2 徐进华;基于灰色系统理论的数据挖掘及其模型研究[D];北京交通大学;2009年
3 俞驰;基于网络数据挖掘的客户获取系统研究[D];西安电子科技大学;2009年
4 冯军;数据挖掘在自动外呼系统中的应用[D];北京邮电大学;2009年
5 于宝华;基于数据挖掘的高考数据分析[D];天津大学;2009年
6 王仁彦;数据挖掘与网站运营管理[D];华东师范大学;2010年
7 彭智军;数据挖掘的若干新方法及其在我国证券市场中应用[D];重庆大学;2005年
8 涂继亮;基于数据挖掘的智能客户关系管理系统研究[D];哈尔滨理工大学;2005年
9 贾治国;数据挖掘在高考填报志愿上的应用[D];内蒙古大学;2005年
10 马飞;基于数据挖掘的航运市场预测系统设计及研究[D];大连海事大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026