收藏本站
《西南财经大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘方法在股票分析中的应用与研究

孙磊平  
【摘要】:改革开放以来,随着我国经济的快速发展,股市应运而生。我国股市自成立以来,历经了风风雨雨之后,伴随着成长,逐步发展壮大。并且随着人民生活水平的日益提高,人们手头闲置的资金也越来越多,投资需求日益旺盛,投资意识和金融意识也日益增长,投资方式也越来越多样化。股票市场由于其高风险高回报的特性,长期以来,不断吸引人们投入到其中,逐渐成为许多人投资的重要手段之一。越来越多的人将手头的资金投入到股市,以期获得较为可观的回报。然而由于专业知识的缺乏、信息的不对称性等等原因,人们对于股市的投资往往带有盲目性、投机性,很难获得可观的收益。因此,对于股票市场,寻求一套有效的方法,降低人们投资的风险,同时提高人们投资的收益就显得非常重要。在股票市场中,时刻都会诞生大量的数据,上市公司也会定期发布大量的财务数据,如何有效地利用这些数据,减少投资者的投资风险,从而给投资者带来较高的回报便成为了一个非常值得分析研究的问题。 上市公司定期发布的财务报告数据具有较大的信息含量,这些信息含量包括各种财务比率指标。综合这些财务指标,能够一定程度上反映公司整体的经营运行状况,有利于投资者判断公司的内在价值,从而有助于投资者更好地判断上市公司股票的投资价值。对于中长期的投资者来说,如何利用这些信息来判断股票的未来投资价值,显得尤为重要。而本文试图通过数据挖掘技术,来研究上市公司公布的财务比率指标和股票投资价值的内在联系,期望挖掘出财务数据中有用的信息,从而对股票的投资价值作出更好的判断。传统的统计模型对于数据有较高的要求,对于数据的假定较多,要求过于严格,实际中的数据往往很难达到这种要求,而数据挖掘技术对于数据的要求相对较低,能够相对较好地处理非正态、非平稳、高噪声的数据。数据挖掘通过结合统计学、机器学习和人工智能等技术对于处理海量数据和高频数据往往能够达到不错的效果。另外数据挖掘还能够对不断获得的新数据进行模型的动态更新,非常适合应用于新环境。数据挖掘是当今国际上统计学、人工智能和数据库研究方面最富活力的新兴领域,从大型数据库中挖掘有效信息的问题已经成为近年来数据分析研究领域中的一个新热点。股票投资风险与机遇并存,如何把握风险,使投资回报最大化是投资者追求的目标。在上市公司公布的财务数据以及股票行情数据库中积累了大量的历史数据,如何充分利用这些历史数据,为投资者提供决策依据,把数据挖掘方法运用于股市投资研究和探索变得很有意义。因此,本文尝试用数据挖掘中的方法来对上市公式财务数据进行分析,目的是发现公司财务数据和股票投资价值的联系,为投资者提供参考。 本文基于国内外研究成果,介绍了数据挖掘的相关理论,并且引入数据挖掘的相关方法对上市公司定期公布的财务比率指标和股票价格变化之间的关系进行了研究分析。文章中用到的数据挖掘技术包括决策树分类、神经网络模型以及logistic回归模型三种方法,将三种方法运用于股票价值投资分析中,通过三种方法来研究上市公司公布的财务比率指标与股票投资价值之间的内在联系,并试图寻找哪些财务指标对于上市公司的股价的变化有较大的影响,并且对三种方法取得的结果进行评估和对比分析,比较各种模型进行实证分析时取得的效果,从而更好地判断股票的投资价值。文中建立模型时以上市公司公布的财务指标作为输入变量,为便于不同上市公司的比较,财务指标均选取财务比率指标。并为了综合反映公司的运行状况,从公司盈利能力、偿债能力、发展能力、运营能力以及现金流五个大的方面来选取指标,以更为准确的反映公司的内在价值。此外,以个股赢率作为目标变量建立模型。其中个股赢率为二元变量,当股票一年期的涨跌幅大于大盘指数的涨跌幅时取“1”,否则便取“O”。文章的思路便是以综合反映上市公司运行状况的财务比率指标为输入变量,以个股赢率为目标变量,来研究分析上市公司公布的财务比率指标和上市公司个股赢率是不是存在关系,如果存在关系,哪些财务比率指标对个股赢率的影响较大以及哪种模型预测效果较好,这些都是文章中要研究和解决的问题。
【学位授予单位】:西南财经大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:F832.51;F224

手机知网App
【参考文献】
中国期刊全文数据库 前7条
1 陆璇,张岭松,陈小悦;利用上市公司公开的财务信息预测未来的销售[J];当代经济科学;2003年01期
2 赵宇龙;会计盈余披露的信息含量——来自上海股市的经验证据[J];经济研究;1998年07期
3 陈晓,陈小悦,刘钊;A股盈余报告的有用性研究——来自上海、深圳股市的实证证据[J];经济研究;1999年06期
4 朱绍文,胡宏银,王泉德,张大斌,黄浩,陆玉昌;决策树采掘技术及发展趋势[J];计算机工程;2000年10期
5 陈光华;;人工神经网络在证券价格预测中的应用[J];计算机仿真;2007年10期
6 刘新勇,贺江峰,孟祥泽,陈增强,袁著祉;基于神经网络的股市预测[J];南开大学学报(自然科学版);1998年03期
7 陆璇;刘慧霞;陈晓;;中国上市公司未来收益预测的实证研究——贝叶斯动态模型及其预测[J];中南大学学报(社会科学版);2003年02期
【共引文献】
中国期刊全文数据库 前10条
1 邵瑞萍;随机漫步、效率市场与证券市场分析[J];安徽大学学报;2002年06期
2 李瑞琪;程乃伟;郭燕;;基于蚁群神经网络火灾信息处理技术研究[J];安防科技;2011年07期
3 贺艳辉;袁永明;张红燕;龚贇翀;王红卫;;BP人工神经网络在罗非鱼价格预测中的应用[J];安徽农业科学;2010年35期
4 沈维成;;资本结构、股权结构与公司绩效[J];安徽工业大学学报(社会科学版);2008年04期
5 于雷;;数字岩心领域中的公式发现研究[J];信息安全与技术;2011年12期
6 李继红;李琳;毕宗岳;张敏;;基于BP神经网络的连续油管焊接热影响区性能预测[J];兵器材料科学与工程;2012年03期
7 孙爱军,陈小悦;关于会计盈余的信息含量的研究——兼论中国股市的利润驱动特性[J];北京大学学报(哲学社会科学版);2002年01期
8 郭迎宾;;反应过度与反应不足:论文综述[J];北方经济;2010年08期
9 贾花萍;;基于神经网络的特征选择与提取方法研究[J];办公自动化;2008年14期
10 崔敏;;论遗传算法在旅行商问题中的应用[J];办公自动化;2011年08期
中国重要会议论文全文数据库 前10条
1 祁生文;伍法权;;基于模糊数学的TBM施工岩体质量分级研究[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(中)[C];2012年
2 李琨;王晓东;刘会景;张云生;苗琦;;瓦斯“冒大数”及其神经网络滤波器的研究[A];第二十七届中国控制会议论文集[C];2008年
3 王剑平;黄红霞;李宏彪;张云生;;基于支持向量机模型的瓦斯涌出量预测[A];第二十七届中国控制会议论文集[C];2008年
4 王春林;;灰熔点预测建模研究[A];中国自动化学会控制理论专业委员会B卷[C];2011年
5 曹波伟;薛青;牛金涛;龚长虹;刘磊;;基于神经网络和专家系统的装备智能故障诊断的研究[A];中国自动化学会控制理论专业委员会C卷[C];2011年
6 高玮;;基于进化神经网络的股票市场智能仿真预测[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
7 欧建文;姚金波;梁小平;吴畏;;羽毛角蛋白提取工艺参数的BP网络评价法[A];铜牛杯第九届功能性纺织品及纳米技术研讨会论文集[C];2009年
8 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
9 胡松峰;彭显刚;;电网短期负荷预测方法综述[A];武汉(南方九省)电工理论学会第22届学术年会、河南省电工技术学会年会论文集[C];2010年
10 陈高才;蒋义宏;;会计信息的治理有用性检验[A];中国会计学会高等工科院校分会2006年学术年会暨第十三届年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 张帆;全景视觉图像质量优化方法研究[D];哈尔滨工程大学;2010年
2 汪木兰;神经网络硬化实现的共性技术在电力传动中应用研究[D];合肥工业大学;2010年
3 邓红平;网络会计信息披露真实度评价及影响因素研究[D];华中科技大学;2010年
4 李进营;财务报告透明度与投资者保护[D];南开大学;2010年
5 陈文正;保险公司债券投资研究[D];南开大学;2010年
6 李琨;监控技术与涌现性分析在煤矿瓦斯灾害防治中的应用研究[D];昆明理工大学;2009年
7 张晓东;中国上市公司财务报告人为操控的实证研究[D];东北财经大学;2010年
8 孙翯;公允价值信息的价值相关性[D];东北财经大学;2010年
9 杨娜;基于云参数干旱遥感监测模型与集合卡尔曼滤波的土壤湿度同化研究[D];武汉大学;2010年
10 迟雷;基于过程控制优化的重组大肠杆菌高密度发酵研究[D];西北大学;2011年
中国硕士学位论文全文数据库 前10条
1 陈少华;基于Hopfield神经网络控制系统的研究[D];山东科技大学;2010年
2 李娜;基于神经网络的非线性系统H_∞控制[D];广西师范学院;2010年
3 赵凤义;上市公司季报披露信息与股价的关系研究[D];浙江理工大学;2010年
4 丛强;基于模糊关联规则Web挖掘算法的研究[D];哈尔滨工程大学;2010年
5 梁怀志;基于嵌入式的车型分类系统的设计与实现[D];大连理工大学;2010年
6 庞中华;微流控芯片注塑成型工艺规范的试验研究与质量预测[D];大连理工大学;2010年
7 马岩尉;基于前馈神经网络的电子鼻模式识别方法[D];大连理工大学;2010年
8 李慧;基于粗糙集理论的连续属性离散化算法研究[D];辽宁师范大学;2010年
9 杨克强;LVQ神经网络在齿轮箱故障诊断中的研究[D];安徽农业大学;2010年
10 王宏云;基于数据挖掘的煤矿安全监测系统研究[D];辽宁工程技术大学;2009年
【二级参考文献】
中国期刊全文数据库 前7条
1 陆璇,陈小悦,张岭松,刘慧霞;中国上市公司财务基本信息对未来收益的预测能力[J];经济科学;2001年06期
2 陈小悦,肖星,过晓艳;配股权与上市公司利润操纵[J];经济研究;2000年01期
3 吴联生;投资者对上市公司会计信息需求的调查分析[J];经济研究;2000年04期
4 赵宇龙;会计盈余披露的信息含量——来自上海股市的经验证据[J];经济研究;1998年07期
5 陈晓,陈小悦,刘钊;A股盈余报告的有用性研究——来自上海、深圳股市的实证证据[J];经济研究;1999年06期
6 徐前方;上证指数中的奇异吸引子[J];数量经济技术经济研究;1994年02期
7 李敏强,徐博艺,寇纪淞;遗传算法与神经网络的结合[J];系统工程理论与实践;1999年02期
【相似文献】
中国期刊全文数据库 前10条
1 李云飞;谢晓晨;;基于GA-SVM的股票投资价值评价研究[J];燕山大学学报;2009年06期
2 陶永宏;价值工程在股票投资中的应用浅议[J];价值工程;1996年04期
3 谢勇;;柳州上市公司投资价值分析比较[J];大众商务;2009年16期
4 胡春林;企业投资价值与股票市场表现——基于江西上市公司财务指标的实证分析[J];科技情报开发与经济;2004年08期
5 吴书琴;;上市公司投资价值判断核心财务指标探析[J];东方企业文化;2011年12期
6 孙洪松;王中兴;;我国上市公司利润操纵行为定量分析方法研究[J];石油化工管理干部学院学报;2005年03期
7 王以恒;;公司股价增长与所处行业及其财务数据关系分析[J];现代商业;2011年18期
8 汪赫瑜;王伟;;股票间关联规则的挖掘算法[J];中国科技信息;2008年05期
9 ;细解分红等财务指标 透析深红利ETF投资价值[J];证券导刊;2010年40期
10 戴丽萍;财务指标与股票价格定位:一种实证研究[J];云南财贸学院学报;2004年04期
中国重要会议论文全文数据库 前10条
1 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
5 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
7 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
8 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
9 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
中国重要报纸全文数据库 前10条
1 徐国杰;加息周期不改长期向好趋势[N];中国证券报;2007年
2 银河证券 王昉;07长电债利率5.3%之上凸现投资价值[N];证券时报;2007年
3 本报记者:史丽;券商集合理财与股票型基金 谁更有投资价值[N];经济参考报;2005年
4 依白;高科技股投资价值几何[N];中国信息报;2000年
5 广发基金市场部;投资标普农业指数 分享美盛盛宴[N];证券时报;2011年
6 陈振华;证券投资基金的投资价值[N];中国城乡金融报;2002年
7 华夏证券研究所课题组;沪深港市场投资价值比较研究(上)[N];中国证券报;2004年
8 向德伟;透过盈利能力的现象看本质[N];海峡财经导报;2005年
9 西南证券 段海瑞;短期调整不影响长期投资价值[N];证券时报;2005年
10 本报记者  徐国杰;房地产等行业仍有投资价值[N];中国证券报;2006年
中国博士学位论文全文数据库 前10条
1 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
2 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
3 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
4 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
5 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
6 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
7 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
8 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
9 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
10 余红;网络时政论坛舆论领袖研究[D];华中科技大学;2007年
中国硕士学位论文全文数据库 前10条
1 孙磊平;数据挖掘方法在股票分析中的应用与研究[D];西南财经大学;2013年
2 宋云飞;房地产上市公司投资价值的实证研究[D];对外经济贸易大学;2006年
3 刘胜英;上市公司投资价值的财务评价模型的构建[D];沈阳工业大学;2006年
4 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
5 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
6 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
7 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
8 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
9 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
10 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026