收藏本站
《西南财经大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

互联网财经新闻对股市影响的定量分析

赵丽丽  
【摘要】:影响股市波动的因素很多,有市场行情、通货膨胀、交易策略、公司本身等等因素。实际上,所有与财经相关的信息都会影响证券市场股价的波动。这些信息、最终可以归结为定量信息和定性信息。定量信息是指可以直接获得的实际观测数据,即技术指标,例如红利股价比、账面市值比、利润等。而定性信息、是指不能直接用数据精确描述的因素,例如商业环境、文化程度、技术优势、战争、自然灾害、政府经济政策变动等等,互联网财经新闻中就包含了大量的这种定性信息。 新闻对股市有影响,这已经是学术界和实业界公认的事实。互联网财经新闻作为信息时代公众获取财经信息的主要渠道,其与股市波动之间必然有着某种关联,但其对上市公司的报道将是如何影响证券市场股票的价格波动,即:新闻报道对股市的影响第几天最为显著?新闻报道对股市影响的持续时间是多长?中国股票市场分为沪深两市,那么互联财经网新闻对沪深两市股票产生的影响强度、影响周期是否一致?如果不同,那么分别又体现在哪些方面。这一系列问题的解决,对于监管者进行股市制度改革、投资者投资策略选择、承销商承销方案制订等都具有重要的参考意义。 然而目前为止,计算机科学领域学者对新闻与股市波动之间关系的研究,仅局限于预测新闻对股价的影响,并未系统分析两者之间的种种关联。然而,影响股价波动的因素很多,这使得用新闻预测股价的准确度较低,从而实用价值一直不高。计算机领域学者之所以并未系统分析新闻与股市之间关系,是因为此问题的解决需要借助计量经济学的分析方法。目前,经济学领域学者对新闻与股市的研究,由于技术的局限性,仅是简单地分析新闻标题、新闻数量等与股市波动之间的关系,并未挖掘新闻文本信息,而新闻文本中通常包含大量有价值的软信息。造成这种现状的原因是挖掘新闻文本中包含的信息需要计算机领域的文本挖掘技术。总之,各领域都存在技术局限性,使得系统地分析新闻文本信息与股市波动之间关系这项研究还处于知识空白。 基于此,本篇文章跨计算机科学与经济学两学科,利用文本挖掘技术中的支持向量回归模型和计量经济学中多元回归分析方法,将新闻内容量化为造成股市波动的一个影响因子,首次从宏观层面上,系统地分析互联网新闻文本信息对中国股市的影响。本文采用如下技术方案来研究新闻对股市的影响: (1)采用文本挖掘技术,量化定性新闻这种无结构的文本信息对股市的影响,量化结果作为定性新闻对股市影响的一个因子。此阶段涉及的文本挖掘技术有向量空间模型、TFIDF加权方法、特征降维、中文分词、支持向量回归等等。如何选择最优方法,提高量化结果的准确性,这是此阶段需要解决的问题,也本篇文章的关键点。本文根据股市特性,建立股市特有的特征词库来进行文本向量化,从而将无结构的文本信息转换为结构化的向量形式。在向量化过程中,本文采用TFIDF来进行特征加权,采用同义词词库进行特征降维,从而得到最终的新闻文本向量。然后采用支持向量回归来建立新闻文本向量与股票收益率之间的回归模型,用此模型来量化新闻对股市的影响,量化结果作为定性新闻影响股市的因子。 (2)将定性新闻对股市影响的因子与定量的影响股市的主要技术指标相结合,采用计量经济学的多元线性回归模型,依据各种假设检验来分析新闻是如何影响股市,影响的显著性等问题。具体而言,本文将量化后的新闻对股市影响的因子作为多元回归模型的解释变量之一,将股票累计异常收益率作为被解释变量,采用统计检验方法来检验多元回归模型的拟合优度、方程显著性和新闻等因子的显著性问题,从而具体分析新闻因子与股市波动之间的关系。 通过实验,我们发现:沪深两市上市公司的新闻报道后都会影响该上市公司的股票的波动,但对深市上市公司股票的影响要强于沪市股票,而且,沪市上市公司的新闻影响力度和持续时间均小于深市上市公司。同时,我们发现,新闻报道后沪市上市公司的收益明显受到公司规模的影响,经分析可得,对于规模越大的公司,新闻报道对其股票产生的影响越不明显,对于规模越小的公司,新闻报道对其产生的影响越大,且持续时间越长。 本文的创新之处可以从以下方面加以详述。 (1)本文从研究方法上来讲,创新之处在于:融合计算机领域的文本挖掘技术与经济学领域的计量方法,跨学科角度解决新闻与股市波动之间的关系问题。财经新闻内容中包含大量影响股市的信息,本文采用计算机领域中的文本挖掘技术来量化这些信息对股市的影响,并将量化结果作为影响股市收益率的一个指标因子,融合影响股市的几个主要技术指标,采用计量经济学中多元线性回归分析的各种假设检验方法,来分析新闻如何影响股市,影响持续时间以及影响强度等问题。 (2)本文从研究角度来讲,创新之处在于:目前大部分研究还主要集中在用新闻预测股价方面。本文利用文本挖掘技术和计量经济学方法,将新闻内容量化为影响股市波动的一个因子,系统分析互联网财经新闻对中国股市的影响。同时,中国股市分为沪深两市,但目前为止,很少有研究将沪深两市进行对比分析。本文致力于研究互联网财经新闻对沪市和深市股票产生的影响强度、影响周期是否一致等问题。 (3)本文从技术方面来讲,创新之处在于:针对股市特性,本文建立了股市专有的特征词以及同义词词库。在对新闻文本进行中文分词时,将股市特征词库加入分词字典,增加分词准确性。在用文本挖掘技术进行新闻文本向量化时,本文采用的方法是基于特征词库的向量化方法,同时根据同义词词库对文本向量化结果进行特征降维,从而得到一个较为合理的向量化结果。 本文的内容结构安排如下:第一部分介绍论文的研究背景、研究意义以及研究方法;第二部分对本文涉及的相关技术进行介绍,本文涉及两个领域的相关知识,故此部分按领域分别进行介绍;第三部分介绍实验过程所需数据的准备工作,本实验所需数据分为两大块,即新闻数据和股票交易日数据,故此部分分别介绍两块数据的获取以及预处理工作;第四部分介绍实验步骤以及实验结果;第五部分对整篇论文做总结以及展望。
【学位授予单位】:西南财经大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:F49;F832.51;F224

【引证文献】
中国期刊全文数据库 前2条
1 徐伟;李韵喆;;行业与个股新闻对股票价格影响的定量分析[J];财经界(学术版);2015年13期
2 陈茜;连婉琳;;基于文本挖掘技术的互联网股票新闻的情感分类[J];中国市场;2015年24期
中国硕士学位论文全文数据库 前10条
1 王世伟;基于深度学习的财经新闻对股市投资决策影响的研究[D];兰州财经大学;2018年
2 王璐;外部环境信息披露对上市公司股票价格波动的影响研究[D];浙江师范大学;2018年
3 张春雨;基于深度学习模型的证券价格预测实证研究[D];山西大学;2018年
4 杨博文;家庭财产对婚姻纠纷的影响[D];南京财经大学;2018年
5 张碌杰;互联网财经新闻与股价波动的关系研究[D];首都经济贸易大学;2017年
6 徐振敬;基于情感分析的国际原油价格走势预测研究[D];北京化工大学;2016年
7 邢世昌;基于神经网络的新闻舆情受欢迎程度预测研究[D];海南大学;2016年
8 杨慧;不同市态下媒体报道对上市公司股价波动影响的研究[D];兰州大学;2016年
9 戴成骏;基于文本情感分析的股价预测研究与实现[D];重庆大学;2016年
10 张昊;互联网财经新闻对股市影响效应的测度[D];浙江工商大学;2015年
【参考文献】
中国期刊全文数据库 前6条
1 赵静梅;何欣;吴风云;;中国股市谣言研究:传谣、辟谣及其对股价的冲击[J];管理世界;2010年11期
2 饶育蕾;王攀;;媒体关注度对新股表现的影响——来自中国股票市场的证据[J];财务与金融;2010年03期
3 赵伟;梁循;;互联网金融信息量与收益率波动关联研究[J];计算机技术与发展;2009年12期
4 杨继东;;媒体影响了投资者行为吗?——基于文献的一个思考[J];金融研究;2007年11期
5 徐筱凤,李寿喜;中国企业市盈率:理论分析与经验证据[J];世界经济文汇;2005年Z1期
6 何诚颖;中国股市市盈率分布特征及国际比较研究[J];经济研究;2003年09期
【共引文献】
中国期刊全文数据库 前10条
1 张纯;吴明明;;媒体在资本市场中的角色:信息解释还是信息挖掘?[J];财经研究;2015年12期
2 卞曰瑭;许露;;加权投资者关系网络的股市传闻扩散演化模型[J];重庆大学学报(社会科学版);2015年06期
3 凌玲;方军雄;;谁在购买媒体的有偿沉默?[J];会计论坛;2015年01期
4 史青春;周静婷;;市场传闻、澄清公告与股价波动[J];现代财经(天津财经大学学报);2015年11期
5 刘豪;胡艳;;媒体报道、投资者注意力与IPO抑价[J];财会月刊;2015年29期
6 陈鹏程;周孝华;;媒体报道影响询价机构的新股发行参与行为吗?[J];云南财经大学学报;2015年05期
7 吴健鹏;;投资者非理性偏好心理行为研究综述[J];中国市场;2015年38期
8 李小荣;罗进辉;;媒体关注与公司现金股利支付[J];经济理论与经济管理;2015年09期
9 王赟玥;;余额宝的现状与未来[J];中国市场;2015年36期
10 童颖;;社交媒体时代的资本市场——以企业信息披露制度为视角[J];农村经济与科技;2015年08期
【同被引文献】
中国期刊全文数据库 前2条
1 邹亚宝;;媒体对有限理性投资者投资行为的影响研究[J];金融教育研究;2012年05期
2 陈华;梁循;;互联网股票新闻归类和板块分析的方法[J];电脑开发与应用;2006年11期
中国硕士学位论文全文数据库 前10条
1 李蒙科;媒体负面报道对上市公司股价波动影响的实证研究[D];成都理工大学;2017年
2 张碌杰;互联网财经新闻与股价波动的关系研究[D];首都经济贸易大学;2017年
3 王莉;基于人工智能算法的股票价格波动规律预测方法研究[D];吉林大学;2016年
4 刘玺;基于BP神经网络的股价预测方法研究[D];北京交通大学;2016年
5 夏玲;重污染企业社会责任信息自愿披露的市场反应研究[D];辽宁科技大学;2016年
6 刘庆玲;基于模糊深度学习网络算法的短期股价预测[D];哈尔滨工业大学;2016年
7 俞福福;基于神经网络的股票预测[D];哈尔滨工业大学;2016年
8 张贵勇;改进的卷积神经网络在金融预测中的应用研究[D];郑州大学;2016年
9 张志华;基于深度学习的情感词向量及文本情感分析的研究[D];华东师范大学;2016年
10 戴成骏;基于文本情感分析的股价预测研究与实现[D];重庆大学;2016年
【二级引证文献】
中国硕士学位论文全文数据库 前10条
1 胡英;网络舆情视角下的“互联网+”行业发展趋势研究[D];首都经济贸易大学;2018年
2 王世伟;基于深度学习的财经新闻对股市投资决策影响的研究[D];兰州财经大学;2018年
3 杭葛烨;基于分解集成的医院诊疗人次预测研究[D];北京化工大学;2018年
4 赵亚晴;数据驱动的石油消费与价格预测研究[D];北京化工大学;2018年
5 张佳禹;基于深度学习算法的上市公司投资决策支持模型研究[D];辽宁师范大学;2018年
6 刘艺文;媒体股市报道的逆周期调节作用研究[D];南昌大学;2018年
7 杨宏磊;基于文本挖掘的股市舆情分析方法研究[D];哈尔滨工程大学;2018年
8 金星;投资者情绪对股票市场的预测研究[D];浙江工商大学;2018年
9 谭君如;规制媒体与股市关系的法律问题研究[D];海南大学;2017年
10 张碌杰;互联网财经新闻与股价波动的关系研究[D];首都经济贸易大学;2017年
【二级参考文献】
中国期刊全文数据库 前10条
1 杨继东;;媒体影响了投资者行为吗?——基于文献的一个思考[J];金融研究;2007年11期
2 许柳英,陈启欢;公众注意力影响买入行为吗?——基于投资者行为的分析[J];上海管理科学;2005年04期
3 徐筱凤,李寿喜;企业盈亏、流通股规模与股票定价——来自中国证券市场的经验证据[J];经济经纬;2005年01期
4 李寿喜;会计报表信息与股价相关性之中美差异比较[J];上海金融;2004年07期
5 吴意云;时间序列经济计量学:协整理论与ARCH模型——2003年诺贝尔经济学奖得主理论评介[J];浙江社会科学;2003年06期
6 范龙振,王海涛;上海股票市场行业与地区效应分析[J];系统工程学报;2003年02期
7 陈占锋;上海股票市场A股泡沫问题:市盈率测量与综合解释[J];世界经济;2002年07期
8 陈信元,陈冬华,朱红军;净资产、剩余收益与市场定价:会计信息的价值相关性[J];金融研究;2002年04期
9 李红刚,付茜;中国股票市盈率合理范围探析[J];改革;2002年02期
10 吴明礼;我国股市的市盈率结构分布和分析[J];数量经济技术经济研究;2001年05期
【相似文献】
中国期刊全文数据库 前10条
1 张如坤;;移动出版环境下财经新闻的变革[J];传播与版权;2018年08期
2 孔翔宇;毕秀春;张曙光;;财经新闻与股市预测——基于数据挖掘技术的实证分析[J];数理统计与管理;2016年02期
3 李丹丹;;“时、度、效”标尺在财经新闻报道中的实践[J];新闻前哨;2019年04期
4 肖鲁仁;杨子璇;;大数据背景下财经新闻的特质、问题及对策[J];湖南工业职业技术学院学报;2018年05期
5 柳青;;如何做好财经类新闻采编专业人才培养[J];采写编;2018年03期
6 宋昭勋;吴静;赵应春;;浅谈香港财经新闻发展阶段及其特点[J];新闻研究导刊;2017年23期
7 孙天一;;财经新闻对中国股市的影响[J];时代金融;2018年02期
8 张雨萌;;中学大众化视野下的财经新闻[J];财经界(学术版);2018年03期
9 刘桂平;;国内财经新闻教育师资述评[J];科技经济导刊;2018年13期
10 刘镇;;融媒时代打造“3D版”财经新闻之浅见[J];传播力研究;2018年09期
中国重要会议论文全文数据库 前10条
1 裴振霞;;英语财经新闻报道中的语法隐喻分析[A];福建省外国语文学会2009年年会暨学术研讨会论文集[C];2009年
2 莫林虎;王晓乐;;我国高校财经新闻教育创新的探索与实践——以中央财大财经新闻专业为例[A];新时期中国新闻学学科建设30年[C];2008年
3 苏培科;;财经记者要有公众意识和责任感——兼评2009年重大财经新闻事件与报道[A];新闻学论集(第23辑)[C];2009年
4 Steve H.Hanke;袁梦婷;;公私合作关系的前车之鉴:约翰劳与密西西比公司[A];《IMI研究动态》2018年第二季度合辑[C];2018年
5 雍益楚;;浅谈“大众化”视野下的财经新闻[A];《同行》2015年9月(上)[C];2015年
6 梁軍童;;基于评价理论级差系统的财经新闻翻译[A];东北亚外语论坛(2018 NO.4 总第8期)[C];2018年
7 王一诺;;浅谈财经新闻的故事化报道[A];《同行》2015年9月(上)[C];2015年
8 夏岩;;面对改变 共同成长[A];第九届中国期货分析师论坛专刊[C];2015年
9 常河;;新闻视觉传播时代的“东早模式”[A];完善图片机制、提高履职能力——第十届全国新闻摄影理论年会论文集[C];2004年
10 潘若愚;姚浩浩;朱克毓;;基于词频统计分析国内外文本挖掘的研究热点[A];第十二届(2017)中国管理学年会论文集[C];2017年
中国重要报纸全文数据库 前10条
1 撰稿 唐维 点评 蔡江伟;2017国际十大财经新闻[N];证券时报;2017年
2 本报记者 杜一娜;清华大学新闻与传播学院 培养懂财经更懂中国的专业人才[N];中国新闻出版广电报;2017年
3 国家互联网信息办公室网络新闻信息传播局副局长 刘冲;适应传播规律 增强财经新闻吸引力[N];中国新闻出版广电报;2016年
4 ;证券日报编辑部评选推出2016年中国十大财经新闻[N];证券日报;2016年
5 ;2016年十大海外财经新闻[N];中国证券报;2016年
6 本报见习记者 郝天韵;财经新闻如何修炼“上乘功夫”[N];中国新闻出版广电报;2017年
7 ;财经新闻要“对称”“对应”“对路”[N];中国新闻出版广电报;2015年
8 本报记者 李雪昆;财经新闻如何“追上”公众期待[N];中国新闻出版广电报;2015年
9 ;本报编辑部评出2003十大国际财经新闻[N];中国证券报;2003年
10 沈敏;一个财经新闻博主的生活[N];经济参考报;2012年
中国博士学位论文全文数据库 前10条
1 杨保达;全媒体时代电视财经新闻生产研究[D];复旦大学;2013年
2 石研;中国财经媒体传播失灵现象研究[D];武汉大学;2010年
3 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
4 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
5 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
6 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
7 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
8 胡庆辉;非稀疏多核支持向量机学习方法研究[D];武汉大学;2015年
9 孙宗海;支持向量机及其在控制中的应用研究[D];浙江大学;2003年
10 徐芳;航空影像分割的支持向量机方法[D];武汉大学;2004年
中国硕士学位论文全文数据库 前10条
1 赵丽丽;互联网财经新闻对股市影响的定量分析[D];西南财经大学;2012年
2 雍舜;基于财经新闻文本数据挖掘的股市预测研究[D];浙江财经大学;2019年
3 杨若涵;目的论视角下BBC财经新闻汉译实践报告[D];首都经济贸易大学;2018年
4 苏煜荣;议程设置与有限关注:财经新闻与股市波动关系研究[D];暨南大学;2018年
5 陈海文;面向金融品种价格预测的财经信息数据挖掘技术研究[D];国防科学技术大学;2016年
6 王世伟;基于深度学习的财经新闻对股市投资决策影响的研究[D];兰州财经大学;2018年
7 黄晨;FT中文网财经新闻报道研究[D];湖南大学;2017年
8 王婧;《新周刊》财经新闻报道研究(2007-2016)[D];黑龙江大学;2018年
9 李娜;中国财经新闻俄译研究[D];上海外国语大学;2018年
10 韩兴彩;财经新闻中“that”从句的汉译实践报告[D];大连海事大学;2017年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026