收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用

王珊珊  
【摘要】:随着新闻在金融工具交易算法中变的越来越重要,金融行业观察者,投资者和其它的金融分析家对新闻给予了更多的关注。一些金融服务公司为此设立了特定的服务,用来帮助用户过滤一些不相关的新闻和文本文档信息譬如证交所的条例规定信息等。除了金融服务公司以外,一些新闻发布商同样为用户提供了类似的服务,尽管如此,提供给用户的过滤后的新闻信息仍然需要人的判断处理以便进一步发现新闻内容对金融市场的意义,对于特定交易的金融工具需要进一步区分哪些是重要的新闻,哪些是不重要的新闻,并判断每类重要新闻对该金融工具市场走势的影响极性。但是这些人工的处理判断通常会受到自身信息处理能力的局限性以及认知的偏见性的影响。 因此,为了用户能够在金融市场中对新闻信息进行更客观的判断,降低人工处理对信息判断的影响,我们设计了一个基于本体论模型的数据挖掘框架,这个框架用来客观的,量化的描述新闻与金融工具交易活动之间的关系。框架包含两个相互关联的部分:一部分是一个本体论模型,主要用于表达金融工具市场中的新闻知识。这一模型又由两个部分组成,其中一部分是一个用OWL DL语言表达的模型(OWL DL是Web本体论语言的一个子语言),这一部分主要描述了领域知识的层级结构,包括新闻、金融工具市场参与者、金融工具及其他们之间的关系。同时这部分也对领域知识中的某些特定词汇给了明确的定义。另外一个部分是一个因果关系图,用来说明新闻对金融工具存在着直接或间接的“因-—果”影响模式,这些影响模式可以用OWL规则语言写入。另一部分是基于这个本体论模型的一个数据挖掘框架,这个框架由三部分组成:第一部分是本体论模型在protégé工具中的实现,被用来依据金融工具的特性和新闻的分类对将要处理的新闻和金融数据进行分类处理;第二部分是一个规则推理系统,在protégé中的jess插件中实现。对于某个给定的金融工具交易活动,这个推理系统可以推荐给用户哪些是可能重要的新闻,并产生对这个金融工具进行数据挖掘的一个模型;第三部分是一个贝叶斯网络算法,是通过结合分类处理后的金融和新闻数据以及对应的数据挖掘模型而产生的一个算法,这个算法精确的计算出了那些可能重要的新闻与某种金融工具交易活动之间存在的量化关系。 这个论文中的研究主要有以下主要贡献: 1)在本体论模型的基础上,有三个子贡献,首先,可以更深刻的理解金融工具市场中的新闻知识;第二,可以帮助建立基于新闻的金融交易模型或算法;第三,可以辅助和支持相关系统的开发与设计(譬如根据新闻对股票价格进行预测的系统,帮助金融市场参与者搜索相关新闻的系统等)。 2)在基于本体论模型的数据挖掘框架上,这个研究提供了:1.一个用来处理不同类的新闻或来自不同行业间的、不同特性的金融数据的本体论模型方法; 2.一个用来把领域知识结合到整个数据挖掘过程中的推理系统,其产生的数据挖掘模型包含了对某个金融工具的交易活动重要的新闻变量以及这些新闻对该活动的影响性(“正的”,“中性的”,“负的”);3.对这个数据挖掘框架的实验评价,以便验证该框架的有效性。 尽管论文中给出了如何定量、定性的学习新闻与金融工具之间的关系的方法,但仍然有一些不足。因此,后续的研究有两个可能的方向:一是雇佣有投资经验的投资者参与评估试验,利用框架给出的数据结果作决策,验证框架是否有效,数据结果是否能帮助投资者减少由于主观认知的偏见性而造成的损失。但是这个研究方向有一些不可避免的困难,因为有经验的投资者很难被集中起来进行试验;另外一个可能的研究方向是开发一个系统,用框架中给出的数据结果作为输入支持投资者对实时新闻做出及时的交易决策。一些决策理论将会指导如何开发这类系统。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 华武;抓好重大题材 扩大报道领域——’95江西电视奖新闻类作品评选综述[J];声屏世界;1996年05期
2 张志安;对比中美杂志 再探市场空间[J];CO.公司;2003年11期
3 纪斌斌;求变 创新 提升——2003年度江苏省广播电视奖新闻类参评节目综述[J];视听界;2005年02期
4 胡晓新;;让城市“文脉”在晚报中凸现——《宁波晚报》创新“文化特色新闻”的实践[J];新闻记者;2006年05期
5 楚桥;;贵州电视台:《百姓关注》撬动本地销售力[J];大市场(广告导报);2006年05期
6 吴丹琦;;新闻类方言节目的创新[J];视听纵横;2009年03期
7 张秋野;王力劭;丁鹏;;连续语音识别网格技术在新闻制播平台的应用[J];电视技术;2010年02期
8 杨国清;试析新闻类电视节目主持人的培养[J];视听界;2001年04期
9 郑越华;;民生新闻“破茧”之策[J];中国记者;2008年05期
10 韩娇;中国新闻类期刊的软肋[J];出版参考;2004年34期
11 杨改学;新闻类电视节目的生命力[J];当代电视;2003年05期
12 ;从零售监测数据透视新闻类杂志的发展[J];传媒;2004年08期
13 欧阳明;中国新闻类期刊提升国际竞争力的三大途径[J];编辑之友;2003年05期
14 邹荫辛;试谈中国特色的新闻类主持人节目[J];中国广播电视学刊;1996年05期
15 尼珍;新闻语体成语运用失误举隅[J];阅读与写作;2003年08期
16 ;2004年6月社会新闻类报刊广告投放监测[J];传媒;2004年08期
17 新航标;;喜欢的新闻靠前站[J];电脑迷;2009年05期
18 张华;让经济新闻类报纸版面深、软、活[J];报刊之友;2003年02期
19 潘远发;;新闻类栏目不宜滥用“精彩”一词[J];电视研究;2006年01期
20 王锵,石纯一;一种因果推理形式[J];软件学报;1997年04期
中国重要会议论文全文数据库 前3条
1 舒蔡菊;刘晋;;基于系统动力学的动物学习过程分析[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
2 黄静怡;黄秀清;;网间结算费用对当前电信市场格局的影响预测[A];融合与创新——中国通信学会通信管理委员会第29次学术研讨会论文集[C];2011年
3 孙文杰;魏现杰;卞真林;;作战仿真中C~3I系统的建模与仿真研究[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 王珊珊;知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用[D];中国科学技术大学;2009年
2 谷勇浩;信息系统风险管理理论及关键技术研究[D];北京邮电大学;2007年
3 蔡玮;新闻类语篇研究的语体学意义[D];复旦大学;2004年
4 黄聿清;两岸电视观众收视行为之研究[D];复旦大学;2006年
5 王翠霞;农村生猪养殖区域生态系统管理的反馈仿真及应用研究[D];南昌大学;2008年
6 王伟;电网投资规划的系统动力学建模与中压配电网络结构优化[D];华北电力大学(北京);2007年
7 张晓慧;我国油气资源——社会经济系统协调发展研究[D];中国石油大学;2008年
8 黄小军;旅游服务供应链协调机制与整体优化研究[D];南昌大学;2009年
9 王桂森;企业IT服务外包风险控制模型研究[D];哈尔滨工业大学;2011年
10 张青敏;移动商务信息扩散及其对价值链的影响研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 陈洁娜;中国新闻类杂志的市场分析与发展对策[D];暨南大学;2003年
2 王婷婷;我国电视新闻类主持人节目的审美研究[D];河北大学;2004年
3 马亚梅;可持续发展网络群体认知的模型研究[D];昆明理工大学;2010年
4 陆伟忠;基于本体论的信息检索框架[D];武汉大学;2005年
5 李志刚;基于DEMATEL的制造业企业动态平衡计分卡的应用研究[D];哈尔滨理工大学;2009年
6 杨颖策;基于CDG的核动力装置警报分析方法研究[D];哈尔滨工程大学;2008年
7 徐增展;我国新闻类期刊的发展探析[D];广西大学;2006年
8 王荣辉;区域交通与经济产业结构关系研究[D];北京交通大学;2007年
9 石莉;定性推理在概念设计中的应用研究[D];西安电子科技大学;2001年
10 王一如;《环球》杂志评析[D];河南大学;2006年
中国重要报纸全文数据库 前10条
1 商报记者 李鹏 采写 整理;新闻类杂志数字化生存[N];中国图书商报;2010年
2 萧笑;新闻类杂志将走向哪里?[N];中国图书商报;2008年
3 刘静;新闻类图书的现状与方向[N];中国新闻出版报;2006年
4 陈万琼;非新闻类版面拉动市场的实现途径[N];中华新闻报;2006年
5 韩春秒;手机报新闻类信息的传播误区及规避方略[N];中华新闻报;2007年
6 记者吴重生 实习生许冰冰;浙江新闻界“出书热”方兴未艾[N];中国新闻出版报;2011年
7 黄文;非洲照片拍得比亚洲照片好[N];中国摄影报;2006年
8 本报记者 郑丽君;全球年度图片奖(POYI):平中见奇阿里克西亚摄影基金:静心之作[N];中国摄影报;2010年
9 李鹏;期刊人眼中的期刊职场[N];中国图书商报;2007年
10 记者 苏应奎通讯员 王英芳;云南着力规范城市报纸广告秩序[N];中国新闻出版报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978