收藏本站
《华中科技大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

金融数据挖掘中的增量聚类算法及应用研究

孙小林  
【摘要】:传统的聚类分析方法一般都没有考虑大容量数据集合的问题,而数据挖掘技术在金融领域的研究重点之一就是如何从海量数据中高效率地获取知识;另外,传统聚类方法的研究多集中于数字属性的数据,而电汇数据中存在大量非数字属性以及具有多种特征的数据集合;聚类输出的结果不容易理解也是传统聚类分析方法的问题之一。因此,反洗钱系统中的聚类算法的研究主要集中在如何提高大型数据集合的聚类效率、如何处理具有各种特征的数据集合,如文档数据、分类数据等以及如何对聚类结果给出概念性解释。 国家外汇管理局决策支持系统已经着手研究在非现场监管系统中数据挖掘技术的应用。将大规模数据集合高效地划分为有意义的子集是金融数据挖掘的基本问题之一。由于数据采集时的随意性和不规则性,加上市场发展的渐进过程和管理制度的滞后,使得金融数据挖掘必须在缺少背景知识的情况下,处理属性类型复杂、有噪音及孤立点和不完整的数据。传统的BIRCH算法由于其增量特性适应于大型数据库,但是该算法利用的汇总信息的思想无法处理分类属性的数据;K-means算法虽然可以处理分类属性的数据但是由于其高昂的代价而无法适应于大型的数据库。笔者结合基于分类方法的K-means中心点算法以及基于层次方法的BIRCH增量算法提出核心树(Core-Tree)的思想来弥补两个算法的缺点,即:使用中心点的思想来表示BIRCH算法中汇总信息,利用类核心的思想来提高确定中心点的效率;与此同时,将基于概念模型的方法应用到聚类输出结果中,使输出结果被解释为可以理解的层次关系,从而改善提高该算法的输出质量。最后笔者提出了将核心树算法应用到国家外汇信息管理决策系统中的方案, 并通过实验证明了将该算法应用到金融数据挖掘中能够达到预期效果。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 骆世广;骆昌日;周自波;刘淳;;证券市场分析法在金融数据挖掘实验教学中的应用[J];高等函授学报(自然科学版);2011年05期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国硕士学位论文全文数据库 前1条
1 贾宏峰;ICA自适应算法及其在金融数据挖掘中的应用[D];大连理工大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978