收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于可疑金融交易识别的离群模式挖掘研究

汤俊  
【摘要】: 本文的选题来源于对可疑金融交易行为的识别与监控理论原型体系研究。主要研究内容是利用机器学习和系统复杂性的理论和方法,从海量和复杂的金融交易数据中学习和识别客户金融交易的行为模式,从而挖掘出那些明显偏离正常行为范式的所谓离群模式,实现对涉嫌洗钱或欺诈的可疑金融交易行为的计算机自动甄别和监管。 金融系统是一个非常复杂的大系统,一直以来对金融系统可疑交易判断的研究采用的大多是线性化和在严格假设条件下的简化模型,这样的确使问题得到了简化,但在实践过程中却导致高漏检率和高误报率。 本文根据金融交易的非线性机制,引入了基于系统复杂性理论的混沌分析方法,对由内在确定动力学机制产生的具有外部随机性特征的金融交易时间序列进行分析和判别,主要研究成果与创新如下: (1)金融交易的混沌属性分析 混沌行为是由确定性系统产生,但其行为却表现为类似随机的,具有短期可预测但长期不可预测的特性。本文利用相空间重构理论实现对金融时间序列的混沌属性分析,采用互信息法计算出最优时延,假近邻法计算最优嵌入维,轨道跟踪法求取最大Lvapunov指数,基于真实数据的实验结果表明,金融交易时间序列存在有限的关联维和一个正的最大Lyapunov指数,证实了对金融交易数据的时间序列进行混沌方法建模的可行性。 (2)基于混沌原理的金融交易行为产生机制识别 本文提出利用对金融交易行为的机制进行识别以获得对离群交易行为的预测。混沌数据所具有的短期可预测性为混沌背景中的细微差别行为检测提供了新思路。本文基于Takens定理重构混沌背景信号相空间,采用RBF神经网络对正常金融交易数据建立预测模型,以此对可疑金融交易数据进行预测,由于正常金融交易与可疑金融交易内在产生机理存在本质差异,因此可疑金融交易必然存在较大的预测误差。通过理想混沌时间序列与实际金融数据的仿真实验表明,基于混沌的误差检测方法对于离群模式能够有效检出。 (3)金融数据的特征提取与相似性度量 特征提取的目的是获得能够被机器识别的数学特征。区别于传统的金融时间序列的相似性度量方法,提出了一种基于RBF神经网络一步预测误差序列特征提取与相似性度量方法。该方法将时间序列之间的相似性度量换化成特征矢量之间的相似性度量,且特征矢量综合考虑了连续的时域功率特征和离散的客户背景特征。实验证明该方法相对于传统的直接距离、傅立叶变换、ARMA模型法具有明显优势。同时为了解决可疑交易数据分类中的异构数据集相似性度量问题,提出采用异构特征向量的距离度量函数HVDM以满足支持向量机自动分类要求。 (4)基于一类支持向量机的离群分类判别 针对金融交易数据量大、无训练集的特点,利用基于统计学习理论的一类支持向量机实现基于无监督的离群分类。最后用基于异构数据集距离度量HVDM的RBF形核函数,训练一类支持向量机,仿真数据以及实际金融数据的离群检测实验证明了该方法的有效性。 通过上述四步前后相互衔接、具有严密逻辑联系的离群模式挖掘工作,构成了一套具备针对复杂金融交易行为内在细微机制差别的离群模式完整挖掘体系,这一体系还可推广应用于信号处理、网络入侵检测、危机预警、健康普查、财务审计、电子商务等众多应用领域。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张焱,欧阳一鸣,王浩,汪曦东;数据挖掘在金融领域中的应用研究[J];计算机工程与应用;2004年18期
2 贾纳豫;试论数据挖掘与机器学习、统计学、数据库的关系[J];玉溪师范高等专科学校学报;2000年04期
3 王涛;;遗传算法及其应用[J];新乡学院学报(自然科学版);2008年01期
4 周志华;;通过集成学习进行知识获取[J];重庆邮电大学学报(自然科学版);2008年03期
5 马世欢;张今;;一种基于遗传算法的优化分类器方法[J];襄樊职业技术学院学报;2008年06期
6 许孝元;韩国强;闵华清;;多步原子规则的大规模关联分类[J];控制理论与应用;2007年03期
7 邓甦;付长贺;;四种贝叶斯分类器及其比较[J];沈阳师范大学学报(自然科学版);2008年01期
8 郭萌;王珏;;数据挖掘与数据库知识发现:综述[J];模式识别与人工智能;1998年03期
9 方晓彤,陈国龙,叶文辉;基于关联度分析的遗传算法研究及其应用[J];计算机应用研究;2005年09期
10 徐宏宁;李代平;何利明;熊建斌;;银行反洗钱系统的研究[J];微型机与应用;2010年09期
11 何国辉;吴礼发;;基于机器学习的文本分类技术的研究[J];计算机与现代化;2009年08期
12 朱明;王俊普;;一种聚类学习的新方法[J];模式识别与人工智能;2000年03期
13 王强;沈永平;陈英武;;支持向量机规则提取[J];国防科技大学学报;2006年02期
14 田密;孟志青;李向军;彭丽芳;姜华;;一种基于SOM单属性时态特征聚类的方法[J];西安文理学院学报(自然科学版);2006年02期
15 徐从富;陈峰;范晶;;人工智能若干前沿技术及其在信息对抗中的应用展望[J];通信对抗;2007年03期
16 李思广;周雪梅;;基于机器学习的入侵检测系统[J];硅谷;2008年08期
17 刘在强;林东岱;冯登国;;一种用于网络取证分析的模糊决策树推理方法(英文)[J];软件学报;2007年10期
18 亢俊健;杜在林;张新东;朱群英;;使用信息增益方法选择分类器[J];计算机工程与应用;2009年14期
19 龙文;马坤;辛阳;杨义先;;适用于协议特征提取的关联规则改进算法[J];电子科技大学学报;2010年02期
20 李文斌;陈嶷瑛;张娟;张新东;;使用Fisher线性判别方法的提取分类器[J];计算机工程与应用;2010年14期
中国重要会议论文全文数据库 前10条
1 汤俊;;自适应反洗钱辅助信息系统开发框架设计[A];第10届计算机模拟与信息技术会议论文集[C];2005年
2 关雪飞;杨军;马小兵;;决策树在航空发动机状态数据分析中的应用[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
3 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
4 姜达维;;体育统计与数据挖掘:区别、联系与融合[A];第七届全国体育科学大会论文摘要汇编(二)[C];2004年
5 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
6 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
7 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
8 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
10 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 汤俊;基于可疑金融交易识别的离群模式挖掘研究[D];武汉理工大学;2007年
2 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
3 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
4 黄静华;支持向量机算法研究及在气象数据挖掘中的应用[D];中国矿业大学(北京);2011年
5 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
6 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
7 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
8 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
9 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
10 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 向光;基于机器学习和数据挖掘的入侵检测技术研究[D];东北大学;2005年
2 叶文辉;基于关联的遗传算法的研究及应用[D];福州大学;2004年
3 刘孟旭;基于EP的多分类器表决分类算法[D];郑州大学;2004年
4 曹倬瑝;基于数据挖掘的设备故障诊断[D];北京化工大学;2005年
5 那力嘉;基于个人信息管理的邮件处理系统[D];天津大学;2004年
6 樊聪;利用web抽取双语翻译对的研究与实现[D];重庆大学;2007年
7 顾雅枫;基于用户兴趣模型的信息检索研究[D];兰州大学;2009年
8 滕月阳;数据挖掘中若干数学模型与算法研究[D];大连理工大学;2005年
9 祝好;基于机器学习的P2P流量识别[D];北京邮电大学;2010年
10 刘勤;数据挖掘在H08小型电子变压器质量管理中的应用[D];电子科技大学;2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 张凤喜;反洗钱 一条看不见的战线[N];中国国门时报;2004年
3 ;央行欲参加反洗钱组织特别评估[N];财会信报;2005年
4 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
5 喻敬明;反洗钱全球行动[N];金融时报;2001年
6 刘维云;反洗钱 金融机构该做些什么[N];联合日报;2005年
7 陈玲;做好“六个强化” 履行反洗钱义务[N];中国城乡金融报;2007年
8 文一;明年反洗钱工作从七方面入手[N];国际商报;2006年
9 雷和平 姬宜平;基层反洗钱:“单兵”难胜[N];金融时报;2006年
10 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978