收藏本站
《江苏大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

SVDD算法研究及在信用卡欺诈检测中的应用

刘艳红  
【摘要】: 随着全球信用卡欺诈交易数量的惊人增长,信用卡欺诈手法的不断翻新,主要表现为:冒用他人信用卡交易和恶意透支、伪造信用卡诈骗、使用作废信用卡诈骗等,由此带来的损失也日益增加。如何能有效、快速、准确地识别出信用卡欺诈交易已成为目前金融界普遍关心的问题。 数据挖掘技术的应用为信用卡欺诈提供了智能型的检测方法。已有方法主要是将数据挖掘中的分类方法如贝叶斯算法、决策树算法和神经网络算法应用于信用卡欺诈检测模型中。基于这三类算法的欺诈检测模型存在以下问题:因为是有监督的欺诈检测,所以检测不出新类型的欺诈;建立模型所需数据集都属于银行的保密资料,所用的代表欺诈信息的数据很难找到;因为合法交易往往比欺诈交易多的多,所以存在严重的类别不平衡问题,这种不平衡会导致误分类,以至于分类精度不高。针对以上存在的问题,本文提出将单值分类方法一支持向量数据描述算法(Support Vector Data Description,SVDD)应用到欺诈检测模型的建立中。单值分类方法属于无监督分类方法,只用一类数据建模,能够检测出新类型的欺诈,并且也不存在类别不平衡问题。研究高效的SVDD方法、如何将该方法应用到欺诈检测模型中是本文研究的两个关键点。本文的工作如下: (1)对支持向量数据描述分类方法进行分析,指出SVDD方法的优缺点,分析了将其应用于信用卡欺诈检测模型建立中的优势和不足。 (2)提出一种k-means聚类与改进的SVDD算法结合的新的分类算法(KmD-SVDD)。基于分而治之并行计算的思想,先用k-means聚类将整个数据集划分为k个簇,再用改进的SVDD算法并行训练k个簇,最后再对获得的k个局部支持向量集训练,即得到最终的全局决策边界。讨论了聚类个数k对训练时间的影响,并给出了k的选择方法。在合成数据和实际数据集上的实验结果表明,所提算法具有高效率和高分类精度。 (3)提出基于蚁群算法的KmD-SVDD参数寻优方法。实验表明,KmD-SVDD算法中正则化参数C和核参数σ的确定对其性能影响很大,为进一步提高分类精度,将蚁群算法应用于KmD-SVDD参数的寻优中。首先由专家经验来确定这两个参数的有效位,C和σ在蚁群系统中由节点值体现,激素物质遗留在蚂蚁所走过的每个节点上,用k-fold交叉验证平均分类错误率作为目标函数值来更新信息素的浓度,这样搜索出来的最终路径代表模型此时具有最好的建模精度。与直接采用交叉验证方法比较,证明了该方法能够进一步提高分类精度。 (4)提出基于KmD-SVDD算法的两阶段信用卡欺诈检测模型。该模型利用整群有相似消费行为的持卡人来取代原先单一的持卡人,克服了采用单一持卡人时交易记录数据不足的缺陷。通过与其他模型比较,验证了该模型的有效性。
【学位授予单位】:江苏大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13

【引证文献】
中国博士学位论文全文数据库 前1条
1 牛晓辉;新农合住院费用的分析及异常值筛检方法研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前2条
1 冯凯;基于流形空间结构覆盖模式的一类目标分类算法研究[D];燕山大学;2012年
2 徐宇童;工况识别及阀门操作合理性可视化监测[D];北京化工大学;2013年
【参考文献】
中国期刊全文数据库 前3条
1 马良;全局优化的一种新方法[J];系统工程与电子技术;2000年09期
2 陈建;信用卡的反欺诈管理[J];中国信用卡;2005年08期
3 盛昭瀚,柳炳祥;一种基于粗集神经网络的欺诈风险分析方法[J];应用科学学报;2003年02期
【共引文献】
中国期刊全文数据库 前10条
1 夏晓;潘和平;;基于支持向量机的人民币兑美元汇率实证研究[J];管理学家(学术版);2010年08期
2 林大辉;陈秋妹;宁正元;;基于支持向量机的栗属树种分类研究[J];莆田学院学报;2009年05期
3 丁雪梅;陈贝贝;;基于标准数据集的异常检测技术综述与实验分析[J];莆田学院学报;2012年02期
4 宋婉娟;;基于支持向量机的手写数字串识别[J];湖北第二师范学院学报;2010年02期
5 沈乐平;黄维民;饶天贵;;基于支持向量机的上市公司违规预警模型研究[J];中大管理研究;2008年02期
6 孙蕾;温有奎;;一种改进的SVM算法在决策分析中的应用[J];情报理论与实践;2006年06期
7 葛永,陈建安;基于正交小波包和K-L变换的水声信号特征提取与识别[J];情报指挥控制系统与仿真技术;2005年02期
8 周永生;张肖斌;;基于支持向量机的雷达弹道外推方法仿真研究[J];指挥控制与仿真;2006年03期
9 熊杰;;基于D-S证据理论的机载雷达模糊识别方法[J];指挥控制与仿真;2006年04期
10 刘丙泉;梁静国;;FCM-SVM组合方法在不平衡信息识别中的应用[J];情报杂志;2008年12期
中国重要会议论文全文数据库 前10条
1 刘志斌;金连文;;候选字静态生成技术及其在两级LDA汉字识别中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
3 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 梁禹;王义刚;王娜;;基于支持向量机的电力电子电路故障诊断[A];第二十六届中国控制会议论文集[C];2007年
5 刘华;张建华;王娆芬;王行愚;;人机系统操作员功能状态的模糊聚类方法[A];第二十九届中国控制会议论文集[C];2010年
6 尹钟;张建华;;基于支持向量机方法的过程操作员功能状态分类[A];中国自动化学会控制理论专业委员会A卷[C];2011年
7 ;Data-driven Process Monitoring Method Based on Dynamic Component Analysis[A];中国自动化学会控制理论专业委员会B卷[C];2011年
8 晋朝勃;胡刚强;史广智;李玉阳;;一种采用支持向量机的水中目标识别方法[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
9 尹雪娇;;基于蚁群算法的故障诊断[A];创新沈阳文集(A)[C];2009年
10 江萍;;车牌分割中的阈值选择策略[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
4 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
5 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
6 乔小燕;基于生物形态学的赤潮藻显微图像分割与特征提取研究[D];中国海洋大学;2010年
7 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
8 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
9 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
10 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
2 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
3 廖甜甜;白细胞图像语义识别分类的研究[D];南昌航空大学;2010年
4 黄正荣;基于振动波的高速公路车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
5 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
6 刘桂珍;颅骨三维重建与信息提取[D];山东科技大学;2010年
7 刘志强;基于数据挖掘的客户行为分析和预测研究[D];山东科技大学;2010年
8 张海峰;空间三维信息重构与飞行器路径规划[D];山东科技大学;2010年
9 田文娟;基于支持向量机的人民币序列号识别方法的研究[D];山东科技大学;2010年
10 陈楠楠;互动音乐桌[D];山东科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 易红梅;张林秀;罗仁福;刘承芳;Scott Rozelle;;新型农村合作医疗:农民认知与受益调查[J];人口学刊;2011年01期
2 陈杰;日本的护理保险及其启示[J];市场与人口分析;2002年02期
3 刘本强;张祥东;;新农合运行中的问题及对策研究[J];时代经贸(中旬刊);2008年S4期
4 骆华萍;郜艳晖;张丕德;;多水平模型及其对肝癌患者住院费用影响因素的分析[J];数理医药学杂志;2010年01期
5 王斌会,陈平雁,郭祖超,徐勇勇;回归诊断中的图示模型及其应用[J];数理医药学杂志;1997年03期
6 赵良渊,王彤,何大卫;关于SAS与SPSS软件中的异常点诊断[J];山西医科大学学报;2002年04期
7 饶未欣;石油化工安全技术与环境风险评价[J];石油化工安全技术;2000年01期
8 王铁民;关键阀门安全附件现状与发展趋势[J];石油化工安全技术;2005年03期
9 孙玉叶;郝永梅;;化工安全生产实训基地建设初探[J];实验技术与管理;2009年01期
10 刘新春;袁乐平;;定额结算制度下基本医疗保险住院费用控制方案探析[J];实用预防医学;2007年01期
中国博士学位论文全文数据库 前5条
1 徐创洲;新型农村合作医疗医药费用控制研究[D];西北农林科技大学;2011年
2 黄光鑫;支持向量数据描述与支持向量机及其应用[D];电子科技大学;2011年
3 韩颖;新型农村合作医疗数据挖掘研究[D];山西医科大学;2009年
4 庄进发;基于模式识别的流程工业生产在线故障诊断若干问题研究[D];厦门大学;2009年
5 梅锋;基于核机器学习的高光谱异常目标检测算法研究[D];哈尔滨工程大学;2009年
中国硕士学位论文全文数据库 前10条
1 李超;河南省新型农村合作医疗不同阶段实施效果评价[D];郑州大学;2011年
2 杨振章;基于支持向量数据描述的分类识别算法研究[D];杭州电子科技大学;2009年
3 路亮;基于高维空间目标类几何覆盖模型的一类分类器研究[D];燕山大学;2010年
4 陈坚;杭州市住院医疗费用现况研究[D];浙江大学;2001年
5 肖锦铖;合肥地区不同人群住院费用结构分析与期望调查[D];安徽医科大学;2001年
6 邹宗峰;数据挖掘在制定病例组合住院费用控制方案中的应用[D];暨南大学;2003年
7 陈燕凌;综合医院单病种住院费用影响因素分析与控制研究[D];第三军医大学;2006年
8 赵晓华;新型农村合作医疗筹资与补偿水平对策研究[D];浙江大学;2006年
9 左磊;阳极焙烧炉故障预警方法研究[D];兰州理工大学;2007年
10 易晖;电子设备智能故障诊断系统的研究[D];燕山大学;2006年
【二级参考文献】
中国期刊全文数据库 前8条
1 梁艳春,周春光,李寿范;基于遗传算法的Rosenbrock函数优化问题的研究[J];软件学报;1997年09期
2 曾黄麟,曾谦;基于粗集理论的神经网络[J];四川轻化工学院学报;2000年01期
3 曲思韦;信用卡风险的有效化解[J];时代经贸;2004年06期
4 徐迪,马大军,李元熹;神经元网络在股价预测中的应用[J];系统工程理论与实践;1998年11期
5 张纪会,徐心和;一种新的进化算法——蚁群算法[J];系统工程理论与实践;1999年03期
6 陈雷;国际信用卡欺诈与预防[J];中国信用卡;2004年06期
7 淮金;揭示信用卡犯罪[J];云南金融;2004年03期
8 马良;来自昆虫世界的寻优策略——蚂蚁算法[J];自然杂志;1999年03期
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026