收藏本站
《江苏大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

SVDD算法研究及在信用卡欺诈检测中的应用

刘艳红  
【摘要】: 随着全球信用卡欺诈交易数量的惊人增长,信用卡欺诈手法的不断翻新,主要表现为:冒用他人信用卡交易和恶意透支、伪造信用卡诈骗、使用作废信用卡诈骗等,由此带来的损失也日益增加。如何能有效、快速、准确地识别出信用卡欺诈交易已成为目前金融界普遍关心的问题。 数据挖掘技术的应用为信用卡欺诈提供了智能型的检测方法。已有方法主要是将数据挖掘中的分类方法如贝叶斯算法、决策树算法和神经网络算法应用于信用卡欺诈检测模型中。基于这三类算法的欺诈检测模型存在以下问题:因为是有监督的欺诈检测,所以检测不出新类型的欺诈;建立模型所需数据集都属于银行的保密资料,所用的代表欺诈信息的数据很难找到;因为合法交易往往比欺诈交易多的多,所以存在严重的类别不平衡问题,这种不平衡会导致误分类,以至于分类精度不高。针对以上存在的问题,本文提出将单值分类方法一支持向量数据描述算法(Support Vector Data Description,SVDD)应用到欺诈检测模型的建立中。单值分类方法属于无监督分类方法,只用一类数据建模,能够检测出新类型的欺诈,并且也不存在类别不平衡问题。研究高效的SVDD方法、如何将该方法应用到欺诈检测模型中是本文研究的两个关键点。本文的工作如下: (1)对支持向量数据描述分类方法进行分析,指出SVDD方法的优缺点,分析了将其应用于信用卡欺诈检测模型建立中的优势和不足。 (2)提出一种k-means聚类与改进的SVDD算法结合的新的分类算法(KmD-SVDD)。基于分而治之并行计算的思想,先用k-means聚类将整个数据集划分为k个簇,再用改进的SVDD算法并行训练k个簇,最后再对获得的k个局部支持向量集训练,即得到最终的全局决策边界。讨论了聚类个数k对训练时间的影响,并给出了k的选择方法。在合成数据和实际数据集上的实验结果表明,所提算法具有高效率和高分类精度。 (3)提出基于蚁群算法的KmD-SVDD参数寻优方法。实验表明,KmD-SVDD算法中正则化参数C和核参数σ的确定对其性能影响很大,为进一步提高分类精度,将蚁群算法应用于KmD-SVDD参数的寻优中。首先由专家经验来确定这两个参数的有效位,C和σ在蚁群系统中由节点值体现,激素物质遗留在蚂蚁所走过的每个节点上,用k-fold交叉验证平均分类错误率作为目标函数值来更新信息素的浓度,这样搜索出来的最终路径代表模型此时具有最好的建模精度。与直接采用交叉验证方法比较,证明了该方法能够进一步提高分类精度。 (4)提出基于KmD-SVDD算法的两阶段信用卡欺诈检测模型。该模型利用整群有相似消费行为的持卡人来取代原先单一的持卡人,克服了采用单一持卡人时交易记录数据不足的缺陷。通过与其他模型比较,验证了该模型的有效性。
【学位授予单位】:江苏大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13

【引证文献】
中国博士学位论文全文数据库 前1条
1 牛晓辉;新农合住院费用的分析及异常值筛检方法研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前2条
1 冯凯;基于流形空间结构覆盖模式的一类目标分类算法研究[D];燕山大学;2012年
2 徐宇童;工况识别及阀门操作合理性可视化监测[D];北京化工大学;2013年
【参考文献】
中国期刊全文数据库 前7条
1 王国胜,钟义信;支持向量机的若干新进展[J];电子学报;2001年10期
2 苗绘;信用卡欺诈及防范[J];金融教学与研究;2005年04期
3 张小云,刘允才;高斯核支撑向量机的性能分析[J];计算机工程;2003年08期
4 郭萌;王珏;;数据挖掘与数据库知识发现:综述[J];模式识别与人工智能;1998年03期
5 马良;全局优化的一种新方法[J];系统工程与电子技术;2000年09期
6 陈建;信用卡的反欺诈管理[J];中国信用卡;2005年08期
7 盛昭瀚,柳炳祥;一种基于粗集神经网络的欺诈风险分析方法[J];应用科学学报;2003年02期
【共引文献】
中国期刊全文数据库 前10条
1 王全凤;郑浩;;基于径向基函数神经网络的高层建筑结构选型[J];四川建筑科学研究;2010年05期
2 冀卫兴;陈忠海;方筝;;基于DE—BP算法的空调负荷预测研究[J];四川建筑科学研究;2010年05期
3 张根耀,李竹林,赵宗涛;遮挡情况下运动目标的跟踪[J];安徽大学学报(自然科学版);2003年03期
4 陈弋兰;王鸣;孙书诚;;朴素贝叶斯分类器的误差估计[J];安徽工程科技学院学报(自然科学版);2008年04期
5 张红涛;胡玉霞;张恒源;顾波;;储粮害虫图像识别中的特征压缩研究[J];安徽农业科学;2008年27期
6 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
7 张昭;何东健;;基于计算机视觉的竹块颜色分类方法研究[J];安徽农业科学;2010年26期
8 王婷婷;黄燕;;基于NC-SVM的酵母蛋白功能预测研究[J];现代农业科技;2011年07期
9 汪洁;朱军;;基于Linux的中文垃圾邮件过滤系统设计与实现[J];安徽农业大学学报;2011年02期
10 苏科;陈志彬;;基于BP神经网络的车牌识别系统[J];辽宁科技大学学报;2010年05期
中国重要会议论文全文数据库 前10条
1 刘志斌;金连文;;候选字静态生成技术及其在两级LDA汉字识别中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
3 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
4 梁禹;王义刚;王娜;;基于支持向量机的电力电子电路故障诊断[A];第二十六届中国控制会议论文集[C];2007年
5 刘华;张建华;王娆芬;王行愚;;人机系统操作员功能状态的模糊聚类方法[A];第二十九届中国控制会议论文集[C];2010年
6 尹钟;张建华;;基于支持向量机方法的过程操作员功能状态分类[A];中国自动化学会控制理论专业委员会A卷[C];2011年
7 ;Data-driven Process Monitoring Method Based on Dynamic Component Analysis[A];中国自动化学会控制理论专业委员会B卷[C];2011年
8 晋朝勃;胡刚强;史广智;李玉阳;;一种采用支持向量机的水中目标识别方法[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
9 尹雪娇;;基于蚁群算法的故障诊断[A];创新沈阳文集(A)[C];2009年
10 江萍;;车牌分割中的阈值选择策略[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
4 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
5 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
6 乔小燕;基于生物形态学的赤潮藻显微图像分割与特征提取研究[D];中国海洋大学;2010年
7 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
8 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
9 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
10 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
2 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
3 廖甜甜;白细胞图像语义识别分类的研究[D];南昌航空大学;2010年
4 黄正荣;基于振动波的高速公路车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
5 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
6 刘桂珍;颅骨三维重建与信息提取[D];山东科技大学;2010年
7 刘志强;基于数据挖掘的客户行为分析和预测研究[D];山东科技大学;2010年
8 张海峰;空间三维信息重构与飞行器路径规划[D];山东科技大学;2010年
9 田文娟;基于支持向量机的人民币序列号识别方法的研究[D];山东科技大学;2010年
10 陈楠楠;互动音乐桌[D];山东科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 湛勇;张滨;翟慎重;王黎;;新型农村合作医疗农民住院费用分析[J];重庆医学;2011年09期
2 陈启卷;张军仿;陈晓华;乔亮亮;郭江;;基于物联网的阀门智能系统研究与开发[J];水电自动化与大坝监测;2012年03期
3 耿技;印鉴;;改进的共享型最近邻居聚类算法[J];电子科技大学学报;2006年01期
4 李明霞;路莹;;基于声音识别的多阀门泄漏检测系统[J];大连工业大学学报;2008年01期
5 潘志松;陈斌;缪志敏;倪桂强;;One-Class分类器研究[J];电子学报;2009年11期
6 胡正平;贾千文;;基于SRM自组织多区域覆盖的可拒绝近邻分类算法研究[J];电子与信息学报;2009年02期
7 胡正平;许成谦;贾千文;;基于高维空间最小生成树自适应覆盖模型的可拒绝分类算法[J];电子与信息学报;2010年12期
8 余国先;张国基;韦佳;任亚洲;;一种基于多图的集成直推分类方法[J];电子与信息学报;2011年08期
9 周毕芬;;新型农村合作医疗制度的困境与出路[J];福建农林大学学报(哲学社会科学版);2008年01期
10 蒲晓丰;雷武虎;汤俊杰;黄涛;;基于带野值的SVDD的高光谱图像异常检测[J];光电工程;2010年12期
中国博士学位论文全文数据库 前5条
1 徐创洲;新型农村合作医疗医药费用控制研究[D];西北农林科技大学;2011年
2 黄光鑫;支持向量数据描述与支持向量机及其应用[D];电子科技大学;2011年
3 韩颖;新型农村合作医疗数据挖掘研究[D];山西医科大学;2009年
4 庄进发;基于模式识别的流程工业生产在线故障诊断若干问题研究[D];厦门大学;2009年
5 梅锋;基于核机器学习的高光谱异常目标检测算法研究[D];哈尔滨工程大学;2009年
中国硕士学位论文全文数据库 前10条
1 李超;河南省新型农村合作医疗不同阶段实施效果评价[D];郑州大学;2011年
2 杨振章;基于支持向量数据描述的分类识别算法研究[D];杭州电子科技大学;2009年
3 路亮;基于高维空间目标类几何覆盖模型的一类分类器研究[D];燕山大学;2010年
4 陈坚;杭州市住院医疗费用现况研究[D];浙江大学;2001年
5 肖锦铖;合肥地区不同人群住院费用结构分析与期望调查[D];安徽医科大学;2001年
6 邹宗峰;数据挖掘在制定病例组合住院费用控制方案中的应用[D];暨南大学;2003年
7 陈燕凌;综合医院单病种住院费用影响因素分析与控制研究[D];第三军医大学;2006年
8 赵晓华;新型农村合作医疗筹资与补偿水平对策研究[D];浙江大学;2006年
9 左磊;阳极焙烧炉故障预警方法研究[D];兰州理工大学;2007年
10 易晖;电子设备智能故障诊断系统的研究[D];燕山大学;2006年
【二级参考文献】
中国期刊全文数据库 前10条
1 王珏;Rough Set约简与数据浓缩[J];高技术通讯;1997年11期
2 马良;TSP及其扩展问题的混合型启发式算法[J];上海理工大学学报;1999年01期
3 郑洪源,周良,丁秋林;神经网络在销售预测中的应用研究[J];计算机工程与应用;2001年24期
4 赵明旺;连续可微函数全局优化的混合遗传算法[J];控制与决策;1997年05期
5 梁艳春,周春光,李寿范;基于遗传算法的Rosenbrock函数优化问题的研究[J];软件学报;1997年09期
6 曾黄麟,曾谦;基于粗集理论的神经网络[J];四川轻化工学院学报;2000年01期
7 曲思韦;信用卡风险的有效化解[J];时代经贸;2004年06期
8 徐迪,马大军,李元熹;神经元网络在股价预测中的应用[J];系统工程理论与实践;1998年11期
9 张纪会,徐心和;一种新的进化算法——蚁群算法[J];系统工程理论与实践;1999年03期
10 陈雷;国际信用卡欺诈与预防[J];中国信用卡;2004年06期
【相似文献】
中国期刊全文数据库 前10条
1 张春生,王秀美;实时性欺诈检测系统的设计与实现[J];计算机工程与应用;2005年16期
2 杨彦;周翔;周竹荣;;一种校园卡欺诈检测模型[J];计算机工程;2011年12期
3 黄晓辉,张四海,王煦法;基于免疫网络的分类应用于审计欺诈检测[J];计算机工程与应用;2005年29期
4 童新安;刘永;王云鹏;;可视化数据挖掘在信贷欺诈检测中的应用[J];宜春学院学报;2010年04期
5 郭涛;李贵洋;;信用卡欺诈行为多层动态检测模型[J];微计算机信息;2009年12期
6 张克涵;吴迪;李爱国;宋保维;;基于贝叶斯分类器的报税欺诈检测[J];计算机仿真;2010年09期
7 李晓妹;;数据挖掘在金融欺诈检测中的应用[J];知识经济;2011年13期
8 应维云;覃正;李秀;;面向客户全生命周期价值的客户行为分析决策支持研究[J];情报杂志;2008年06期
9 徐永华;;基于支持向量机的信用卡欺诈检测[J];计算机仿真;2011年08期
10 王世卫;李爱国;;基于SVM的报税欺诈检测[J];计算机工程;2006年09期
中国重要会议论文全文数据库 前10条
1 王世卫;李爱国;;报税欺诈检测研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年
2 章林柯;何琳;阎兆立;程晓斌;;声学故障的SVDD评估方法研究[A];2011'中国西部声学学术交流会论文集[C];2011年
3 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
4 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
5 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
6 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
7 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
8 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
9 朱孝开;杨德贵;;基于多层SVDD的模式识别方法[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
10 陆维权;;数据挖掘在肿瘤患者住院费用研究中的应用[A];第十九届全国肿瘤医院管理学术研讨会论文汇编[C];2009年
中国重要报纸全文数据库 前10条
1 王芳;RSA被评网络欺诈检测领域领导者[N];中国企业报;2009年
2 晓国;靠数据挖掘留住客户[N];中国计算机报;2002年
3 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
4 张立明;数据挖掘之道[N];网络世界;2003年
5 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
6 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
7 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
8 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
9 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
10 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
中国博士学位论文全文数据库 前10条
1 方景龙;基于SVDD的单/多示例学习研究[D];浙江工业大学;2011年
2 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
3 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
4 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
5 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
6 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
7 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
8 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
9 许兆新;基于元知识的数据挖掘系统研究[D];哈尔滨工程大学;2003年
10 刘强;心气虚证的数据挖掘和网络结构研究[D];湖南中医学院;2003年
中国硕士学位论文全文数据库 前10条
1 刘艳红;SVDD算法研究及在信用卡欺诈检测中的应用[D];江苏大学;2010年
2 杨彦;一种校园卡欺诈检测模型研究[D];西南大学;2012年
3 李传亮;基于SVDD和参数辨识的模拟电路故障诊断方法研究[D];南京航空航天大学;2011年
4 龙哲;基于SVDD的多示例学习方法的研究[D];杭州电子科技大学;2012年
5 杨玺;基于支持向量机的信用卡欺诈检测研究[D];四川师范大学;2008年
6 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
7 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
8 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
9 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
10 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026