收藏本站
《华中科技大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于粗糙集和聚类的数据挖掘算法及其在反洗钱中的应用研究

陈云开  
【摘要】: 数据挖掘的任务是发现大量数据中尚未被发现的知识,特别是一些隐藏在大量数据中的关系和趋势。数据挖掘技术的这一特点和功能正是反洗钱监测分析系统所需求的。数据挖掘中的多种算法,在反洗钱领域都有着良好的应用前景。利用数据挖掘技术进行反洗钱数据监测和分析,是国内外研究的一个热点。因此,研究适合金融交易数据特点的关键的数据挖掘算法,并运用到中国反洗钱系统建设中,具有十分重要的理论研究和实际应用价值。 粗糙集理论是处理模糊和不确定知识的一种数学工具,已在人工智能与知识发现,模式识别与分类,故障检测等方面得到了较好应用。给出了基于粗糙集的挖掘算法生成决策模型,用于判定交易是否可疑。该算法首先实现属性约简,形成分辨矩阵,然后从中发现规则,这一算法适用于决策属性和分类属性依赖关系不明确、给定数据不完备的情况。 考虑到高维空间中数据分布较稀疏的特点,常用聚类算法多用数据之间的距离尺度来衡量数据间的相似度,然后聚类,不能产生很好的聚类效果。给出基于超图的聚类算法,把一个求解高维空间聚类问题转换为一个超图分隔寻优问题,高维空间的关系转化成超图,用超边的权重来描述空间点间的关系。对超图的分割实际上就是聚类的过程,将权重大的超边中包含的数据点尽量放在一个类中,同时使被切割的超边权重之和最小。不需要对数据集事先进行降维,即可完成聚类过程。能有效祛除噪声点,在高维空间获得较好的聚类结果。 针对传统聚类算法难以解释其聚类结果的问题,通过语义中心对聚类结果进行概念描述,使语义中心在最大限度上反映类簇的特征。由于分类型数据在金融数据中占着较大的比重,概念聚类相比传统基于数值型数据的聚类能够更好地适应分类数据。给出的基于解释规则的增量概念聚类算法能够给出聚类结果的大致涵义,并能够通过概念与属性之间的确信因子和包容因子的计算生成规则,在更深层度上挖掘隐含信息。 在上述研究基础上,根据我国具体的反洗钱的具体情况,借鉴美国、加拿大、澳大利亚等国反洗钱系统建设的成果和经验,研究适合中国国情的反洗钱信息系统。在分析了反洗钱系统的建设背景、已有的信息化基础的基础上,确定了系统的建设目标,设计了反洗钱系统的总体框架,包括信息辅助核查平台、检测分析平台、反洗钱数据挖掘平台三大部分。 基于上述理论和研究成果,结合数据集成与交换、数据仓库和OLAP技术,开发和实现了一个反洗钱信息系统,已成功应用于国家外汇管理局反洗钱实际应用,并在全国推广。该系统是我国研制的第一个专业化、智能型的反洗钱信息管理系统,实现并加强对反洗钱数据的分析和处理,提高反洗钱工作的效率和质量,取得满意的效果。该项目获中国人民银行2006年银行科技发展奖二等奖。
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP311.13

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 杨胜刚;王鹏;;基于数据挖掘技术的人民币反洗钱系统设计[J];财经理论与实践;2005年06期
2 许小满,孙雨耕,杨山,黄汝激;超图理论及其应用[J];电子学报;1994年08期
3 徐志春,肖伟平,何宏;数据开采技术在反洗钱系统中的应用[J];湖南工程学院学报(自然科学版);2003年03期
4 刘杰;中国金融业:反“洗钱”风暴在行动[J];改革与理论;2000年07期
5 张燕玲;金融业反洗钱问题研究[J];国际金融研究;2002年11期
6 朱之伟;基于数据大集中构建反洗钱系统[J];华南金融电脑;2005年05期
7 孙莹莹;姚文辉;;数据挖掘技术在反洗钱系统中的应用[J];华南金融电脑;2006年04期
8 陈凌;;浅谈数据挖掘技术在反洗钱系统中的应用[J];华南金融电脑;2006年08期
9 王红新;王静;王业丹;;反洗钱信息系统的建设[J];华南金融电脑;2006年10期
10 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
中国博士学位论文全文数据库 前1条
1 李刚;知识发现的图模型方法[D];中国科学院软件研究所;2001年
【共引文献】
中国期刊全文数据库 前10条
1 秦洪英;数据挖掘在网络业务流设计中的实现过程[J];阿坝师范高等专科学校学报;2005年03期
2 孙娜;;基于数据仓库技术的电力设备决策系统[J];安徽电气工程职业技术学院学报;2010年01期
3 于海涛;Rough集理论在数据约简中的应用[J];安徽教育学院学报;2004年03期
4 朱文婕;数据仓库技术及应用[J];安徽电子信息职业技术学院学报;2004年Z1期
5 尹荣章,郑诚;一个基于关系数据库的联机分析处理系统的设计与实现[J];安徽大学学报(自然科学版);2001年01期
6 程家兴,钱付兰;粗糙集方法在基于属性分类中的应用[J];安徽大学学报(自然科学版);2005年01期
7 杨萍,杨明;基于VPRS的重要属性评价方法研究[J];安徽工程科技学院学报(自然科学版);2003年01期
8 秦宗贵;;OLAP技术及其在电信行业中的应用[J];安徽科技;2006年06期
9 王正德;杜瑞卿;庞发虎;刘广亮;;粗糙集聚类分析对姜黄属植物数值分类的研究Ι[J];安徽农业科学;2006年17期
10 仲红,谢荣传;基于Web的数据仓库[J];安徽师范大学学报(自然科学版);2002年02期
中国重要会议论文全文数据库 前10条
1 宋亚男;刘春和;李新俊;齐俊臣;;导弹贮存可靠性数据仓库的研究与设计[A];中国电子学会可靠性分会第十三届学术年会论文选[C];2006年
2 方炜炜;杨炳儒;彭珍;;一种基于粗糙集的启发式属性归约的新算法[A];第二十七届中国控制会议论文集[C];2008年
3 杨秀萍;;经济金融安全与商业银行反洗钱[A];科学发展与社会责任(B卷)——第五届沈阳科学学术年会文集[C];2008年
4 杨静;;基于数据仓库决策分析的电力系统应用研究[A];安徽省电机工程学会优秀学术论文集(2002-2003)[C];2005年
5 邹刚;滕书华;孙即祥;陈森林;敖永红;;一种粗糙集优化协同原型模式约简分类方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
6 杨真;李也白;籍志兵;常一帆;;数据分析技术在商品销售中的应用研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
7 阮鸣梁;陈维默;;数据挖掘技术的发展与应用[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
8 张帆;余开朝;;数据仓库在CRM系统中的应用研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
9 欧晓鸥;王志立;邵发森;;一种基于数据集市的产品设计知识处理方法[A];全国先进制造技术高层论坛暨第七届制造业自动化与信息化技术研讨会论文集[C];2008年
10 吴泽雄;;数据仓库浅谈[A];海南省通信学会学术年会论文集(2005)[C];2005年
中国博士学位论文全文数据库 前10条
1 杨锦园;基于传感器管理的移动机器人融合算法研究[D];华中科技大学;2010年
2 刘美;WSN多目标跟踪节点任务分配及跟踪算法研究[D];华南理工大学;2010年
3 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年
4 单玉红;基于土地生态位和多主体的城市居住空间演化情景模型研究[D];武汉大学;2009年
5 赵娜;基于知识地图的多领域本体语义互联研究[D];吉林大学;2011年
6 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
7 于秀娟;加工过程的质量异常预测与诊断方法研究[D];吉林大学;2011年
8 王辉;珠三角花岗岩残积土边坡稳定性分析及非线性预测[D];吉林大学;2011年
9 杨婷婷;基于数据的电站节能优化控制研究[D];华北电力大学(北京);2010年
10 柯硕灏;配网故障自诊自愈新原理与新方法研究[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
2 黄惠莉;离岸公司涉外投资法律问题研究[D];华东政法大学;2010年
3 庞岱军;泰安市农村信息服务平台建设研究[D];山东农业大学;2009年
4 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
5 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
6 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
7 王玉波;基于基本概率赋值调整的数据融合方法及应用[D];大连理工大学;2010年
8 刘莹;不一致决策表的属性约简与规则获取研究[D];大连理工大学;2010年
9 龚健;数据挖掘技术在农业信息服务中的应用研究[D];安徽农业大学;2010年
10 李洪;增量式粗糙集属性约简算法的研究[D];长沙理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 黄汝激;从基本割集矩阵综合有向图的分解法[J];北京科技大学学报;1994年02期
2 乔斌,郑洪涛,郭智疆,李玉榕,蒋静坪;针对信息系统不完备性的粗糙集分层递阶约简[J];电路与系统学报;2001年02期
3 黄汝激;通过有向k超树产生有向图的有向k树多项式[J];电子学报;1987年01期
4 黄汝激;超网络的有向k超树分析法[J];电子科学学刊;1987年03期
5 黄汝激;产生符号网络函数的主子超图法[J];电子科学学刊;1989年03期
6 黄汝激;子网络抽取定理和多端反馈网络的拓扑公式[J];电子科学学刊;1989年05期
7 黄汝激;求网络总可靠度的状态空间树法和精确分解算法[J];电子科学学刊;1990年03期
8 黄汝激;一般k阶余因式的k超连接表达式和分解定理[J];电子科学学刊;1991年03期
9 黄汝激;应用超图理论实现有向基本割集矩阵[J];电子科学学刊;1992年01期
10 陈廷槐,康泰,姚荣;超图的连通性及容错多总线系统的设计[J];中国科学(A辑 数学 物理学 天文学 技术科学);1987年12期
中国重要报纸全文数据库 前1条
1 中国人民银行行长 周小川;[N];金融时报;2004年
【相似文献】
中国期刊全文数据库 前10条
1 李敏;安晓丹;;数据挖掘技术在商业库存决策支持算法的研究[J];哈尔滨商业大学学报(自然科学版);2008年04期
2 王令群;郑应平;周爱华;;数据挖掘在芯片生产过程数据分析中的应用[J];半导体技术;2006年01期
3 王晓洁;王付强;;粗糙集神经网络算法在数据挖掘中的研究与应用[J];河南机电高等专科学校学报;2007年04期
4 阎文星;梁庆霞;辛爱莉;;利用数据挖掘实现管理客户关系中的客户保持[J];商场现代化;2006年19期
5 焦锴;王雄;熊智华;;粗糙集数据挖掘技术在丙酮精制中的应用研究[J];计算机工程;2007年03期
6 陈丹;赵欢;;基于数据挖掘诊断事件方法的网络入侵检测系统[J];科学技术与工程;2007年12期
7 亢平;沈钧毅;;基于扩展粗糙集理论的信用风险分析[J];微电子学与计算机;2008年03期
8 董军凯;;数据挖掘技术在教学质量评价中的应用[J];大众科技;2009年08期
9 马洪江;;基于粗糙集关联规则挖掘的入侵检测研究[J];计算机科学;2006年09期
10 刘宇阳;;数据挖掘技术在高校学生成绩分析中的应用[J];交通科技与经济;2008年03期
中国重要会议论文全文数据库 前10条
1 黄新焕;张岐山;林振思;;基于数据挖掘技术的客户价值评价方法[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
2 易向军;宋威;;数据挖掘技术在冶金MES中的应用探讨[A];全国冶金自动化信息网年会论文集[C];2004年
3 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
4 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
5 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
6 王令群;郑应平;周爱华;;数据挖掘技术在半导体生产过程数据分析中的应用[A];2005年中国智能自动化会议论文集[C];2005年
7 曾慧琴;莫耀赐;;一种基于数据挖掘技术的继电保护故障信息处理系统[A];广西电机工程学会第九届青年学术论坛论文集[C];2006年
8 张志恒;花拥军;;基于粗糙集的数据挖掘技术在企业财务危机预测中的应用[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
9 龚燕冰;倪青;王永炎;;数据挖掘技术在中医证候研究中的应用[A];全国中西医结合内分泌代谢病学术会议论文汇编[C];2006年
10 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 陈云开;基于粗糙集和聚类的数据挖掘算法及其在反洗钱中的应用研究[D];华中科技大学;2007年
2 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
3 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
4 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
5 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
6 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
7 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
8 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
9 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
10 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 王赫;基于粗糙集的数据挖掘在服务概念开发中的应用研究[D];湖南大学;2007年
2 李智玲;基于区分矩阵的粗糙集属性约简算法在数据挖掘中的应用研究[D];太原理工大学;2007年
3 罗烨;基于数据挖掘技术的电信客户流失预测模型的研究与应用[D];苏州大学;2008年
4 范洁;数据挖掘中孤立点检测算法的研究[D];中南大学;2009年
5 崔为娜;基于粗糙集理论的数据挖掘方法研究[D];长春理工大学;2007年
6 李明壮;基于决策树的数据挖掘算法研究与应用[D];中国石油大学;2008年
7 韩伟;基于粗糙集的数据挖掘技术在质量监督管理系统中的应用[D];浙江工业大学;2005年
8 陈艳;数据挖掘在信用卡信用风险管理中的应用[D];厦门大学;2008年
9 吴俊;数据挖掘技术在公安出入境管理中的应用研究[D];合肥工业大学;2006年
10 肖厚国;基于遗传算法的粗糙集属性约简方法研究[D];大连海事大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026