收藏本站
《西南交通大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘聚类算法研究

张昭涛  
【摘要】:近年来,数据挖掘获得了快速发展,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。国内主流的网站评比的未来十大热门技术中,数据挖掘占了一席,而且现今世界几大超级公司也早早地投入数据挖掘的研究,这其中包括IBM、MicroSoft等。数据挖掘技术集数理理论、专家系统、人工智能、神经网络、图形图象设计等多门学科于一身,其发展速度必将大大影响全球信息化的进程,对其进行系统、深入、全面、详尽地研究是信息化发展的客观需要。本文对数据挖掘技术,尤其是聚类分析进行了较为系统地分析和研究,提出了一些改进的算法,主要包括以下一些内容: 数据挖掘技术的概述。对数据挖掘技术的产生进行了简要的回顾,对数据挖掘的发现模式和常使用的技术进行了详细地分类、归纳和总结。对数据挖掘技术的应用进行了归纳,为本文的全面展开奠定了基础。 聚类分析的概述。聚类分析是数据挖掘的一个重要的研究方向,是一种无监督学习的方式,在许多方面发挥着重要的作用。对聚类分析的定义、使用的数据类型和主要的算法等进行了简要的介绍。 蚁群算法的概述。群体智能是模仿自然界昆虫行为的一个研究领域,同样也在许多领域取得了较为突出的成绩,而且有了一定的发展。蚁群算法是群体智能的一个典型代表算法,而且应用面比较广。对基于蚂蚁寻路和蚂蚁聚类的算法分别进行了简要介绍。 基于阈值的T-Value算法及蚁群聚类组合算法的研究。在研究了基本蚁群算法的基础上,结合蚂蚁寻路和觅食的习性和聚类的思想,提出一些想法和改进。首先把蚂蚁觅食原理结合k-means提出了一种基于信息素的k-means改进算法;根据密度聚类的思想,提出一种基于阈值的算法-T-Value算法,同时引入ε邻域到T-Value中,结合基于信息素的k-means算法提出了一种T-Value聚类组合算法;结合LF算法和基于信息素的k-means算法,提出另一种聚类组合算法-蚁群聚类组合算法。最后对各种算法进行数据测试和性能分析,并把蚁群聚类组合算法用于移动客户的消费行为分析。
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP311.13

手机知网App
【引证文献】
中国博士学位论文全文数据库 前3条
1 向先全;基于水信息技术的渤海湾水生态环境特性及模拟研究[D];天津大学;2011年
2 任艳;基于公理模糊集与支持向量机的知识发现方法与应用研究[D];大连理工大学;2011年
3 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年
中国硕士学位论文全文数据库 前10条
1 张晓艳;面向农业信息服务平台的挖掘技术研究[D];湖南工业大学;2010年
2 于亚飞;基于划分和密度的聚类算法研究[D];安徽大学;2011年
3 黄延红;基于蚁群算法的聚类算法研究[D];电子科技大学;2011年
4 蒋志为;基于模糊集的蚁群聚类算法研究[D];西南交通大学;2006年
5 翁丽芳;基于银行机构客户账户的可疑洗钱交易行为识别研究[D];西南交通大学;2006年
6 王莹;应用于体质分类的聚类方法研究及改进[D];西安电子科技大学;2007年
7 楼若岩;校园网用户群体行为的研究与分析[D];江苏大学;2007年
8 刘净;基于多分类器集成的聚类算法研究[D];河海大学;2007年
9 任荣;基于数据挖掘技术的服装投产号型辅助决策的研究与应用[D];西北第二民族学院;2007年
10 邹远强;蚁群聚类算法及其在电信客户分群中的应用[D];湖南大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 张素兵,刘泽民;ATM业务控制中的一种新的神经网络方法[J];北京邮电大学学报;2001年02期
2 范九伦,裴继红,谢维信;基于可能性分布的聚类有效性[J];电子学报;1998年04期
3 林锦,朱文兴;凸整数规划问题的混合蚁群算法[J];福州大学学报(自然科学版);1999年06期
4 马良,项培军;蚂蚁算法在组合优化中的应用[J];管理科学学报;2001年02期
5 吴斌,傅伟鹏,郑毅,刘少辉,史忠植;一种基于群体智能的Web文档聚类算法[J];计算机研究与发展;2002年11期
6 杨欣斌,孙京诰,黄道;一种进化聚类学习新方法[J];计算机工程与应用;2003年15期
7 李勇,段正澄;动态蚁群算法求解TSP问题[J];计算机工程与应用;2003年17期
8 刘明吉;王秀峰;黄亚楼;;数据挖掘中的数据预处理[J];计算机科学;2000年04期
9 万小军,杨建武,陈晓鸥;文档聚类中k-means算法的一种改进算法[J];计算机工程;2003年02期
10 张莉,周伟达,焦李成;核聚类算法[J];计算机学报;2002年06期
【共引文献】
中国期刊全文数据库 前10条
1 张钊;;一种新型配电网故障定位寻优算法[J];安徽电气工程职业技术学院学报;2007年03期
2 孙娜;;基于数据仓库技术的电力设备决策系统[J];安徽电气工程职业技术学院学报;2010年01期
3 唐安军;;人工智能和专家系统在灭火救援中的应用[J];安防科技;2006年04期
4 朱文婕;数据仓库技术及应用[J];安徽电子信息职业技术学院学报;2004年Z1期
5 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
6 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
7 尹荣章,郑诚;一个基于关系数据库的联机分析处理系统的设计与实现[J];安徽大学学报(自然科学版);2001年01期
8 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
9 秦宗贵;;OLAP技术及其在电信行业中的应用[J];安徽科技;2006年06期
10 段翠芳;李伟;;故障树分析法在农产品立体仓库故障诊断中的应用[J];安徽农业科学;2010年22期
中国重要会议论文全文数据库 前10条
1 宋亚男;刘春和;李新俊;齐俊臣;;导弹贮存可靠性数据仓库的研究与设计[A];中国电子学会可靠性分会第十三届学术年会论文选[C];2006年
2 杨卫莉;郭雷;赵天云;肖谷初;;融合分水岭算法和蚁群聚类的图像分割[A];第二十六届中国控制会议论文集[C];2007年
3 ;Novel Hybrid Clustering Algorithm Incorporating Artificial Immunity into Fuzzy Kernel Clustering for Pattern Recognition[A];第二十六届中国控制会议论文集[C];2007年
4 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年
5 高尚;江新姿;汤可宗;;蚁群算法与遗传算法的混合算法[A];第二十六届中国控制会议论文集[C];2007年
6 赵云鹏;石丽;刘莹;;基于数据挖掘的高校规模分析及应用研究[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
7 杨静;;基于数据仓库决策分析的电力系统应用研究[A];安徽省电机工程学会优秀学术论文集(2002-2003)[C];2005年
8 任鸿;郑岩;曲昭伟;邓芳;;聚类有效性研究[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
9 钱小聪;郑宝玉;穆明鑫;;神经网络联机手写签名验证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
10 王皓;曹永锋;孙洪;;基于流域变换的聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
2 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
3 陈飞;基于Agent船载危险品应急管理资源协同分配机制研究[D];大连海事大学;2010年
4 张进;地震叠前数据的弹性阻抗非线性反演方法研究[D];中国海洋大学;2009年
5 时长江;豆科类杂草种子图像识别系统研究[D];中国海洋大学;2009年
6 吴启涛;城市抗震防灾规划空间决策支持系统研究[D];中国海洋大学;2010年
7 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
8 刘文光;商用汽车电控机械自动变速器智能控制技术研究[D];江苏大学;2010年
9 许伟;基于进化算法的复杂化工过程智能建模方法及其应用[D];华东理工大学;2011年
10 李晋江;海量数据点三维重构中一类关键问题研究[D];山东大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
2 李颖;用蚁群算法求解最小极大流问题[D];河南理工大学;2010年
3 杨媛;基于灰关联及其预测的煤矿安全管理及事故预警方法[D];河南理工大学;2010年
4 单文娟;铝电解槽焙烧与启动过程危险源辨识与评价研究[D];河南理工大学;2010年
5 王文栋;GEP及SVM融合的分类技术研究[D];广西师范学院;2010年
6 邵晓路;蚁群群体智能网络可视化试验平台研制[D];浙江理工大学;2010年
7 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
8 李振;网络舆情预测关键技术研究[D];郑州大学;2010年
9 李翠;基于车辆自动识别的智能计重监控系统的研究与设计[D];郑州大学;2010年
10 刘春燕;教学网络DIDS数据分析方法的研究与改进[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 叶良艳;;基于改进后的K-means聚类算法的网吧用户行为聚类[J];安徽科技学院学报;2009年04期
2 曾凡锋;基于SNMP的网络流量统计分析系统[J];北方工业大学学报;2003年01期
3 贺仁亚,程乾生,孙喜晨;属性均值聚类二叉树及其在人脸识别中的应用[J];北京大学学报(自然科学版);2002年05期
4 陈云飞,刘玉树,钱越英,赵基海;一种基于密度的启发性群体智能聚类算法[J];北京理工大学学报;2005年01期
5 李业丽;秦臻;;一种改进的k-means算法[J];北京印刷学院学报;2007年02期
6 王凤基;;大学生网络学习行为差异分析及对策研究[J];长春工业大学学报(高教研究版);2012年01期
7 赵耀红;;基于向量空间模型的信息检索系统的研究与实现[J];长春大学学报;2009年08期
8 曹中初,孙苏南;CA与GIS的集成用于地理信息的动态模拟和建模[J];测绘通报;1999年11期
9 王桥,吴纪桃;空间决策支持系统中的模型标准化问题研究[J];测绘学报;1999年02期
10 曾维华;;多源信息融合技术在内陆湖库水华预警中的研究进展与展望[J];长江流域资源与环境;2009年01期
中国重要会议论文全文数据库 前2条
1 汤俊;;自适应反洗钱辅助信息系统开发框架设计[A];第10届计算机模拟与信息技术会议论文集[C];2005年
2 张纪会;程杰;徐心和;;蚁群算法研究进展[A];1998中国控制与决策学术年会论文集[C];1998年
中国博士学位论文全文数据库 前10条
1 冯红伟;数据挖掘技术的研究及应用[D];西北工业大学;2002年
2 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
3 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年
4 李秋丹;数据挖掘相关算法的研究与平台实现[D];大连理工大学;2004年
5 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
6 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
7 王实;基于Web访问信息挖掘的推荐方法研究[D];中国科学院研究生院(计算技术研究所);2001年
8 王中;数据挖掘技术及其在证券领域的应用[D];天津大学;2005年
9 裴志利;数据挖掘技术在文本分类和生物信息学中的应用[D];吉林大学;2008年
10 王彤;数据挖掘的新技术研究[D];天津大学;2007年
中国硕士学位论文全文数据库 前10条
1 沈麒;基于校园网的用户行为分析系统的设计与实现[D];苏州大学;2011年
2 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
3 柳枫;基于统计的数据挖掘技术在CRM系统中的应用研究[D];大连理工大学;2003年
4 刘振岩;数据挖掘分类算法的研究与应用[D];首都师范大学;2003年
5 刘赏;结合密度思想的蚂蚁聚类算法[D];河北工业大学;2003年
6 陈耿;数据挖掘技术及其在用户行为分析系统中的应用[D];西南交通大学;2003年
7 张斌;聚类算法研究及在客户忠诚度分析中的应用[D];青岛大学;2003年
8 郭军华;数据挖掘中聚类分析的研究[D];武汉理工大学;2003年
9 邹蜀宁;中国反洗钱问题探析[D];中国海洋大学;2003年
10 苏瑛;聚类分析模型在房地产投资决策中的应用研究[D];西安建筑科技大学;2004年
【二级引证文献】
中国期刊全文数据库 前9条
1 赵维;;数据挖掘技术在可疑金融交易控制领域的应用综述[J];东方企业文化;2011年04期
2 杨柳;曹玖新;刘波;时莉莉;;基于无偏Q值反馈的社区划分算法[J];东南大学学报(自然科学版);2011年01期
3 陈应显;;基于模糊集的蚁群空间聚类方法研究[J];计算机工程与应用;2011年02期
4 徐丽;丁世飞;;粒度聚类算法研究[J];计算机科学;2011年08期
5 朱琳;;蜜罐技术在入侵检测系统中的研究应用[J];价值工程;2012年15期
6 党小超;郝占军;王筱娟;;模糊加权Markov链的用户行为预测[J];兰州大学学报(自然科学版);2011年01期
7 张玉成;徐大纹;王筱娟;;基于加权马尔可夫链的主动用户行为预测模型[J];计算机工程与设计;2011年10期
8 马春英;曹安得;周允征;;蚁群聚类组合的改进算法[J];沈阳建筑大学学报(自然科学版);2011年04期
9 刘小利;刘小辉;;数据聚类算法在web数据挖掘中的应用[J];科技创新导报;2012年31期
中国博士学位论文全文数据库 前2条
1 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
2 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
中国硕士学位论文全文数据库 前10条
1 葛苗苗;基于校园网的网络用户行为分析研究[D];南京财经大学;2010年
2 李颖慧;聚类分析技术在中国移动客户消费模式中的应用研究[D];长春工业大学;2010年
3 高希瑞;基于文本挖掘的企业危机预警研究[D];华东师范大学;2011年
4 孙燕花;基于聚类的网络用户行为分析[D];中南大学;2011年
5 于亚飞;基于划分和密度的聚类算法研究[D];安徽大学;2011年
6 耿锦威;聚类算法及基于簇模式聚类集成研究[D];安徽大学;2011年
7 田园丽;蚁群聚类算法研究与应用[D];辽宁工程技术大学;2011年
8 梁莹;基于数据挖掘技术的客户消费行为分析系统的开发与应用[D];广西大学;2011年
9 王会霞;山西移动增值业务精确营销研究[D];中北大学;2012年
10 李志强;基于数据挖掘技术的可疑洗钱交易行为模式识别研究[D];西南交通大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 庄昌文,范明钰,李春辉,虞厥邦;基于协同工作方式的一种蚁群布线系统[J];半导体学报;1999年05期
2 李连源,刘泽民,周正;基于ACS的动态分布式路由算法[J];北京邮电大学学报;2000年02期
3 吴福保,李奇,宋文忠;模糊聚类分析的传递方法[J];东南大学学报;1999年02期
4 林锦,朱文兴;凸整数规划问题的混合蚁群算法[J];福州大学学报(自然科学版);1999年06期
5 马良;求解最小比率TSP的一个算法[J];系统工程;1998年04期
6 马良;多目标投资决策模型的进化算法[J];上海理工大学学报;1998年01期
7 马良;TSP及其扩展问题的混合型启发式算法[J];上海理工大学学报;1999年01期
8 全惠云,江力;求解TSP的演化算法[J];湖南师范大学自然科学学报;1999年02期
9 马良,项培军;蚂蚁算法在组合优化中的应用[J];管理科学学报;2001年02期
10 李敏强,张志强,寇纪淞;关于杂合遗传算法的研究[J];管理科学学报;1998年01期
【相似文献】
中国期刊全文数据库 前10条
1 张新光,王建华;数据仓库信息处理技术研究[J];齐齐哈尔大学学报;2000年03期
2 丁纪云,蔡春娥;利用构造数据集评定数据挖掘过程的方法[J];湖南广播电视大学学报;2001年02期
3 任承业,罗伟其;校园信息系统中CRM与数据挖掘的结合和应用[J];计算机工程与应用;2003年13期
4 王艳;数据挖掘在数字图书馆中的应用[J];情报科学;2003年02期
5 邵红全,赵茜;用SQL Server2000实现数据挖掘的技术与策略[J];电脑开发与应用;2003年04期
6 耿庆鹏,卢子芳;利用数据挖掘技术实现对电信行业用户欺诈行为的预测[J];电信快报;2003年10期
7 蒋良孝,蔡之华;基于数据仓库的数据挖掘研究[J];计算技术与自动化;2003年03期
8 叶静,蔡之华;遥感图像中的数据挖掘应用概述[J];计算机与现代化;2003年10期
9 黄解军,万幼川,潘和平;银行客户关系管理与数据挖掘的应用[J];计算机工程与设计;2003年07期
10 崔强,朱卫东;基于数据挖掘的铁路机务段成本控制系统[J];铁路计算机应用;2003年01期
中国重要会议论文全文数据库 前10条
1 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
5 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
6 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
7 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
8 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
2 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
3 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
4 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
5 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
6 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
7 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
8 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
9 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
10 余红;网络时政论坛舆论领袖研究[D];华中科技大学;2007年
中国硕士学位论文全文数据库 前10条
1 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
2 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
3 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
4 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
5 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
6 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
7 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年
8 黎卫英;数据挖掘在中职幼教课程改革中的应用[D];福建师范大学;2009年
9 张煜辉;数据挖掘和SPC在生产过程质量控制中应用研究[D];上海交通大学;2009年
10 刘华敏;数据挖掘在高职院校学生成绩分析中的应用[D];安徽大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026