收藏本站
《河北工业大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

结合密度思想的蚂蚁聚类算法

刘赏  
【摘要】: 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,被信息产业界认为是数据库系统最重要的前沿之一,是信息产业最有前途的交叉学科。聚类分析是数据挖掘的一个重要研究领域。聚类分析的目的就是将数据库中的数据划分成具有一定意义的子类,使得不同子类中的数据尽可能不同,而同一子类中的数据尽可能相似。它在商业、生物、医学、地质、web文档等方面都有重要的应用,是当前的研究热点问题之一。 本文我们在仔细研究分析当前的聚类分析方法的基础上,把基于蚂蚁的聚类算法,与密度的聚类算法思想——“聚类是这样的区域,区域中的点的密度大于与之相邻的区域。”相结合,提出了基于密度思想的蚂蚁聚类算法。在该算法中,蚂蚁在二维网格空间中不断的搬运数据对象,比较它们之间的相似性,把相似性大的数据对象放到一起,不相似的数据对象移开,达到了聚类分析的结果,并把聚类结果作为K-Means的初始聚类中心,用K-Means算法对数据进一步进行聚类分析,加快算法的收敛性。同时,在一开始充分考虑数据集中数据对象本身的属性,使蚂蚁在搬运数据对象的过程中,避免一些不必要的移动,只把密度较低区域中的数据对象指定到相应的类中,使蚂蚁在搜索数据时具有启发性,提高了算法的效率。该算法还保持蚂蚁聚类算法的优点:利用蚂蚁算法的随机性,避免聚类分析过程陷入局部最优,初始中心由基于蚂蚁聚类算法得到,避免了K—Means等算法对初始值的敏感性的缺点。把基于密度的聚类思想运用到蚂蚁聚类算法中,是本文的创新点。 我们通过理论分析,和对一些数据进行实验,表明基于密度思想的蚂蚁聚类算法的运行时间大大优于原有的蚂蚁聚类算法,而且最后的聚类质量也达到了令人满意的效果。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 宋宇辰;宋飞燕;孟海东;;基于密度复杂簇聚类算法研究与实现[J];计算机工程与应用;2007年35期
2 孟海东;宋飞燕;宋宇辰;;面向复杂簇的聚类算法研究与实现[J];计算机应用与软件;2008年10期
3 李乐;陈鸿昶;李鹏;;一种改进的基于密度的聚类算法[J];电子技术应用;2009年09期
4 蒋志为;陶宏才;白学祥;;基于模糊集的蚁群聚类算法的改进[J];计算机应用;2006年08期
5 莫锦萍;陈琴;马琳;苏一丹;;一种新的K-Means蚁群聚类算法[J];广西科学院学报;2008年04期
6 张天伍;李卫平;;一种基于密度的引力聚类算法[J];河南科学;2008年11期
7 刘大任;孙焕良;牛志成;朱叶丽;;一种新的基于密度的聚类与孤立点检测算法[J];沈阳建筑大学学报(自然科学版);2006年01期
8 胡宏梅;董恩清;;人工蚁群聚类码书设计算法[J];通信技术;2007年07期
9 王洪春;彭宏;;一种基于主成分分析的异常点挖掘方法[J];计算机科学;2007年10期
10 冀俊忠;黄振;刘椿年;;基于聚类和分段优化的蚁群算法[J];北京工业大学学报;2008年04期
11 张晓;;基于密度聚类算法的异常检测[J];伊犁师范学院学报(自然科学版);2010年04期
12 于勇前;赵相国;王国仁;陈衡岳;;一种基于密度单元的自扩展聚类算法[J];控制与决策;2006年09期
13 夏师;梁碧珍;陆月然;罗明山;;聚类分析研究进展[J];现代计算机(专业版);2009年03期
14 陈敏;高学东;;并行DBSCAN聚类算法[J];中国管理信息化;2010年05期
15 高志华;贲可荣;章林柯;;可增量学习的水下航行器噪声源识别中聚类算法研究[J];计算机工程与科学;2010年09期
16 王贞化;焦东杰;;一种基于密度的无监督聚类算法[J];新乡学院学报(自然科学版);2010年06期
17 张彩虹,王春才,颜雁;医保决策支持系统中的聚类算法[J];长春理工大学学报;2004年04期
18 刘天元;郑志国;包海峰;;基于聚类算法的客户分析在通讯行业中的应用研究[J];长春理工大学学报(自然科学版);2007年04期
19 彭艳;王小玲;;一种混合聚类算法在用户聚类中的应用研究[J];信息技术;2008年01期
20 陈磊;余建坤;邢晓宇;;谱系聚类在综合国力分析中的应用[J];云南民族大学学报(自然科学版);2009年01期
中国重要会议论文全文数据库 前10条
1 娄冬梅;陈明;朱有娜;;一种基于密度的无参数聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
3 程尊平;周鼎;王晨;周皓峰;汪卫;施伯乐;;SDPHC——基于密度的分割和分层的自校聚类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
5 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
6 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
8 范晔;周水庚;曹晶;周傲英;;通过数据取样扩展基于密度的聚类算法[A];第十六届全国数据库学术会议论文集[C];1999年
9 孙焕良;邱菲;刘俊岭;朱叶丽;;IncSNN——一种基于密度的增量聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
10 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 山东众志生物产业集团公司;蚂蚁产业缘何越做越大[N];大众科技报;2004年
2 北京自然博物馆 侯迎;蚂蚁的趣事轶闻[N];北京科技报;2003年
3 任秋凌;蚂蚁识途利用几何学[N];北京科技报;2004年
4 记者 詹娟;小“蚂蚁”做大物流[N];中国证券报;2004年
5 金子竹;知识经济时代的懒蚂蚁企业家[N];光明日报;2004年
6 龚荣东;也谈蚂蚁爬墙[N];福建科技报;2006年
7 刘妍;人类可仿效蚂蚁解决交通拥堵难题[N];大众科技报;2008年
8 员军虎;“懒蚂蚁”新思维[N];中华合作时报;2004年
9 本报记者 郭白岩;集体采购:蚂蚁雄兵的回忆[N];中国经营报;2008年
10 本报特约记者 王金元;小蚂蚁吃掉大雨林[N];中国绿色时报;2003年
中国博士学位论文全文数据库 前10条
1 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
2 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
3 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
4 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
5 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
6 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
7 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
8 梅娟;复杂生物网络聚类分析方法[D];江南大学;2010年
9 潘鸿飞;形状特征描述及聚类算法研究[D];安徽大学;2011年
10 张智英;蚂蚁与舞草互惠共生关系研究[D];西南农业大学;2001年
中国硕士学位论文全文数据库 前10条
1 刘赏;结合密度思想的蚂蚁聚类算法[D];河北工业大学;2003年
2 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
3 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
4 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
5 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
6 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
7 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
8 王帆;基于优化目标可调控的免疫聚类算法的研究[D];太原理工大学;2010年
9 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
10 武彩丽;基于规范切和分水岭的聚类算法研究[D];西安电子科技大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978