收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于仿射传播聚类算法的改进研究

雷小培  
【摘要】:乜速发展的计算机技术,使得越来越多的数据信息充斥在人类生活的各个角落。如何更好的解决大规模和高维度的数据信息的检索问题,不但能将样本信息、按照对象间的相似度划分,而且能快速的选出代表样本集的类代表点,学者提出了一种新的算法一仿射传播聚类算法。已经有文献证明,标准的仿射传播算法不仅在聚类规模上超过了经典的K均值算法,而且在聚类时间上更是略胜一筹。传统的仿射传播算法计算样本点之间的相似性采用的是将样本点所有的特征都等同看待的欧式距离函数,采用何种距离测度,才能更好的反应样本空间的特征,本文正是针对此问题,采用几种不同的距离函数计算样本集的相似性,并比较了每种算法的聚类结果,最后就如何提高算法的聚类速度问题,对偏向参数的搜索策略做了相关的改进。 本论文阐述并总结了标准的仿射传播算法的基本原理,重点分析了算法的几个重要参数。现有的对标准算法的一些改进算法大都采用欧氏距离函数计算数据点之间的相似性,算法比较单一,有时无法反应样本集的真实的空间特征。本文针对不同空间特征的数据集,采用了三种距离函数:欧氏距离、曼哈顿距离以及特征距离分别计算不同维度下的数据点集,以及图像的灰度矩阵的相似度,然后采用标准的仿射传播聚类算法进行聚类。实验结果表明,对于不同的特征空间应该采用不同的距离函数计算样本集的相似度矩阵,才能得到更高质量的聚类结果。 传统的仿射传播聚类算法采用顺序查找法查找聚类质量最高的聚类结果对应的偏向参数,此方法花费的时间比较长,特别是在最坏的情况下,需要搜索整个偏向参数的空间。在追求聚类质量的前提下,为了提高聚类的速度,本文的第四章采用二分法的搜索策略查找最优的聚类结果对应的偏向参数,最后进行了仿真实验,从仿真结果中得出,改进后的算法与预期期望的结果相符,有效的降低了花费在迭代运算过程中的时间,提高了算法的聚类速度。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 徐耀良,高利;自适应模糊控制在多温区电加热炉中的应用[J];控制与决策;1998年S1期
2 荣雅君,窦春霞;基于神经网络预测模型的聚类自适应模糊控制器的设计及应用[J];电工技术学报;2003年03期
3 许剑峰,林嘉宜,黎绍发;一种基于中心对称性的聚类算法[J];计算机工程与设计;2003年05期
4 李晓莉,陈雪;基于模式识别聚类思想的PON ODN规划设计[J];光通信技术;2003年12期
5 李存华,孙志挥,陈耿,胡云;核密度估计及其在聚类算法构造中的应用[J];计算机研究与发展;2004年10期
6 张彩虹,王春才,颜雁;医保决策支持系统中的聚类算法[J];长春理工大学学报;2004年04期
7 史兴键,李伟华,王文奇;基于优化聚类算法的安全审计模型[J];计算机工程与应用;2005年17期
8 周如旗;个性化数据聚类的属性坐标分析法[J];电脑与信息技术;2005年03期
9 潘磊,吴小俊,尤媛媛;基于聚类的视频镜头分割和关键帧提取[J];红外与激光工程;2005年03期
10 张永梅,韩焱,张建华;一种有效聚类算法的研究和实现[J];计算机应用;2005年07期
11 叶菲,罗景青;一种基于BFSN聚类的多参数综合分选算法[J];雷达与对抗;2005年02期
12 严馨,周丽华,陈克平,徐广义;一种改进的带障碍的基于密度和网格的聚类算法[J];计算机应用;2005年08期
13 厍向阳,薛惠锋,高新波;基于障碍物约束的遗传-中心点聚类算法研究[J];系统工程与电子技术;2005年10期
14 罗印升,李人厚,张维玺;一种基于克隆选择的聚类算法[J];控制与决策;2005年11期
15 吕昱;程代杰;;基于SOM的市场细分研究[J];计算机科学;2005年12期
16 李向伟;仇德成;;数据挖掘技术在Web中的应用研究[J];电脑知识与技术(学术交流);2006年02期
17 何明;冯博琴;马兆丰;傅向华;;一种基于高斯混合模型的无监督粗糙聚类方法[J];哈尔滨工业大学学报;2006年02期
18 吴丹;冯新喜;;多雷达多目标航迹起始算法研究[J];空军工程大学学报(自然科学版);2006年01期
19 刘大任;孙焕良;牛志成;朱叶丽;;一种新的基于密度的聚类与孤立点检测算法[J];沈阳建筑大学学报(自然科学版);2006年01期
20 谷淑化;吕维先;;基于消息传递的并行聚类算法[J];现代计算机;2006年01期
中国重要会议论文全文数据库 前10条
1 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
3 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
4 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
5 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
6 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
8 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
9 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 余琳;邓玲;;常见聚类算法的比较以及DSS系统中的应用[A];湖北省通信学会、武汉通信学会2009年学术年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
2 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
3 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
4 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
5 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
6 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
7 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
8 梅娟;复杂生物网络聚类分析方法[D];江南大学;2010年
9 潘鸿飞;形状特征描述及聚类算法研究[D];安徽大学;2011年
10 余卫宇;几种图像结构语义模型和图像[D];华南理工大学;2005年
中国硕士学位论文全文数据库 前10条
1 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
2 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
3 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
4 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
5 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
6 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
7 武彩丽;基于规范切和分水岭的聚类算法研究[D];西安电子科技大学;2010年
8 张立;基于新闻评论数据的K-means聚类算法的研究[D];太原理工大学;2010年
9 毕晋芝;遗传优化的K均值聚类算法[D];太原理工大学;2010年
10 王帆;基于优化目标可调控的免疫聚类算法的研究[D];太原理工大学;2010年
中国重要报纸全文数据库 前3条
1 ;视频数据中挖“宝”[N];计算机世界;2002年
2 本报记者 赵凤华 通讯员 戴世勇 陶春明;本科生登上全国学术会议讲坛[N];科技日报;2008年
3 本报记者 于翔;多元管理防范金融风险[N];网络世界;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978