收藏本站
《长沙理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于粒子群优化的数据流挖掘的聚类算法分析

王琳  
【摘要】:随着计算机及其应用技术的迅猛发展,人类获取数据的能力得到很大程度的提高,数据流(Data Streams)已成为重要的数据来源之一,因此有关数据流的挖掘算法也已成为一个重要的前沿课题。数据流聚类是数据流挖掘的一个重要的分支,其主要目的是从数据流中发现新的知识模式和隐藏的新规律。 数据流是一个由不断到达的数据所组成的动态变化增长的数据集,要从有限的数据处理分析过渡到无限的数据处理分析,人们面临着新的严峻的挑战,需要寻求新的聚类算法。最为经典的数据流聚类算法是CluStream算法,Clustream算法包括在线聚类部分和离线部分两部分,本文主要的研究工作是基于两层模型,对数据流的离线部分做优化处理。 本文的主要研究工作包括以下几个方面: (1)分析了粒子群算法与遗传算法优缺点,并结合两者的优点,对基于质心的K-means算法的聚类中心做优化,使得K-means的聚类算法产生更好的聚类效果。实验数据表明:采用基于交换技术的混合IGAPSO的聚类算法比单一的K-means算法性能更好。 (2)PSO作为一种智能优化算法,有时也会因为早熟而陷入局部最优解。为了解决局部最优的问题,利用捕食-被捕食的粒子群优化(PPPSO)作优化,在PPPSO中,捕食者追逐被捕食者的中心,而被捕食者逃离捕食者,这是一种防止局部最优者出现且找到全局最优者的一种有效的方法。本文提出了一种使用PPPSO来优化模糊均值的聚类方法。 (3)在高维数据流空间里,为了解决多余特征对数据流聚类质量的影响,提出了一种基于粒子群与特征选择的数据流聚类算法。此算法具有自动探测、移除多余不重要特征等功能。实验结果表示,基于特征选择的数据流聚类算法(DSCFC),在对有多余特征的数据流聚类时,比CluSteam算法更有效,聚类质量更好。 (4)在数据流挖掘中,要快速地挖掘出数据流中的任意有趣模式,如果只利用现有的基于频繁项集算法直接进行复杂模式挖掘是困难的。为解决此问题,一种基于频繁项集的条件模式挖掘被提出。从频繁项集出发,去挖掘那些不能从项集中立即发现的任意模式,即条件模式挖掘。把任意模式条件挖掘与数据聚类分析结合起来,能更快速有效地挖掘数据库中任意的有趣的规则。
【学位授予单位】:长沙理工大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP18

【相似文献】
中国期刊全文数据库 前10条
1 李晓莉,陈雪;基于模式识别聚类思想的PON ODN规划设计[J];光通信技术;2003年12期
2 张彩虹,王春才,颜雁;医保决策支持系统中的聚类算法[J];长春理工大学学报;2004年04期
3 史兴键,李伟华,王文奇;基于优化聚类算法的安全审计模型[J];计算机工程与应用;2005年17期
4 周如旗;个性化数据聚类的属性坐标分析法[J];电脑与信息技术;2005年03期
5 潘磊,吴小俊,尤媛媛;基于聚类的视频镜头分割和关键帧提取[J];红外与激光工程;2005年03期
6 张永梅,韩焱,张建华;一种有效聚类算法的研究和实现[J];计算机应用;2005年07期
7 叶菲,罗景青;一种基于BFSN聚类的多参数综合分选算法[J];雷达与对抗;2005年02期
8 严馨,周丽华,陈克平,徐广义;一种改进的带障碍的基于密度和网格的聚类算法[J];计算机应用;2005年08期
9 吕昱;程代杰;;基于SOM的市场细分研究[J];计算机科学;2005年12期
10 何明;冯博琴;马兆丰;傅向华;;一种基于高斯混合模型的无监督粗糙聚类方法[J];哈尔滨工业大学学报;2006年02期
中国重要会议论文全文数据库 前10条
1 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
3 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
4 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
5 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
6 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
8 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 余琳;邓玲;;常见聚类算法的比较以及DSS系统中的应用[A];湖北省通信学会、武汉通信学会2009年学术年会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 计算机世界实验室 吴挺;Intel的专业“核动力”[N];计算机世界;2007年
2 ;视频数据中挖“宝”[N];计算机世界;2002年
3 北京 冬梅;P4时代真的来了吗[N];中国电脑教育报;2001年
4 ;立体防护“中枢神经系统”[N];网络世界;2003年
5 ;NetScreen-IDP 500 高端入侵检测与防护设备[N];计算机世界;2003年
6 甘久斌;如何有效管理宽带用户[N];通信产业报;2002年
7 ;港湾网络多业务万兆城域网解决方案[N];人民邮电;2003年
8 李勇;降低投资70%[N];中国计算机报;2003年
9 本报记者 赵凤华 通讯员 戴世勇 陶春明;本科生登上全国学术会议讲坛[N];科技日报;2008年
10 记者 郭姜宁;企业级电子商务资金流网络管理系统问世[N];科技日报;2001年
中国博士学位论文全文数据库 前10条
1 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
2 王修君;高效数据流和海量文本处理算法研究[D];中国科学技术大学;2011年
3 朱小栋;基于扩展预测模型标记语言的数据流挖掘系统建模研究[D];南京航空航天大学;2009年
4 吴枫;数据流挖掘若干关键技术研究[D];国防科学技术大学;2009年
5 由育阳;数据流容错挖掘算法研究[D];哈尔滨工程大学;2011年
6 郭立超;数据流挖掘若干技术研究及其在电信行业的应用[D];浙江大学;2011年
7 李军;基于用户行为挖掘的数据流管理技术研究[D];北京邮电大学;2012年
8 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
9 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
10 张剑;宽带接入网流量识别关键技术研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 王琳;基于粒子群优化的数据流挖掘的聚类算法分析[D];长沙理工大学;2010年
2 张驹;基于数据流的聚类算法研究与实现[D];中南大学;2009年
3 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
4 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
5 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
6 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
7 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
8 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
9 王帆;基于优化目标可调控的免疫聚类算法的研究[D];太原理工大学;2010年
10 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026