收藏本站
《浙江大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

动点聚类算法及其量子化研究

李强  
【摘要】: 数据聚类是模式识别的重要分支,它在模式分析、数据挖掘、信息获取、图像分割、决策等领域都有重要的应用。而这些领域的问题,通常都没有关于数据的先验知识可供利用。正是由于实际问题存在这些难以逾越的限制条件,因此,数据聚类应运而生,它特别适合对未标记数据点间的关系进行探索。数据聚类就是研究如何对未标记的数据进行分组或分类的学科,它不需要事先提供任何标记的样本,聚类的任务就是找出大量数据的内在结构,将这些未标记的数据点聚合成有意义的类别,以对它们的结构进行评价。在典型的聚类算法中,用于聚类的数据点是固定不动的,通过设计函数找到聚类中心或边界。然而,近年来,一些研究者提出动点聚类的新思想,他们将数据点考虑为自身可移动的Agent,通过设计简单规则,让数据点自动完成聚类。 另一方面,量子计算的研究方兴未艾,在过去十年间,量子计算取得了一系列惊人的成就,以奇特的量子效应,如量子内在并行性、量子纠缠等为基础的量子算法,已经提供了量子计算可能比经典计算更强大的有力证据。如Shor的大数质因子分解量子算法,将经典计算中的NP完全问题转化为一个P问题,以多项式时间完成经典算法指数时间才能完成的任务。这些成就让我们意识到量子算法可能比已知最好的经典算法更快更好地解决问题,甚至解决某些经典计算无法有效解决的问题。更重要的是,它提供了一条寻找潜在算法加速的新途径。 本文的研究主要分为两个部分:(1)经典世界中的动点聚类算法。受近年来兴起的动点聚类思想的启发,本文提出基于改进随机游动模型,基于复杂网络上的Flocking,基于演化网络上的博弈等几种动点聚类算法。(2)量子世界中的聚类算法。受量子计算已取得的惊人成就的鼓舞,本文将数据聚类问题与量子计算结合起来,提出基于量子随机游动和基于量子博弈的聚类算法,它们也可以看作是本文提出的两种经典世界中的动点聚类算法的量子化。本文的主要研究内容概括如下: (1)基于改进随机游动模型的聚类算法。随机游动是一类特殊的随机过程,本文提出一种改进的随机游动模型,并基于此模型建立聚类算法,并证明了算法的收敛性。算法中,数据点既是图的顶点,又是可移动的粒子,因而数据点形成的图的形状将随时间变化。每个移动的数据点又可以看作是一个局域控制系统,通过控制器调整转移概率并确定下一步的转移方向。当数据点根据简单规则在空间中作随机游动时,相似的数据点逐渐游动到同一个位置,并稳定下来形成一个聚类,而不同的聚类则相互远离。最后,当算法收敛时,聚类也就自动形成。 (2)基于复杂网络上的Flocking聚类算法。复杂网络是近年提出的一种描述社会网络的拓扑结构,本文将数据点考虑为可移动的Agent,并且为每个Agent添加长程链接,从而将它们之间的关系用一个时变的复杂网络来表示。由此,将经典Flocking模型推广到复杂网络拓扑上,进而研究了一种基于复杂网络上的Flocking聚类算法。复杂网络的结构不仅为数据聚类提供了新的拓扑,更重要的是,复杂网络中的长程链接还为数据点提供了无法直接感知的隐含信息,并且加快了算法的收敛速度。最后,数据点会在算法收敛时,自动形成分离的群落,每个群落对应一个聚类。 (3)基于演化网络上的博弈聚类算法。演化博弈理论植根于对生物界中动植物的竞争与合作现象的研究,本文将数据点看作有一定决策能力的博弈参与人,提出一种基于演化网络上的博弈聚类算法。每个博弈参与人的目的都是使自己的收益最大化,通过观察周围邻居的收益,断掉与低收益邻居的连边,而重新与有高收益的邻居相连,从而使得网络开始演化。在博弈参与人不断调整自己连边的过程中,某些策略会在网络中传播,并最终成为演化稳定策略。聚类在参与人博弈的过程中自然涌现,最后,采用相同演化稳定策略的数据点被分为一类,演化稳定策略的个数对应了聚类的类数。 (4)基于量子随机游动的聚类算法。量子随机游动是经典随机游动的量子模拟,本文将量子随机游动与数据聚类结合起来,提出一种基于量子随机游动的聚类算法。量子随机游动与经典随机游动的区别在于,它的演化是酉的和可返的,而且,可能的经典路径在量子随机游动中产生相干。这就使得在量子随机游动中,粒子位置的概率分布与经典情况完全不同,这就为量子聚类算法得到更好的结果提供了机会。本文首先研究了两个基于一维量子随机游动的聚类算法,然后将一维量子随机游动推广到高维,从而建立基于高维随机游动的聚类算法,最后讨论了参数对聚类算法的影响。 (5)基于量子博弈的聚类算法。量子博弈是经典博弈的量子模拟,在提出的基于量子博弈的聚类算法中,数据点作为可以使用量子策略的博弈参与人与对手进行2×2量子博弈。量子博弈利用量子纠缠态,使得博弈双方在使用量子策略时隐含地相互影响,从而获得与经典博弈不同的结果。本文考虑了两类量子策略情况、设计了两种收益矩阵和两种断边重连函数,并分别讨论和分析了不同条件组合对博弈参与人总收益和算法收敛速度的影响。
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP391.41

【相似文献】
中国期刊全文数据库 前10条
1 彭宇;罗清华;彭喜元;;UIDK-means:多维不确定性测量数据聚类算法[J];仪器仪表学报;2011年06期
2 史迎春;刘继超;;基于分类聚类技术的影视数据挖掘研究[J];软件导刊;2011年06期
3 张桂芬;;数据挖掘技术在图书馆中的应用研究[J];煤炭技术;2011年07期
4 黄韬;刘胜辉;谭艳娜;;基于k-means聚类算法的研究[J];计算机技术与发展;2011年07期
5 李艳灵;魏涛;;基于轮廓波变换的模糊聚类图像分割[J];信阳师范学院学报(自然科学版);2011年03期
6 石慧;翁福利;;一种基于关联矩阵的直觉模糊聚类算法[J];重庆文理学院学报(自然科学版);2011年04期
7 曹巧玲;郭华平;范明;;旋转网格:一种新的聚类融合方法[J];计算机科学;2011年07期
8 曹宇;尹刚;李翔;程荣斌;王怀民;;聚类搜索引擎研究进展浅析[J];电脑知识与技术;2011年22期
9 赵向梅;王艳君;刘林;;聚类算法及聚类融合算法研究[J];电子设计工程;2011年15期
10 彭兴媛;刘琼荪;王立威;;基于条件互信息下聚类的朴素贝叶斯分类算法[J];云南大学学报(自然科学版);2011年05期
中国重要会议论文全文数据库 前10条
1 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
3 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
4 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
5 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
6 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
8 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 余琳;邓玲;;常见聚类算法的比较以及DSS系统中的应用[A];湖北省通信学会、武汉通信学会2009年学术年会论文集[C];2009年
中国重要报纸全文数据库 前3条
1 ;视频数据中挖“宝”[N];计算机世界;2002年
2 本报记者 赵凤华 通讯员 戴世勇 陶春明;本科生登上全国学术会议讲坛[N];科技日报;2008年
3 本报记者 于翔;多元管理防范金融风险[N];网络世界;2010年
中国博士学位论文全文数据库 前10条
1 李强;动点聚类算法及其量子化研究[D];浙江大学;2009年
2 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
3 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
4 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
5 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
6 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
7 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
8 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
9 梅娟;复杂生物网络聚类分析方法[D];江南大学;2010年
10 潘鸿飞;形状特征描述及聚类算法研究[D];安徽大学;2011年
中国硕士学位论文全文数据库 前10条
1 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
2 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
3 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
4 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
5 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
6 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
7 王帆;基于优化目标可调控的免疫聚类算法的研究[D];太原理工大学;2010年
8 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
9 武彩丽;基于规范切和分水岭的聚类算法研究[D];西安电子科技大学;2010年
10 张立;基于新闻评论数据的K-means聚类算法的研究[D];太原理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026