图论在聚类分析中的应用
【摘要】:本文讨论聚类分析中的系统聚类法、模糊聚类法和灰色聚类法,着重探讨其聚类的图论方法。
第一章 介绍聚类分析的基本知识。
第二章 讨论系统聚类分析及其中著名的最短距离法,指出了最短距离法即为图论中求赋权连通图最小支撑树Kruskal算法的变形,得到了最短距离法的优良性质:
定理2.1对最短距离法和k=n-1,n-2,…,1成立。它说明最短距离法得到的系统H=(P_n,P_(n-1),…,P_1)对每个m=n-1,n-2,…,2,P_m既是分离性最好的m-剖分,又是相似性最好的m-剖分。
第三章讨论模糊聚类分析及其常用的传递闭包法,指出这种聚类方法的复杂性,定义了模糊关系图G=(X,E,(?))及其中两点u,v间的连通强度S(u,v),证明了S是X上的模糊等价关系、G=(X,E,(?))的最大支撑树具有如下性质:
定理3.2 设T是模糊关系图G=(X,E,(?))的一棵支撑树,则以下陈述等价:
(1)T是G的最大支撑树;
(2)对于任意的e'∈E(T),从T中移出e'得T_1,T_2,则w(e')=(?)w(e);
(3)对任意的u,v∈X(u≠v),T中u,v之间的惟一路是G中最优(u,v)路。并建立了G=(X,E,(?))中任两点的连通强度和(?)的传递闭包t((?))之间的关系:
定理“.“设X二!xl,花,…,xn}
的传递闭包t(尽)=尽”=(‘(”,),、。
图,则
,尽=(动nx,是X上的模糊相似关系,尽
G=(X,E,豹是与X,尽相对应的模糊关系
t(B从,x’)二稍=s(x,.,xj.)·
由此仿照图论中求赋权连通图最小支撑树的Dijkstra算法,给出了模糊聚类的
最大支撑树算法如下:
设模糊相似矩阵尽=(份)nx,,聚类水平为兄,令人表示树的结点集,记
份二r(气,xj
(l)任选一点vl:X,记鸿={vl},令l(vl)=o,P(vl)==。,l(v):=r(vl,v),
P(v):=vl(丫,。X、鸿),k:=
(2)算
z(v)誊z(v·),令凡十,一人。{v·},对每个;。x\人*,,若
r(v’,v)l(v),则l(v):=r(v’,v),P(v):=v’.
(3)若k二n一1,据指针P(.)倒向追踪得最大支撑树T;T去掉w(e)兄的
所有边e后的各连通分支即为X在之水平上的一个分类,停,否则,-
令k片k+1,回(2).
而且其复杂性仅为口(矛),最后通过实例进行了验证.
第四章讨论灰色关联聚类分析及其传统的逐行检查法,分析用这种方法进
行灰色关联聚类的复杂性为口(m4).仿照模糊聚类分析的最大支撑树方法中连
通强度的定义和相关结论,给出了赋权图G=(犷,E,D)中两点u,v间的连通强度
S(。,‘)及其最大支撑树的一个性质·定义了G=(V,E,D)的兄一截图叹和连通
闭包G两个概念,得到了如下结论:
定理4.2设赋权图G=(代E,D),则任取兄任[0,l],G;=认.
由此分析说明了指标集X中两点u,v在兄水平上能够归为一类,等价于它们在
关联图G=(X,E,A)的最大支撑树T的兄一截图瓜中连通·据此建立了灰色关
联聚类的最大支撑树方法,其复杂性仅为口(mZ),有效降低了运算的复杂性,最
后通过实例进行了验证.
关键词:系统聚类;模糊聚类;灰色关联聚类;最小支撑树;最大支撑树
中图分类号:O巧7.6