收藏本站
收藏 | 论文排版

基于耦合DNA-GA-P系统的聚类分析研究

姜珍妮  
【摘要】:依据生物体中细胞器和细胞膜的工作原理,P系统可按照极大并行模式运行,其计算能力等价于图灵机,当前已经被学者们用于处理数据挖掘问题。DNA遗传算法(DNA Genetic Algorithm,简称DNA-GA)模拟生物的遗传信息表达机制,该类信息表达过程同样发生在真核生物的细胞中,所以本文我们将P系统与DNA遗传算法进行有效耦合,既可以保留P系统的分布式并行计算能力又可以融合DNA遗传算法丰富的对象表达机制和基因级操作,可以扩展P系统计算模型的对象及规则表达方式,为现有的P系统提供新的动态演化模式,进一步拓宽P系统能处理的问题。在移动数据爆炸式增长的今天,传统的数据处理方式已经不能满足海量数据处理的需求,数据挖掘由此而生,其中聚类分析是数据挖掘领域的一项重要研究内容,作为一种可以处理数据并从数据中提取可用知识的有效手段,其重要性在模式挖掘、图像处理等领域得到广泛认可。但当前的聚类方法自身都存在一些不足之处,我们除了可以改进算法本身外,还可以借助其他优化方法对聚类方法做进一步优化。因此可以在聚类方法中结合新的优化算法,融入新的计算模型,以便进一步优化聚类效果。新方法和新模型的研究是数据挖掘领域的重要课题。本文的主要研究内容如下:(1)构建耦合DNA-GA-P系统基于P系统以及DNA遗传算法的生物学知识,构建新型的耦合DNA-GA-P系统。同时基于耦合DNA-GA-P系统,提出四种扩展的耦合DNA-GA-P系统,分别是:具有定向交流与概率进化规则的耦合DNA-GA类细胞P系统,具有膜分裂/膜溶解规则的耦合DNA-GA类组织P系统,基于链式拓扑结构的耦合DNAGA-P系统以及基于自组装思想的耦合DNA-GA种群P系统。并对提出的P系统进行了收敛性分析和系统分析。(2)对四种常用聚类算法进行改进,分别将四种耦合DNA-GA-P系统用于实现改进之后的聚类算法,具体有:a)提出了基于耦合DNA-GA类细胞P系统的模糊C均值聚类算法基于权重均值的距离计算方式被用于计算模糊C均值聚类算法(Fuzzy Cmeans clustering algorithm,简称FCM)的目标函数。新型的耦合DNA-GA类细胞P系统被用于实现聚类过程,利用耦合DNA-GA-P系统的全局搜索能力和跳出局部最优的能力进一步优化改进算法,使用了UCI数据集对改进的算法进行了性能验证。b)基于耦合DNA-GA类组织P系统的密度峰值聚类算法基于K近邻(K-Nearest Neighbor,简称KNN)和香农熵的计算方法被用于计算数据点的密度矩阵。耦合DNA-GA类组织P系统被用于实现聚类过程。新的类组织P系统能够在提高算法效率的同时还降低算法的复杂性。最终,在人工数据集和UCI数据集上分别进行了实验验证。c)基于耦合DNA-GA链式P系统的集成模糊K-modes算法基于直觉模糊集(Intuitionistic fuzzy set,IFS)和核技巧,均衡地解决模糊Kmodes算法所有属性问题,提高算法对噪声的鲁棒性。然后将改进之后的模糊Kmodes算法与另外两种K-modes算法作为基聚类算法,综合三个算法的各自优势,对模糊K-modes算法做一致性聚类。耦合DNA-GA链式P系统被用于实现提出的集成聚类算法,以防止聚类算法陷入局部最优,同时实现隐式并行的聚类过程。d)基于耦合DNA-GA种群P系统的多视图谱聚类算法提出一种新的基于KNN和图思想的自动加权多视图一致性聚类算法。一方面,在初始化数据表示矩阵(相似度矩阵)的过程中使用K近邻思想。另一方面,采用相似度矩阵而不是原始数据对象来学习一致性矩阵。相似度矩阵将在迭代过程中不断更新。然后,在一致性矩阵生成过程中,为了考虑不同视图的不同贡献,系统自动为各个视图生成权重,并在后期更新过程中同步更新每个视图的权重信息。最后,当一致图收敛时,对一致图执行谱聚类算法,并得到最终的多视图聚类结果。将这个多视图谱聚类过程按照具体规则要求在耦合DNA-GA的种群P系统中完成,系统的极大并行性可进一步提高算法的运行效率。(3)将提出的基于耦合DNA-GA-P类细胞P系统的模糊C均值聚类算法和基于耦合DNA-GA种群P系统的多视图谱聚类算法分别用于图像分割和文本聚类中。综上所述,本文主要提出了一种新型的耦合DNA-GA-P系统,并基于系统定义,结合P系统中的进化交流、膜分裂膜溶解、链式拓扑结构以及自组装思想的基本概念,扩展了四种耦合DNA-GA-P系统,同时分别将四种系统用于四种改进的聚类算法中,最后将其中两种基于耦合DNA-GA-P系统的聚类算法分别用于图像分割和文本聚类的实际应用中。


知网文化
【相似文献】
中国博士学位论文全文数据库 前1条
1 姜珍妮;基于耦合DNA-GA-P系统的聚类分析研究[D];山东师范大学;2021年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978