收藏本站
《西安电子科技大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于自然计算的模糊聚类新算法研究

李洁  
【摘要】:数据挖掘技术是近年来国际上在信息决策领域最前沿和最活跃的研究方向之一。作为数据挖掘的一种强有力的分析工具,聚类分析得到了人们的广泛关注。聚类分析是多元统计分析的方法之一,也是统计模式识别中非监督模式分类的一个重要分支,近二十年来得到了迅猛的发展,有许多聚类分析新算法不断被提出。 自然计算是目前新兴的一类计算方法,它以自然界,特别是生物体的功能、特点和作用机理为基础设计出的计算模型。它具有自适应、自组织、自学习等能力,能够解决传统计算方法难于解决的许多复杂问题,因而近年来成为研究的热点,并在诸多领域中得到了广泛的应用。 针对现有聚类分析算法在数据挖掘应用中存在的不完善甚至严重不足之处,本文结合自然计算方法,对传统模糊聚类算法进行较为系统的改造和革新,主要探讨了有关具有混和属性特征数据的聚类算法目标函数的定义以及优化方法,提出了适合大数据集的网络结构聚类新算法,扩展了聚类分析的应用范围,并构造了适合于数据挖掘的新的聚类有效性函数。实验结果表明,本文提出的一系列有关模糊聚类分析的新思想和新方法都取得了良好的效果。 归纳起来,本文的研究成果主要表现在以下几个方面: 1.定义了一个新的相异性匹配测度,修正了传统聚类算法的目标函数——类散布矩阵的迹,将数据集中不同属性特征相结合,构成新的聚类目标函数,使得其能够适合混合类属特征的数据,并利用遗传算法对其进行优化,克服传统的模糊κ-均值(FKM)算法对原型初始化敏感的缺点,使得算法能够以较高的概率收敛到全局最优解。 2.利用人工免疫系统中著名的克隆选择算法改进遗传算法,避免了遗传算法中可能出现的早熟现象,同时由于基于克隆算子的克隆选择算法是群体搜索策略,本质上固有并行性和搜索变化的随机性,在搜索中不易陷入局部极值,最终能以概率1获得问题的全局最优解,而且收敛速度比遗传算法更快,因此更加适合大数据集的聚类分析。 3.结合人工免疫系统中免疫网络理论,提出用免疫网络来进行聚类分析,由于所获得的网络神经元代表了数据子集中的典型样本,因而可以用来产生相应的数据子集;通过最小生成树对获得的网络神经元的连接权进行分析,最终自动解决了FKM类型算法需要事先输入类别数以及聚类原型必须一致的难题。 4.借鉴生物免疫系统的免疫应答中禁忌克隆的现象,提出禁忌克隆算法,并 与克隆选择算法相结合,形成基于克隆算法的网络结构聚类分析新算法。由于新 算法将克隆选择与禁忌克隆相结合,使得到的网络即具有免疫的特异性又具有免 疫耐受性,因此具有有效的清晰网络结构,从而使网络结构聚类算法对数据集边 界点以及噪声点不再敏感。 5.利用免疫系统中有限资源理论,设计了一种模糊识别球,使其作用范围随 刺激水平的变化而变化,通过对B细胞的竞争,将刺激水平低的识别球清除,使 网络对模糊边界点不敏感,从而能够代表各类的典型样本,使得到的网络具有清 晰的结构,同时大大提高运算效率,解决了网络规模随迭代次数以及运行时间随 数据量呈指数增长这一难题,使基于网络结构的聚类算法更适合大数据集聚类分 析。 6.由于对聚类分析而言,聚类有效性问题经常可以转化为最佳类别数k的自 动确定。所以我们提出划分模糊度这一新概念,同时兼顾数据集的模糊划分信息 和几何结构信息,将模糊划分嫡与划分模糊度相结合,定义了一种修正的划分模 糊度作为聚类有效性函数。这种新的聚类有效性函数不仅能够有效地分析数值型 数据分类结果的合理性,而且对类属型数据也是有效的。并基于此,提出两种分 别适合于数值型数据和类属型数据的参数优选方法。 本文的工作受到国家自然科学基金和国家“863”计划的资助。 关键词:数据挖掘,模糊聚类分析,自然计算,数值特征,类属特征,克隆选择, 禁忌克隆,模糊识别球,聚类有效性
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘伯强;一种复杂图形的处理和扫描技术[J];微细加工技术;2000年02期
2 王纪川;刘宇;齐勇;侯迪;;一种摄像机采集图像的二值化算法[J];计算机工程与应用;2007年30期
3 练在中;三维隐藏线消除法综述[J];计算机研究与发展;1987年10期
4 刘伯强,曹景森,胡咏梅;浓碱液测量过程中算法的探讨[J];基础自动化;1995年04期
5 杨正瓴;排序问题串行算法复杂性下界关系讨论[J];天津大学学报;1993年06期
6 孙杨模;;操作系统常见的几种算法举例分析[J];湖北三峡职业技术学院学报;2010年02期
7 刘伯强,刘忠国;张力同步系统微机控制算法的实现[J];机械与电子;2000年04期
8 杨锦宣;;重复数据统计算法及在商务网站中的应用[J];科技信息;2011年20期
9 刘伯强;曹景森;;单片机控制系统中算法的处理和应用[J];电气自动化;1995年02期
10 杜玉兰;赵磊;;基于C#的HASH算法探析[J];计算机安全;2007年08期
11 郑向宁;;声呐数据动态显示的线性插值抽值算法[J];声学与电子工程;2010年02期
12 马后永;张守川;靖旭;吴毅;;测量大气相干长度的数据处理算法比对研究[J];大气与环境光学学报;2010年06期
13 江萍;;基于局部信息的图像滤波及边缘锐化算法[J];当代农机;2010年06期
14 刘伯强;多电机系统微机控制技术的研究[J];电机与控制学报;2000年04期
15 刘伯强;多电机系统微机控制技术的研究[J];山东科学;2000年03期
16 俞斌;汤群芳;曹才开;;一种基于DSP的视频图像压缩系统的设计[J];国外电子元器件;2007年04期
17 孙杨模;;《操作系统概论》常见的几种算法[J];恩施职业技术学院学报;2010年01期
18 吕孟军;张纯良;游有鹏;徐峰;;提高莫尔条纹正切法细分精度的改进算法[J];纳米技术与精密工程;2011年03期
19 苏俊宏,陈磊,朱日宏;干涉图空域延拓技术研究[J];红外与激光工程;2005年04期
20 施政;;多人视频聊天系统中的视频压缩算法研究[J];中国传媒科技;2005年10期
中国重要会议论文全文数据库 前10条
1 谢丽聪;;SVB查询改写算法的改进[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 黄友锐;赵娜娜;;一种基于小波分析的焊缝识别算法[A];煤矿自动化与信息化——第20届全国煤矿自动化与信息化学术会议暨第2届中国煤矿信息化与自动化高层论坛论文集[C];2010年
3 李易;管庆;;基于DM642的智能视频监控系统[A];2008年中国西部青年通信学术会议论文集[C];2008年
4 侯艳芳;冯红梅;;基于神经网络的调制识别算法的研究[A];武汉(南方九省)电工理论学会第22届学术年会、河南省电工技术学会年会论文集[C];2010年
5 张明慧;;基于模糊蒙片算法的CR图像边缘增强[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年
6 程勇新;朱清新;;一种基于边折叠LOD技术的蒙皮动画算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
7 宁佐贵;;模糊控制算法的等价关系[A];中国工程物理研究院科技年报(1999)[C];1999年
8 刘田军;唐友喜;孙德福;;基于预修正ACE的OFDM系统峰平比抑制方法[A];2008年中国西部青年通信学术会议论文集[C];2008年
9 孙岚;刘雁春;陆秀平;欧阳永忠;李明叁;许家琨;;利用CUBE算法处理多波束测深数据研究[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
10 孙岚;刘雁春;陆秀平;欧阳永忠;李明叁;许家琨;;利用CUBE算法处理多波束测深数据研究[A];第二十一届海洋测绘综合性学术研讨会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 张韵萍苏小兰 李宾;对抗“震魔”的科技武器[N];中国经营报;2008年
2 赵艳秋李映;DSP核供应商灵活应对潜力应用[N];中国电子报;2007年
3 韩霁;高新技术在抗震救灾中得到应用[N];经济日报;2008年
4 ;系统加密防破解[N];中国计算机报;2008年
5 李晓萍;探测生命的“四种武器”[N];人民公安报;2008年
6 张显峰;机载干涉SAR系统掀起测绘革命[N];中国矿业报;2004年
7 ;22寸宽屏典范[N];电子资讯时报;2007年
8 记者 董映璧;人类活动影响全球气温[N];科技日报;2007年
9 苗得雨;挺进图像搜索时代[N];电脑报;2008年
10 本报记者 王繁泓;定华:破解储罐液位测量难题[N];中国化工报;2006年
中国博士学位论文全文数据库 前10条
1 张冬丽;人工蜂群算法的改进及相关应用研究[D];燕山大学;2014年
2 杨矫云;大规模生物序列分析的高性能算法和模型[D];中国科学技术大学;2014年
3 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
4 黄亮;社会网络中的社区发现与链接预测算法研究[D];华中科技大学;2012年
5 石斌斌;高自由度GNSS抗干扰技术研究[D];国防科学技术大学;2011年
6 李一明;基于传导闭包图结构的布图算法研究[D];电子科技大学;2011年
7 樊玲;微弱目标检测前跟踪算法研究[D];电子科技大学;2013年
8 郭玉坤;某些正反散射问题的快速算法研究[D];吉林大学;2010年
9 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年
10 周玉宇;基于Memetic算法的套料与切割优化方法研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 陈志强;基于经验模态分解算法的列车超偏载检测[D];中南大学;2010年
2 戴金;改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用[D];北京交通大学;2011年
3 余港;改进PSO算法及其应用[D];成都理工大学;2010年
4 余兵;基于枝条相关性的人工植物算法[D];太原科技大学;2013年
5 李亚龙;改进量子蚁群算法的研究及应用[D];安徽大学;2014年
6 汪洋;复杂网络的社团发现算法研究[D];安徽大学;2014年
7 段奇志;元器件光学检测系统的算法研究与实现[D];哈尔滨工业大学;2011年
8 庞秀立;基于色散算法的超宽带微波肿瘤检测技术研究[D];西安电子科技大学;2013年
9 史世泽;局部敏感哈希算法的研究[D];西安电子科技大学;2013年
10 石丽红;基于SOM算法的高维数据可视化[D];燕山大学;2013年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978