收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于一维SOM神经网络的聚类及数据分析方法研究

于鷃  
【摘要】: 聚类分析是数据挖掘领域中一个非常活跃的研究课题。 自组织特征映射网络(Self-Organization Map,SOM)能够将输入数据映射到输出神经元阵列中,并保持数据集的拓扑结构和密度分布,使同类数据聚集在一起。 自从SOM问世以来,人们对它的研究大多数聚焦在二维SOM上,对一维SOM的研究相对较少。直觉上,二维SOM比一维SOM能保持更多的数据集结构信息。但是,笔者发现,在把同类数据聚集在一起,把不同类数据完全分离方面一维SOM并不逊色于二维SOM。而且,在类边界识别、样本之间的相似关系表达以及类与类之间的相邻关系的表达方面,一维SOM比二维SOM更容易、更明确。为此,本论文开展了基于一维SOM聚类的系列实验研究。系统研究了一维SOM的聚类功能,着力开发出几个基于一维SOM的聚类分析方法。 实验结果表明,一维SOM能像二维SOM一样对数据空间样本进行正确聚类。与二维SOM相比,一维SOM不但能保持原数据空间中类的线性可分性,而且能把数据空间中线性不可分的类映射为线性可分的类,使得一维SOM映射图中相邻数据和相邻类的关系更直观,类分界线的可视化更容易。 通过系列实验,研究了神经元个数、训练参数与聚类结果之间的关系。提出了独立性、分散度和最大聚集度三个评价一维SOM训练和聚类效果的定量指标。找到了使一维SOM得到充分训练的参数取值范围。为开发基于一维SOM的系列聚类分析法奠定了基础。 根据一维和二维映射图拓扑保持性的互补性,提出了基于一维和二维SOM组合图的聚类方法(CC-SOM)。使用该方法对三个典型数据集进行了聚类实验,结果表明,该方法不仅适用于球形类,对于结构复杂的非球形类也具有较好的聚类效果。 针对高维大数据集聚类问题,提出了基于一维SOM最相似原型序列的聚类方法(MSPS-SOM)。实验表明,该方法具有较好的抗噪音能力和对大数据集的处理能力,能够较好地识别基于距离的类和基于密度的类。 提出了样距图的概念,确立了样距图数据的获取程序和样距图的绘制及校正方法,找出了典型数据集结构特征与样距图或校正样距图形状特征的一一对应关系。在此基础上提出了基于一维SOM输出序列样距图的数据分析法(SDP-SOM)。实验表明,使用该方法不仅可以得到聚类结果,还能得到有关数据集的精细结构信息。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨志荣,李磊;用SOM聚类实现多级高维点数据索引[J];计算机研究与发展;2003年01期
2 王昌龙,黄惟一;人工嗅觉系统设计初步[J];工业仪表与自动化装置;2003年05期
3 余健;郭平;;自组织映射(SOM)聚类算法的研究[J];现代计算机;2007年03期
4 王万荣;;数据挖掘技术的应用研究[J];知识经济;2008年06期
5 徐海燕;唐惠康;;数据挖掘技术[J];黑龙江科技信息;2009年17期
6 谢春丽;;数据仓库技术在公司管理中的应用[J];内蒙古科技与经济;2009年24期
7 伊宏;;数据挖掘技术概述[J];中国标准导报;2008年03期
8 卢云燕;;数据挖掘技术[J];重庆教育学院学报;2006年03期
9 周茜,田忠和;Visual InterDev下的SOM编程[J];计算机应用与软件;2000年12期
10 郑世珏,张江陵;基于嵌入式开发板SOM-2353F的电子课本应用系统设计[J];计算机应用研究;2004年03期
11 徐晓敏;甘仞初;;基于SOM实例归纳学习的信息系统总体设计模式生成方法[J];计算机应用研究;2006年05期
12 陈良维;;数据挖掘中聚类算法研究[J];微计算机信息;2006年21期
13 王世东;;基于SOM网络以线段为基元的曲线重建[J];安徽建筑工业学院学报(自然科学版);2009年05期
14 习胜丰;基于脚本对象模型(SOM)的Web数据绑定技术的实现[J];计算机系统应用;2003年10期
15 孙颖;;基于数据仓库技术的经营管理模型及其实现[J];黑龙江科技信息;2007年20期
16 于金霞;蔡自兴;段琢华;;基于激光雷达的环境特征提取方法研究[J];计算机测量与控制;2007年11期
17 刘瑞新;;多维空间数据的存储结构研究[J];河南大学学报(自然科学版);2008年04期
18 马道钧;俞利强;;基于语音参数的神经网络识别研究[J];北京电子科技学院学报;2008年02期
19 朱牧;孟凡荣;周勇;;一种确定聚类数目的自组织特征映射网络[J];微电子学与计算机;2009年08期
20 赵捧未;王亚楠;窦永香;;对等网环境下动态知识地图的构建研究[J];信息系统学报;2010年01期
中国重要会议论文全文数据库 前10条
1 郭景峰;杜京;马倩;邹晓红;;一种基于数据集性质的快速等差模式聚类算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 许晓峰;金澈清;高明;周傲英;;面向大型数据集合的关键分类查找算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 贺康;庞海荣;;SOM神经网络在全液压钻机故障诊断中的应用[A];煤矿机电一体化新技术2011学术年会论文集[C];2011年
4 ;MR Brain Image Segmentation Based on Wavelet Transform and SOM Neural Network[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
5 崔江涛;肖斌;詹海生;;面向高维数据集的近邻顺序查询方法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
6 熊涛;鲍玉昆;胡忠义;;基于SOM和SVMs的股票价格指数多步预测方法[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
7 朱牧;孟凡荣;周勇;;一种确定聚类数目的自组织特征映射网络[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
8 徐凡;梁爽;李艳红;王丹;;基于SOM网络和遗传算法的经济区域规划的研究[A];2007第三届中国智能交通年会论文集[C];2007年
9 张文明;马全峰;;基于HLA的物资供应辅助决策联邦及其邦员SOM的设计[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
10 于佳;王燕;;基于SOM的视频中人工文本区域检测方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 于鷃;基于一维SOM神经网络的聚类及数据分析方法研究[D];天津大学;2009年
2 申彦;大规模数据集高效数据挖掘算法研究[D];江苏大学;2013年
3 彭涛;基于特征和实例的海量数据约简方法研究[D];华中科技大学;2011年
4 董志强;胶质细胞源性神经营养因子在大鼠神经痛及电针镇痛中的作用及其机制研究[D];复旦大学;2005年
5 徐志鹏;造纸过程中纸病检测关键技术研究[D];江南大学;2005年
6 唐勤;非均衡数据分类算法及其在助学贷款风险管理中的应用研究[D];华中科技大学;2012年
7 闫伟;基于数据挖掘的复杂产品关键质量特性识别的方法研究[D];天津大学;2012年
8 米传民;贷款损失准备金计提与商业银行监管方法研究[D];南京航空航天大学;2006年
9 唐明珠;类别不平衡和误分类代价不等的数据集分类方法及应用[D];中南大学;2012年
10 余廷芳;火电厂厂级监控信息系统(SIS)建模、实现及人工智能的应用研究[D];东南大学;2004年
中国硕士学位论文全文数据库 前10条
1 姚冰;一种改进的非平衡数据集支持向量机分类算法[D];吉林大学;2010年
2 黎猛;基于SOM的文本聚类模型研究[D];华中科技大学;2011年
3 毕红净;动态数据集隐私保护技术研究[D];内蒙古科技大学;2010年
4 宋玉丹;针对特征缺省数据集的模式识别方法与应用研究[D];江南大学;2011年
5 侯德森;一种面向大数据集的部分优先聚类算法[D];华北电力大学(北京);2011年
6 陈心怡;基于改进SOM算法的化工过程故障诊断研究[D];华东理工大学;2013年
7 付渊;运用神经网络聚类方法推进构建本体的自动化[D];太原理工大学;2006年
8 周亮;基于粗糙集的大数据集挖掘算法研究与实现[D];江苏大学;2010年
9 蔡丽宏;SOM聚类算法的改进及其在文本挖掘中的应用研究[D];南京航空航天大学;2011年
10 施红鑫;基于附加敏感参数SOM神经网络的自动聚类系统的研究[D];燕山大学;2010年
中国重要报纸全文数据库 前10条
1 ;OLAP立方体开始瓦解[N];网络世界;2008年
2 林晓明;CommVault一体化解决方案[N];中国计算机报;2007年
3 记者 马芳;人类首获自身参考基因组数据集合[N];南方日报;2010年
4 ;数据集市:深化挖掘第一步[N];人民邮电;2006年
5 莫言钧;现阶段A股市场存在泡沫吗[N];上海证券报;2007年
6 ;集中式存储缓存[N];网络世界;2007年
7 清华大学信息技术研究院 侯玮玮 鞠大鹏 汪东升 清华大学-威视数据安全研究所 李东锋 侯海波;灾难备份:让你有备无患[N];计算机世界;2006年
8 李点;电子商务需要“即时管理”[N];北京科技报;2001年
9 ;“经济型”数据仓库行情看涨[N];网络世界;2005年
10 ;重复数据删除的经济性[N];网络世界;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978