收藏本站
《天津大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘中聚类方法的研究

王莉  
【摘要】:面对大规模的、高维的数据,如何建立有效、可扩展的的聚类数据挖掘算法是数据挖掘领域的一个研究热点。围绕以上问题,本文对聚类算法进行了深入研究,主要包括以下几个方面的内容: 通过对Kohonen自组织映射模型(SOFM)及其主要改进模型的分析,提出一种树形动态生长自组织模型。其网络结构在训练中动态生成,克服了SOFM网络结构固定化的限制;所生成的网络结点数目远远低于传统的SOFM及动态增长自组织映射模型(GSOM),所需训练周期少,训练效率高;用扩展因子(SF)来控制网络的生长速度,可以得到精度不同的聚类结果;由用户选取不同的SF值和输入样本集实现数据集的层次聚类。 针对基于密度、基于网格聚类方法的缺陷,提出一种基于网格、密度及距离的综合聚类方法。通过仿真实验并与现有聚类算法的比较,该方法能识别任意形状、大小、不同密度的类;能有效过滤噪声数据;参数设置简单,无需预先给定聚类个数;具有近似线性时间复杂度,执行效率高,适合大规模数据的聚类问题。 针对现有层次聚类方法的缺点,提出一种层次聚类方法。该方法首先采用划分方法将数据分成原子簇,然后以这些原子簇为基础,实行自底向上的层次聚类得到最终的聚类结果。其可识别任意形状、大小的类,过滤“噪声”数据;具有近似线性时间复杂度,算法执行效率高,适合大规模数据的聚类问题。 将代表点思想与神经网络技术相结合,提出一种基于代表点、密度和神经网络的综合聚类方法。其首先使用代表点来描述数据空间的几何特征,然后将代表点的位置与密度信息同时作为神经网络的输入,通过网络训练得到聚类结果。该方法即继承了代表点方法聚类能力强的特点,而且由于使用了可视化SOFM(ViSOM)网络模型,聚类结果的可视性效果好。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张剑飞,王辉;数据挖掘中基于模型的聚类分析方法研究[J];克山师专学报;2004年03期
2 李宗福,邓琼波,李桓;Kohonen SOFM神经网络及其演化研究[J];计算机工程与设计;2004年10期
3 杨斌,赵红漫,赵宗涛,张乐;一个改进的遥感图像目标纹理分类识别算法[J];微电子学与计算机;2004年09期
4 张博洋,吴晓娟,葛庆国;基于SOFM神经网络的动态手势分割技术的研究[J];山东大学学报(工学版);2004年01期
5 冯长建,丁启全,吴昭同,童进;SOFM和HMM在旋转机械升降速全过程故障诊断中的应用[J];上海海运学院学报;2001年03期
6 程柏林,朱元清,马晓岩;一种用于雷达信号分选的改进型神经网络[J];空军雷达学院学报;2005年02期
7 刘松;;部署应用网格是IT部门的当务之急[J];通信世界;2009年24期
8 方敏,叶锋;基于自组织特征映射网的灰度图像二值化方法[J];合肥工业大学学报(自然科学版);2001年06期
9 刘松;;应用网格:IT部门的当务之急[J];中国电信业;2009年09期
10 史桂蓉,邢渊,张永清;用神经网络进行散乱点的区域分割[J];机械科学与技术;2002年04期
11 王虹,时文;基于SOFM的聚类分析在数据挖掘中的应用研究[J];交通与计算机;2005年03期
12 李大辉;王永红;;基于神经网络模型的聚类分析技术研究[J];高师理科学刊;2007年02期
13 徐涌,陈恩红,王煦法;基于神经网络的Web用户行为聚类分析[J];小型微型计算机系统;2001年06期
14 刘志成;陈承欢;黄格飞;;基于层次方法的数据挖掘工具的设计与实现[J];电脑开发与应用;2006年12期
15 陈兵;吴微;;基于SOFM和最短路径法的黏连字符分割[J];仪器仪表学报;2006年S3期
16 刘松;;部署应用网格是IT部门的当务之急[J];机械工业信息与网络;2009年04期
17 王焱;王磊明;孙雁鸣;;SOFM模型在杂草图像识别中的应用[J];计算机工程与科学;2011年04期
18 许锋,方弢,卢建刚,孙优贤;一种基于PCA/SOFM混合神经网络的图象压缩算法[J];中国图象图形学报;2003年09期
19 许元红;吴扬扬;;基于聚类方法的ATM交易量分析[J];华南金融电脑;2006年01期
20 高琳琦;李从东;;个性化产品推荐中的SOFM神经网络模型[J];天津师范大学学报(自然科学版);2006年02期
中国重要会议论文全文数据库 前10条
1 刘特安;聂建英;;基于SOFM神经网络的大气窗口最优特征方法研究[A];2009年先进光学技术及其应用研讨会论文集(上册)[C];2009年
2 黄姣;;基于GIS与SOFM网络的中国综合自然区划[A];地理学核心问题与主线——中国地理学会2011年学术年会暨中国科学院新疆生态与地理研究所建所五十年庆典论文摘要集[C];2011年
3 吕超;刘君;刘瑜;;基于Delaunay图的非结构变形网格计算方法研究[A];中国航空学会第七届动力年会论文摘要集[C];2010年
4 刘邦弟;;主从网格方法[A];中国工程物理研究院科技年报(1998)[C];1998年
5 杨关良;欧阳清;;基于自组织特征映射网络的图像压缩改进算法[A];中国图学新进展2007——第一届中国图学大会暨第十届华东六省一市工程图学学术年会论文集[C];2007年
6 许和勇;叶正寅;王刚;史爱明;;用非结构嵌套网格方法计算旋翼前飞流场[A];第十届全国空气弹性学术交流会会议论文集[C];2007年
7 王兴勇;郭军;刘树坤;谢省宗;;Lattice Boltzmann方法的分块-耦合算法[A];计算流体力学研究进展——第十二届全国计算流体力学会议论文集[C];2004年
8 伍贻兆;田书玲;刘学强;夏健;;基于非结构网格的非定常流数值模拟方法研究[A];非定常空气动力学研讨会论文选集[C];2007年
9 潘志远;崔维成;;使用RANS方程及动网格方法模拟圆柱体的涡激振动[A];第七届全国水动力学学术会议暨第十九届全国水动力学研讨会文集(上册)[C];2005年
10 艾辉林;陈艾荣;;基于ALE格式的动网格方法数值模拟桥梁断面气动导数[A];第十三届全国结构风工程学术会议论文集(下册)[C];2007年
中国博士学位论文全文数据库 前10条
1 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年
2 哈斯巴干;神经网络及其组合算法的遥感数据分类研究[D];中国科学院研究生院(遥感应用研究所);2003年
3 高晓雷;SOZRSL软件需求规格说明语言及其求精[D];上海大学;2004年
4 孙玉芬;基于网格方法的聚类算法研究[D];华中科技大学;2006年
5 葛全文;ICF中流体不稳定性的数值模拟研究与Hamilton-Jacobi方程的运动网格方法[D];中国工程物理研究院;2003年
6 孙志伟;空间数据聚类的研究[D];天津大学;2007年
7 李若;移动网格方法及其应用[D];北京大学;2001年
8 田书玲;基于非结构网格方法的重叠网格算法研究[D];南京航空航天大学;2008年
9 张宏伟;一类粘弹性流体模型与数值分析的研究[D];中南大学;2007年
10 王巍;有相对运动的多体分离过程非定常数值算法研究及实验验证[D];国防科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 王磊明;SOFM算法在图像识别中的应用研究[D];辽宁工程技术大学;2011年
2 杨波;基于SOFM、VQ与HMM的说话人识别技术研究[D];西安科技学院;2002年
3 王欣欣;基于KPCA和SOFM神经网络的文本分类算法研究[D];新疆大学;2012年
4 王晓雪;三类BAM神经网络的动力行为研究及SOFM神经网络的应用[D];中国海洋大学;2012年
5 张继昊;基于SOFM自组织特征映射网络的图像语义分割与标识[D];上海交通大学;2010年
6 宫铭举;基于多小波的图像矢量量化研究[D];中国海洋大学;2005年
7 王靓明;融合多重模糊矩阵_SOFM的Web日志挖掘研究[D];南昌大学;2010年
8 孙炳彤;扩展SDM模型及其在预测和识别中的应用研究[D];南京航空航天大学;2002年
9 邓颖;容差电路故障诊断BP和SOFM神经网络方法[D];湖南大学;2001年
10 任继军;彩色图象分割及其在中医舌图象处理中的应用[D];西北工业大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978