收藏本站
《天津大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘中聚类方法的研究

王莉  
【摘要】:面对大规模的、高维的数据,如何建立有效、可扩展的的聚类数据挖掘算法是数据挖掘领域的一个研究热点。围绕以上问题,本文对聚类算法进行了深入研究,主要包括以下几个方面的内容: 通过对Kohonen自组织映射模型(SOFM)及其主要改进模型的分析,提出一种树形动态生长自组织模型。其网络结构在训练中动态生成,克服了SOFM网络结构固定化的限制;所生成的网络结点数目远远低于传统的SOFM及动态增长自组织映射模型(GSOM),所需训练周期少,训练效率高;用扩展因子(SF)来控制网络的生长速度,可以得到精度不同的聚类结果;由用户选取不同的SF值和输入样本集实现数据集的层次聚类。 针对基于密度、基于网格聚类方法的缺陷,提出一种基于网格、密度及距离的综合聚类方法。通过仿真实验并与现有聚类算法的比较,该方法能识别任意形状、大小、不同密度的类;能有效过滤噪声数据;参数设置简单,无需预先给定聚类个数;具有近似线性时间复杂度,执行效率高,适合大规模数据的聚类问题。 针对现有层次聚类方法的缺点,提出一种层次聚类方法。该方法首先采用划分方法将数据分成原子簇,然后以这些原子簇为基础,实行自底向上的层次聚类得到最终的聚类结果。其可识别任意形状、大小的类,过滤“噪声”数据;具有近似线性时间复杂度,算法执行效率高,适合大规模数据的聚类问题。 将代表点思想与神经网络技术相结合,提出一种基于代表点、密度和神经网络的综合聚类方法。其首先使用代表点来描述数据空间的几何特征,然后将代表点的位置与密度信息同时作为神经网络的输入,通过网络训练得到聚类结果。该方法即继承了代表点方法聚类能力强的特点,而且由于使用了可视化SOFM(ViSOM)网络模型,聚类结果的可视性效果好。
【学位授予单位】:天津大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前2条
1 邱献红;姚会丽;;聚类分析在城市经济发展水平分析中的应用[J];经营管理者;2012年11期
2 张光照;;职业院校学生自我认知满意度评价模型研究[J];中国职业技术教育;2012年02期
中国博士学位论文全文数据库 前4条
1 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
2 单世民;基于网格和密度的数据流聚类方法研究[D];大连理工大学;2006年
3 李永红;结构分析中的实时计算方法研究[D];湖南大学;2008年
4 相洁;启发式问题解决认知神经机制及fMRI数据分析方法研究[D];太原理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 丁金凤;基于网格与密度的数据流聚类算法研究[D];哈尔滨工程大学;2010年
2 乔慧婷;基于密度聚类的峰谷时段划分方法研究[D];华北电力大学(北京);2011年
3 殷烨;移动增值业务分析与营销策略[D];山西财经大学;2011年
4 侯泽民;基于自组织映射的文本聚类研究[D];西南交通大学;2010年
5 张艳丽;基于综合度量的划分聚类研究[D];安徽大学;2011年
6 张奇峰;大型应用程序的自部署机制研究[D];华中科技大学;2010年
7 徐辰冠;基于数据挖掘聚类技术的我国高校分类研究[D];华中科技大学;2011年
8 王会霞;山西移动增值业务精确营销研究[D];中北大学;2012年
9 郭维;桥吊电机机械性能参数的统计特征与状态聚类分析[D];上海海事大学;2006年
10 王莹;应用于体质分类的聚类方法研究及改进[D];西安电子科技大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 赵艳厂,谢帆,宋俊德;一种新的聚类算法:等密度线算法[J];北京邮电大学学报;2002年02期
2 行小帅,焦李成;数据挖掘的聚类方法[J];电路与系统学报;2003年01期
3 高新波,裴继红,谢维信;模糊c-均值聚类算法中加权指数m的研究[J];电子学报;2000年04期
4 王磊,潘进,焦李成;免疫算法[J];电子学报;2000年07期
5 刘静,钟伟才,刘芳,焦李成;免疫进化聚类算法[J];电子学报;2001年S1期
6 杨广文,郑纬民,王鼎兴,李晓明;一种有效的启发式聚类算法[J];电子学报;1999年02期
7 陈金山,韦岗;遗传+模糊C-均值混合聚类算法[J];电子与信息学报;2002年02期
8 王莉,王正欧;TGSOM:一种用于数据聚类的动态自组织映射神经网络[J];电子与信息学报;2003年03期
9 周水庚,周傲英,曹晶;基于数据分区的DBSCAN算法[J];计算机研究与发展;2000年10期
10 周水庚,周傲英,曹晶,胡运发;一种基于密度的快速聚类算法[J];计算机研究与发展;2000年11期
中国博士学位论文全文数据库 前1条
1 李仁璞;分类数据挖掘中若干基本问题的研究[D];天津大学;2003年
【共引文献】
中国期刊全文数据库 前10条
1 谢涛,蒋泽中;边坡系统稳定性多模型综合评价[J];四川建筑科学研究;2004年02期
2 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
3 张安勤;数据挖掘与进化算法[J];安徽教育学院学报;2002年03期
4 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
5 华文立;胡学刚;;平衡决策树分类精度与规则简易性研究[J];安徽电子信息职业技术学院学报;2006年04期
6 陈键;;浅析常用聚类分析算法[J];安徽电子信息职业技术学院学报;2007年01期
7 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
8 焦誉;赖建章;柯佳;;一种基于密度的网格动态聚类算法的研究[J];安徽大学学报(自然科学版);2007年01期
9 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
10 梁佩佩,杨丽萍;基于模糊关系数据库的聚类算法研究[J];安徽职业技术学院学报;2004年01期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 谭守标;霍剑青;郝建;王晓蒲;赵永飞;谢行恕;;高分辨率软X射线显微成像下细胞的自动提取?[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 ;Novel Hybrid Clustering Algorithm Incorporating Artificial Immunity into Fuzzy Kernel Clustering for Pattern Recognition[A];第二十六届中国控制会议论文集[C];2007年
5 李枚毅;游维;蔡自兴;;多样度和适应度引导的遗传算法操作概率计算研究[A];第二十六届中国控制会议论文集[C];2007年
6 张志华;王莉;刘洪;;最大化网络广告收入的投放决策[A];第二十六届中国控制会议论文集[C];2007年
7 ;A Hybrid Clustering Algorithm Based on Grid Density and Rough Sets[A];第二十七届中国控制会议论文集[C];2008年
8 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七届中国控制会议论文集[C];2008年
9 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
10 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 张杏莉;几何约束求解关键问题研究[D];山东科技大学;2010年
2 樊建聪;分布估计学习算法研究[D];山东科技大学;2010年
3 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
4 戴运桃;粒子群优化算法研究及其在船舶运动参数辨识中的应用[D];哈尔滨工程大学;2010年
5 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
6 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
7 曹宇;利用遗传算法对声障板优化设计的研究[D];哈尔滨工程大学;2010年
8 冯麟涵;舰船系统抗冲击性能全局优化方法研究[D];哈尔滨工程大学;2009年
9 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
10 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
2 王浩锋;基于BP神经网络的航段安全评估研究[D];中国工程物理研究院;2010年
3 代宏伟;布里渊散射水下探测目标的自动识别[D];南昌航空大学;2010年
4 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
5 刘志强;基于数据挖掘的客户行为分析和预测研究[D];山东科技大学;2010年
6 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
7 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
8 贾莉莉;跳扩散模型下几种奇异期权的保险精算定价研究[D];山东科技大学;2010年
9 滕景忠;智能瓦斯传感器的研制[D];山东科技大学;2010年
10 陈少华;基于Hopfield神经网络控制系统的研究[D];山东科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 赵姝,张燕平,张铃,张媛,陈传明;覆盖聚类算法[J];安徽大学学报(自然科学版);2005年02期
2 李翠霞,于剑;一种模糊聚类算法归类的研究[J];北京交通大学学报;2005年02期
3 孙雪;李昆仑;胡夕坤;赵瑞;;基于半监督K-means的K值全局寻优算法[J];北京交通大学学报;2009年06期
4 孟宪颐;响应面法在可靠性优化设计中的应用[J];北京建筑工程学院学报;1999年Z1期
5 冯向东;高等学校定位:竞争中的抉择[J];北京大学教育评论;2004年02期
6 马陆亭;我国高等学校分类的结构设计[J];北京大学教育评论;2005年02期
7 赵艳厂,谢帆,宋俊德;一种新的聚类算法:等密度线算法[J];北京邮电大学学报;2002年02期
8 廖里,余英泽,吴渝,聂能;数据挖掘和数据仓库及其在电信业中的应用[J];重庆邮电学院学报(自然科学版);2000年04期
9 向友君;谢胜利;;图像检索技术综述[J];重庆邮电学院学报(自然科学版);2006年03期
10 聂武,刘玉秋,穆罕默德·江罕赞布·阿桑,温保华;某护卫舰的结构再分析(英文)[J];船舶力学;2001年03期
中国重要报纸全文数据库 前1条
1 张梦颖;[N];经济观察报;2003年
中国博士学位论文全文数据库 前10条
1 冯红伟;数据挖掘技术的研究及应用[D];西北工业大学;2002年
2 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
3 刘勇国;基于数据挖掘的网络入侵检测研究[D];重庆大学;2003年
4 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
5 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
6 李秋丹;数据挖掘相关算法的研究与平台实现[D];大连理工大学;2004年
7 熊家军;基于数据挖掘的入侵检测关键技术研究[D];华中科技大学;2004年
8 曹赛先;高等学校分类的理论与实践[D];华中科技大学;2004年
9 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
10 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 刘志芳;精确营销对品牌价值提升的机理研究[D];河北大学;2010年
2 杨凌;聚类分析中聚类数的确定问题[D];武汉科技大学;2001年
3 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
4 骆志群;数据挖掘技术在我国移动通信运营业的应用研究[D];浙江大学;2002年
5 孙孝萍;基于聚类分析的数据挖掘算法研究[D];西南石油学院;2002年
6 刘振岩;数据挖掘分类算法的研究与应用[D];首都师范大学;2003年
7 翟静;可扩展的文本分类系统的核心API的设计与实现[D];四川大学;2003年
8 郭军华;数据挖掘中聚类分析的研究[D];武汉理工大学;2003年
9 赵恒;数据挖掘中分类属性数据聚类研究[D];西安电子科技大学;2003年
10 姜伟;基于数据挖掘聚类算法的研究及其应用[D];辽宁工程技术大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 宋向红;白明月;;基于聚类的学生成绩分析[J];电脑知识与技术;2012年03期
2 陈俊杰;赵丽;相洁;;用机器学习方法解码脑图像数据[J];计算机工程与应用;2012年10期
3 米源;杨燕;李天瑞;;基于密度网格的数据流聚类算法[J];计算机科学;2011年12期
4 邢长征;张国凯;;基于自适应网格划分的数据流聚类算法[J];计算机工程与科学;2011年10期
5 潘燕;;数据挖掘在汽车销售企业CRM中的应用[J];计算机时代;2011年11期
6 何勇;刘青宝;;基于动态网格的数据流聚类分析[J];计算机应用研究;2008年11期
7 潘云伟;成卫;肖海承;赵明翠;;基于粒子群优化算法的交通数据流聚类分析[J];科学技术与工程;2010年28期
8 邢长征;王飞;王丽丽;;密度网格参数自适应的数据流聚类算法[J];计算机科学与探索;2011年10期
9 王超学;潘正茂;马春森;董丽丽;张涛;;改进型加权KNN算法的不平衡数据集分类[J];计算机工程;2012年20期
10 季月华;;高职院校学生对英语课程设置的满意度研究[J];海外英语;2012年20期
中国博士学位论文全文数据库 前2条
1 马爱清;GIS电场及其逆问题数值计算方法研究[D];上海交通大学;2009年
2 张正;基于减基法的结构力学响应的快速计算方法研究[D];湖南大学;2012年
中国硕士学位论文全文数据库 前10条
1 丁金凤;基于网格与密度的数据流聚类算法研究[D];哈尔滨工程大学;2010年
2 乔晓燕;基于fMRI的图像情感分析方法研究[D];太原理工大学;2011年
3 赵丽;解读fMRI情感类型的机器学习方法研究[D];太原理工大学;2011年
4 陈希;基于R语言数据挖掘的社交网络客户细分研究[D];北京邮电大学;2011年
5 高希瑞;基于文本挖掘的企业危机预警研究[D];华东师范大学;2011年
6 屠强;流数据的层次聚类和频繁模式的挖掘算法研究[D];南京理工大学;2011年
7 刘旭;基于互联网数据的话题发现及追踪技术研究与实现[D];复旦大学;2010年
8 米源;基于密度网格的数据流聚类算法研究[D];西南交通大学;2011年
9 张艳丽;基于综合度量的划分聚类研究[D];安徽大学;2011年
10 黄莉;基于聚类的入侵检测方法研究[D];安徽理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 许俊刚,柯有安;自组织神经网络雷达目标识别的研究[J];北京理工大学学报;1992年03期
2 史笑兴,顾明亮,王太君,何振亚;有序聚类方法及其在神经网络语音识别中的应用[J];电路与系统学报;2000年02期
3 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
4 刘健庄;基于二维直方图的图象模糊聚类分割方法[J];电子学报;1992年09期
5 裴继红,范九伦,谢维信;一种新的高效软聚类方法:[J];电子学报;1998年02期
6 贺前华,韦岗,陆以勤;基因算法研究进展[J];电子学报;1998年10期
7 王磊,潘进,焦李成;免疫算法[J];电子学报;2000年07期
8 刘静,钟伟才,刘芳,焦李成;免疫进化聚类算法[J];电子学报;2001年S1期
9 刘健庄,谢维信,黄建军,李文化;聚类分析的遗传算法方法[J];电子学报;1995年11期
10 陈金山,韦岗;遗传+模糊C-均值混合聚类算法[J];电子与信息学报;2002年02期
中国博士学位论文全文数据库 前1条
1 裴继红;基于模糊信息处理的图像分割方法研究[D];西安电子科技大学;1998年
【相似文献】
中国期刊全文数据库 前10条
1 张剑飞,王辉;数据挖掘中基于模型的聚类分析方法研究[J];克山师专学报;2004年03期
2 李宗福,邓琼波,李桓;Kohonen SOFM神经网络及其演化研究[J];计算机工程与设计;2004年10期
3 杨斌,赵红漫,赵宗涛,张乐;一个改进的遥感图像目标纹理分类识别算法[J];微电子学与计算机;2004年09期
4 张博洋,吴晓娟,葛庆国;基于SOFM神经网络的动态手势分割技术的研究[J];山东大学学报(工学版);2004年01期
5 冯长建,丁启全,吴昭同,童进;SOFM和HMM在旋转机械升降速全过程故障诊断中的应用[J];上海海运学院学报;2001年03期
6 程柏林,朱元清,马晓岩;一种用于雷达信号分选的改进型神经网络[J];空军雷达学院学报;2005年02期
7 刘松;;部署应用网格是IT部门的当务之急[J];通信世界;2009年24期
8 方敏,叶锋;基于自组织特征映射网的灰度图像二值化方法[J];合肥工业大学学报(自然科学版);2001年06期
9 刘松;;应用网格:IT部门的当务之急[J];中国电信业;2009年09期
10 史桂蓉,邢渊,张永清;用神经网络进行散乱点的区域分割[J];机械科学与技术;2002年04期
中国重要会议论文全文数据库 前10条
1 刘特安;聂建英;;基于SOFM神经网络的大气窗口最优特征方法研究[A];2009年先进光学技术及其应用研讨会论文集(上册)[C];2009年
2 黄姣;;基于GIS与SOFM网络的中国综合自然区划[A];地理学核心问题与主线——中国地理学会2011年学术年会暨中国科学院新疆生态与地理研究所建所五十年庆典论文摘要集[C];2011年
3 吕超;刘君;刘瑜;;基于Delaunay图的非结构变形网格计算方法研究[A];中国航空学会第七届动力年会论文摘要集[C];2010年
4 刘邦弟;;主从网格方法[A];中国工程物理研究院科技年报(1998)[C];1998年
5 杨关良;欧阳清;;基于自组织特征映射网络的图像压缩改进算法[A];中国图学新进展2007——第一届中国图学大会暨第十届华东六省一市工程图学学术年会论文集[C];2007年
6 许和勇;叶正寅;王刚;史爱明;;用非结构嵌套网格方法计算旋翼前飞流场[A];第十届全国空气弹性学术交流会会议论文集[C];2007年
7 王兴勇;郭军;刘树坤;谢省宗;;Lattice Boltzmann方法的分块-耦合算法[A];计算流体力学研究进展——第十二届全国计算流体力学会议论文集[C];2004年
8 伍贻兆;田书玲;刘学强;夏健;;基于非结构网格的非定常流数值模拟方法研究[A];非定常空气动力学研讨会论文选集[C];2007年
9 潘志远;崔维成;;使用RANS方程及动网格方法模拟圆柱体的涡激振动[A];第七届全国水动力学学术会议暨第十九届全国水动力学研讨会文集(上册)[C];2005年
10 艾辉林;陈艾荣;;基于ALE格式的动网格方法数值模拟桥梁断面气动导数[A];第十三届全国结构风工程学术会议论文集(下册)[C];2007年
中国博士学位论文全文数据库 前10条
1 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年
2 哈斯巴干;神经网络及其组合算法的遥感数据分类研究[D];中国科学院研究生院(遥感应用研究所);2003年
3 高晓雷;SOZRSL软件需求规格说明语言及其求精[D];上海大学;2004年
4 孙玉芬;基于网格方法的聚类算法研究[D];华中科技大学;2006年
5 葛全文;ICF中流体不稳定性的数值模拟研究与Hamilton-Jacobi方程的运动网格方法[D];中国工程物理研究院;2003年
6 孙志伟;空间数据聚类的研究[D];天津大学;2007年
7 李若;移动网格方法及其应用[D];北京大学;2001年
8 田书玲;基于非结构网格方法的重叠网格算法研究[D];南京航空航天大学;2008年
9 张宏伟;一类粘弹性流体模型与数值分析的研究[D];中南大学;2007年
10 王巍;有相对运动的多体分离过程非定常数值算法研究及实验验证[D];国防科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 王磊明;SOFM算法在图像识别中的应用研究[D];辽宁工程技术大学;2011年
2 杨波;基于SOFM、VQ与HMM的说话人识别技术研究[D];西安科技学院;2002年
3 王欣欣;基于KPCA和SOFM神经网络的文本分类算法研究[D];新疆大学;2012年
4 王晓雪;三类BAM神经网络的动力行为研究及SOFM神经网络的应用[D];中国海洋大学;2012年
5 张继昊;基于SOFM自组织特征映射网络的图像语义分割与标识[D];上海交通大学;2010年
6 宫铭举;基于多小波的图像矢量量化研究[D];中国海洋大学;2005年
7 王靓明;融合多重模糊矩阵_SOFM的Web日志挖掘研究[D];南昌大学;2010年
8 孙炳彤;扩展SDM模型及其在预测和识别中的应用研究[D];南京航空航天大学;2002年
9 邓颖;容差电路故障诊断BP和SOFM神经网络方法[D];湖南大学;2001年
10 任继军;彩色图象分割及其在中医舌图象处理中的应用[D];西北工业大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026