收藏本站
《武汉科技大学》 2001年
收藏 | 手机打开
二维码
手机客户端打开本文

聚类分析中聚类数的确定问题

杨凌  
【摘要】: 聚类就是按照事物间的相似性进行区分和分类的过程,在这一过程中没有教师指导,因此是一种无监督分类。聚类分析则是用数学方法研究和处理所给对象的分类以及各类之间的亲疏程度,是在对数据不作任何假设的条件下进行分析的工具。在人工智能和模式识别中,聚类分析亦称为“无先验学习”,是机器学习中知识获取的重要环节。“物以类聚,人以群分”,聚类是一个古老的问题,它伴随着人类社会的产生和发展而不断深化,人类要认识世界就必须区分不同的事物并认识事物间的相以性。聚类已被广泛地应用于各种工程和科学领域,如心理学、生物学、医学、通讯和远程感应等。 人们根据不同领域的需要,提出了各种不同的聚类方法,其中最受欢迎的是目标聚类法,但是他们大多是假设在给定聚类数的前提下,根据待聚类样本的属性,优化类中心或隶属度,将它们划分到各个类中。这有点类似于系统辨识中,假设系统结构确定,来进行参数估计一样。至于聚类数的确定问题,要么未给出答案,要么使用穷举法。因此现在的问题是我们能否比较方便地直接确定聚类数,而不需任何假设。这将是本文所主要讨论的问题。 就迭代最优化方法而言,最重要的是选取适当的聚类准则和类间相似性度量。但是,在此方面,人们已经做了很多有意义的工作,所以本文将在前人的基础上选择一个恰当的聚类准则函数,以便在无任何假设条件的前提下比较简单地直接确定聚类数。另外,由于迭代最优化方法是一种爬山法,所以难免会收敛到局部极值,因此如何解决该问题也是本文将讨论。 本文考虑如下聚类准则函数: 武汉科技大学硕士论文 。 lllfl LAI=y > 11.IIX-X 11 lflllX M=llll IIX X 11 其中包括经典的类内加权平方误差和准则函数。并证明了该优化问题 是聚类数的一个单峰函数,可分两层实现:外层用黄大分别法,内层 用K一均值聚类算法和具有最优保存策略的遗传算法。之所以将:二者 结合在一起,是回为K一均值算法是一种爬山法,容易收敛到冈部极 小值,对初始条件较敏感,但收敛速度较快,而遗传算法是 卞dl随机 搜索算法,能够以较大概率找到全局最忧解,且对们始条件个敏感, 但收敛速度较慢。 本文的仿真表明使用该准则函数及此种实现方式能在无仟何假 设条件的情况下,比较方匣、直接地确定聚类数,丘所得的结果优于 另外两种准则函数。
【学位授予单位】:武汉科技大学
【学位级别】:硕士
【学位授予年份】:2001
【分类号】:TP311.13

手机知网App
【引证文献】
中国期刊全文数据库 前4条
1 袁忠军;陈刚;;基于结构自适应神经网络用电量时间特征的聚类分析[J];重庆大学学报(自然科学版);2007年08期
2 程慈;柴瑞敏;;聚类数的自动确定[J];科技信息(科学教研);2008年14期
3 罗罕频;占峰;任剑锋;;基于LabVIEW的锋电位分类虚拟仪器[J];实验室研究与探索;2010年11期
4 钟咏兵;张瑞昌;肖树臣;贾秋锐;李相伟;;基于空域法的UCAV群目标编群策略研究[J];微计算机信息;2011年09期
中国硕士学位论文全文数据库 前8条
1 李全栋;基于内容的视频检索中镜头分割与关键帧提取研究[D];中北大学;2011年
2 林孟辉;嗅觉神经信号记录和峰电位分类方法研究[D];南京航空航天大学;2010年
3 李丽珊;基于动态簇中心迁移的聚类算法及应用[D];福州大学;2005年
4 黄关山;基于聚类规则挖掘的教学分析系统设计与实现[D];东南大学;2005年
5 刘梦琳;基于微粒群优化算法的聚类分析及其在学生成绩管理中的应用[D];山东师范大学;2007年
6 汤立;房地产项目目标市场定位研究[D];中南大学;2007年
7 陈芳楠;电力营销系统中需电量预测的设计与实现[D];电子科技大学;2009年
8 李宇泊;K均值算法初始聚类中心选取相关问题研究[D];兰州交通大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 刘健庄,谢维信,黄建军,李文化;聚类分析的遗传算法方法[J];电子学报;1995年11期
2 杨广文,郑纬民,王鼎兴,李晓明;一种有效的启发式聚类算法[J];电子学报;1999年02期
3 杨广文,李晓明,王义和,郑纬民,王鼎兴;确定性退火技术[J];计算机学报;1998年08期
4 白硕;不完全知识下的概念聚类[J];计算机学报;1995年06期
5 李琼;系统聚类分析中的遗传算法[J];武汉交通科技大学学报;2000年03期
6 彭宏,王兴华;具有Elitist选择的遗传算法的收敛速度估计[J];科学通报;1997年02期
7 张晓缋,戴冠中,徐乃平;一种新的优化搜索算法──遗传算法[J];控制理论与应用;1995年03期
8 恽为民,席裕庚;遗传算法的全局收敛性和计算效率分析[J];控制理论与应用;1996年04期
9 何清;模糊聚类分析理论与应用研究进展[J];模糊系统与数学;1998年02期
10 杨广文,王鼎兴,郑纬民,李晓明;一种利用确定性退火技术的聚类模型与算法研究[J];软件学报;1999年06期
【共引文献】
中国期刊全文数据库 前10条
1 吴大宏,赵人达;基于遗传算法与神经网络的桥梁结构健康监测系统研究初探[J];四川建筑科学研究;2002年03期
2 邓建斌;叶洪江;;基于混沌遗传算法的配电网无功补偿优化[J];安徽电气工程职业技术学院学报;2006年03期
3 乔志杰;程翠翠;;基于遗传算法优化的模糊PID控制研究及其仿真[J];安徽电气工程职业技术学院学报;2009年03期
4 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
5 安振刚,李谋渭,尹显东,于宁,唐伟;遗传神经网络在平整轧制力预报中的应用[J];鞍钢技术;2001年06期
6 陈征;;一类系统的二次李雅普诺夫函数存在性的判断[J];安徽电子信息职业技术学院学报;2006年04期
7 华文立;胡学刚;;平衡决策树分类精度与规则简易性研究[J];安徽电子信息职业技术学院学报;2006年04期
8 姚元金;广义不变凸分式多目标规划的最优性条件[J];安徽大学学报(自然科学版);2004年01期
9 孙小军;焦建民;何俊红;;解优化问题的遗传加速信赖域搜索算法[J];安徽大学学报(自然科学版);2008年03期
10 张蕾蕾;;对称弧式连通凸多目标半无限规划的对偶性[J];安徽大学学报(自然科学版);2010年01期
中国重要会议论文全文数据库 前10条
1 齐继阳;竺长安;曾议;;基于遗传禁忌混合搜索算法的设备布局研究[A];2004“安徽制造业发展”博士科技论坛论文集[C];2004年
2 刘钰;韩峰;董楠;陆希成;雷鸣;;爆炸容器安全概率的统计分析方法[A];全国危险物质与安全应急技术研讨会论文集(下)[C];2011年
3 丁婷;崔红涛;;遗传算法在智能天线扇区波束赋形及阵元失效补偿中的应用[A];经济策论(上)[C];2011年
4 程远林;李茂军;;基于小生境遗传算法的配电网电容器优化配置[A];第二十六届中国控制会议论文集[C];2007年
5 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
6 张志华;王莉;刘洪;;最大化网络广告收入的投放决策[A];第二十六届中国控制会议论文集[C];2007年
7 赵瑞艳;李树荣;张晓东;苗荣;;基于混合遗传算法的热传导系统最优控制问题求解[A];第二十七届中国控制会议论文集[C];2008年
8 王清;宋年年;王佳庆;姚菁;;优化自抗扰控制器在主汽温控制系统中的应用[A];第二十七届中国控制会议论文集[C];2008年
9 康忠健;徐丽;勾松波;金华蓉;李瑞生;;考虑分布电容的神经网络单相接地故障测距算法[A];第二十七届中国控制会议论文集[C];2008年
10 姜封国;;基于小生境技术的混合遗传算法[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 李佳;载人潜器阻力性能的数值和试验预报及外形优化研究[D];哈尔滨工程大学;2010年
2 张亚娟;适应性企业战略协同机制研究[D];哈尔滨工程大学;2010年
3 谭枫;介入式文化算法及其应用研究[D];哈尔滨工程大学;2010年
4 陆满君;通信辐射源个体识别与参数估计[D];哈尔滨工程大学;2010年
5 谭佳琳;粒子群优化算法研究及其在海底地形辅助导航中的应用[D];哈尔滨工程大学;2010年
6 陈得宇;基于MAS的智能电压控制系统研究[D];哈尔滨工程大学;2010年
7 李晚龙;六自由度Stewart平台分散智能控制研究[D];哈尔滨工程大学;2010年
8 董慧群;代建制项目风险预警管理研究[D];辽宁工程技术大学;2010年
9 许爱德;开关磁阻电机在船舶电力推进中的应用研究[D];大连海事大学;2010年
10 刘冬雁;川西高原甘孜黄土记录的早更新世晚期以来的古气候变化[D];中国海洋大学;2009年
中国硕士学位论文全文数据库 前10条
1 张小亮;非线性规划的信赖域算法[D];河南理工大学;2010年
2 万成;动态环境下的元胞遗传算法研究[D];南昌航空大学;2010年
3 李坤;参数参与进化的自适应遗传算法研究[D];南昌航空大学;2010年
4 王金凤;多阶段投资组合模型及其算法的研究[D];南昌航空大学;2010年
5 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
6 马水松;多目标遗传算法与非支配集的构造研究[D];山东科技大学;2010年
7 李臻;城市公交车辆智能调度优化研究[D];山东科技大学;2010年
8 朱国凯;泰安市农村公路典型路面结构研究[D];山东科技大学;2010年
9 纪二云;基于改进遗传算法的电力系统无功优化的研究[D];山东科技大学;2010年
10 施晓坤;煤炭企业人才结构优化[D];山东科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 张红云,石阳,马垣;数据挖掘中聚类算法比较研究[J];鞍山钢铁学院学报;2001年05期
2 唐菁;Web文本挖掘系统及聚类算法的研究[J];电信建设;2004年02期
3 李岩;市场营销风险评价方法研究[J];商业研究;2004年13期
4 董颖,唐加福,许宝栋,汪定伟;一种求解非线性规划问题的混合粒子群优化算法[J];东北大学学报;2003年12期
5 李鑫滨,杨景明,丁喜峰;基于递推k-均值聚类算法的RBF神经网络及其在系统辨识中的应用[J];燕山大学学报;1999年04期
6 晏华;刘贵松;;采用熵的多维K-匿名划分方法[J];电子科技大学学报;2007年06期
7 陈刚,王超,周波;电力营销决策支持系统的设计[J];电力需求侧管理;2003年04期
8 行小帅,焦李成;数据挖掘的聚类方法[J];电路与系统学报;2003年01期
9 谷波,张永奎;文本聚类算法的分析与比较[J];电脑开发与应用;2003年11期
10 曾朝晖,刘亚军;神经网络数据挖掘方法在网络营销中的应用[J];电脑知识与技术;2005年15期
中国博士学位论文全文数据库 前6条
1 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年
2 陈刚;基于数据挖掘的电力营销决策支持系统的结构原理及算法研究[D];重庆大学;2004年
3 李伟生;信息融合系统中态势估计技术研究[D];西安电子科技大学;2004年
4 张旭秀;盲源分离及其在脑电信号处理中应用的研究[D];大连理工大学;2006年
5 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
6 陈黎飞;高维数据的聚类方法研究与应用[D];厦门大学;2008年
中国硕士学位论文全文数据库 前10条
1 叶华章;房地产项目开发前期策划——兼论居住小区定位[D];重庆大学;2001年
2 李凡;数据挖掘技术的研究与应用[D];西安电子科技大学;2002年
3 陈小鸣;深圳住宅房地产市场营销的研究[D];武汉理工大学;2002年
4 周波;德阳电业局电力营销决策支持系统的设计与实现[D];重庆大学;2002年
5 姜伟;基于数据挖掘聚类算法的研究及其应用[D];辽宁工程技术大学;2004年
6 毛嘉莉;聚类K-means算法及并行化研究[D];重庆大学;2003年
7 张文哲;基于内容的视频分析与检索方法研究[D];西北工业大学;2004年
8 苏守宝;基于遗传算法的聚类挖掘研究[D];安徽大学;2004年
9 张鹏;基于主成分分析的综合评价研究[D];南京理工大学;2004年
10 龙海莉;市场细分与目标市场问题研究[D];西北工业大学;2005年
【二级引证文献】
中国期刊全文数据库 前1条
1 宋向红;白明月;;基于聚类的学生成绩分析[J];电脑知识与技术;2012年03期
中国硕士学位论文全文数据库 前10条
1 于砚博;房地产住宅项目营销策略研究[D];天津大学;2012年
2 李运闯;STP策划在大型居住房地产项目中的实证研究[D];西安建筑科技大学;2008年
3 卢红民;基于4C理论的西安房地产营销策划研究[D];西安建筑科技大学;2009年
4 李伟;基于竞争情报的重庆TG房地产公司北碚区项目综合定位的研究[D];重庆大学;2009年
5 施红鑫;基于附加敏感参数SOM神经网络的自动聚类系统的研究[D];燕山大学;2010年
6 曲爱英;南京市某房地产项目的市场定位研究[D];西安建筑科技大学;2009年
7 王晓敏;基于微粒群算法的关联规则挖掘方法及应用[D];山东师范大学;2010年
8 詹跃荣;动作电位模式分类及噪声对神经元模型频率同歩性影响研究[D];杭州电子科技大学;2012年
9 刘俊;基于离散Morse理论的数据挖掘研究[D];山东师范大学;2012年
10 段豪;视频检索技术中关键帧提取算法的研究[D];太原理工大学;2012年
【二级参考文献】
中国期刊全文数据库 前5条
1 刘健庄,谢维信,黄建军,李文化;聚类分析的遗传算法方法[J];电子学报;1995年11期
2 方建安,邵世煌;采用遗传算法学习的神经网络控制器[J];控制与决策;1993年03期
3 陈根社,陈新海;应用遗传算法设计自动交会控制器[J];西北工业大学学报;1994年02期
4 马光文,王黎,G·A·Walters;水电站优化调度的FP遗传算法[J];系统工程理论与实践;1996年11期
5 田明,戴汝为;神经元网络控制系统[J];信息与控制;1992年03期
【相似文献】
中国期刊全文数据库 前10条
1 周世兵;徐振源;唐旭清;;K-means算法最佳聚类数确定方法[J];计算机应用;2010年08期
2 周世兵;徐振源;唐旭清;;一种基于近邻传播算法的最佳聚类数确定方法[J];控制与决策;2011年08期
3 周欢;黄立平;;基于SOM神经网络的C-均值聚类算法[J];计算机应用;2007年S1期
4 唐西西;;一种新的混合遗传聚类算法[J];广西工学院学报;2006年03期
5 赵伟丽;张志国;;蚁群聚类算法的改进和实现[J];科技信息(学术研究);2008年02期
6 夏师;梁碧珍;陆月然;罗明山;;聚类分析研究进展[J];现代计算机(专业版);2009年03期
7 赵慧;刘希玉;;一种新的基于网格压缩的聚类算法SGRIDS研究[J];计算机应用研究;2009年09期
8 赖建章;倪志伟;刘志伟;;一种基于密度树的网格快速聚类算法的研究[J];计算机工程;2006年17期
9 张天伍;李卫平;;一种基于密度的引力聚类算法[J];河南科学;2008年11期
10 李峻金;向阳;芦英明;吴朔桐;;粒子群聚类算法综述[J];计算机应用研究;2009年12期
中国重要会议论文全文数据库 前10条
1 杨柳;钟诚;陆向艳;;基于P2P网络的分布式聚类算法研究分析[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
2 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 史金成;胡学钢;;基于约束的数据流聚类研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
4 仲秋雁;莫佳卉;;基于拓展自组织神经网络方法的客户市场细分[A];第十届中国管理科学学术年会论文集[C];2008年
5 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
6 田小丽;郑康锋;钮心忻;;一种基于改进K-Medoids算法的网络攻击检测技术[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
7 杨欣斌;黄道;;一种新的聚类算法[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
9 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 高学东;周磊;;Web点击流数据聚类算法[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
2 中谷期货 杨静;期货公司客户信用风险评级体系研究[N];期货日报;2007年
3 YMG记者 孙长波;烟台经济增速全球第三[N];烟台日报;2008年
4 符信;30个指标评价社会发展水平[N];南方日报;2005年
5 雨文;全国专家聚云财大研讨区域经济学[N];云南日报;2006年
6 中国社会科学院研究生院人文学院 王昌燧 朱剑 朱铁权;原始瓷产地研究之启示[N];中国文物报;2006年
7 王式跃;对宁波区域经济发展差异的分析[N];中国信息报;2007年
8 蒋志华 杨诚 陈晓卫 从日玉 李瑞娟;中国公众统计素养调查研究[N];中国信息报;2009年
9 记者 王宝琳;我首次采用基因组学技术研究中药[N];科技日报;2009年
10 江洪波;我国封闭式基金绩效评价实证研究[N];中国证券报;2003年
中国博士学位论文全文数据库 前10条
1 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
2 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
3 唐东明;聚类分析及其应用研究[D];电子科技大学;2010年
4 赵宁;理中丸和四君子汤与脾虚证方证相关性的实验研究[D];中国中医科学院;2006年
5 曹锋;数据流聚类分析算法[D];复旦大学;2006年
6 吕崇山;代谢综合征中医辨证分型及其与临床检测指标的相关性研究[D];福建中医学院;2008年
7 袁军宝;我国农业现代化进程中的农户兼业经营问题研究[D];兰州大学;2009年
8 邵伟钰;地方政府债务风险预警体系研究[D];苏州大学;2008年
9 吴飞珍;基因芯片数据的聚类功能评价算法和判别分析算法研究[D];上海大学;2009年
10 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 杨凌;聚类分析中聚类数的确定问题[D];武汉科技大学;2001年
2 李慧慧;基于GIS的空间聚类算法的研究与应用[D];贵州大学;2008年
3 徐勇;分析型CRM中聚类算法的研究[D];兰州理工大学;2010年
4 毕晋芝;遗传优化的K均值聚类算法[D];太原理工大学;2010年
5 杜晨阳;分布式聚类算法研究与应用[D];浙江大学;2011年
6 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
7 武彩丽;基于规范切和分水岭的聚类算法研究[D];西安电子科技大学;2010年
8 刘赏;结合密度思想的蚂蚁聚类算法[D];河北工业大学;2003年
9 谷垒;聚类算法及其在电信收入保障系统中的应用研究[D];湖南大学;2010年
10 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026