收藏本站
《南京航空航天大学》 2014年
收藏 | 手机打开
二维码
手机客户端打开本文

海洋环境下聚类算法的研究

陈加顺  
【摘要】:聚类分析是数据挖掘(Data Mining,DM)重要方法之一,在图像处理,环境预测,天气预报等许多领域有着广泛应用,也是进行海洋飓风和赤潮研究的一种新方法。针对目前海洋环境中的飓风和赤潮的分析方法单一性和不完善性,本文采用聚类分析方法对这两种现象进行分析。传统的飓风研究方法依据气象学或空气动力学的原理进行分析,本文采用聚类方法,根据飓风生成的移动特征,把飓风抽象为轨迹,并以此聚类。赤潮过程包含多个阶段,各阶段具有不确定性,这是由赤潮理化因子的不同作用而引起的。传统研究赤潮对所有影响因子数据统一处理,这种方法难以发现个体因子对赤潮的影响作用。针对这一不足之处以及赤潮过程多阶段模糊的特点,提出模糊聚类与权重值相结合的方法,并以此分析赤潮产生过程以及各阶段的特征。影响赤潮发生的理化因子具有高维性,高维数据综合分析,更适合采用模糊聚类分析方法。为了表明算法的有效性,本文构造了一种新有效性评价指标,克服传统依靠距离作为衡量标准的有效性指标的不足。本文以提出的聚类创新理论为研究重点,以海洋环境领域中的应用为背景,内容涉及计算智能技术、海洋飓风以及赤潮,属于交叉学科的研究课题,具有十分重要的理论意义和实际应用价值。论文的主要工作如下:1.研究了飓风轨迹聚类算法。提出了一种基于相似子轨迹的聚类算法。该算法基于子轨迹的划分,提出相似子轨迹的概念,利用相似子轨迹近似代表一个子轨迹聚类区域的空间特征,因此可以减少空间搜寻,算法能够有效的降低时间复杂度和空间复杂度,提高了算法的执行效率。2.研究了轨迹聚类算法输入参数问题。针对轨迹聚类过程中对输入参数ε和Min Lns具有敏感性,提出了一种对输入参数非敏感的轨迹聚类算法,算法根据轨迹划分的子轨迹指定距离和可达距离概念,计算得到上一个参数化的簇排序,通过此排序序列表示轨迹数据内在聚类结构,并且使用此排序序列聚类的结果等效于利用一个参数范围实现轨迹聚类的结果。因此算法能够避免由唯一参数值带来聚类结果的不确定性,有效降低了聚类结果对输入参数的敏感性。3.研究了赤潮发生过程中各阶段的模糊聚类。赤潮发生过程可以分为四个阶段,这四个阶段受多种理化因子制约,各阶段之间难以区别,具有模糊性。某一理化因子在四个阶段都有可能有相同的值,或者值变化非常大。因此不同理化因子在赤潮过程各个阶段的作用大小并不相同。针对赤潮过程的模糊性和各因子对赤潮各阶段影响的重要程度不同的特点,提出一种基于权重的模糊聚类算法,为隶属度函数和典型值函数分配不同的权值。算法克服了模糊可能性均值聚类算法(Fuzzy possibilitic C-Means,FPCM)中限制典型值的不足之处,也克服了可能性模糊聚类算法(Possibilitic Fuzzy C-Means,PFCM)中随机确定参数的不合理性。算法运用基于原型驱动的学习方法确定权重参数,使得权重参数计算更合理。实验结果表明该方法聚类效果明显。4.研究了区间数据集的模糊聚类问题。随着应用的需要,使用区间值变量描述对象大量存在于实际生活中。基于欧氏距离的聚类方法虽然对点数据聚类效果明显,但对区间数据的处理欧氏距离度量方法则显得不足,聚类效果不明显。针对这一特点,提出了区间数据集的三种二次型距离度量方法,在此基础上修改目标方程产生三种算法。在UCI数据集和海洋鱼类数据集上的实验结果表明,新算法能够得到较好的聚类效果,并且有较低误分率。5.研究了聚类有效性指标。在未知数据集中如何确定最佳聚类数和如何确定真实聚类中心,以及如何度量类内紧致度和类间分离度属于聚类有效性研究的问题。目前许多有效性指标算法的类内和类间的度量方法都基于欧氏距离方法,这种方法对于球状数据能够较好的发现最佳聚类数,但对于重叠度较高的数据集和不规则数据集,效果不明显。本文提出了一种非欧氏距离有效性指标VI,指标对类内采用隶属度表示数据集的紧致程度,而类间度量采用反贴近度方法,能够有效克服采用欧氏距离作为重叠数据集和不规则数据集的度量指标而引起的不准确性。该方法既考虑了模糊划分又结合了数据的分布特征,对聚类结果的评价更客观,飓风和赤潮以及其他数据集实验结果表明,该有效性指标都能够找出最佳聚类数和聚类中心。
【学位授予单位】:南京航空航天大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前7条
1 王莉,王正欧;TGSOM:一种用于数据聚类的动态自组织映射神经网络[J];电子与信息学报;2003年03期
2 林昱,林荣澄;RESEARCH ON RED TIDE OCCURRENCES USING ENCLOSED EXPERIMENTAL ECOSYSTEM IN WEST XIAMEN HARBOR, CHINA RELATIONSHIP BETWEEN NUTRIENTS AND RED TIDE OCCURRENCE[J];Chinese Journal of Oceanology and Limnology;2000年03期
3 ;Mechanism for initial brows-like meso-scale vortex effects on tropical cyclone track[J];Science China(Earth Sciences);2012年04期
4 毛宇星;施伯乐;;基于扩展自然序树的概化关联规则增量挖掘方法[J];计算机研究与发展;2012年03期
5 孟祥福;马宗民;张霄雁;王星;;基于改进决策树算法的Web数据库查询结果自动分类方法[J];计算机研究与发展;2012年12期
6 吴成茂,范九伦;基于类内差和改进划分系数的聚类有效性函数[J];系统工程与电子技术;2004年08期
7 赵恒;张高煜;胡海虹;;新的基于数据几何结构的聚类有效性函数[J];系统工程与电子技术;2007年01期
【共引文献】
中国期刊全文数据库 前10条
1 沈来信;黄战;杨帆;;基于改进的自组织特征网络聚类分析[J];安徽工程科技学院学报(自然科学版);2007年01期
2 田彦山;;基于山峰聚类的聚类上限确定方法[J];江西师范大学学报(自然科学版);2007年02期
3 张栒;邓辉文;;基于减法聚类与聚类有效性评判的FCM聚类[J];重庆工学院学报;2006年05期
4 孙娟娟;刘缵武;;判断数据适合分级方法的理论分析[J];测绘工程;2007年05期
5 谷保平;郭红艳;;基于动态SOFM的网络入侵检测[J];计算机安全;2009年08期
6 姜园,张朝阳,仇佩亮,周东方;用于数据挖掘的聚类算法[J];电子与信息学报;2005年04期
7 周翠;吴国平;;基于自适应谐振理论的油气圈闭聚类评价[J];工程地球物理学报;2008年03期
8 陆宇旻;郭会林;李陶深;苏一丹;;一种新的基于动态SOFM的神经网络聚类模型[J];广西师范大学学报(自然科学版);2007年04期
9 张栒;田彦山;;基于减法聚类的聚类上限确定方法[J];固原师专学报;2006年03期
10 张朝林;宋长青;;“复杂构型涡旋移动动力学的研究”研究成果介绍[J];地球科学进展;2013年09期
中国博士学位论文全文数据库 前10条
1 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
2 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年
3 钱晓东;基于神经网络等技术的数据与文本聚分类研究[D];天津大学;2005年
4 李永森;SDMKD及智能空间决策支持系统研究[D];合肥工业大学;2006年
5 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年
6 张旭;人工免疫算法及其在船舶柴油机智能故障诊断中的应用研究[D];大连海事大学;2007年
7 耿新青;基于模糊逻辑和神经网络的数据及文本挖掘的方法研究[D];天津大学;2005年
8 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
9 孙志伟;空间数据聚类的研究[D];天津大学;2007年
10 陈默;无声调语言母语者汉语声调浮现过程的实验和模拟研究[D];北京语言大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘飞荣;SOM算法的改进及其在中文文本聚类的应用[D];南昌大学;2010年
2 曹毅然;基于自组织特征映射神经网络的GSM网络优化研究[D];吉林大学;2011年
3 牟善玲;动态心电波形聚类策略的有效性分析[D];天津理工大学;2011年
4 侯泽民;基于自组织映射的文本聚类研究[D];西南交通大学;2010年
5 庞宇;DICOM格式的图像分割技术在脑出血CT影像中的应用[D];安徽大学;2011年
6 耿锦威;聚类算法及基于簇模式聚类集成研究[D];安徽大学;2011年
7 于迪;模糊聚类分析在煤与瓦斯突出事故预测中的应用研究[D];辽宁工程技术大学;2011年
8 杨占华;聚类分析研究及其在文本挖掘中的应用[D];西南交通大学;2006年
9 张栒;FCM算法初始化方法研究[D];西南大学;2006年
10 乔坤;基于系统能量理论的聚类算法及其应用研究[D];西安建筑科技大学;2007年
【二级参考文献】
中国期刊全文数据库 前8条
1 田永祥,罗哲贤;Vertical Structure of Beta Gyres and Its Effect on Tropical Cyclone Motion[J];Advances in Atmospheric Sciences;1994年01期
2 陈联寿,罗哲贤;Effect of the Interaction of Different Scale Vortices on the Structure and Motion of Typhoons[J];Advances in Atmospheric Sciences;1995年02期
3 范九伦,裴继红,谢维信;基于可能性分布的聚类有效性[J];电子学报;1998年04期
4 范九伦,吴成茂;划分系数和总变差相结合的聚类有效性函数[J];电子学报;2001年11期
5 范九伦,吴成茂;可能性划分系数和模糊变差相结合的聚类有效性函数[J];电子与信息学报;2002年08期
6 孟祥福;严丽;张文博;马宗民;;基于文档属性单元松弛的XML近似查询方法[J];计算机研究与发展;2010年11期
7 朱玉全,孙志挥,季小俊;基于频繁模式树的关联规则增量式更新算法[J];计算机学报;2003年01期
8 易彤,徐宝文,吴方君;一种基于FP树的挖掘关联规则的增量更新算法[J];计算机学报;2004年05期
【相似文献】
中国期刊全文数据库 前10条
1 葛磊;武芳;王鹏波;张冬林;;3维建筑综合中基于最小特征的面平移算法[J];测绘科学技术学报;2009年02期
2 骆雯,孙延明,陈振威,陈锦昌;判断点与封闭多边形相对关系的改进算法[J];机械;1999年03期
3 李林;卢显良;;一种基于切割映射的规则冲突消除算法[J];电子学报;2008年02期
4 刘巧玲;张红英;林茂松;;一种简单快速的图像去雾算法[J];计算机应用与软件;2013年07期
5 林亚平,杨小林;快速概率分析进化算法及其性能研究[J];电子学报;2001年02期
6 章郡锋;吴晓红;黄晓强;何小海;;基于暗原色先验去雾的改进算法[J];电视技术;2013年23期
7 杨铁军;靳婷;;一种动态整周模糊值求解算法及其仿真分析[J];系统工程与电子技术;2007年01期
8 周秀玲;郭平;陈宝维;王静;;几种计算超体积算法的比较研究[J];计算机工程;2011年03期
9 吴一戎,胡东辉,彭海良;Chirp Scaling SAR成象算法及其实现[J];电子科学学刊;1995年03期
10 王贵竹;一种产生单向分解值的算法[J];安徽大学学报(自然科学版);2001年03期
中国重要会议论文全文数据库 前10条
1 尹冀锋;;一种新的图象自适应增强算法[A];四川省通信学会一九九二年学术年会论文集[C];1992年
2 宁春平;田家玮;郭延辉;王影;张英涛;郑桂霞;刘研;;计算机辅助增强、分割算法在鉴别乳腺良、恶性肿块中的应用价值[A];中华医学会第十次全国超声医学学术会议论文汇编[C];2009年
3 谢丽聪;;SVB查询改写算法的改进[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 郑存红;;复杂背景下相关跟踪算法研究及DSP实现[A];中国光学学会2010年光学大会论文集[C];2010年
5 杨文杰;吴军;;RFID抗冲突算法研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
6 高山;毕笃彦;魏娜;;一种基于UPF的小目标TBD算法[A];第十四届全国图象图形学学术会议论文集[C];2008年
7 周磊;张卫华;王晓奇;张军;;基于流水算法的智能路障机器人设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
8 潘巍;李战怀;陈群;索博;李卫榜;;面向MapReduce的非对称分片复制连接算法优化技术研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
9 李伟伟;蔡康颖;郑新;王文成;;3D模型中重复结构的多尺度快速检测算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
10 杨任尔;陈恳;励金祥;;基于棱边方向检测的运动自适应去隔行算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中国重要报纸全文数据库 前1条
1 国泰君安资产管理部;“算法交易”是道指暴跌罪魁祸首?[N];上海证券报;2010年
中国博士学位论文全文数据库 前10条
1 冯辉;网络化的并行与分布式优化算法研究及应用[D];复旦大学;2013年
2 许玉杰;云计算环境下海量数据的并行聚类算法研究[D];大连海事大学;2014年
3 李琰;基于猫群算法的高光谱遥感森林类型识别研究[D];东北林业大学;2015年
4 陈加顺;海洋环境下聚类算法的研究[D];南京航空航天大学;2014年
5 张冬丽;人工蜂群算法的改进及相关应用研究[D];燕山大学;2014年
6 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
7 王征;分布式互斥算法的研究与实现[D];电子科技大学;2007年
8 王艳娇;人工蜂群算法的研究与应用[D];哈尔滨工程大学;2013年
9 杨世品;P系统优化算法及应用研究[D];浙江大学;2013年
10 张毅;群智能算法的改进及其在相关领域中的应用[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 姚鑫宇;EMD去噪与MUSIC算法在DOA估计中的联合应用[D];昆明理工大学;2015年
2 陆进;面向含噪数据聚类相关算法的研究[D];复旦大学;2014年
3 李家昌;基于能量约束的超声图像自动分割算法[D];华南理工大学;2015年
4 陈坚;基于密度和约束的数据流聚类算法研究[D];兰州大学;2015年
5 高健;基于Zynq7000平台的去雾算法研究及实现[D];南京理工大学;2015年
6 顾磊;基于Hadoop的聚类算法的数据优化及其应用研究[D];南京信息工程大学;2015年
7 杨燕霞;基于Hadoop平台的并行关联规则挖掘算法研究[D];四川师范大学;2015年
8 王羽;基于MapReduce的社区发现算法的设计与实现[D];南京理工大学;2015年
9 许振佳;流式数据的并行聚类算法研究[D];曲阜师范大学;2015年
10 董琴;人工蜂群算法的改进与应用[D];大连海事大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026