收藏本站
《西北农林科技大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

半监督聚类算法研究及植物叶片识别应用

李龙龙  
【摘要】:作为现代农业的重要组成部分,植物鉴别在植物分类学、精细农业和园艺学、中医药研究等人们生产生活密切相关的各个领域具有重要的应用价值。叶片作为一种扁平的二维结构植物器官,叶片外形、叶缘和纹理等特征具有明显的形态差异,是植物物种鉴别和形态区分的重要指标,而准确高效的图像特征提取方法和分类识别算法是解决植物叶片分类问题的关键所在。近年来,有关植物叶片的特征选择及分类识别算法无论从理论上还是应用研究方面都取得了一定的进展,然而相关算法中对识别特征高度相似的叶片图像研究不多,而随着图像获取技术的不断提升,捕获的植物叶子图像分辨率更高、维度更多,高维叶片图像的特征提取以及分类识别器的设计逐渐成为叶片图像分类识别中的亟待解决的新难题。本文以叶片图像特征提取和分类器的设计为突破口,围绕高维图像的降维算法、模糊半监督聚类算法设计、叶片分类识别应用等关键问题,研究新的数据降维算法、聚类算法的参数优化算法以及特征加权的半监督聚类算法,在此基础上构建出植物叶片图像的识别框架,并用UCI数据集和实测数据集进行试验。论文主要研究工作和结论如下:(1)提出一种改进型的PCA降维算法L-PCA,有效降低了特征维度,提高了分类识别率。借鉴经典凸技术聚类算法中的全局线性降维算法PCA(Principal Component Analysis)与LDA(Linear Discriminant Analysis)聚类算法思想,提出一种改进型的PCA降维算法L-PCA,该算法在保证原有样本协方差结构不变的前提下,获取变换矩阵中最重要的主分量进行赋权,通过调节类内与类间离散矩阵,使得类内距离最小化、类间聚类最大化,来搜索一个合适的映射子空间来实现不同类别数据之间的划分。人工数据集和自测数据集下实验结果表明,L-PCA算法的一阶最近近邻分类器平均泛化误差为11.94%,其平均降维准确性为94.50%,目标数据表达连续性能达到0.97。(2)改进了传统FCM算法,提出一种基于模糊分离度的FCM聚类模糊加权指数优选算法EOSD。对传统的FCM算法进行了改造,提出了一种基于模糊分离度的FCM聚类模糊加权指数优选算法EOSD,在模糊划分指数和分离指数两种模糊评价函数的基础上构造出模糊分离度,并通过观测实际样本数据和人造样本数据下的模糊分离度曲线拐点进行最优加权指数的选取,并通过目标函数的拐点法对实验结果进行验证。实验也证明了EOSD优选算法能够有效进行最优加权指数的选取,m的取值介于1.8-2.2之间,而FCM族算法最优值为2。(3)为了设计一种合理的分类器算法,提出一种新型模糊半监督加权聚类算法。本文引入成对约束,采用聚类和特征加权同步进行的思想,将特征加权融合到聚类过程中,进一步提高了聚类算法的类识别能力,通过对用户提供的模式特征边信息进行选择和鉴别,并经过一套有效的特征加权流程获取整个输入模式的特征权值集合,同时使用该特征权值对目标函数进行修正,并通过准确率和NMI评价方法对SFFD算法进行全面评价。8种UCI数据集下的聚类结果表明,特征加权的模糊半监督聚类算法SFFD能够有效的解决常见的聚类问题,在8个数据集上的性能均优于其余算法的平均值约7.74%,其权值能够提高算法的2.00%至7.00%的分类准确率。(4)为了有效解决聚类算法中最佳聚类数的确定问题,分析权值因子在聚类划分过程中的作用,使用不同评价算法评估了SFFD算法的有效性,并对其聚类过程中划分矩阵的权值变化曲线进行监控。本文在SFFD聚类算法的基础上,首先采用PC、CE、SC、XB等4种聚类结果评价算法对相应的聚类结果展开评价,最终通过不同聚类评价结果的对比分析获取不同数据集下的最佳聚类数;其次,采用标签数据和先验知识等已知信息生成成对约束信息指导半监督聚类过程,使用UCI数据集和Leaf自测集作为样本信息进行聚类分析,通过获取聚类过程中输入特征向量的权值v的变化曲线分析特征权值对聚类性能和分割结果的影响。选择合适的聚类评价算法能够将误差控制在2以内,从而有效的解决最佳聚类数的预设问题,而特征权值在20个聚类周期内将划分矩阵的权值进行明确划分,因此,有效提升聚类算法各项性能的最简单快捷的方法便是特征赋权。(5)采用特征加权模糊半监督聚类算法SFFD算法作为分类识别器,构建植物叶片图像识别框架。通过实地采集相似度较高的叶片数字图像并提取多种识别特征作为输入数据集,使用SFFD分类器的特征加权过程极大的提高了聚类速度并有效的增强了算法的分类质量,10类植物叶片的识别实验结果表明,该算法省略了样本训练环节,每种识别特征在30%的监督信息指导下即可获得72.40%至86.46%的识别准确率,其单一特征平均识别率为82.92%。另外,在相同的预处理算法及相同的标签数据数量下,叶缘特征和复合特征是叶片图像分类过程中的最佳分类特征,其次是形状特征。综上所述,为了解决实际中叶片图像的分类问题,融合了降维思想、参数优化方法、半监督聚类算法、聚类评价及应用分析等研究内容,提出了解决问题的几种关键算法。这些新算法均取得了较好的应用效果。通过实验分析得出:叶片分类识别算法的成功与否主要取决于分类识别器和特征提取算法,其中,恰当的半监督信息能够有效的提高识别准确率和分类性能,而合理的降维算法可以大大降低特征提取的计算复杂度。
【关键词】:半监督聚类 叶片识别 降维算法 特征加权 聚类性能
【学位授予单位】:西北农林科技大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:S126;TP391.41
【目录】:
  • 摘要5-7
  • ABSTRACT7-14
  • 第1章 绪论14-26
  • 1.1 研究背景与意义14-16
  • 1.1.1 植物鉴别的重要性14-15
  • 1.1.2 叶片分类的可行性15-16
  • 1.2 国内外研究现状16-19
  • 1.2.1 计算机视觉研究16-17
  • 1.2.2 特征获取与图像分类器17-18
  • 1.2.3 模糊聚类分类器在图像识别中的应用18
  • 1.2.4 机器视觉下的植物叶片图像识别18-19
  • 1.3 存在问题19-21
  • 1.4 研究目标与研究内容21-22
  • 1.4.1 研究目标21
  • 1.4.2 研究内容21-22
  • 1.5 研究方法与技术路线22-25
  • 1.5.1 研究方法22-23
  • 1.5.2 技术路线23-25
  • 1.5.2.1 核心算法设计23-24
  • 1.5.2.2 性能评估24
  • 1.5.2.3 分类识别研究24-25
  • 1.6 论文的组织结构25-26
  • 第2章 L-PCA算法下的高维图像降维处理26-47
  • 2.1 引言26-27
  • 2.2 降维算法分析27-37
  • 2.2.1 凸降维技术27-33
  • 2.2.1.1 全谱降维算法28-31
  • 2.2.1.2 稀疏谱降维算法31-33
  • 2.2.2 非凸降维算法33-35
  • 2.2.2.1 Sammon mapping33-34
  • 2.2.2.2 LLC(Locally Linear Coordination)34-35
  • 2.2.3 常见算法的对比分析35-36
  • 2.2.3.1 相互关系35
  • 2.2.3.2 性能比较35-36
  • 2.2.4 PCA与LDA36-37
  • 2.337-39
  • 2.3.1 算法思想37-38
  • 2.3.2 L-PCA算法步骤38-39
  • 2.4 实验与分析39-46
  • 2.4.1 供试数据集39-40
  • 2.4.2 实验方法40-41
  • 2.4.3 实验结果41-46
  • 2.4.3.1 人工数据集下的实验结果41-44
  • 2.4.3.2 实测数据集下的实验结果44-46
  • 2.5 本章小结46-47
  • 第3章 基于模糊分离度的FCM算法加权指数优化研究47-56
  • 3.1 FCM算法研究及问题分析47-48
  • 3.2 基于模糊分离度的FCM聚类加权指数优选算法48-51
  • 3.2.1 FCM聚类算法48-49
  • 3.2.2 基于模糊分离度的FCM聚类算法49-51
  • 3.2.2.1 算法思想49
  • 3.2.2.2 密度函数定义49
  • 3.2.2.3 判别准则49-50
  • 3.2.2.4 算法步骤50-51
  • 3.2.3 基于模糊分离度的FCM聚类模糊加权指数优选算法EOSD51
  • 3.3 实验结果与分析51-55
  • 3.3.1 供试数据集51-52
  • 3.3.2 试验方案52
  • 3.3.3 实验结果及分析52-55
  • 3.4 本章小结55-56
  • 第4章 特征加权的模糊半监督聚类算法研究56-70
  • 4.1 半监督聚类算法研究进展与问题分析56-58
  • 4.2 半监督模糊加权聚类算法58-63
  • 4.2.1 SFFD算法模型58-62
  • 4.2.1.1 自适应距离范式下的FCM聚类算法58-59
  • 4.2.1.2 特征加权的模糊聚类算法59-61
  • 4.2.1.3 引入成对约束61-62
  • 4.2.2 算法描述62-63
  • 4.3 评价实验63-69
  • 4.3.1 实验数据集及实验方法63-64
  • 4.3.2 实验结果及分析64-69
  • 4.4 本章小结69-70
  • 第5章 聚类有效性评价研究70-80
  • 5.1 聚类评价方法及问题分析70-71
  • 5.2 SFFD算法及权值的定义71-72
  • 5.3 性能评价算法72-73
  • 5.4 实验结果与分析73-78
  • 5.4.1 供试数据集及实验方案73-74
  • 5.4.2 实验结果74-78
  • 5.4.2.1 最佳聚类数的确定74-77
  • 5.4.2.2 UCI下权值v的变化情况77
  • 5.4.2.3 自测数据集下权值v的变化情况77-78
  • 5.5 本章小结78-80
  • 第6章 SFFD算法在植物叶片图像识别中的应用80-100
  • 6.1 植物叶片识别研究及问题分析80-83
  • 6.1.1 叶片识别特征的研究及问题分析80-81
  • 6.1.2 分类算法研究及问题分析81-83
  • 6.2 叶片识别框架83-89
  • 6.2.1 构建多种特征向量矩阵84-86
  • 6.2.1.1 叶缘特征提取方法84
  • 6.2.1.2 形状特征提取方法84-86
  • 6.2.1.3 纹理特征提取方法86
  • 6.2.1.4 复合特征的构建方法86
  • 6.2.2 植物叶片分类器算法设计86-89
  • 6.3 实验方法89-91
  • 6.4 算法性能分析91-98
  • 6.5 讨论98-99
  • 6.6 本章小结99-100
  • 第7章 结论和展望100-104
  • 7.1 结论100-101
  • 7.2 本文的创新点101-102
  • 7.3 展望102-104
  • 参考文献104-114
  • 致谢114-115
  • 攻读博士学位期间发表的论文、参加科研项目情况115

【相似文献】
中国期刊全文数据库 前3条
1 丁幼春;王书茂;;基于RHT的多圆检测改进算法[J];中国农业大学学报;2008年04期
2 彭红星;邹湘军;陈丽娟;熊俊涛;陈科尹;林桂潮;;基于双次Otsu算法的野外荔枝多类色彩目标快速识别[J];农业机械学报;2014年04期
3 赵雪;陈龙飞;;基于MapReduce的ROCK聚类算法[J];河北科技师范学院学报;2014年01期
中国重要会议论文全文数据库 前10条
1 尹冀锋;;一种新的图象自适应增强算法[A];四川省通信学会一九九二年学术年会论文集[C];1992年
2 宁春平;田家玮;郭延辉;王影;张英涛;郑桂霞;刘研;;计算机辅助增强、分割算法在鉴别乳腺良、恶性肿块中的应用价值[A];中华医学会第十次全国超声医学学术会议论文汇编[C];2009年
3 谢丽聪;;SVB查询改写算法的改进[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 郑存红;;复杂背景下相关跟踪算法研究及DSP实现[A];中国光学学会2010年光学大会论文集[C];2010年
5 杨文杰;吴军;;RFID抗冲突算法研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
6 高山;毕笃彦;魏娜;;一种基于UPF的小目标TBD算法[A];第十四届全国图象图形学学术会议论文集[C];2008年
7 周磊;张卫华;王晓奇;张军;;基于流水算法的智能路障机器人设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
8 潘巍;李战怀;陈群;索博;李卫榜;;面向MapReduce的非对称分片复制连接算法优化技术研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
9 李伟伟;蔡康颖;郑新;王文成;;3D模型中重复结构的多尺度快速检测算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
10 杨任尔;陈恳;励金祥;;基于棱边方向检测的运动自适应去隔行算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中国重要报纸全文数据库 前1条
1 国泰君安资产管理部;“算法交易”是道指暴跌罪魁祸首?[N];上海证券报;2010年
中国博士学位论文全文数据库 前10条
1 冯辉;网络化的并行与分布式优化算法研究及应用[D];复旦大学;2013年
2 许玉杰;云计算环境下海量数据的并行聚类算法研究[D];大连海事大学;2014年
3 李琰;基于猫群算法的高光谱遥感森林类型识别研究[D];东北林业大学;2015年
4 陈加顺;海洋环境下聚类算法的研究[D];南京航空航天大学;2014年
5 王洋;基于群体智能的通信网络告警关联规则挖掘算法研究[D];太原理工大学;2015年
6 雷雨;面向考试时间表问题的启发式进化算法研究[D];西安电子科技大学;2015年
7 熊霖;大数据下的数据选择与学习算法研究[D];西安电子科技大学;2015年
8 周雷;基于图结构的目标检测与分割算法研究[D];上海交通大学;2014年
9 王冰;人工蜂群算法的改进及相关应用的研究[D];北京理工大学;2015年
10 周旭;复杂网络中社区发现算法研究[D];吉林大学;2016年
中国硕士学位论文全文数据库 前10条
1 姚鑫宇;EMD去噪与MUSIC算法在DOA估计中的联合应用[D];昆明理工大学;2015年
2 陆进;面向含噪数据聚类相关算法的研究[D];复旦大学;2014年
3 李家昌;基于能量约束的超声图像自动分割算法[D];华南理工大学;2015年
4 陈坚;基于密度和约束的数据流聚类算法研究[D];兰州大学;2015年
5 高健;基于Zynq7000平台的去雾算法研究及实现[D];南京理工大学;2015年
6 顾磊;基于Hadoop的聚类算法的数据优化及其应用研究[D];南京信息工程大学;2015年
7 杨燕霞;基于Hadoop平台的并行关联规则挖掘算法研究[D];四川师范大学;2015年
8 王羽;基于MapReduce的社区发现算法的设计与实现[D];南京理工大学;2015年
9 许振佳;流式数据的并行聚类算法研究[D];曲阜师范大学;2015年
10 董琴;人工蜂群算法的改进与应用[D];大连海事大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026