收藏本站
《西北农林科技大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于随机森林的苹果内部品质多标签分类方法研究

耿晗  
【摘要】:作为四大水果之一,苹果在人类日常生活中占据了很重要的地位,我国的苹果产量居世界第一,但出口量只占总产量1.46%,阻碍我国鲜果出口的一个重要因素是苹果的分选、检测能力以及检测速度不能满足市场的需求。随着社会科技的迅速发展,评价苹果的品质已经不再局限于通过颜色、大小等外部指标进行评判,人们越来越关注其营养价值和内部品质,先进的水果分选检测能力需要建立在水果内部品质检测之上,而水果的内部品质由其内部的糖分、含水率等多种理化指标来决定。因此寻求一种检测苹果糖度、硬度、含水率等内部品质的方法对苹果的分级销售和出口具有重大意义。目前大量研究已证明介电特征和水果的内部指标具有非常紧密的关系,而介电特征的测量可以在无损的情况下完成,并依据介电特征推断苹果的理化特征。本研究的主要内容如下:(1)构建基于随机森林的苹果内部品质分类模型。在随机森林分类器的工作原理和基础上,分析了其主要参数的选取和功能。本实验中介电特征有108种,理化特征标签有8种,将理化特征均分为5个等级,共8×5个标签信息。将500个苹果均分成10个子集,将10个子集中的一个作为测试集,而其余的9个作为训练集,采用十折交叉验证的方法训练出多棵决策树构成随机森林。训练结果表明随机森林分类器能够有效地处理苹果内部品质多标签分类问题,且森林规模越大,分类准确率越高,使用信息增益目标函数的随机森林与其他随机森林相比具有较好分类性能。与SVM算法进行对比,随机森林有较好的分类准确性。(2)选取随机森林的输出类别。不同于传统的决策树方法,本实验对待随机森林作为一个整体,使融合信息单独包含在每个叶子节点,每个叶节点对应一个苹果,将苹果用理化特征标注标签并预测。在类别选取时,采用TF-IDF算法传回随机森林的输出类别。实验结果表明,基于TF-IDF方法传回的随机森林输出类别可以将介电特征和相关的理化特征有效关联。(3)对随机森林的输出类别排序。本研究中苹果理化特征中的8个指标分别被预分为5个等级。由于随机森林的每棵决策树都是独立的,在选取输出类别时计算标注苹果的标签概率后,对输出类别的个数进行排序,系统地分配苹果最佳标签标记苹果的理化特征。本实验中,使用Rank SVM算法进行排序,将3种框架模型应用于Rank SVM中,分别是f(ci)=ci,f(ci)=ci2以及f(ci)为本研究中提出的系统选取f(ci)的框架模型。实验结果表明,f(ci)通过系统的选取对苹果品质分类效果较好,在分类预测中标签级别分布较为一致,均方根误差为0.51。
【学位授予单位】:西北农林科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:S661.1;TP391.41

【参考文献】
中国期刊全文数据库 前10条
1 王莉莉;付忠良;;基于标签相关性的多标签分类AdaBoost算法[J];四川大学学报(工程科学版);2016年05期
2 谈英;顾宝兴;姬长英;田光兆;金丽丽;李珈慧;;基于颜色和重量特征的苹果在线分级系统设计[J];计算机工程与应用;2016年02期
3 蔡骋;李永超;马惠玲;李晓龙;;基于介电特征选择的苹果内部品质无损分级[J];农业工程学报;2013年21期
4 蔡骋;李晓龙;马惠玲;任小林;黄良妹;曾燕春;;基于生物阻抗特性的苹果新鲜度无损测定[J];农业机械学报;2013年02期
5 安慧珍;马惠玲;任小林;;苹果果实贮藏期间电学参数与品质指标的关系[J];食品科学;2013年02期
6 岳绒;郭文川;刘卉;;近红外漫反射光谱检测损伤猕猴桃的内部品质[J];食品科学;2011年10期
7 刘端阳;邱卫杰;;基于加权SVM主动学习的多标签分类[J];计算机工程;2011年08期
8 刘端阳;邱卫杰;;基于SVM期望间隔的多标签分类的主动学习[J];计算机科学;2011年04期
9 方匡南;吴见彬;朱建平;谢邦昌;;随机森林方法研究综述[J];统计与信息论坛;2011年03期
10 张亚静;Sakae Shibusawa;李民赞;;基于机器视觉的番茄内部品质预测[J];农业工程学报;2010年S2期
中国硕士学位论文全文数据库 前4条
1 张菲;中国水果出口至东盟的影响因素和潜力分析[D];南京农业大学;2011年
2 林如泉;水果出口跨越技术性贸易壁垒的对策研究[D];华中农业大学;2007年
3 楼军文;中国水果进出口检验检疫技术性贸易措施研究[D];中国农业大学;2005年
4 宋金亚;基于介电特性和灰色理论的苹果内部品质无损检测方法研究[D];浙江工业大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 赵云涵;陈刚强;陈广亮;刘小平;牛宁;;耦合多源大数据提取城中村建筑物——以广州市天河区为例[J];地理与地理信息科学;2018年05期
2 杨兴雨;李华平;张宇波;;基于聚类和随机森林的协同过滤推荐算法[J];计算机工程与应用;2018年16期
3 朱龙珠;宫立华;刘鲲鹏;杨菁;赵强;;基于随机森林算法的投诉预警模型优化方法[J];电力信息与通信技术;2018年08期
4 宋攀;景丽萍;;基于神经网络探究标签依赖关系的多标签分类[J];计算机研究与发展;2018年08期
5 郭桂祯;刘乃山;;基于随机森林模型的区域洪涝灾害房屋倒损评估方法研究[J];灾害学;2018年03期
6 吴志明;李建超;王睿;时蕾;苗松;吕恒;李云梅;;基于随机森林的内陆湖泊水体有色可溶性有机物(CDOM)浓度遥感估算[J];湖泊科学;2018年04期
7 钟登华;沈子洋;王佳俊;崔博;任炳昱;王栋;;基于实时监控的混凝土坝振捣施工质量动态评价研究[J];水利学报;2018年07期
8 张玉华;孟一;姜沛宏;陈东杰;;基于多传感器信息融合的水果综合品质检测与分级[J];食品工业;2018年06期
9 李宁;徐永明;何苗;吴笑涵;;基于遥感的北京市体感温度指数反演研究[J];生态环境学报;2018年06期
10 曹琼;苏欢;宛晓春;宁井铭;;基于EGCG,ECG和咖啡碱含量的乌龙茶产地鉴定[J];茶叶科学;2018年03期
中国硕士学位论文全文数据库 前10条
1 耿晗;基于随机森林的苹果内部品质多标签分类方法研究[D];西北农林科技大学;2018年
2 赵冕;苹果内部品质无损检测极弱信号放大与信号传输系统设计[D];西北农林科技大学;2017年
3 邱光应;基于机器视觉的苹果果梗/花萼与缺陷识别[D];西南大学;2017年
4 胡志晨;基于介电特性的苹果无损分级测量模块的设计与实现[D];西北农林科技大学;2016年
5 韩琼;紫外线及芦荟提取物对水果保鲜机制的研究[D];河南师范大学;2015年
6 商亮;基于介电谱无损检测苹果品质及种类[D];西北农林科技大学;2015年
7 金明威;天津口岸进口水果检疫管理研究[D];天津大学;2015年
8 张柯;金属化包装改善食品微波加热效果的研究[D];江南大学;2014年
9 李永超;基于介电信号分析的苹果内部品质无损检测[D];西北农林科技大学;2014年
10 黄一晨;基于面层材料与结构的沥青路面抗车辙性能研究[D];北京工业大学;2014年
【二级参考文献】
中国期刊全文数据库 前10条
1 付忠良;张丹普;王莉莉;;多标签AdaBoost算法的改进算法[J];四川大学学报(工程科学版);2015年05期
2 郭鹏程;李辉;袁江霞;罗兴锜;;基于改进支持向量机的水电机组多类轴心轨迹智能识别[J];农业工程学报;2013年15期
3 安慧珍;马惠玲;任小林;;苹果果实贮藏期间电学参数与品质指标的关系[J];食品科学;2013年02期
4 郭文川;王婧;朱新华;;基于介电特性的燕麦含水率预测[J];农业工程学报;2012年24期
5 梁明;孟大伟;;多特征图像融合的苹果分级方法应用研究[J];计算机仿真;2012年07期
6 席新明;何东健;;基于介电特性的水中钾盐浓度检测[J];农业工程学报;2012年07期
7 杨小青;党宏社;;基于像素点变换法的苹果颜色分级系统研究[J];农机化研究;2012年03期
8 姜玮;刘静波;陶旭;王宇;张燕;王二雷;卢静;;均匀设计-BP神经网络优化超临界CO_2提取杜香挥发油工艺[J];农业工程学报;2011年S2期
9 刘亚平;刘兴华;李红波;;葡萄冷藏中电学参数与质地特性变化规律[J];农业工程学报;2011年10期
10 李先锋;朱伟兴;花小朋;孔令东;;基于D-S证据理论的决策级多特征融合苹果分级方法[J];农业机械学报;2011年06期
中国硕士学位论文全文数据库 前4条
1 张辉;中国贸易结构优化路径选择研究[D];天津财经大学;2010年
2 吕宁;我国边际产业的界定和发展对策研究[D];哈尔滨工程大学;2009年
3 伍小梅;深加工视角下我国水果业的出口竞争力研究[D];湖南大学;2006年
4 秦建丽;广西水果产业现状与发展对策研究[D];广西大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 陈一诺;董绍华;;基于随机森林算法的管道缺陷预测方法[J];油气储运;年期
2 刘阳;杜华军;岳子涵;马杰;吕武;;基于随机森林的无人机检测方法[J];计算机工程与应用;年期
3 胡蝶;;基于随机森林的债券违约分析[J];当代经济;2018年03期
4 温博文;董文瀚;解武杰;马骏;;基于改进网格搜索算法的随机森林参数优化[J];计算机工程与应用;2018年10期
5 赵艺淞;杨昆;王保云;黎晓路;;随机森林在城市不透水面提取中的应用研究[J];云南师范大学学报(自然科学版);2017年03期
6 吴辰文;梁靖涵;王伟;李长生;;一种顺序响应的随机森林:变量预测和选择[J];小型微型计算机系统;2017年08期
7 顾娟;林敏;鞠桂玲;;基于随机森林回归的军械器材需求预测[J];自动化应用;2017年09期
8 刘迎春;陈梅玲;;流式大数据下随机森林方法及应用[J];西北工业大学学报;2015年06期
9 罗超;;面向高维数据的随机森林算法优化探讨[J];商;2016年04期
10 杨晓峰;严建峰;刘晓升;杨璐;;深度随机森林在离网预测中的应用[J];计算机科学;2016年06期
中国重要会议论文全文数据库 前10条
1 尤东方;赵杨;;存在混杂时高维数据的随机森林分析[A];2017年中国卫生统计学学术年会论文集[C];2017年
2 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
3 吕洁;;基于随机森林算法对内蒙古地区地面逐日平均温度的估算[A];第34届中国气象学会年会 S20 气象数据:深度应用和标准化论文集[C];2017年
4 张炜;;天津市人才吸引力影响要素评价——基于随机森林法的检验分析[A];发挥社会科学作用 促进天津改革发展——天津市社会科学界第十二届学术年会优秀论文集(中)[C];2017年
5 高洪利;;基于随机森林算法的卷烟销量预测及分析[A];中国烟草学会学术年会优秀论文集[C];2017年
6 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
7 高磊;秦慧杰;许康;;基于随机森林的资源三号影像地表覆盖信息提取[A];地理信息与人工智能论坛暨江苏省测绘地理信息学会2017年学术年会论文集[C];2017年
8 郑志伟;邱佳玲;阳庆玲;龚晓春;郭山清;贾忠伟;郝春;;随机森林算法对文本情感分析的应用与R软件实现[A];2017年中国卫生统计学学术年会论文集[C];2017年
9 杨璐;宋建国;;基于随机森林的地震储层分类方法研究[A];2017中国地球科学联合学术年会论文集(三十八)——专题71:内磁层动力学、专题72:计算地球物理方法和技术、专题73:地热:“学”以致“用”、专题74:电磁卫星观测与应用[C];2017年
10 刘继辉;许磊;马晓龙;李达;林鸿佳;杨洋;杨晶津;李兴绪;王慧;;基于随机森林回归的制丝过程参数影响权重分析[A];中国烟草学会学术年会优秀论文集[C];2017年
中国重要报纸全文数据库 前1条
1 本报记者 田新元;人工智能助力保险业智慧化转型[N];中国改革报;2017年
中国博士学位论文全文数据库 前10条
1 王鑫;基于随机森林的认知网络频谱感知算法研究[D];东北大学;2016年
2 王晓军;基于大数据的风洞马赫数集成建模方法的研究[D];东北大学;2016年
3 姚登举;面向医学数据的随机森林特征选择及分类方法研究[D];哈尔滨工程大学;2016年
4 黄玥;VANET信息安全问题及异常检测技术研究[D];吉林大学;2017年
5 倪强;基于随机前沿和随机森林法的沿海开发区发展效率研究[D];天津大学;2011年
6 季斌;内蒙古浩布高地区多金属矿综合信息找矿预测研究[D];合肥工业大学;2017年
7 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
8 金超;基于随机森林的医学影像分割算法研究及应用[D];苏州大学;2017年
9 李宝富;巨厚砾岩层下回采巷道底板冲击地压诱发机理研究[D];河南理工大学;2014年
10 赵东;基于群智能优化的机器学习方法研究及应用[D];吉林大学;2017年
中国硕士学位论文全文数据库 前10条
1 韩杏杏;县域尺度农用地表层土壤有机质含量预测技术对比研究[D];郑州大学;2018年
2 耿晗;基于随机森林的苹果内部品质多标签分类方法研究[D];西北农林科技大学;2018年
3 梁君雅;控制混杂的随机森林方法评价及其在高维组学数据分析中的应用[D];南京医科大学;2018年
4 张宇;基于振动光谱的汽油非法添加煤油的检测方法研究[D];华东交通大学;2018年
5 任才溶;基于并行随机森林的城市PM_(2.5)浓度预测[D];太原理工大学;2018年
6 赵佳楠;基于随机森林的长江三角洲PM_(2.5)浓度空间模拟及暴露风险评估[D];华东师范大学;2018年
7 赵书慧;基于MODIS卫星数据的水面积提取方法研究[D];山东师范大学;2018年
8 肖怀硕;基于振动信号的断路器故障诊断与状态评估[D];山东大学;2018年
9 李欣欣;基于代价敏感性随机森林与支持向量机的肝硬化并发肝性脑病风险预测模型研究[D];山西医科大学;2018年
10 杜沛冬;结合卷积神经网络和随机森林的癫痫自动检测[D];山东大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026