收藏本站
收藏 | 论文排版

基于高斯分布的正交分解分类损失函数的研究

刘孟鑫  
【摘要】:近年来,深度神经网络取得了突破性的进展,如今在生活中的各个领域都得到了广泛的应用,比如图像分类识别、人脸识别、语音识别等。随着对网络结构和损失函数的不断优化,深度神经网络显著的改善了各种复杂的分类任务的性能。损失函数是深度学习中不可或缺的一部分,而对于不同的任务,有各种各样的损失函数,如MSE,BCE等。关于损失函数的性能有很多研究。一个好的损失函数理论上应该能够使得数据集中相同类别的特征的分布更加紧凑,不同类别的特征的分布更加分离。本文提出了一种新的用于分类任务的损失函数,即基于高斯分布的正交分解损失函数。Center loss、contrastive loss等大多数现有方法会在训练过程中动态确定样本特征的收敛方向。相比之下,基于高斯分布的正交分解损失函数将收敛方向分解为两个相互正交的分量,即切向方向和径向方向,并对它们分别进行优化。从理论上讲,这两个组件分别影响样本特征分布的类间分离性和类内紧凑性。因此,分别最小化它们的损失可以避免在优化过程中彼此间的影响从而获得更稳定的收敛中心。此外,本文假设这两个分量都遵循高斯分布,高斯分布已经被证明是通过准确为训练特征建模,从而提高分类效果的有效方式。MNIST,CIFAR和Image Net等多个分类实验证明了基于高斯分布的正交分解损失函数的有效性。本文的研究工作主要从以下五个方面展开:(1)本文提出了一个新的优化思想,该优化思想从收敛方向的角度考虑优化问题。(2)本文分解了收敛方向,将其正交分解为径向方向和切向方向两个部分,并且分别对它们进行优化。(3)本文解耦了提取的特征的方向和模长,从而避免了在优化过程中,这两者产生的相互影响。(4)本文使用被提取的特征的方向和模长,来分别规划特征分布的类间分离性和类内紧凑性。(5)本文使用高斯分布来指导被提取的特征在方向和模长上的优化过程。


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 陈子兴;;巧用复数的模长解题[J];中学生数理化(学习研究);2019年02期
2 刘琼玉;;从三个视角解一道高考向量模长题[J];理科考试研究;2016年11期
3 张晓萍,崔敏芳;信息处理子系统识别单元I损失函数的确定[J];火力与指挥控制;1990年01期
4 王快妮;曹进德;;基于截断1-范数损失函数的鲁棒超限学习机[J];南京信息工程大学学报(自然科学版);2019年04期
5 康倩;周水生;;光滑有下界的奖惩结合损失函数的最大间隔双球模型[J];模式识别与人工智能;2021年10期
6 唐晓凤;雷向东;;一种基于个性化成对损失加权的新颖推荐[J];小型微型计算机系统;2021年03期
7 张欣彧;尤鸣宇;朱江;韩煊;;基于联合损失函数的小规模数据人脸识别[J];北京理工大学学报;2020年02期
8 孙晶;;“向量模长”的妙用[J];数学学习与研究;2012年17期
9 段敏霞;刘鑫;董增寿;;深度自编码与改进损失函数在极端不均衡故障诊断中的应用[J];科学技术与工程;2021年11期
10 彭正阳;吕立;于碧辉;;基于动态损失函数的远程监督关系抽取[J];小型微型计算机系统;2021年02期
11 汪云;;基于改进离散余弦间隔损失函数的遥感道路分割[J];数字通信世界;2021年11期
12 王颖俐;魏玲;;基于改进的区间损失函数聚合法的三支决策[J];南京大学学报(自然科学);2021年03期
13 戴鑫;吴黎军;;基于平衡损失函数和最大熵方法的信度估计[J];伊犁师范学院学报(自然科学版);2020年01期
14 郭起捷;;损失函数在预测诊断中的应用[J];汽车实用技术;2018年18期
15 王娜娜;;相对差损失函数下的保费估计[J];科技风;2016年17期
16 李小光;;混合损失函数支持向量回归机的性能研究[J];西北大学学报(自然科学版);2011年02期
17 周学君;彭锦;;关于ε不敏感损失函数推广误差的界[J];数学杂志;2010年03期
中国重要会议论文全文数据库 前20条
1 吴夏;田新亮;寇雨丰;李欣;卢文月;;基于深度神经网络的二维水翼绕流研究[A];第十一届全国流体力学学术会议论文摘要集[C];2020年
2 张振宇;彭晶晶;梁燕燕;;基于机器学习实现冷轧产品的动态工艺调整[A];第十二届中国钢铁年会论文集——11.冶金自动化与智能化[C];2019年
3 张月义;宋明顺;韩之俊;;动态特性质量损失函数研究[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
4 邓聪;傅少荣;高嘉锜;潘嘉辉;;基于不完备数据集近邻聚类的缺失用电信息填补算法[A];福建省电机工程学会2020年学术年会获奖论文集(下册)[C];2021年
5 叶蓓;田淑芳;成秋明;葛云钊;;基于GF-5 AHSI高光谱影像的岩性填图应用研究[A];首届全国矿产勘查大会论文集[C];2021年
6 卢功林;葛俏;王玉娟;谈世磊;曹红伟;卢志鹏;;基于深度学习的不停车自动超载检测方法[A];2020中国自动化大会(CAC2020)论文集[C];2020年
7 王羽;姜晓夏;陆辰;王振宇;王珩;吴振锋;;军事机器阅读理解数据集构建与评估[A];2019第七届中国指挥控制大会论文集[C];2019年
8 缪国宇;刘洪鹏;苏文学;刘荣生;赵相东;;基于数据仓库的企业指标分析系统[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 王子恒;齐勇刚;刘军;;路面交通标志检测调研:数据集及算法[A];2018中国汽车工程学会年会论文集[C];2018年
10 李静茹;钱伟民;;ε-不敏感损失函数下的Bayes估计方法[A];中国现场统计研究会第12届学术年会论文集[C];2005年
11 郭景峰;杜京;马倩;邹晓红;;一种基于数据集性质的快速等差模式聚类算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
12 孟烨;张鹏;宋大为;王雷;;信息检索系统性能对数据集特性的依赖性分析[A];第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集[C];2013年
13 田捷;;三维医学影像数据集处理的集成化平台[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
14 冷传良;;飞机化铣成样板划线数据集设计方法探索[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
15 范明;魏芳;;挖掘基本显露模式用于分类[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
16 刘通;张宇献;;基于加权平均数的模糊聚类有效性函数[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
17 林荔;林铖;;福建省小时风速数据集研制及应用[A];第35届中国气象学会年会 S20 深度信息化:应用支持与智能发展[C];2018年
18 于爱荣;刘晓明;曹雷;王俊;;NET Web Services数据集在Delphi中的处理与研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
19 冷传良;;基于CATIA V6的三维制造数据集的设计与管理[A];探索 创新 交流——第六届中国航空学会青年科技论坛文集(上册)[C];2014年
20 张增明;陈套;丁泽军;;Mo和Ta的有效电子能量损失函数[A];2006年全国电子显微学会议论文集[C];2006年
中国博士学位论文全文数据库 前20条
1 郦博文;两类模型的统计推断及应用[D];中国科学技术大学;2019年
2 王峰;基于深度学习的人脸认证方法研究[D];电子科技大学;2018年
3 周瑜;基于度量学习和最大值损失函数的偏标记学习算法研究[D];大连理工大学;2017年
4 张月义;质量损失函数与测量系统校准研究[D];南京理工大学;2010年
5 皇群博;晴空条件FY-3C大气微波垂直探测资料变分同化研究[D];国防科技大学;2018年
6 马飞;复杂场景下的行人重识别关键技术研究[D];武汉大学;2019年
7 孙秀宝;基于CMA-LSAT v1.0数据集的近百年全球陆表气温变化研究[D];南京信息工程大学;2018年
8 陈迪;耕地数量与质量时空变化遥感监测研究[D];中国农业科学院;2019年
9 李星达;钢琴多音估计问题和音乐生成问题的深度学习方法[D];吉林大学;2019年
10 刘皓;基于深度学习的行人再识别问题研究[D];合肥工业大学;2017年
11 王建培;聚类有效性分析及其在电学层析成像中的应用[D];天津大学;2017年
12 杨勋;跨视域行人再识别若干问题研究[D];合肥工业大学;2017年
13 李超;高阶多数据集建模新方法与应用研究[D];哈尔滨工程大学;2017年
14 申彦;大规模数据集高效数据挖掘算法研究[D];江苏大学;2013年
15 黄维忠;相依风险及平衡损失函数下的信度理论[D];华东师范大学;2013年
16 严远亭;不完整数据集的多视角集成分类研究[D];安徽大学;2016年
17 谷琼;面向非均衡数据集的机器学习及在地学数据处理中的应用[D];中国地质大学;2009年
18 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
19 吴毅;数字人全身分割数据集的建立及人体胸腔与盆腔的数字化研究[D];第三军医大学;2012年
20 吴国清;科学计算时变数据集的数据挖掘算法研究[D];中国工程物理研究院;2009年
中国硕士学位论文全文数据库 前20条
1 刘孟鑫;基于高斯分布的正交分解分类损失函数的研究[D];天津大学;2019年
2 韦博熠;人脸识别改进损失函数与人像发型消除和变换网络研究[D];西安建筑科技大学;2021年
3 陈柯安;基于排序损失函数的一阶目标检测算法研究[D];上海交通大学;2020年
4 刘路飞;深度学习感知损失函数的设计与应用[D];南京大学;2018年
5 崔浩翔;多尺度稠密网络及其在图像后处理中的应用研究[D];深圳大学;2019年
6 孙吉;分层逆伽马-逆伽马模型下的尺度参数在Stein损失函数下的贝叶斯估计[D];重庆大学;2019年
7 孙雅;分层均匀和逆伽马模型的参数在Stein损失函数下的经验贝叶斯估计量[D];重庆大学;2019年
8 代黎;基于代价敏感的不平衡分类问题实证研究[D];华中师范大学;2019年
9 何颖;基于多任务学习的行人再识别算法研究[D];华南理工大学;2019年
10 王艳旗;基于深度学习的行人重识别[D];电子科技大学;2019年
11 张策;基于0-1损失的支持向量机分类器[D];北京交通大学;2019年
12 周小又;遮挡条件下基于人体部位的行人检测[D];哈尔滨工业大学;2019年
13 蒋名超;AMSoftmax与中心损失模型的人脸识别研究[D];广东工业大学;2019年
14 杜卉然;产品质量检测的生成对抗网络方法[D];广东工业大学;2019年
15 王雅晴;自然场景下金丝猴重识别算法的研究与实现[D];西安电子科技大学;2019年
16 程彦军;基于监控视频的行人重识别技术研究[D];华中科技大学;2019年
17 邬继阳;基于深度学习的人脸识别技术研究[D];华中科技大学;2019年
18 金雨竹;基于改进条件生成对抗网络的人脸姿态转换研究[D];西南交通大学;2019年
19 任胜男;基于one-shot学习的果蔬疾病识别研究[D];北京林业大学;2019年
20 程建峰;基于深度学习的多任务人脸属性识别研究与应用[D];西南石油大学;2018年
中国重要报纸全文数据库 前20条
1 记者 张梦然;最大规模婴儿微生物组数据集建立[N];科技日报;2018年
2 记者 张梦然;癌症学研究公布最新数据集[N];科技日报;2018年
3 记者 季张颖;上海已累计开放2100项公共数据集[N];上海法治报;2019年
4 记者 王莉英;行政审批网上全流程办理率年底超80%[N];深圳特区报;2017年
5 记者 金昶 通讯员 陈斯音;我国发布首款全球海洋Argo网格数据集产品[N];中国海洋报;2017年
6 中国青年报·中青在线记者 谢宛霏;为AI领域“造血”[N];中国青年报;2017年
7 记者 罗旭;全球人工智能挑战赛开赛[N];光明日报;2017年
8 记者 刘钊 通讯员 徐文慧 杨溯;自主研发数据集显示今年上半年最热[N];中国气象报;2015年
9 冉瑞奎 刘晓林 戴艳萍;均一化历史气温数据集问世[N];中国气象报;2006年
10 通讯员廖雅琴记者冯竞;“国人数字化可视人体数据集”完成[N];科技日报;2003年
11 记者 张梦然;科学家以图片数据集揭秘“生命奥秘”[N];科技日报;2015年
12 王素琴刘晓林 通讯员 王新华;宇如聪强调用好16个新数据集产品[N];中国气象报;2008年
13 记者 刘钊;自研数据集显示今年将成最热一年[N];中国气象报;2015年
14 记者 刘浪 通讯员 廖雅琴;中国首套数字化“可视人”数据集在渝通过成果鉴定[N];重庆日报;2003年
15 本报记者 刘霞;AI助力抗“疫” 美发布新冠病毒数据集[N];科技日报;2020年
16 地学系;地学系阳坤课题组发布中国区域高分辨率气象驱动数据集[N];新清华;2020年
17 记者 陈玮;科学调查听民意 统计数据集建议[N];兰州日报;2014年
18 余海蓉梁超;四川研制高质量省级气象数据集[N];中国气象报;2007年
19 昌家杰 邹莹 本报记者 于莘明;探究“数字人”的虚与实[N];科技日报;2005年
20 记者 王宝军 通讯员 王新华;2009年气候变化重点数据集建设完成[N];中国气象报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978