收藏本站
收藏 | 论文排版

图像高斯混合模型的判别学习方法

陈雪峰  
【摘要】: 高斯混合模型(Gaussian Mixture Model)是统计模式识别中一类重要建模工具。基于高斯混合模型的图像识别方法,具有形式灵活、识别速度快、抗干扰能力强、识别准确率高等优点,成为图像识别领域中一种重要的建模方法,在文档分析与识别、图像与视频检索、生物特征识别与认证、目标检测与跟踪、医学图像分析与识别、智能交通、智能监控等领域得到广泛应用。 高斯混合模型学习方法按照学习目标不同可分为生成学习和判别学习。大量的研究表明,判别学习使模式识别系统的识别性能显著提高,学习效果明显好于传统的生成式学习。很多研究机构都开展了图像统计建模的判别学习研究工作,并提出了许多学习方法。本文面向图像识别问题,研究图像的高斯混合模型判别学习方法,用于从训练样本中获得判别能力强的高斯混合模型,实现有效分类。本文研究内容包括基于贝叶斯分类器的判别学习准则、基于判别学习的模型选择方法和判别学习智能优化算法。 本文提出了最大最小后验伪概率软目标学习方法(Soft target based MMP Learning with Data Selection , SoftDS-MMP ),用于学习基于后验伪概率( Posterior Pesudo-probability)的贝叶斯分类器。SoftDS-MMP对每个模式类的正样本和反样本的后验伪概率分别定义相应的软目标,用该软目标度量分类器在训练集上的分类损失。SoftDS-MMP通过最小化分类损失,同时最大化两个软目标之间的距离,获得分类器的最优参数集合。本文还进一步利用软目标进行数据选择,从训练集中移出和插入训练样本,压缩训练数据集,提高训练速度。在数据选择过程中,对于那些后验伪概率远超过其相应软目标值的训练样本,在一定的训练周期内暂时将其移出训练集。与基于硬目标的学习方法相比,SoftDS-MMP降低了过学习风险,提高了训练速度。 本文在SoftDS-MMP判别学习框架下,提出了一种高斯混合模型成份个数选择方法。该方法将Soft-MMP目标函数结合到贝叶斯模型选择框架中,用拉普拉斯方法估计SoftDS-MMP目标函数的边缘积分,并将最大化拉普拉斯估计值做为高斯混合模型判别选择准则。利用线性搜索策略,同时获得最优高斯混合模型结构和模型参数。该方法主要优点是将判别信息引入到模型选择当中,以判别方式同时学习高斯混合模型的结构和参数,提高了分类器的判别性能。 为了提高判别学习算法的训练速度和优化效果,本文提出了一种基于判别学习目标函数梯度的进化策略优化算法。该方法利用目标函数的梯度信息调整Cholesky协方差矩阵自适应进化策略中的参数(Covariance Matrix Adaptation Evolution Strategy based on Cholesky Factorization, Cholesky-CMA-ES),包括加权均值、协方差矩阵和全局步长,提高优化效果和优化效率。该方法主要思想是对每代进化中个体的加权均值用梯度下降算法进行调整,并根据调整后的均值更新协方差矩阵和全局步长。该方法在训练过程中动态调整梯度信息和Cholesky-CMA-ES在联合优化方法中所占的比重。在训练初期,Cholesky-CMA-ES在该联合优化方法中占主导地位,快速确定最优搜索区域;然后,逐渐增加基于梯度优化算法在联合优化方法中所占的比重,以加强联合优化方法的局部探索能力。该联合优化方法实现了Cholesky-CMA-ES与梯度下降算法的互补。一方面,利用其多点随机优化策略可以降低陷入局部最优解的概率;另一方面,利用目标函数的梯度信息可以加快收敛速度。 本文将所提出的判别学习准则、模型选择方法和联合优化算法应用于手写体数字识别问题中。在对高斯混合模型进行判别选择和学习的SoftDS-MMP方法框架下,利用联合优化算法来优化手写体数字分类器的结构和参数。学习得到的分类器在常用的CENPAMI和MNIST手写体数字样本库上进行了验证。在CENPAMI手写体数字样本库上取得了的识别率,在MNIST手写体数字样本库上取得了的识别率。实验结果以及与目前最好识别效果的比较证明了我们所提出方法的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 石如亮;王波;李弼程;高新建;;低速率信道环境下鲁棒的说话人确认[J];计算机应用;2007年04期
2 肖涵;李友荣;吕勇;;基于四分位偏差分形维与高斯混合模型的故障识别算法研究[J];振动工程学报;2008年01期
3 王岐学;钱盛友;赵新民;;基于差分特征和高斯混合模型的湖南方言识别[J];计算机工程与应用;2009年35期
4 谢从华;宋余庆;陈健美;常晋义;;医学图像的混合模型成份数估计[J];计算机科学;2010年10期
5 刘大鹏;尾关和彦;朱庆生;;添加音素持续时间信息到频谱模型的说话人辨认研究[J];计算机技术与发展;2007年05期
6 王明芬;李翠华;余强力;;基于融合邻域信息的海面运动目标检测[J];厦门大学学报(自然科学版);2007年05期
7 王常亮;;基于聚类的自动颜色传输[J];计算机工程与应用;2007年25期
8 牛滨;孔令志;罗森林;潘丽敏;郭亮;;基于MFCC和GMM的个性音乐推荐模型[J];北京理工大学学报;2009年04期
9 潘章明;曲政;;基于差分进化算法的高斯混合模型参数估计[J];现代计算机(专业版);2009年05期
10 强继平;谢剑斌;陈章永;程永茂;刘通;;复杂环境下基于高斯混合模型的目标检测方法[J];微计算机信息;2010年02期
11 邓赵红;王士同;;基于压缩集密度估计的ML模糊推理系统构建[J];江南大学学报(自然科学版);2010年01期
12 陈俊;盛利元;;基于LSP线谱对参数的GMM说话人识别系统[J];微计算机信息;2010年04期
13 赵义正;;改进GMM谱包络转换性能的语音转换算法研究[J];科学技术与工程;2010年17期
14 曾秀花;杨鉴;徐永华;;语种辨识的多特征信息应用[J];计算机工程与应用;2010年25期
15 赵义正;;一种新的分维高斯混合模型语音转换方法[J];计算机与现代化;2010年09期
16 吕声,尹俊勋;同语种说话人转换的实现[J];移动通信;2004年S3期
17 何明;冯博琴;马兆丰;傅向华;;一种基于高斯混合模型的无监督粗糙聚类方法[J];哈尔滨工业大学学报;2006年02期
18 胡海清;张歆奕;;应用于说话人识别的AdaBoost GMM算法[J];五邑大学学报(自然科学版);2006年03期
19 袁礼海;李钊;宋建社;;利用高斯混合模型实现概率密度函数逼近[J];无线电通信技术;2007年02期
20 杨辉;彭良玉;陆世专;;基于小波域高斯混合模型与中值滤波的图像去噪研究[J];电子技术应用;2007年05期
中国重要会议论文全文数据库 前10条
1 瞿俊;姜青山;董槐林;;基于高斯混合模型的层次聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 应冬文;颜永红;付强;国雁萌;;基于约束高斯混合模型的噪声功率谱估计[A];2010年通信理论与信号处理学术年会论文集[C];2010年
3 张雪青;胡贝贝;杨浩;郭勤;崔大祥;;基于金字塔连接与高斯混合模型算法的量子点荧光芯片检测系统的设计[A];中国光学学会2011年学术大会摘要集[C];2011年
4 蔡念;郭文婷;陈世文;潘晴;;融合高斯混合模型和小波变换的运动目标检测[A];第十五届全国图象图形学学术会议论文集[C];2010年
5 刘李漫;陶文兵;田金文;;融合多高斯混合模型与Graph Cuts优化技术的目标自动检测方法[A];第十五届全国图象图形学学术会议论文集[C];2010年
6 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 王莹;景新幸;杨海燕;;改进EM算法的高斯混合模型在说话人识别中的应用[A];2008年全国声学学术会议论文集[C];2008年
8 周洁;;基于高斯混合模型的情感语音转换[A];2011'中国西部声学学术交流会论文集[C];2011年
9 马尽文;何学锋;;高斯混合模型的数据尺度可压缩参数学习算法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
10 郑永煌;王磊;陈嘉鸿;;基于GMM与EM彩色图像分割算法的应用研究[A];2007中国控制与决策学术年会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 陈雪峰;图像高斯混合模型的判别学习方法[D];北京理工大学;2009年
2 姚志均;目标跟踪系统中的鲁棒性研究[D];华中科技大学;2012年
3 吕声;说话人转换方法的研究[D];华南理工大学;2004年
4 高妍方;判别贝叶斯网络的学习算法及其应用研究[D];国防科学技术大学;2008年
5 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
6 张原;基于高斯混合模型的无线传感器网络节点定位算法的研究[D];吉林大学;2010年
7 贾俊杰;空间数据挖掘中若干关键技术研究[D];长安大学;2009年
8 肖涵;基于高斯混合模型与子空间技术的故障识别研究[D];武汉科技大学;2007年
9 唐李军;Cubature卡尔曼滤波及其在导航中的应用研究[D];哈尔滨工程大学;2012年
10 林春漪;基于混合贝叶斯网络的医学图像语义建模及其检索的研究[D];华南理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 李莉;应用神经网络建立金融预测分析系统[D];武汉大学;2005年
2 丁爱明;基于MFCC和GMM的说话人识别系统研究[D];河海大学;2006年
3 丛菡菡;基于支持相量机的稳键说话人识别[D];电子科技大学;2008年
4 姜可梅;检测代替分类的脑机接口研究[D];燕山大学;2011年
5 史燕;基于小波变换的图像检索技术研究[D];西北大学;2006年
6 吴杰;基于高斯混合模型的话者识别系统的研究[D];吉林大学;2008年
7 吴华玉;抗噪声说话人识别技术研究[D];南京师范大学;2008年
8 丁国梁;耳语音说话人识别的研究[D];苏州大学;2009年
9 庄文;应用VQ和GMM的说话人识别系统研究[D];西华大学;2008年
10 薛峰;说话人识别及其在噪声环境下的鲁棒性研究[D];苏州大学;2009年
中国重要报纸全文数据库 前1条
1 ;汉王OCR金融行业解决方案[N];中国计算机报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978