收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于自适应和MCE的说话人识别模型训练技术

李荟  
【摘要】: 说话人识别技术因其自身独特的方便性、经济性、准确性和可扩展性等优点,在生物特征识别领域中具有广阔的应用前景。尽管在实验室环境下,说话人识别系统已经取得了比较令人满意的效果,但是现实中的各种外界因素使得系统性能明显下降。为了提高系统实用化程度,还需要解决很多问题,其中一个显著的问题就是如何在训练数据不足的情况下提高系统的性能。 针对训练数据不足的特点,本文在对说话人建模时采用的是高斯混合模型—通用背景模型(Gaussian Markov Model-Uniform Background Model, GMM-UBM),主要从说话人识别模型的自适应方法和参数估计方法两个方面,研究如何提高说话人识别系统的识别率。在说话人识别模型自适应方面,改进传统的用最大后验概率MAP (Maximum A Posterior Probability)得到说话人模型的方法,将语音识别中的最大似然线性回归MLLR (Maximum Likelihood Linear Regression)和基于特征音(EigenVoice, EV)的自适应方法,应用到说话人识别模型自适应当中,并将其与MAP方法进行比较;针对MAP和MLLR各自的优缺点,将其结合为综合渐进的自适应方法。在参数估计方面,考虑到常用的基于最大似然ML(Maximum Likelihood)准则的算法有一定局限性,它不能有效地刻画说话人之间的差异。针对这一不足,可以引入近年来语音识别算法中基于最小分类错误MCE(Minimum Classification Error)的训练方法,它以最小分类错误为目标进行区分性训练。采用MCE方法有助于提高说话人识别系统的性能。 实验结果表明,针对不同训练语料的数量,首先应用合适的自适应方法进行说话人识别模型的自适应,再利用基于MCE的参数训练方法对系统改进,这样系统的识别率会有显著的提高,得到测试的最好识别率为91.2%。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 倪建克;曾虹;张翔;;基于最大均值似然判决规则的说话人辨认研究[J];杭州电子科技大学学报;2006年05期
2 王成儒,王金甲;基于并行PNN模型的说话人辨认研究[J];计算机工程;2004年01期
3 张玲华,石操,张子菁,杨震,郑宝玉;说话人辨认系统中码本生成的新算法[J];信号处理;2004年04期
4 王成儒,王金甲,练秋生;一种新的用于说话人辨认的PNN分类器的研究(英文)[J];自动化学报;2004年03期
5 邱政权,江太辉;GMM/ANN混合说话人辨认模型[J];计算机工程与应用;2004年17期
6 茅晓泉,胡光锐,唐斌;说话人辨认中基于进化策略的最大互信息训练方法[J];上海交通大学学报;2003年03期
7 王成儒,王金甲;基于MCE训练算法的说话人辨认系统[J];计算机工程;2003年13期
8 何致远,胡起秀,徐光祐;两级决策的开集说话人辨认方法[J];清华大学学报(自然科学版);2003年04期
9 张玲华,杨震,郑宝玉;基于HMM的说话人辨认系统及其改进[J];电讯技术;2003年06期
10 林江云;;说话人辨认中GMM模型的聚类优化研究[J];心智与计算;2008年01期
11 殷启新,韩春光,杨鉴;基于掌上电脑录音的说话人辨认[J];云南民族大学学报(自然科学版);2003年04期
12 马建,郭建东;说话人识别技术研究[J];福建电脑;2005年01期
13 谢青松;潘进;史永林;李国朋;;基于GMM模型的说话人辨认系统[J];电脑知识与技术;2009年09期
14 周娟;杨鼎才;;基于GA-SVM的说话人辨认的参数优化[J];电子技术;2008年02期
15 荣蓉;;基于神经网络的与文本相关说话人辨认系统[J];山东科学;2008年04期
16 冷自强;王金明;林大会;;一种GMM-SVM混合说话人辨认模型[J];军事通信技术;2009年01期
17 熊汉春,贺前华,李海洲;一种用于说话人辨认的EM训练算法[J];数据采集与处理;1998年03期
18 蔡耿平,黄顺珍,徐志鸿,蓝波,范国华,梁凡;声纹识别系统[J];深圳大学学报(理工版);2002年02期
19 杨阳;陈永明;;声纹识别技术及其应用[J];电声技术;2007年02期
20 谭萍;邢玉娟;李明;;基于核Fisher判别的说话人辨认[J];科学技术与工程;2008年08期
中国重要会议论文全文数据库 前10条
1 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
2 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认快速算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 郑娜;;基于假设检验的信号检测[A];电波科学学报[C];2011年
4 李文;李淼;张建;陈雷;雪艳;;一种带权值参数的非监督式形态切分方法[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 徐琳;谢湘;匡镜明;;结合MLLR和MAP的说话人聚类自适应方法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
6 周瑜;金怡珠;李桂莲;;一种改进的基于HMM-BIC的说话人日志系统[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 王成儒;王金甲;李静;;一种用于说话人辨认的概率神经网络的MCE训练算法[A];第三次全国会员代表大会暨学术会议论文集[C];2002年
8 彭诗雅;;声纹识别技术研究[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
9 张玲华;郑宝玉;杨震;;一种新的具有噪声鲁棒性的说话人语音特征及其应用[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
10 倪建克;曾虹;张翔;;基于最大均值似然判决规则的说话人辨认研究[A];浙江省电子学会2006年学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 李燕萍;说话人辨认中的特征参数提取和鲁棒性技术研究[D];南京理工大学;2009年
2 郑建炜;基于核方法的说话人辨认模型研究[D];浙江工业大学;2010年
3 周宇;中国手语识别中自适应问题的研究[D];哈尔滨工业大学;2010年
4 王增赟;自适应方法在几类非线性时滞系统控制中的应用[D];湖南大学;2010年
5 徐利敏;说话人辨认中的特征变换和鲁棒性技术研究[D];南京理工大学;2008年
6 颜建华;正电子发射断层图像重建算法研究[D];华中科技大学;2007年
7 郭大波;网格基单目和立体视频编码及相关技术研究[D];西安电子科技大学;2009年
8 张健;多类不确定非线性系统全局自适应稳定控制设计[D];山东大学;2012年
9 陈波;自适应光学图像复原理论与算法研究[D];解放军信息工程大学;2008年
10 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 李荟;基于自适应和MCE的说话人识别模型训练技术[D];哈尔滨工业大学;2007年
2 王金甲;噪声环境下鲁棒性文本自由说话人辨认系统的研究[D];燕山大学;2003年
3 崔双喜;语音识别中说话人自适应技术的研究与实现[D];燕山大学;2006年
4 赵欢欢;基于隐马尔可夫模型的说话人转换研究[D];中国科学技术大学;2009年
5 明兰;基于数据融合的协作频谱检测算法的研究[D];南京邮电大学;2011年
6 张如艳;基于核函数的最大后验概率的分类方法的研究及其应用[D];江南大学;2012年
7 雷雄国;基于因子分析概率统计模型的说话人识别[D];湘潭大学;2006年
8 曹华;复杂性分析方法在语音及图像处理中的应用研究[D];浙江大学;2004年
9 李红阳;运动图像恢复[D];清华大学;2002年
10 常志国;说话人识别系统的研究与实现[D];上海师范大学;2004年
中国重要报纸全文数据库 前2条
1 ;HomePlug输电线上家庭联网[N];网络世界;2001年
2 ;解密声纹锁 一声令下,“芝麻开门”[N];广东科技报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978