收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语音反演机器学习方法的声道模型研究

陈英  
【摘要】:由于协同发音的影响,自动语音识别系统的性能会受到影响。已有的研究表明结合发音信息可以提高语音识别系统的性能,但是发音信息在话音环境中并不容易得到,因此语音反演被提了出来。语音反演是一种从语音信号中预测发音轨迹或者声道配置的方法。如果能够准确地预测发音信息,这些发音信息还能有助于语音合成、语言获取以及语音可视化等。 论文首先提出使用声道变量作为发音信息(代替传统的球状轨迹)来模式化语音动态,并比较了声道变量和球状轨迹的预测性能和非唯一性。论文将语音分别参数化为梅尔倒谱系数,感知线性预测倒谱系数和线性预测倒谱系数,并使用混合密度网络来预测声道变量和球状轨迹。实验结果表明声道变量比球状轨迹能被更准确地预测。另外,论文使用基于模型的统计公式计算声道变量和球状轨迹的标准化的非唯一性,结果表明对于相同的六个辅音,声道变量的非唯一性比球状轨迹的非唯一性低。 论文另一个研究内容为使用四种不同的语音反演的机器学习方法,即前馈人工神经网络、自回归人工神经网络、远端监督学习以及轨迹混合密度网络比较声道变量和球状轨迹,结果表明声道变量比球状轨迹有更好的性能,更适合基于发音器官特征的自动语音识别系统。另外论文分别将语音参数化为梅尔倒谱系数和声学参数,并比较了这四种方法对声道变量的预测性能,结果表明从整体来看三层隐层的前馈人工神经网络对声道变量的预测性能最好。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 于迎霞,史家茂;一种改进的基于倒谱特征的带噪端点检测方法[J];计算机工程;2004年19期
2 马道钧;陈天策;高婕;;语音端点检测方法的分析与实现[J];北京电子科技学院学报;2007年04期
3 邓艾东;包永强;赵力;;基于高斯混合模型的转子碰摩声发射识别方法[J];机械工程学报;2010年15期
4 吴龙梅,张建军,赵风光,张云雁;一类新的实时语音端点检测方法[J];上海大学学报(自然科学版);2005年04期
5 徐静波,于洪涛,冉崇森;语音识别中谱包自相关技术[J];数据采集与处理;2004年04期
6 雷传华,张秀彬,孙济宇;连接数字语音识别系统的DSP实时实现[J];上海交通大学学报;1999年12期
7 原玲;自组织特征映射神经网络用于非特定人语音识别[J];军事通信技术;1997年04期
8 邵央,刘丙哲,李宗葛;基于MFCC和加权矢量量化的说话人识别系统[J];计算机工程与应用;2002年05期
9 易鸿锋;谷春燕;金力军;易克初;;基于倒谱递推的逆滤波器设计[J];空间电子技术;2006年S1期
10 戚银城;苑津莎;;语音回声信息隐藏技术研究[J];数据采集与处理;2006年04期
11 段金凤;;语音端点检测方法探讨[J];电脑与电信;2009年04期
12 魏勋;耿志辉;王晓攀;;语音识别的鲁棒性特征提取方法研究[J];无线电工程;2010年08期
13 徐相华;徐伯庆;;应用动态时间规整与矢量量化的语音识别算法[J];光学仪器;2010年03期
14 杨吉斌,曹铁勇,张雄伟;基于AMR编码参数的语音识别[J];解放军理工大学学报(自然科学版);2002年05期
15 马洪连;朱杰;杨凤岐;孟新雨;;基于DSP的声控系统的设计与实现[J];测控技术;2005年12期
16 马元锋;陈克安;马苗;张成;;一种新的可应用于声目标识别的倒谱系数[J];兵工学报;2009年11期
17 李文治;张晓明;殷雄;;基于LSB和量化思想的倒谱域音频水印算法[J];计算机应用;2010年03期
18 王玥;钱志鸿;王雪;程光明;;基于伽马通滤波器组的听觉特征提取算法研究[J];电子学报;2010年03期
19 朱晓晶;侯旭初;崔慧娟;唐昆;;基于LPCC和能量熵的端点检测[J];电讯技术;2010年06期
20 吴淑珍,吴阿华;说话人识别的参量研究和语音库建设[J];北京大学学报(自然科学版);1995年03期
中国重要会议论文全文数据库 前10条
1 郑成诗;胡笑浒;常道庆;李晓东;;语音倒谱系数均值的DD估计算法[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
2 姜薇;徐柏龄;;适于远场语音识别的倒谱系数零均值化改进算法[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
3 纪红;吴善培;;语音识别中三种倒谱系数特征参量性能的比较[A];第二届全国人机语音通讯学术会议论文集[C];1992年
4 许飞;;语音信号特征提取技术简介[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
5 管鲁阳;鲍明;李晓东;田静;;基于双耳模型倒谱系数的车辆识别技术研究[A];中国声学学会2006年全国声学学术会议论文集[C];2006年
6 张敏瑞;易克初;;倒谱在数字水印算法中的应用[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(下册)[C];2002年
7 何佳若;曾向阳;张春雷;;室内语音报警词识别系统设计[A];第二届西安-上海两地声学学术会议论文集[C];2011年
8 王仁华;;语声身份确认系统[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
9 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
10 郑成诗;李晓东;;倒谱系数自适应平滑算法及其在语音增强的应用[A];2008年声频工程学术交流年会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 钱真;视频多模态信息处理的关键技术研究[D];哈尔滨工程大学;2012年
2 宁更新;抗噪声语音识别新技术的研究[D];华南理工大学;2006年
3 赵欢;面向嵌入式计算平台的自动语音识别关键技术研究[D];湖南大学;2010年
4 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
5 关欣;音乐信号自动分类相关算法研究[D];天津大学;2009年
6 吴强;基于听觉感知与张量模型的鲁棒语音特征提取方法研究[D];上海交通大学;2010年
7 陈歆普;基于肌电信号的多模式人机接口研究[D];上海交通大学;2011年
8 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
9 武淑红;延迟2.5ms 8Kbps语音编码算法研究[D];太原理工大学;2012年
10 李新欣;船舶及鲸类声信号特征提取和分类识别研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 段淑斐;听觉—声学混合LPC方法研究[D];太原理工大学;2010年
2 李丹;基于VQ与HMM的说话人识别系统的研究[D];武汉理工大学;2005年
3 李香萍;说话人识别算法研究[D];天津大学;2006年
4 乐莎莎;基于HHT的咳嗽音识别研究[D];广西师范大学;2014年
5 张众;小型语音识别系统的研究和开发[D];天津大学;2004年
6 刘刚;说话人识别系统设计研究[D];华东师范大学;2004年
7 蒋伟;基于高斯混合模型的说话人识别研究[D];电子科技大学;2008年
8 张卫清;语音识别算法的研究[D];南京理工大学;2004年
9 孙智华;数字音频信息隐藏技术的研究[D];浙江工业大学;2007年
10 胡优;语音识别算法及其在嵌入式中的应用[D];电子科技大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978