基于语音反演机器学习方法的声道模型研究
【摘要】:由于协同发音的影响,自动语音识别系统的性能会受到影响。已有的研究表明结合发音信息可以提高语音识别系统的性能,但是发音信息在话音环境中并不容易得到,因此语音反演被提了出来。语音反演是一种从语音信号中预测发音轨迹或者声道配置的方法。如果能够准确地预测发音信息,这些发音信息还能有助于语音合成、语言获取以及语音可视化等。
论文首先提出使用声道变量作为发音信息(代替传统的球状轨迹)来模式化语音动态,并比较了声道变量和球状轨迹的预测性能和非唯一性。论文将语音分别参数化为梅尔倒谱系数,感知线性预测倒谱系数和线性预测倒谱系数,并使用混合密度网络来预测声道变量和球状轨迹。实验结果表明声道变量比球状轨迹能被更准确地预测。另外,论文使用基于模型的统计公式计算声道变量和球状轨迹的标准化的非唯一性,结果表明对于相同的六个辅音,声道变量的非唯一性比球状轨迹的非唯一性低。
论文另一个研究内容为使用四种不同的语音反演的机器学习方法,即前馈人工神经网络、自回归人工神经网络、远端监督学习以及轨迹混合密度网络比较声道变量和球状轨迹,结果表明声道变量比球状轨迹有更好的性能,更适合基于发音器官特征的自动语音识别系统。另外论文分别将语音参数化为梅尔倒谱系数和声学参数,并比较了这四种方法对声道变量的预测性能,结果表明从整体来看三层隐层的前馈人工神经网络对声道变量的预测性能最好。
|
|
|
|
1 |
于迎霞,史家茂;一种改进的基于倒谱特征的带噪端点检测方法[J];计算机工程;2004年19期 |
2 |
马道钧;陈天策;高婕;;语音端点检测方法的分析与实现[J];北京电子科技学院学报;2007年04期 |
3 |
邓艾东;包永强;赵力;;基于高斯混合模型的转子碰摩声发射识别方法[J];机械工程学报;2010年15期 |
4 |
吴龙梅,张建军,赵风光,张云雁;一类新的实时语音端点检测方法[J];上海大学学报(自然科学版);2005年04期 |
5 |
徐静波,于洪涛,冉崇森;语音识别中谱包自相关技术[J];数据采集与处理;2004年04期 |
6 |
雷传华,张秀彬,孙济宇;连接数字语音识别系统的DSP实时实现[J];上海交通大学学报;1999年12期 |
7 |
原玲;自组织特征映射神经网络用于非特定人语音识别[J];军事通信技术;1997年04期 |
8 |
邵央,刘丙哲,李宗葛;基于MFCC和加权矢量量化的说话人识别系统[J];计算机工程与应用;2002年05期 |
9 |
易鸿锋;谷春燕;金力军;易克初;;基于倒谱递推的逆滤波器设计[J];空间电子技术;2006年S1期 |
10 |
戚银城;苑津莎;;语音回声信息隐藏技术研究[J];数据采集与处理;2006年04期 |
11 |
段金凤;;语音端点检测方法探讨[J];电脑与电信;2009年04期 |
12 |
魏勋;耿志辉;王晓攀;;语音识别的鲁棒性特征提取方法研究[J];无线电工程;2010年08期 |
13 |
徐相华;徐伯庆;;应用动态时间规整与矢量量化的语音识别算法[J];光学仪器;2010年03期 |
14 |
杨吉斌,曹铁勇,张雄伟;基于AMR编码参数的语音识别[J];解放军理工大学学报(自然科学版);2002年05期 |
15 |
马洪连;朱杰;杨凤岐;孟新雨;;基于DSP的声控系统的设计与实现[J];测控技术;2005年12期 |
16 |
马元锋;陈克安;马苗;张成;;一种新的可应用于声目标识别的倒谱系数[J];兵工学报;2009年11期 |
17 |
李文治;张晓明;殷雄;;基于LSB和量化思想的倒谱域音频水印算法[J];计算机应用;2010年03期 |
18 |
王玥;钱志鸿;王雪;程光明;;基于伽马通滤波器组的听觉特征提取算法研究[J];电子学报;2010年03期 |
19 |
朱晓晶;侯旭初;崔慧娟;唐昆;;基于LPCC和能量熵的端点检测[J];电讯技术;2010年06期 |
20 |
吴淑珍,吴阿华;说话人识别的参量研究和语音库建设[J];北京大学学报(自然科学版);1995年03期 |
|