收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于语音反演机器学习方法的声道模型研究

陈英  
【摘要】:由于协同发音的影响,自动语音识别系统的性能会受到影响。已有的研究表明结合发音信息可以提高语音识别系统的性能,但是发音信息在话音环境中并不容易得到,因此语音反演被提了出来。语音反演是一种从语音信号中预测发音轨迹或者声道配置的方法。如果能够准确地预测发音信息,这些发音信息还能有助于语音合成、语言获取以及语音可视化等。 论文首先提出使用声道变量作为发音信息(代替传统的球状轨迹)来模式化语音动态,并比较了声道变量和球状轨迹的预测性能和非唯一性。论文将语音分别参数化为梅尔倒谱系数,感知线性预测倒谱系数和线性预测倒谱系数,并使用混合密度网络来预测声道变量和球状轨迹。实验结果表明声道变量比球状轨迹能被更准确地预测。另外,论文使用基于模型的统计公式计算声道变量和球状轨迹的标准化的非唯一性,结果表明对于相同的六个辅音,声道变量的非唯一性比球状轨迹的非唯一性低。 论文另一个研究内容为使用四种不同的语音反演的机器学习方法,即前馈人工神经网络、自回归人工神经网络、远端监督学习以及轨迹混合密度网络比较声道变量和球状轨迹,结果表明声道变量比球状轨迹有更好的性能,更适合基于发音器官特征的自动语音识别系统。另外论文分别将语音参数化为梅尔倒谱系数和声学参数,并比较了这四种方法对声道变量的预测性能,结果表明从整体来看三层隐层的前馈人工神经网络对声道变量的预测性能最好。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘庆峰,王仁华;基于LMA声道模型的语声合成新方法[J];声学学报(中文版);1998年03期
2 顾明亮;神经网络语音识别新特征[J];徐州师范大学学报(自然科学版);1998年02期
3 董力,陈宏钦,马争鸣;基于小波变换的语音段起止端点检测算法[J];中山大学学报(自然科学版);2005年03期
4 周曦;戴蓓蒨;陈雁翔;李辉;;基于纯度和BBN算法的无监督的话者聚类[J];模式识别与人工智能;2005年04期
5 张志敏;郭英;王博;;一种基于倒谱特征的语音端点检测改进算法[J];电声技术;2006年04期
6 范炳远;方建安;;协方差斜格法的LPC参数提取及其FPGA实现[J];计算机工程;2008年15期
7 段金凤;;语音端点检测方法探讨[J];电脑与电信;2009年04期
8 钟山;刘加;;MLLR特征的SVM语种识别算法[J];清华大学学报(自然科学版);2009年S1期
9 张俊星;刘宇;;基于二级搜索模型的有声出版物语音分割算法[J];吉林大学学报(工学版);2009年S2期
10 卢颖;;《人民日报》元旦社论的语音修辞[J];新闻爱好者;2010年19期
11 顾明亮,王太君,史笑兴,何振亚;基于加权全局时频特征的易混淆词识别[J];应用科学学报;1998年03期
12 于迎霞,史家茂;一种改进的基于倒谱特征的带噪端点检测方法[J];计算机工程;2004年19期
13 吴龙梅,张建军,赵风光,张云雁;一类新的实时语音端点检测方法[J];上海大学学报(自然科学版);2005年04期
14 李建磊;马震;陈延萍;;变阶数全极点声道模型及其在MPLPC中的应用仿真[J];声学与电子工程;2007年04期
15 陈东帆;王照亮;刘佛生;;针对构音异常辅助治疗的声道仿真研究[J];计算机工程与科学;2010年01期
16 邓艾东;包永强;赵力;;基于高斯混合模型的转子碰摩声发射识别方法[J];机械工程学报;2010年15期
17 罗元;李嘉穗;徐秉铮;;汉语语音“通—断”模型的统计分析[J];电信科学;1987年07期
18 李洪波;于洪志;;噪声环境下语音识别的端点检测技术[J];西北民族大学学报(自然科学版);2007年01期
19 刘佛生;陈东帆;;基于Matlab的构音异常声道动态仿真[J];计算机辅助工程;2009年02期
20 肖大光;多功能数字式录音机设计[J];电子技术;1997年02期
中国重要会议论文全文数据库 前10条
1 陈立春;董长宝;;具有网络监控管理功能的铁路运输语音记录仪的研究[A];《铁路车务设备信息管理系统研讨会》论文集[C];2011年
2 张金爽;于洪志;郑文思;吕士良;;言语呼吸韵律分析平台的设计与实现[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 肖熙;王侠;王作英;;非齐次HMM语音段长模型的Forward-Backward算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
5 尹巧萍;吴海宁;赵力;;含噪语音信号端点检测方法的研究[A];2008’促进中西部发展声学学术交流会论文集[C];2008年
6 杨鉴;;基于倒谱分析的汉语按规则合成系统[A];第三届全国人机语音通讯学术会议论文集[C];1994年
7 王博;郭英;段艳丽;陈琪;;基于倒谱特征的语音端点检测算法研究[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 陈凡;罗四维;;一个实用语音开发应用系统的设计与实现[A];第二届全国人机语音通讯学术会议论文集[C];1992年
9 李剑;郭西进;;基于SOPC的实时说话人识别系统的研究[A];2009全国虚拟仪器大会论文集(二)[C];2009年
10 沈亚强;程仲文;任德官;;带噪语音信号的信号模型参数和噪声模型参数的辨别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
中国博士学位论文全文数据库 前10条
1 赵腊生;语音情感特征提取与识别方法研究[D];大连理工大学;2010年
2 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
3 杨于村;基于公众移动通信网的端到端加密语音传输技术研究[D];华南理工大学;2009年
4 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
5 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
6 田岚;增强电子耳蜗听感知的处理策略研究[D];天津大学;2009年
7 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年
8 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
9 周文君;舰船VDR人声识别技术研究[D];哈尔滨工程大学;2009年
10 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年
中国硕士学位论文全文数据库 前10条
1 陈英;基于语音反演机器学习方法的声道模型研究[D];南京邮电大学;2013年
2 何明哲;语音片段检索算法的研究与应用[D];华南理工大学;2012年
3 邸燕君;基于感知哈希的语音内容认证方法研究[D];兰州理工大学;2013年
4 王冲;无人机语音指令控制系统技术研究[D];南京航空航天大学;2012年
5 李秀珍;语音识别算法及应用技术研究[D];重庆大学;2010年
6 郭永亮;嵌入式语音指令处理与识别方法的研究[D];南京航空航天大学;2010年
7 丁华伟;基于带有激励源的传输线声道模型仿真研究[D];云南大学;2012年
8 向磊;语音情感特征提取与识别的研究[D];浙江理工大学;2013年
9 李海忠;语音增强算法研究与应用[D];西华大学;2010年
10 卓露;语音增强算法的研究与实现[D];湖北工业大学;2011年
中国重要报纸全文数据库 前7条
1 江西 林慧勇;语音合成芯片MSM6295及其应用[N];电子报;2006年
2 中国科学院自动化研究所模式识别国家重点实验室 于剑陶建华;个性化语音生成技术面面观[N];计算机世界;2007年
3 ;与“小超人”对话[N];中国计算机报;2001年
4 曲豆;声纹鉴定找到敲诈人[N];北京科技报;2004年
5 中科院自动化所 何鹏 陶建华 谭铁牛;看懂人的“脸色”[N];计算机世界;2005年
6 ;关注中国语音技术产业发展[N];科技日报;2000年
7 上海 孙焕挺;OTP型语音电路应用[N];电子报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978