收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

语音的参数表示和质量客观评价研究

付强  
【摘要】: 语音信号的表示和谱失真测度一直是贯穿于语音处理各个领域中的重要而基 本的问题。虽历经几十年的研究和实践,产生了许多卓有成效的理论和方法,但 随着对语音信号认识的进一步加深和近年来许多语音应用领域的蓬勃发展,对这 一传统课题的研究再度活跃起来。语音质量客观评价更是语音表示及其谱失真测 度理论的直接应用。本文重点研究语音信号的各种参数表示方法及其相应的失真 测度,以及它们在语音质量客观评价方面的应用。 1.提出了一种Bark尺度倒谱系数(BSCC)失真测度。它是采用一种余弦镶边 临界带滤波器组代替Mel频率三角滤波器组进行倒谱分析的。理论分析和实 验结果都表明这种新测度的总体性能优于MFCC谱失真测度。它在主观感知 上与Bark谱失真测度相当,而其计算复杂度却与MFCC谱失真测度相似,远 低于Bark谱失真测度,适于实时系统的应用。 2.提出了一种新的子波变换,即语音信号Bark子波变换。它是基于语音感知实 验中Bark频率尺度的概念推导而来的。数学上它是一种非正交的,但却是超 完备的,可逆且是自反演的子波变换。应用在语音识别中时,利用子波变换 的局部基性质,它能取较小的帧长进行分析,因而与MFCC特征提取相比, 在同样的频率分辨率情况下能获得更高的时间分辨率。相关识别实验表明, Bark子波变换的特征在辅音的区别能力方面优于目前广泛应用的MFCC特 征。 3.建立了一个语音质量客观评价系统。它是采用一个符合汉语统计规律的语音 数据库,并进行了规范的主观音质评价得到的结果作为基础而建立成的。首 先分别对LPC倒谱、Mel倒谱、Bark谱、(加权)对数谱及它们的组合测度的 主客观评价相关模型进行了大量的实验性研究。并且采用了一些独特的方法 较好地解决了原始语音信号与失真语音信号之间的同步问题。所建成的系统 是一个可靠的实用评价系统。 4.提出了一种基于神经网络的语音质量客观评价方法。它是采用前向神经网络 实现语音质量客观评价的一步法策略。传统的方法通常包括失真计算和由失 真测度到主观得分估计的非线性回归分析两步。新方法将这两步整合为一步, 采用神经网络自适应地逼近听觉系统的高维非线性感知特性,避免了失真测 度函数和回归分析的函数形式的人为假定。统计学理论分析表明:一步法是 在主观得分一级的算术平均,其估值是MOS的一种无偏一致估计,是比常规 方法更有效的估计子。对比实验结果也证明了其优越性能。 5.基于上述一步法策略,采用径向基函数网络设计了一个更加顽健的语音质量 客观评价系统。在该系统的设计中,对其结构和训练算法方面进行了大量的 探索,解决了一些与实用性有关的关键问题。与基于MLP的系统相比,它在 主客观相关性方面和可扩展性等方面均有所提高,并有较大改进余地。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张晓玲,张培强,沈兰荪;基于信息量失真测度的VQ及在高光谱图像无损压缩中的应用[J];遥感学报;2004年05期
2 方绍武,戴蓓倩;VQ话者模型中失真测度的鲁棒性研究[J];数据采集与处理;2000年02期
3 王仁华,何林顺,黎建宁;等方差加权倒谱失真测度及其在说话人识别中的应用[J];电子学报;1992年08期
4 周汀,章倩苓,闵昊,陈旭昀;基于DCT子空间失真测度的快速矢量编码算法[J];计算机学报;1997年05期
5 方绍武,戴蓓倩,陆伟;基于方差归一化失真测度的改进的LBG算法[J];计算机工程与应用;2000年02期
6 付强,田斌,张知易,易克初;基于神经网络的语音谱失真测度研究[J];声学学报(中文版);2001年02期
7 张如亮,余宁梅,高勇,王冬芳;一种快速相关预测矢量量化的图像编码算法[J];中国图象图形学报;2004年03期
8 刘雅琴;裘雪红;;一种加权矢量量化的说话人识别技术[J];计算机与信息技术;2005年06期
9 项虹丽;陈显治;;声道参数的矢量量化[J];解放军理工大学学报(自然科学版);1992年01期
10 李蕴华;利用语音倒谱参数及基音信息辨认说话人[J];南通工学院学报;1999年02期
11 张如亮,王冬芳,余宁梅,高勇;一种基于并行结构的快速VQ编码算法[J];现代电子技术;2003年17期
12 屈微,刘贺平;基于独立分量分析和矢量量化的说话人识别[J];计算机应用;2005年10期
13 林强;裘雪红;;基于方差归一化失真测度的语音识别[J];电子科技;2007年08期
14 周汀,章倩苓,李蔚,闵昊;基于DCT子空间失真测度的矢量量化VLSI结构设计[J];电路与系统学报;1997年02期
15 李蕴华;将倒谱参数与基音信息有效结合进行说话人辨认[J];信号处理;2000年01期
16 陆义宁,万元元,李晓飞;使用L_1失真测度及其派生方法的无乘法矢量量化[J];电视技术;2001年12期
17 郭新平;;真彩色数字图像在VGA上的显示[J];微计算机应用;1993年03期
18 金振玉,游志刚;矢量量化及其硬件实现[J];北京理工大学学报;1992年03期
19 屈微;刘贺平;张德政;;基于独立分量分析特征提取的故障诊断系统[J];北京科技大学学报;2006年07期
20 黄昊;郭立;李琳;;基于失真测度的直接扩频音频隐写分析[J];中国科学院研究生院学报;2008年02期
中国重要会议论文全文数据库 前10条
1 吴江滨;张知易;;客观音质评价实用化研究进展[A];2006’和谐开发中国西部声学学术交流会论文集[C];2006年
2 李忠强;王磊;孙自力;郑家祥;侯小江;;语音质量评估方法分析[A];2006’和谐开发中国西部声学学术交流会论文集[C];2006年
3 杨伟东;;一种用线性预测系数和音调曲线的讲话人辩认系统[A];第二届全国人机语音通讯学术会议论文集[C];1992年
4 李宏言;盛利元;陈妮;;一种基于矢量量化和查找表的改进DTW语音识别方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
5 朱思俞;李建人;余金森;王海燕;;在中等噪声背景下的全音节汉语语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
6 王波;王炳锡;丁琦;;基于段级特征说话人识别快速算法及DSP实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
7 杨伟东;陈永彬;;与文本无关的讲话人辨认研究[A];第三届全国人机语音通讯学术会议论文集[C];1994年
8 王海燕;朱思俞;李建人;余金森;;噪声背景下大词汇汉语语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
9 闫宝杰;高文;;一种使用非限定词句的话者识别的系统[A];第三届全国人机语音通讯学术会议论文集[C];1994年
10 杨伟东;陈永彬;;使用VQ的汉语讲话人识别研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
中国博士学位论文全文数据库 前3条
1 黄昊;音频信息隐藏关键技术的研究[D];中国科学技术大学;2008年
2 陈善学;矢量量化技术及其在图像信号处理中的应用研究[D];电子科技大学;2009年
3 付强;语音的参数表示和质量客观评价研究[D];西安电子科技大学;2000年
中国硕士学位论文全文数据库 前10条
1 云霞;基于Mel倒谱和Bark谱失真距离的汉语音质客观评价研究[D];西南交通大学;2004年
2 谢艳萍;噪声环境下的说话人识别研究[D];西北大学;2009年
3 李春晓;基于语音识别的莫尔斯报文系统设计与实现[D];哈尔滨工程大学;2006年
4 胡永刚;降维技术计算量分析及基于DCT的复合降维技术研究[D];国防科学技术大学;2006年
5 蒋纯纲;说话人识别系统的研究[D];江南大学;2008年
6 盖兴杰;基于矢量量化的说话人识别分析与研究[D];长春理工大学;2009年
7 孙长斌;基于特定人的小词汇量孤立词语音识别[D];吉林大学;2007年
8 胡宏梅;若干矢量量化码书设计算法研究[D];苏州大学;2007年
9 余水来;DTX/CNG算法的研究与实现[D];大连理工大学;2009年
10 周英凤;基于图像传感器的原始数据压缩及彩色图像重构算法[D];太原理工大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978