收藏本站
《西安电子科技大学》 2000年
收藏 | 手机打开
二维码
手机客户端打开本文

语音的参数表示和质量客观评价研究

付强  
【摘要】: 语音信号的表示和谱失真测度一直是贯穿于语音处理各个领域中的重要而基 本的问题。虽历经几十年的研究和实践,产生了许多卓有成效的理论和方法,但 随着对语音信号认识的进一步加深和近年来许多语音应用领域的蓬勃发展,对这 一传统课题的研究再度活跃起来。语音质量客观评价更是语音表示及其谱失真测 度理论的直接应用。本文重点研究语音信号的各种参数表示方法及其相应的失真 测度,以及它们在语音质量客观评价方面的应用。 1.提出了一种Bark尺度倒谱系数(BSCC)失真测度。它是采用一种余弦镶边 临界带滤波器组代替Mel频率三角滤波器组进行倒谱分析的。理论分析和实 验结果都表明这种新测度的总体性能优于MFCC谱失真测度。它在主观感知 上与Bark谱失真测度相当,而其计算复杂度却与MFCC谱失真测度相似,远 低于Bark谱失真测度,适于实时系统的应用。 2.提出了一种新的子波变换,即语音信号Bark子波变换。它是基于语音感知实 验中Bark频率尺度的概念推导而来的。数学上它是一种非正交的,但却是超 完备的,可逆且是自反演的子波变换。应用在语音识别中时,利用子波变换 的局部基性质,它能取较小的帧长进行分析,因而与MFCC特征提取相比, 在同样的频率分辨率情况下能获得更高的时间分辨率。相关识别实验表明, Bark子波变换的特征在辅音的区别能力方面优于目前广泛应用的MFCC特 征。 3.建立了一个语音质量客观评价系统。它是采用一个符合汉语统计规律的语音 数据库,并进行了规范的主观音质评价得到的结果作为基础而建立成的。首 先分别对LPC倒谱、Mel倒谱、Bark谱、(加权)对数谱及它们的组合测度的 主客观评价相关模型进行了大量的实验性研究。并且采用了一些独特的方法 较好地解决了原始语音信号与失真语音信号之间的同步问题。所建成的系统 是一个可靠的实用评价系统。 4.提出了一种基于神经网络的语音质量客观评价方法。它是采用前向神经网络 实现语音质量客观评价的一步法策略。传统的方法通常包括失真计算和由失 真测度到主观得分估计的非线性回归分析两步。新方法将这两步整合为一步, 采用神经网络自适应地逼近听觉系统的高维非线性感知特性,避免了失真测 度函数和回归分析的函数形式的人为假定。统计学理论分析表明:一步法是 在主观得分一级的算术平均,其估值是MOS的一种无偏一致估计,是比常规 方法更有效的估计子。对比实验结果也证明了其优越性能。 5.基于上述一步法策略,采用径向基函数网络设计了一个更加顽健的语音质量 客观评价系统。在该系统的设计中,对其结构和训练算法方面进行了大量的 探索,解决了一些与实用性有关的关键问题。与基于MLP的系统相比,它在 主客观相关性方面和可扩展性等方面均有所提高,并有较大改进余地。
【学位授予单位】:西安电子科技大学
【学位级别】:博士
【学位授予年份】:2000
【分类号】:TN912.3

【引证文献】
中国期刊全文数据库 前10条
1 刘广建,王伯昶,薛磊,张知易;一种语音通信干扰效果的客观评估方法[J];电子对抗技术;2005年02期
2 张雄伟;沈刘平;曹铁勇;杨吉斌;孙新建;;一种基于语音分类的清晰度客观评价算法[J];解放军理工大学学报(自然科学版);2007年02期
3 姜亚军,赵鹤鸣;普通话单字发音准确度的计算机辅助评价方法[J];计算机工程与应用;2005年26期
4 陆振波,章新华;Bark子波变换的改进及其在水声目标分类中的应用[J];计算机仿真;2005年02期
5 孙新建;邹霞;曹铁勇;张雄伟;赵汉武;;基于加权巴克谱失真的语音质量客观评价算法[J];数据采集与处理;2006年03期
6 陈锋;宋玉凤;李忠强;;语音通信干扰效果客观评估系统设计[J];通信对抗;2008年03期
7 刘张宇;鲍长春;邱建伟;徐昊;;基于GMM的AMR-NB与G.729A之间的LSP参数转码方法[J];通信学报;2010年02期
8 于增辉;黑勇;陈黎明;徐欣锋;吴兆胜;;多通道数字助听器算法及低功耗VLSI设计[J];微电子学与计算机;2012年04期
9 许嵩;李志忠;;声学告警的工效学研究[J];人类工效学;2007年01期
10 杨云升;刘志华;李博章;;利用相空间重构时间延迟特性进行语音音质分析[J];应用声学;2009年01期
中国重要会议论文全文数据库 前1条
1 李忠强;王磊;孙自力;郑家祥;侯小江;;语音质量评估方法分析[A];2006’和谐开发中国西部声学学术交流会论文集[C];2006年
中国博士学位论文全文数据库 前2条
1 陈华伟;语音通信中音质客观评价研究[D];西南交通大学;2007年
2 鄢田云;神经网络在语音质量客观评价应用中的研究[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 吴怡;基于LMS算法的语音增强系统的研究[D];北京邮电大学;2011年
2 唐力;基于压缩感知的语音稀疏基和投影矩阵构造技术的研究[D];南京邮电大学;2012年
3 王光艳;语音信号处理中的数学形态学方法研究[D];河北工业大学;2003年
4 徐爽;小波分析理论在说话人识别中的应用研究[D];燕山大学;2004年
5 姜亚军;普通话单字发音的客观评价方法[D];苏州大学;2005年
6 史蓓蕾;基于矢量量化的说话人识别算法的研究[D];武汉理工大学;2006年
7 梁五洲;抗噪语音识别特征提取算法的研究[D];太原理工大学;2006年
8 苏先礼;语音去混响研究[D];四川大学;2006年
9 樊殊昱;LMS算法的改进研究及其在语音增强方面的应用和性能评估[D];电子科技大学;2007年
10 陈方泉;基于FPGA的嵌入式系统说话人识别算法的研究与实现[D];重庆大学;2007年
【参考文献】
中国期刊全文数据库 前7条
1 付强,张德民,易克初;基于DyWT基音检测的改进MBE语音压缩算法[J];电路与系统学报;1998年03期
2 程俊,易克初,刘丰;广义时频表示的一种实时实现方法[J];电子学报;1997年01期
3 刘加;汉语大词汇量连续语音识别系统研究进展[J];电子学报;2000年01期
4 陈国,胡修林,张蕴玉,朱耀庭;语音质量客观评价方法研究进展[J];电子学报;2001年04期
5 吴淑珍,赵朝阳;基于听觉模型的客观音质评价方法研究[J];电子学报;1999年07期
6 王瑛,张知易;一种基于人耳听觉特性的语音客观测度研究[J];通信技术;1999年03期
7 吴淑珍,LouisC.W.Pols;汉语通信系统客观音质评价方法[J];声学学报;1998年02期
【共引文献】
中国期刊全文数据库 前10条
1 王倩;蒋林华;张京丰;徐海群;;模糊神经网络在粉煤灰混凝土强度预测中的应用[J];四川建筑科学研究;2006年06期
2 张彤;王建平;孟改样;;异因同果关联神经网络在工程造价中的应用研究[J];四川建筑科学研究;2009年02期
3 倪志伟;;BP网络中激活函数的深入研究[J];安徽大学学报(自然科学版);1997年03期
4 杨冠鲁,李晴燕,胡欣;同步发电机监督学习神经网络励磁控制器[J];安徽大学学报(自然科学版);2005年03期
5 周鸣争;人工神经网络在自动控制系统中的应用[J];安徽机电学院学报;2000年02期
6 张久彪,赵芸;一个改进的约束满足模型[J];安徽机电学院学报(自然科学版);1997年04期
7 陈刚,刘庆敏;神经网络用于多类识别问题的有效方法[J];安徽建筑工业学院学报(自然科学版);1999年03期
8 胡俊,汪忠明,方高倪;基于带有偏差单元的IRN模型的大体积混凝土温度预测与控制[J];安徽建筑工业学院学报(自然科学版);2005年01期
9 黄春梅;;神经网络方法在大跨连续梁施工控制中的应用[J];安徽建筑工业学院学报(自然科学版);2006年06期
10 王晓东;;基于一种改进的IRN模型的地基液化判别[J];安徽建筑;2006年04期
中国重要会议论文全文数据库 前10条
1 李俊丽;张光辉;祝晓红;;新型智能变增益单神经元PID控制算法[A];第二十七届中国控制会议论文集[C];2008年
2 张娟;陈杰;段梅;;基于神经网络和广义经典分配算法的多传感器航迹关联[A];第二十七届中国控制会议论文集[C];2008年
3 刘乐;王洪国;王宝伟;;一种基于二次动量项的改进BP网络[A];第二十七届中国控制会议论文集[C];2008年
4 隋金雪;杨莉;华臻;张鑫;;改进的BP网络在火焰燃烧状态识别中的应用[A];第二十七届中国控制会议论文集[C];2008年
5 韩志艳;王健;伦淑娴;王旭;;基于小波包变换的语音信号鲁棒特征提取[A];第二十九届中国控制会议论文集[C];2010年
6 胡玉娥;丁淑萍;;基于改进BP算法的非线性广义预测控制器[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
7 章斯宇;孟子厚;;复杂传递条件下汉语辅音损失率的实验测量[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 陈玉强;刘志刚;杨铁军;肖友洪;;柴油机振动液压伺服主动控制[A];第九届全国振动理论及应用学术会议论文集[C];2007年
9 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
10 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 李华文;船舶交通管理系统经济社会影响评价研究[D];大连海事大学;2010年
3 张进;地震叠前数据的弹性阻抗非线性反演方法研究[D];中国海洋大学;2009年
4 汪木兰;神经网络硬化实现的共性技术在电力传动中应用研究[D];合肥工业大学;2010年
5 朱松;随机回归神经网络的动力学行为研究[D];华中科技大学;2010年
6 刘强;基于复杂系统的铁路客流预测方法研究[D];中国铁道科学研究院;2008年
7 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
8 王晓东;双机架紧凑式炉卷轧机模型自适应优化控制[D];昆明理工大学;2008年
9 张寿明;基于冶炼过程及终点判断技术的烟化炉智能控制系统研究[D];昆明理工大学;2009年
10 栾小丽;基于神经网络的复杂非线性系统鲁棒控制与滤波研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 代宏伟;布里渊散射水下探测目标的自动识别[D];南昌航空大学;2010年
2 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
3 滕景忠;智能瓦斯传感器的研制[D];山东科技大学;2010年
4 李安新;BP神经网络研究与硬件实现[D];山东科技大学;2010年
5 陈少华;基于Hopfield神经网络控制系统的研究[D];山东科技大学;2010年
6 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
7 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
8 李长鹏;基于CSTR温度系统的模糊神经网络预测控制研究[D];哈尔滨工程大学;2009年
9 吴国强;无人机航迹跟踪控制方法研究[D];哈尔滨工程大学;2010年
10 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 吴淑珍,邱小军;加权倒谱距离用于普通话客观音质评价[J];北京大学学报(自然科学版);1992年03期
2 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
3 段新,黄新宇,吴淑珍;与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J];北京大学学报(自然科学版);2003年05期
4 吴淑珍,吴阿华;说话人识别的参量研究和语音库建设[J];北京大学学报(自然科学版);1995年03期
5 王毓芳,尹宝林;一种自适应的汉语普通话音节清浊音分段方法[J];北京航空航天大学学报;2001年04期
6 潘立登,吴宁川;径向基函数神经网络正交最小二乘改进算法的实现[J];北京化工大学学报(自然科学版);2002年04期
7 杨红云,向茂楠;LSP参数的语音分析和合成研究[J];北京理工大学学报;1992年01期
8 于薇,赵胜辉,匡镜明;汉语/英语AMR语音编码参数统计特性[J];北京理工大学学报;2002年06期
9 朱维彬;吕士楠;;基于语义的语音合成——语音合成技术的现状及展望[J];北京理工大学学报;2007年05期
10 陈亮,张雄伟;基于分形维数实现语音分割和增强[J];北京邮电大学学报;2003年S1期
中国重要会议论文全文数据库 前1条
1 康永国;双志伟;陶建华;张维;徐波;;高斯混合模型和码本映射相结合的语音转换算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国重要报纸全文数据库 前1条
1 清华大学计算机系人机交互与媒体集成研究所 蔡莲红 吴志勇 王玮 陶建华 王志明;[N];计算机世界;2001年
中国博士学位论文全文数据库 前8条
1 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
2 盖强;局域波时频分析方法的理论研究与应用[D];大连理工大学;2001年
3 吴义坚;基于隐马尔科夫模型的语音合成技术研究[D];中国科学技术大学;2006年
4 田立斌;语音通信质量客观评价、有效接收及错误恢复算法研究[D];华南理工大学;2004年
5 马晓红;传声器阵列语音增强中关键技术的研究[D];大连理工大学;2006年
6 李超雷;交互式语言学习系统中的发音质量客观评价方法研究[D];中国科学院研究生院(电子学研究所);2007年
7 魏思;基于统计模式识别的发音错误检测研究[D];中国科学技术大学;2008年
8 张瑞;基于视觉选择性注意模型的图像质量评价和视频编码技术研究[D];上海交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘兴立;任意文本的说话人识别系统研究[D];大连理工大学;2000年
2 忻栋;支持向量机算法的研究及在说话人识别上的应用[D];浙江大学;2002年
3 王波;电话信道文本无关说话人识别[D];中国人民解放军信息工程大学;2002年
4 陆晓燕;基于麦克风阵列实现声源定位[D];大连理工大学;2003年
5 王丽秀;基于小波变换的光纤传感器信号消噪技术的研究[D];燕山大学;2003年
6 李轶;说话人识别系统研究[D];浙江大学;2003年
7 王永琦;基于听觉模型反演方法的语音信号的分析及其应用[D];苏州大学;2003年
8 陶智;基于人耳听觉掩蔽效应的语音增强的研究[D];苏州大学;2003年
9 陆晔;基于隐马尔可夫算法的上海城市路名语音识别方法研究[D];华东师范大学;2002年
10 云霞;基于Mel倒谱和Bark谱失真距离的汉语音质客观评价研究[D];西南交通大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 蒋永生;张雄伟;闵刚;刘光云;陈功;;基于改进的MFCC战场被动声目标识别[J];弹箭与制导学报;2008年06期
2 郭月玲;张雪英;白静;;基于支持向量机的语音识别研究[J];电脑开发与应用;2009年03期
3 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期
4 刘伟;韩卫生;;基于atan-LMS与PLPC相结合的稳健语音识别[J];电声技术;2011年03期
5 赵汉武;杨佳;惠景丽;张明;;一种适用于远场噪声抑制的电台话音采集装置[J];电子技术应用;2011年06期
6 段继康;张雪英;白静;;支持向量机语音识别算法在OMAP5912上的移植[J];电子设计工程;2010年06期
7 孙战先;储飞黄;王江;汪海兵;;通信接收机干扰容限自动测量方法研究[J];电子测量与仪器学报;2012年11期
8 付立;;基于MVDR谱的语音通信干扰效果评估方法研究[J];信息技术;2011年06期
9 王光艳;赵晓群;王霞;;基于数学形态学的非线性语音增强方法[J];计算机工程与应用;2006年34期
10 李野;吴亚锋;刘雪飞;;基于BARK子波变换的语音增强方法研究[J];计算机工程与应用;2009年33期
中国博士学位论文全文数据库 前4条
1 王立众;移动VoIP中语音质量增强关键技术研究[D];北京邮电大学;2011年
2 陈华伟;语音通信中音质客观评价研究[D];西南交通大学;2007年
3 李宁;LMS自适应滤波算法的收敛性能研究与应用[D];哈尔滨工程大学;2009年
4 武淑红;延迟2.5ms 8Kbps语音编码算法研究[D];太原理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 林建钢;基于复数负熵最大化的语音盲抽取研究[D];大连理工大学;2010年
2 王琼;音视频质量联合方法研究[D];西安电子科技大学;2011年
3 高扬;耳蜗滤波器倒谱特征在语音识别中的应用[D];太原理工大学;2011年
4 刘婷;基于非线性特征的音符识别算法的研究与应用[D];华北电力大学(北京);2011年
5 秦运柏;超声红外定位系统抗干扰技术研究[D];吉林大学;2011年
6 胡金平;基于说话人识别的无线门禁系统的应用研究[D];兰州理工大学;2011年
7 涂志宏;公路工程保险费率研究[D];江西理工大学;2011年
8 付维;基于HMM的机器人语音识别系统的研究[D];武汉科技大学;2011年
9 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
10 刘鑫;宽带音频的非线性频带展宽技术[D];北京工业大学;2011年
【二级参考文献】
中国期刊全文数据库 前8条
1 易克初,程俊;信号的广义时频表示[J];电子学报;1993年10期
2 丁瑾,钟涛,胡健栋;话音质量的一种新的评价方法[J];电子学报;1997年04期
3 吴淑珍,赵朝阳;基于听觉模型的客观音质评价方法研究[J];电子学报;1999年07期
4 陈国,胡修林,张蕴玉,朱耀庭;对Itakura语音失真测度的改进[J];华中理工大学学报;1999年10期
5 俞士汶,朱学锋,王惠,张芸芸;现代汉语语法信息词典规格说明书[J];中文信息学报;1996年02期
6 王瑛,张知易;一种基于人耳听觉特性的语音客观测度研究[J];通信技术;1999年03期
7 吴淑珍,LouisC.W.Pols;汉语通信系统客观音质评价方法[J];声学学报;1998年02期
8 陈国,胡修林,张蕴玉,朱耀庭;一种基于听觉特性的语音失真测度方法[J];声学学报;2000年05期
【相似文献】
中国期刊全文数据库 前10条
1 王继祥;刘贵忠;刘广健;高向东;;基于小波谱失真测度的语音质量评估[J];兵工学报;2008年01期
2 黄国庆;宋家友;;语音失真测度系统的构成与算法实现[J];信阳师范学院学报(自然科学版);2008年02期
3 王绍源,王耀南;基于矢量失真测度和自适应四叉树分割的彩色图象分形压缩方法[J];中国图象图形学报;1999年09期
4 林强;裘雪红;;基于方差归一化失真测度的语音识别[J];电子科技;2007年08期
5 付强,易克初,田斌,田红心;一种采用余弦镶边临界带滤波器组的弯折谱失真测度[J];西安电子科技大学学报;1999年06期
6 陈华伟;靳蕃;;基于感知模型的美尔谱失真测度[J];西南交通大学学报;2006年06期
7 杨波,傅汝林,张知易;利用前向掩蔽效应改进巴克谱失真测度[J];通信技术;2003年05期
8 黄昊;郭立;李琳;;基于失真测度的直接扩频音频隐写分析[J];中国科学院研究生院学报;2008年02期
9 杨波;;用于客观音质评价的扩展巴克谱失真测度[J];电子科技大学学报;2006年03期
10 方绍武,戴蓓倩,陆伟;基于方差归一化失真测度的改进的LBG算法[J];计算机工程与应用;2000年02期
中国博士学位论文全文数据库 前1条
1 付强;语音的参数表示和质量客观评价研究[D];西安电子科技大学;2000年
中国硕士学位论文全文数据库 前2条
1 吕先明;YASS随机嵌入新方法及基于模型概率解码的信号保持算法研究[D];华南理工大学;2013年
2 云霞;基于Mel倒谱和Bark谱失真距离的汉语音质客观评价研究[D];西南交通大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026