收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向复杂场景的极低码率语音编解码和语音增强关键技术研究

江文斌  
【摘要】:近年来,随着信号处理技术的发展,语音通信系统和语音识别系统在理想条件下取得了良好的效果。然而,在面向宽带资源有限条件下的低码率语音通信、强噪声干扰条件下的语音识别等复杂应用场景,现有系统的性能会大大降低。低码率语音编码会由于量化误差导致语音可懂度的下降,并会随着码率的降低进一步恶化,这对高可懂度的低码率语音编解码提出了更高的要求。实际应用系统中的环境噪声干扰会使得通话质量和识别率大大降低,这对语音增强(或降噪)技术也提出了越来越高的要求。本文对复杂场景下低码率语音编解码和语音增强两大问题展开研究。针对极低码率语音编码问题,分析了语音信号不同感知层的表示方法及对应的编码方法,研究了只需要单一量化编码参数的参数层低码率语音编码方法,并以此为基础实现了语义层高可懂度编解码方法,具体研究内容如下:实现了采用梅尔倒谱系数的低码率语音编解码方法。该方法只需要一种参数表示语音信号,使得实现极低码率量化编码时不需要考虑参数间联合矢量量化的问题,从而极大地简化了量化器的设计。为了实现基于梅尔倒谱系数的高质量语音信号重建,在解码端实现了采用混合高斯模型的清浊分类和基音周期估计,并使用此信息实现了一种改进型幅度谱迭代逼近的方法重建时域信号。该重建方法充分利用了语音信号本身的特点,信号初始化为最小相位信号或者合成相位信号,从而实现了高质量语音的重建并加速了迭代算法的收敛速度。在基于梅尔倒谱系数编码方法的基础上,实现了一种采用深度神经网络的语义层低码率编解码方法,并对其中的基于语音参数重构信号和高维度数据量化两大关键技术问题展开研究。研究了受限波尔兹曼机结构的深度神经网络用于语音信号语义层的特征提取,实现了信号功率谱的语义层重构;研究了深度自动编码器用于高维度数据量化,实现了一种融合传统量化编码器和神经网络解码器的矢量量化方法。基于深度神经网络进行信号重构和高维度矢量量化,实现了语义层高可懂度的极低码率语音编解码器。针对复杂环境下的语音降噪问题,本文研究了单/多通道语音增强算法,实现了融合特定人信息的单通道语音增强方法,并实现了不依赖波达方向估计的噪声鲁棒性多通道空间滤波方法,具体内容如下:实现了一种融合特定人信息的单通道语音增强算法。该算法分别对噪声估计、噪声分类、噪声鲁棒的说话人识别、特定人信息的提取及融合进行了研究,实现了基于自适应混合高斯模型的噪声估计方法、采用参数域特征的噪声分类方法、针对典型的噪声环境分别建立对应说话人模型的话者识别方法、以及从说话人模型提取信息融合到语音增强算法的方法,从而减少了对噪声估计算法的依赖,有效提升了增强后语音信号的质量。研究了噪声鲁棒性阵列信号空间滤波算法,包括不依赖于波达方向估计的改进型最小方差无失真响应波束形成算法和基于广义特征值分解的盲波束形成算法,并分析得出噪声鲁棒性波束形成算法的关键是信号和噪声的时频掩膜估计。针对现有时频掩膜估计算法的种种不足,实现了一种功率谱域实高斯模型的时频掩膜估计算法,该算法较传统复高斯模型的时频掩膜估计方法大大降低了计算复杂度;实现了一种基于深度神经网络时频掩膜估计算法,该方法采用多目标训法并融合了阵列空间信息,较同类方法大大提高了时频掩膜的精度。综上所述,本文对复杂环境下的极低码率语音编码器和语音增强关键技术问题进行了深入研究和分析,研究了基于梅尔倒谱系数的语音编码方法并实现了语义层编解码器、研究了融合特定人信息的语音增强算法并实现了噪声鲁棒性空间降噪方法。本文为极低码率语音编码器和语音增强技术的应用提供了理论依据和实践参考。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 刘鹏;;基于深度学习的语音增强方法研究[J];智能计算机与应用;2019年05期
2 石玲;;基于计算机声卡的谱相减语音增强系统分析[J];信息与电脑(理论版);2010年04期
3 孙涛;;基于计算机声卡的谱相减语音增强系统分析[J];南昌教育学院学报;2010年05期
4 张晓雷;;基于深度学习的语音增强简述[J];网络新媒体技术;2019年02期
5 李璐君;屈丹;;一种基于组合深层模型的语音增强方法[J];信息工程大学学报;2018年04期
6 袁文浩;娄迎曦;梁春燕;夏斌;;利用生成噪声提高语音增强方法的泛化能力[J];电子学报;2019年04期
7 阴法明;唐於烽;;基于深度置信网络的语音增强算法[J];电子器件;2018年05期
8 余华;唐於烽;赵力;;基于改进深度置信网络的语音增强算法[J];数据采集与处理;2018年05期
9 薛慧君;李盛;路国华;张杨;焦腾;王健琪;荆西京;;提升小波用于非接触语音增强算法的研究[J];医疗卫生装备;2013年05期
10 胡海波;刘柏森;许银;;基于小波变换的语音增强研究[J];黑龙江工程学院学报(自然科学版);2011年01期
11 褚伟;;基于条件深度卷积生成对抗网络的语音增强研究[J];智能计算机与应用;2019年04期
12 邓贺元;刘加;夏善红;彭春荣;;一种联合频谱和空间特征的深度学习多通道语音增强算法[J];电子测量技术;2019年18期
13 任济生;任鹏;吉爱国;曹茂永;;基于小波变换的双通道相干语音增强[J];电子器件;2008年04期
14 ;Soata III:E1高密度回音消除和StudioSound级语音增强系统[J];通讯世界;2003年02期
15 张行;赵馨;;基于神经网络噪声分类的语音增强算法[J];中国电子科学研究院学报;2020年09期
16 蓝天;惠国强;李萌;吕忆蓝;刘峤;;采用上下文相关的注意力机制及循环神经网络的语音增强方法[J];声学学报;2020年06期
中国重要会议论文全文数据库 前20条
1 王世伟;胡笑浒;郑成诗;李晓东;;一种改进的基于能量差语音增强算法[A];中国声学学会第九届青年学术会议论文集[C];2011年
2 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年
3 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
4 童峰;许肖梅;洪青阳;;一种带阶数估计的语音增强算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
5 袁榕嵘;吴鸣;杨军;;双麦克风语音增强快速算法[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
6 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 李海峰;韩纪庆;郑铁然;;元音、辅音粗判自适应电话语音增强方法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
8 高登峰;杨波;郭东岳;;基于深度神经网络的地空通话语音增强方法[A];第一届空中交通管理系统技术学术年会论文集[C];2018年
9 楼厦厦;郑成诗;李晓东;;滤波器权值约束对自适应零限波束形成语音增强算法鲁棒性影响分析[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
10 任玉宝;;基于联合字典学习的语音增强算法[A];中国声学学会水声学分会2019年学术会议论文集[C];2019年
11 丁沛;曹志刚;;基于语音增强失真补偿的抗噪声语音识别技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
12 吴亚栋;吴旭辉;;一种基于自相关域动态噪声估计方式的语音增强法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
13 孙俊峰;王新龙;;基于非线性动力学的子空间语音增强[A];2004年全国物理声学会议论文集[C];2004年
14 陆生礼;余崇智;;基于语音特征的语音增强方法[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
15 欧贵文;柯登峰;;基于噪音估计和参数估计的优化语音增强算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
16 罗笑雪;柯雨璇;郑成诗;李晓东;;联合谱和空间特征的深度学习语音增强研究[A];2019年全国声学大会论文集[C];2019年
17 满娟;吴鸣;杨军;;利用谱减法对骨导信号语音增强的研究[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
18 程琳娟;郑成诗;彭任华;李晓东;;基于自适应幅度补偿的深度神经网络语音增强算法研究[A];第十三届全国信号和智能信息处理与应用学术会议论文集[C];2019年
19 欧贵文;柯登峰;;背景噪音的单帧逼近、变换带宽和信噪比加权的语音增强算法[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
20 黄志华;黄浩;胡英;于迎霞;;基于噪声稀疏特性的语音增强算法分析[A];中国声学学会2017年全国声学学术会议论文集[C];2017年
中国博士学位论文全文数据库 前20条
1 江文斌;面向复杂场景的极低码率语音编解码和语音增强关键技术研究[D];上海交通大学;2018年
2 高天;复杂环境下基于深度学习的语音信号预处理方法研究[D];中国科学技术大学;2018年
3 童仁杰;基于信号稀疏特性的语音增强算法研究[D];中国科学技术大学;2018年
4 王青;基于深层神经网络的多目标学习和融合的语音增强研究[D];中国科学技术大学;2018年
5 孙琦;基于子空间的低计算复杂度语音增强算法研究[D];吉林大学;2017年
6 夏丙寅;面向移动通信的单通道语音增强方法研究[D];北京工业大学;2014年
7 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
8 张龙;有监督学习条件下的单通道语音增强算法研究[D];中国科学技术大学;2017年
9 刘威;单通道语音水印与语音增强算法研究[D];东南大学;2017年
10 章雒霏;基于机器学习的双麦克风手机语音增强算法研究[D];南京师范大学;2017年
11 江小平;舰载通信系统及其关键技术研究[D];华中科技大学;2007年
12 张文耀;基于匹配跟踪的低位率语音编码研究[D];中国科学院研究生院(软件研究所);2002年
13 马晓红;传声器阵列语音增强中关键技术的研究[D];大连理工大学;2006年
14 王冬霞;麦克风阵列语音增强的若干方法研究[D];大连理工大学;2007年
15 Md Shohidul Islam;小波域中鲁棒性的有监督单通道语音增强[D];中国科学技术大学;2020年
16 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
17 袁文浩;基于噪声估计的语音增强方法研究[D];华东理工大学;2013年
18 崔玮玮;基于麦克风阵列的声源定位与语音增强方法研究[D];清华大学;2009年
19 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年
20 柴丽;基于深度神经网络的语音增强目标函数设计研究[D];中国科学技术大学;2021年
中国硕士学位论文全文数据库 前20条
1 周培;基于麦克风阵列语音增强算法的研究及TMS320C6678实现[D];湖南大学;2019年
2 谭纬城;基于频谱补偿的麦克风阵列语音增强算法研究[D];华南理工大学;2019年
3 续娇;基于自适应波束成形的语音增强算法研究与实现[D];北京交通大学;2019年
4 程泽丰;混响环境下的远程语音增强方法研究[D];浙江大学;2019年
5 黄张翼;基于深度神经网络的语音增强方法研究[D];重庆邮电大学;2018年
6 余国修;麦克风阵列语音增强算法研究[D];西安电子科技大学;2019年
7 台龙飞;安全监控中声音识别的研究[D];上海应用技术大学;2019年
8 李湑;单声道语音增强关键技术研究[D];重庆邮电大学;2019年
9 吴晓华;基于听觉感知加权的时域语音增强算法研究[D];南京航空航天大学;2019年
10 叶富强;基于主观听觉反馈的机器学习语音增强模型优化研究[D];哈尔滨工业大学;2019年
11 Guernaz Zineddine;电话和语音识别系统的语音增强[D];哈尔滨工业大学;2019年
12 孙桂琪;基于相空间重构的语音增强方法研究[D];青岛大学;2019年
13 吴卫鹏;基于改进谱减的语音增强算法研究[D];南京邮电大学;2019年
14 张鹤鸣;基于深度学习的语音增强方法研究[D];大连理工大学;2019年
15 张文瑞;基于生成对抗网络的语音增强方法的研究[D];西安电子科技大学;2019年
16 刘建东;基于非负矩阵分解的单通道语音增强系统实现[D];西安电子科技大学;2019年
17 霍陆陆;基于自适应噪声相消的语音增强系统研究[D];西安电子科技大学;2019年
18 潘冬梅;数字助听器中基于深度学习的方向性语音增强算法研究[D];北京工业大学;2019年
19 王虎;基于稀疏表示及二值掩码估计的语音增强算法研究[D];山东科技大学;2018年
20 褚伟;基于条件深度卷积生成对抗网络的语音增强模型研究[D];华东交通大学;2019年
中国重要报纸全文数据库 前3条
1 ;NMS Sonata Ⅲ/Studio Sound级语音增强系统话音更清晰[N];中国计算机报;2003年
2 本报记者 马楠;NMS市场目标转向无线服务提供商[N];通信产业报;2001年
3 ;VoIP服务不只是便宜的通话[N];网络世界;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978