收藏本站
《北京工业大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

低速率波形内插语音编码关键技术的研究

齐峰岩  
【摘要】: 在现代通信系统中,语音是最基本、最重要的通信方式,通常是经过压缩以比特流的形式传输的,由于考虑到传输成本、效率、占用的物理信道、存储空间等因素,人们希望在保证好的语音质量的前提下,尽可能地压低语音编码的传输速率。这个语音信息压缩过程被称为语音编码。 低速率语音编码已被广泛地应用在无线移动通信,VoIP(Voice over Internet Protocol)、语音信箱、保密通信和卫星通信中。随着下一代无线网络和Internet网络的发展,语音编码更多的应用和服务将会被提供。这使得近些年来人们对高质量的低速率语音编码有着持续增长的兴趣。因此,研究如何在低速率下获得具有通信质量的重建语音是语音编码中一个十分重要的课题。 在高质量低速率的语音编码中,波形内插(Waveform Interpolation,WI)语音编码技术是极具潜力的编码方案之一。近些年许多学者对其进行了广泛的研究,本文在此基础上针对低速率WI语音编码模型和参数量化等关键技术进行了深入的研究,提出了一系列改进算法,并最终提出一种2kb/s低复杂度改进型波形内插(Low-complex Improved Waveform Interpolation,LIWI)语音编码方法。本文的主要贡献体现为如下几方面: 一、为了减少WI模型的计算复杂度,提出了基于快速傅立叶变换、三次B样条插值和周期延拓技术的特征波形(Characteristic Waveform,CW)表示和对齐的快速算法,与原方法相比,计算量下降到原方法的1/5,同时也使得CW在插值和量化时更合理; 二、为了严格保证SEW与REW的能量和为1,提出了一种特征波形的二次功率归一化算法,仅需要SEW能量就可以算出二者的能量比,并可应用到后续的REW的分类量化和CW合成中; 三、为了对慢渐变波形(Slowly Evolving Waveform,SEW)幅度、快渐变波形(Rapidly Evolving Waveform,REW)幅度和特征波形功率进行有效量化,本文首先采用临界频带理论、分析合成技术、感觉加权技术以及预测式矢量量化技术,提出了一种基于基音周期分类的SEW分析合成预测式多码书量化方法;其次,本文根据基音和量化后SEW的功率信息对REW幅度进行分类,提出了一种基于离散余弦变换的REW矩阵多码书量化方法。这种SEW和REW幅度的多码书量化方法在牺牲了一些储存空间的条件下,有效解决了低比特率WI编码中比特分配不足的问题;再者,本文以语音能量的平稳过渡性为依据,提出了CW功率的分类量化方法,有效地改善了过渡段和起始段的功率量化精度。实验结果表明,这些量化方法明显地提高了重建语音的感性质量; 四、根据SEW和REW的能量比对合成语音进行分类,提出了一种CW的动态加权合成方法,即SEW成分正比于能量比,REW成分反比于能量比。该方法在很大程度上解决了WI模型不太适合描述清音的问题,提高了合成语音的自然度; 五、提出了基于Sigmoid函数的改进型基音内插方法,修正了原公式在某些特殊基音插值中出现的“病态”的插值结果; 六、提出一种基于支持向量机的含噪语音的清/浊/静音的分类方法,这种方法可以在各种信噪比等级下将语音信号有效地分为清音、浊音和静音三类信号,并在此基础上开发出具有鲁棒性的语音激活检测算法; 七、开发出一套低复杂度高质量的2kb/s的WI语音编码算法,并对其语音质量、算法时间复杂度和空间复杂度等参数做了评测。其中,诊断押韵测试(Diagnostic Rhyme Test,DRT)表明,重建语音的可懂度为优;平均意见分(Mean Opinion Score,MOS)测试及主观A/B测试表明2kb/s LIWI编码器的语音质量接近美国联邦标准FS1016的4.8kb/s码激励线性预测(Code Excited Linear Prediction, CELP)编码器,好于2.4kb/s混合激励线性预测(Mixed Excitation Linear Prediction, MELP)声码器;编解码算法的计算复杂度约为91.254MOPS,所需的存储容量大约为78K个浮点存储单元。
【学位授予单位】:北京工业大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TN912.3

手机知网App
【引证文献】
中国重要会议论文全文数据库 前1条
1 胡琦;梁满贵;肖彦;阮秋琦;;双源谐波模型的清浊音分离研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 武淑红;延迟2.5ms 8Kbps语音编码算法研究[D];太原理工大学;2012年
【参考文献】
中国期刊全文数据库 前5条
1 李靓,鲍长春,白燕宁;一种高效、低存储的线谱频率参数矢量量化器[J];北京工业大学学报;2005年02期
2 鲍长春,王都生,樊昌信;低速率声码器中残差谱的变维矢量量化[J];电子学报;1999年01期
3 朱娜娜,鲍长春,李靓;一种新的2kbit/s波形内插语音编码器[J];通信学报;2004年11期
4 鲍长春,樊昌信;基于归一化互相关函数的基音检测算法[J];通信学报;1998年10期
5 李靓,鲍长春;波形内插语音编码器中快渐变波形幅度的量化[J];信号处理;2004年06期
中国博士学位论文全文数据库 前2条
1 汪斌;音频编解码算法及软硬件协同设计研究[D];浙江大学;2004年
2 李靓;高质量的2kb/s波形内插语音编码算法研究[D];北京工业大学;2005年
中国硕士学位论文全文数据库 前1条
1 张海;基于WI的低速率语音编码算法研究与实现[D];北京工业大学;2001年
【共引文献】
中国期刊全文数据库 前10条
1 李淑华;徐良培;陶建平;;基于支持向量机的我国水产品出口贸易风险预警研究[J];安徽农业科学;2008年30期
2 程伟;张燕平;赵姝;;支持向量机在粮食产量预测中的应用[J];安徽农业科学;2009年08期
3 赵万明;黄彦全;谌贵辉;;基于支持向量机的农村用电量需求预测[J];安徽农业科学;2009年25期
4 邹心遥;姚若河;;基于LSSVM的小子样元器件寿命预测[J];半导体技术;2011年09期
5 刘翠红;;基于SVR的船舶溢油事故预测[J];环境科学与管理;2008年09期
6 张贵,乔春生;应用支持向量机回归确定岩体强度指标[J];北方交通大学学报;2004年01期
7 张玉川;张作泉;;支持向量机在股票价格预测中的应用[J];北京交通大学学报;2007年06期
8 肖燕彩;张清;;基于模糊支持向量机的变压器故障诊断[J];北京交通大学学报;2012年01期
9 黄银秀;;基于G.729的线性预测编码的MATLAB实现[J];办公自动化;2010年20期
10 赵果;潘世永;;端点检测在嵌入式声控拨号器中的应用[J];兵工自动化;2007年02期
中国重要会议论文全文数据库 前10条
1 周绮凤;林成德;罗林开;彭洪;;一种基于黎曼度量的训练样本类不平衡SVM分类方法研究[A];第二十六届中国控制会议论文集[C];2007年
2 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
3 康传会;汪晓东;汪轲;常健丽;;基于最小二乘支持向量机的迟滞建模方法[A];第二十九届中国控制会议论文集[C];2010年
4 刘英林;刘洪鹏;査星云;宋扬;;基于SVM的热轧钢卷性能分析[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
5 陈晓清;马君国;赵宏钟;付强;;基于二维小波变换的激光成像雷达目标识别算法[A];中国光学学会2010年光学大会论文集[C];2010年
6 冯辅周;郭恒毅;江鹏程;;支持向量机及其在电机故障诊断中的应用[A];第九届全国振动理论及应用学术会议论文集[C];2007年
7 黄鹤;鲍长春;;一种低延时坚韧的基音检测算法[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
8 牟峰;俞铁城;杨道淳;;新型半波语音编解码的实现[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 窦庚欣;鲍长春;;一种基于矢量量化的语音信号频带扩展方法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 王贵平;鲍长春;;低速率WI语音编码器中LP残差信号的SVD分解及量化[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
4 李晚龙;六自由度Stewart平台分散智能控制研究[D];哈尔滨工程大学;2010年
5 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
6 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
7 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
8 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
9 丁晓东;农田养分流失风险评价及养分平衡管理研究[D];浙江大学;2010年
10 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 徐芳芳;优化问题的PVD算法研究[D];山东科技大学;2010年
2 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
3 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
4 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
5 李海清;支持向量机在金融市场预测中的应用[D];辽宁师范大学;2010年
6 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
7 李会臣;基于时频分析的齿轮故障机理及诊断研究[D];郑州大学;2010年
8 邓禄群;高光谱图像类别信息相关技术研究[D];哈尔滨工程大学;2010年
9 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
10 欧阳杰;基于灰度图像的信息隐藏算法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 鲍长春;窦庚欣;范睿;刘泽新;;ACELP语音编码中代数码书的快速搜索算法[J];北京工业大学学报;2007年08期
2 李晋声,倪维桢,赵振纲;16kbit/sLD-CELP算法的再研究[J];北京邮电大学学报;1995年04期
3 王茂芝;郭彬;徐文皙;;基于改进SOFM的矢量量化图像压缩[J];成都理工大学学报(自然科学版);2007年06期
4 陈明义;孙冬梅;何孝月;;基于改进MFCC语音特征参数的语音质量评估的研究[J];电路与系统学报;2009年03期
5 宾清原,李双田;一种基于MELP的高质量的0.6Kb/s语音编码算法[J];电声技术;2004年10期
6 赵鹤鸣;;RPE—LTP—LPC语音编译码的DSP实现[J];电信科学;1993年04期
7 郭春霞,裘雪红;基于MFCC的说话人识别系统[J];电子科技;2005年11期
8 张刚,谢克明,张雪英,皇甫丽英;低延迟话音编码算法的增益优化与混合窗设计[J];电子与信息学报;2005年06期
9 汪峥,连翰,王建军;说话人识别中特征参数提取的一种新方法[J];复旦学报(自然科学版);2005年01期
10 李泽;崔宣;马雨廷;陈俊宇;;MFCC和LPCC特征参数在说话人识别中的研究[J];河南工程学院学报(自然科学版);2010年02期
中国博士学位论文全文数据库 前4条
1 李烨;基于多带激励模型的低速率语音编码技术研究[D];西安电子科技大学;2011年
2 张文耀;基于匹配跟踪的低位率语音编码研究[D];中国科学院研究生院(软件研究所);2002年
3 应娜;基于正弦语音模型的低比特率宽带语音编码算法的研究[D];吉林大学;2006年
4 杨艳秋;强鲁棒的音频掩密与扩频掩密分析研究[D];重庆大学;2009年
中国硕士学位论文全文数据库 前10条
1 皇甫丽英;G.728算法改进及低码率LD-CELP算法研究[D];太原理工大学;2002年
2 黄雪梅;基于人工神经网络的图像压缩方法研究[D];重庆大学;2005年
3 薛春雨;低延迟码激励算法中增益滤波器的优化与选择[D];太原理工大学;2005年
4 郭春霞;基于MFCC的说话人识别系统研究[D];西安电子科技大学;2006年
5 陶智勇;音频信号识别研究与基于SOPC的设计与实现[D];电子科技大学;2006年
6 梁五洲;抗噪语音识别特征提取算法的研究[D];太原理工大学;2006年
7 沈江峰;8kbit/s低延迟语音编码算法研究[D];太原理工大学;2007年
8 张文莉;PESQ语音质量评价系统的算法研究与实现[D];大连理工大学;2007年
9 崔宣;基于语音混合特征说话人识别的研究[D];西华大学;2008年
10 惠博;语音识别特征提取算法的研究及实现[D];西北大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 李靓,鲍长春,白燕宁;一种高效、低存储的线谱频率参数矢量量化器[J];北京工业大学学报;2005年02期
2 鲍长春,戴逸松;线谱对参数的一步插值预测矢量量化[J];长春邮电学院学报;1995年04期
3 张子男,刘鹏,高丰;软硬件协同验证中的系统性能评估方法[J];电路与系统学报;2003年05期
4 侯兆荣,窦维蓓,董在望;提高MPEG心理声学模型简化算法的计算精度[J];电声技术;2001年07期
5 鲍长春,王都生,樊昌信;低速率声码器中残差谱的变维矢量量化[J];电子学报;1999年01期
6 鲍长春,樊昌信,王都生;线谱频率参数的分裂矢量量化[J];电子科学学刊;1998年04期
7 李正本;主观音质评价若干问题的认识[J];广播与电视技术;2002年08期
8 江灏,崔惠娟,唐昆;一种高质量的 2 kb/s 语言编码算法 MWI[J];清华大学学报(自然科学版);1998年03期
9 杨慧敏,陈弘毅,孙义和;基音调整的语音分析方法[J];清华大学学报(自然科学版);1999年S1期
10 鲍长春,樊昌信;基于归一化互相关函数的基音检测算法[J];通信学报;1998年10期
【相似文献】
中国期刊全文数据库 前10条
1 王少勇,王秉钧;语音编码技术的现状与发展[J];天津通信技术;2000年02期
2 陈在;;一种用于语音编码的高效矢量量化新方法[J];通信技术;1992年02期
3 邹峰;郭英;陈新富;刘燕;;基于MELPe模型的600 BPS声码器算法设计[J];空军工程大学学报(自然科学版);2007年03期
4 范晶;和应民;;一种改进的MELP算法[J];应用科技;2008年05期
5 吴婷婷;曾毓敏;;一种基于改进的矢量量化技术的语音波形编码[J];电子工程师;2007年10期
6 计哲;李晔;崔慧娟;唐昆;;SELP声码器基音周期参数量化合成改进算法[J];高技术通讯;2010年01期
7 鲍长春,卓力,王永会;LSF参数的模拟退火法连接分裂矢量量化[J];电子学报;2001年01期
8 赵永刚;唐昆;崔慧娟;;基于Gaussian混合模型的LSF参数量化方法[J];清华大学学报(自然科学版);2006年10期
9 李靓,鲍长春,王贵平;波形内插语音编码技术回顾与展望[J];通信学报;2005年01期
10 罗亚飞;鲍长春;;低速率WI编码器中4~6bit基音量化算法研究[J];电子与信息学报;2007年11期
中国重要会议论文全文数据库 前10条
1 王贵平;鲍长春;;低速率WI语音编码器中LP残差信号的SVD分解及量化[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
2 乔有田;丁恩杰;徐修国;闫广;;8kb/s CS-ACELP语音编码的原理及应用[A];第十四届全国煤矿自动化学术年会暨中国煤炭学会自动化专业委员会学术会议论文集[C];2004年
3 陈悦;鲍长春;;WI语音编码中相位信息的量化与重建[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
4 张鹏;鲍长春;;基于SVD的低复杂度语音特征波形分解方法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
5 周敏;龙昭华;;LPAS编码技术及其在VoIP中的应用[A];第九届全国青年通信学术会议论文集[C];2004年
6 郭莉莉;鲍长春;;基于非负矩阵分解的语音特征波形分解方法[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
7 刘靖宇;鲍长春;;基于NMF的语音特征波形矩阵量化方法[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
8 徐昊;鲍长春;贾懋珅;;采样率对TCX宽带嵌入式变速率语音编码器质量的影响[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
9 卓力;鲍长春;;一种高效、透明的线谱频率参数矢量量化器[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
10 辛杰;鲍长春;;一种基于安全网扩展的宽带ISF参数矢量量化方法[A];第九届全国人机语音通讯学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 张孺海 刘易国;让鸟儿自由飞翔[N];湖北日报;2005年
2 ;西安工业大学——坚持特色 奋勇争先[N];中国教育报;2006年
3 刘玉靖 武晓东;三驾马车领跑科研攻关[N];中国纺织报;2007年
4 记者 唐景莉通讯员 王锋 实习生 乔欣;向世界展示中国志愿者风采[N];中国教育报;2008年
5 常丽君;让京城污水换清波[N];科技日报;2008年
6 李新一;时尚 追求中性还是回归本性[N];中国服饰报;2010年
7 记者 陈欣然;天津工大喜迎建校五十周年[N];天津教育报;2008年
8 吴铝锌;教育部部长周济湖南省省长周伯华视察湖南工业大学(筹)[N];中国包装报;2005年
9 本报记者 计琳《上海教育》记者 赵锋;上海第二工业大学用制度保障教师下企业[N];中国教育报;2007年
10 李金钢 雷斌;面向经济建设战场 服务国家重点项目[N];中国经济时报;2006年
中国博士学位论文全文数据库 前10条
1 齐峰岩;低速率波形内插语音编码关键技术的研究[D];北京工业大学;2007年
2 李靓;高质量的2kb/s波形内插语音编码算法研究[D];北京工业大学;2005年
3 刘继新;基于矢量量化技术的音频信息隐藏算法的研究[D];哈尔滨工业大学;2010年
4 王冬芳;基于矢量量化技术的图像实时压缩芯片的研究[D];西安理工大学;2009年
5 郑军;网络恶意数据流的检测与控制技术研究[D];哈尔滨工业大学;2006年
6 陈雨时;基于光谱特性的高光谱图像压缩方法研究[D];哈尔滨工业大学;2007年
7 王好贤;数字视频水印嵌入和抽取算法研究[D];哈尔滨工业大学;2008年
8 王都生;多带混合激励低速率语音编码的研究[D];西安电子科技大学;1998年
9 郑勇;小波图像分类矢量量化与网络编码量化的研究[D];电子科技大学;2002年
10 李辉;带噪语音编码的若干问题研究[D];中国科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 王贵平;基于奇异值分解的低速率波形内插语音编码算法的研究[D];北京工业大学;2005年
2 朱娜娜;2kbps波形内插语音编码算法的研究[D];北京工业大学;2003年
3 罗艳芬;语音信号数字处理中语音编解码算法的研究[D];南昌大学;2005年
4 陈悦;波形内插语音编码算法中相位问题的研究[D];北京工业大学;2006年
5 赵峰;基于BP神经网络的低延迟矢量激励语音编码系统[D];太原理工大学;2005年
6 许文佶;矢量量化快速码字搜索算法研究[D];苏州大学;2008年
7 张海;基于WI的低速率语音编码算法研究与实现[D];北京工业大学;2001年
8 李春泉;基于ARM的码激励线性预测编解码系统的实现[D];南昌大学;2007年
9 王浔;基于CS-ACELP语音编码算法的研究及DSP实现[D];哈尔滨理工大学;2007年
10 李纯静;ITU-T G.723.1语音编码器的分析与优化[D];天津大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026