收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

甚低码率低延迟语音编码算法研究

张刚  
【摘要】: 本论文为响应ITU提出的LD-CELP编码算法新指标(延迟低于5毫秒,速率低于8Kb/s,长话音质)开展研究。主要研究目标为: 1.设计并提出在长话音质下延迟2.5毫秒(帧长20样点)码率接近8Kb/s算法; 2.设计并提出在通信质量下延迟5毫秒(帧长40样点)码率接近6Kb/s算法。 为实现上述目标,论文在以下五个方面开展研究并取得创新性的进展。 第一,提出了一种不依赖量化信噪比评价增益滤波器性能的方法,可在增益量化之前直接比较评价增益预测器的各种优化方案,形成了增益预测器与增益量化器分别独立进行优化的方法。研究评价了多个不同的预测器方案后发现有限记忆递推滤波器性能最高;而神经网络滤波器以最低计算代价获得了优于G.728杜宾递推公式的性能。对增益量化,研究比较了固定量化与自适应量化的特性。自适应量化的主要难点是自适应步长因子的优化涉及到海量运算。提出了一种基于人工免疫原理的克隆思维进化算法:N-进制编码方法,用来优化复杂目标函数多个变量,为解决这一问题贡献了一个新的方案。 本研究的第二个创新性贡献是利用小波分析工具开发出语音信号后向实时基音检测算法。现有基音检测都是宽延迟的前向算法,包括G.728标准在内的所有低延迟语音编码算法均无基音检测过程。本研究基于小波分析提出了后向实时基音检测算法,可在2.5ms(20样点)帧内监测到基音脉冲的出现并计算出基音周期。在本研究领域,首次使基音分析用于低延迟语音编码算法成为可能。 研究工作的第三个创新结果是在低延迟语音编码算法中引入自适应码书搜索。低延迟算法每样点少于1bit码率资源,使用自适应码书搜索不利于降低码率。本研究提出新的解决方案是:先利用实时后向基音检测算法对最佳自适应码字标号进行初步定位,然后以此为基准进行自适应码书的修正搜索。一方面降低了自适应码书的码率消耗,另一方面改善了实时后向基音检测算法的精度,用在低延迟语音编码算法中取得理想的效果。 第四,在前面工作的基础上给出了延迟2.5毫秒(帧长20样点)8Kb/s算法。首先基于G.728的结构将帧长由5样点提高到20样点,通过大量反复实验表明,当码率降到8.8K/s以下时音质无法得到保证,计算复杂性也大大超过了实时性要求,必须使用与现有任何算法不同的新结构。研究并提出了三种延迟2.5毫秒的8Kb/s算法: 方案1:自适应码书、固定码书各10bit(其中增益3bit,波形7bit)。 方案2:偶数帧搜索自适应码书,奇数帧使用偶数帧的搜索结果,节省的码率资源用来扩大固定码书尺寸。 方案3:结合后向实时基音检测的自适应码书搜索方案。 实验表明,三种延迟2.5毫秒的8Kb/s算法编码质量都接近了长话音质,计算复杂性与G.728相当。 最后讨论了进一步降低码率的情况。与其它后向编码算法不同,本研究采用代数码激励作固定码书,设计并提出了延迟40样点(5ms)的后向实时基音检测结合自适应码书修正搜索的编码方案,在6.2K/s码率时仍能保持通信质量。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张雪英,陈衍翊,张刚;16kb/s LD-CELP语音编码器的DSP实时实现研究[J];计算机与网络;1997年03期
2 张雪英,张刚,陈衍翊;16kb/s LD-CELP语音编译器的模拟实现[J];计算机与网络;1996年06期
3 倪维桢,惠光辉,田文顺,王德隽;用TMS320C30实时实现16kbit/s LD-CELP语音编码[J];现代电信科技;1994年08期
4 张雪英,陈衍翊,张刚;16kb/s LD-CELP语音编码技术[J];计算机与网络;1996年05期
5 皇甫丽英,张刚,张雪英;改进G.728语音编码算法的增益滤波[J];太原理工大学学报;2002年03期
6 王立忠;;数字会议电视系统音频编解码器技术及其实现[J];通信技术与发展;1998年04期
7 张刚,谢克明,张雪英,皇甫丽英;用增益精确值和归一化波形码书改进G.728[J];通信学报;2003年09期
8 朱卫锋,黄桂金;G.728语音编解码算法的实现和优化[J];电信快报;2004年06期
9 赵炯,张敏,王伟;用TMS320C6211实现多路G.728语音编解码标准[J];现代电子技术;2003年22期
10 王明江;刘倩;;基于FPGA的LD-CELP编解码器设计[J];电子技术;2007年Z2期
11 马霓,胡裕堂,韦岗;一种基于神经网络的LD-CELP算法[J];深圳大学学报(理工版);1997年Z1期
12 王怿,姚天任;基于DSP实现的G.728编码语音码流能量估计算法[J];光学与光电技术;2003年03期
13 殷景华;刘倩;王明江;;LD-CELP编解码器的ASIC设计[J];电子科技;2008年01期
14 汪正兵,邓广林;LD-CELP语音编码算法研究及微机模拟[J];中国空间科学技术;1996年01期
15 Musyaju Raju(拉玖),姚天任;基于LD-CELP和LZH的低比特率语音编码方法[J];通信技术;2000年03期
16 马霓,胡裕堂,韦岗;一种基于神经网络的LD-CELP算法[J];广西大学学报(自然科学版);1996年04期
17 田文顺,倪维桢;同时实现LD-CELP和EC的研究[J];北京电信科技;1998年01期
18 张雪英,张刚;15.2kb/s LD-CELP语音编码算法及实时实现[J];电路与系统学报;1999年01期
19 廉德亮,邓秉忠,吴高峰;利用开关电容电路设计的可变增益滤波器[J];半导体技术;2001年08期
20 黄德智,马尽文;LD-CELP语音编码算法中矢量量化过程的改进[J];电子学报;2001年10期
中国博士学位论文全文数据库 前2条
1 张刚;甚低码率低延迟语音编码算法研究[D];太原理工大学;2007年
2 武淑红;延迟2.5ms 8Kbps语音编码算法研究[D];太原理工大学;2012年
中国硕士学位论文全文数据库 前2条
1 王深涛;基于TMS320C64X的G.728语音编码器的实现[D];大连理工大学;2005年
2 刘倩;基于FPGA的LD-CELP语音编解码器设计[D];哈尔滨理工大学;2008年
中国重要报纸全文数据库 前4条
1 ;抢鲜体验《豪杰超级解霸3000·英雄版》新功能[N];中国计算机报;2003年
2 宿州市公路管理局 王文娟;反射波法在桩基完整性检测中的应用[N];中华建筑报;2004年
3 尤云;播放软件上演三雄恩仇记[N];中国商报;2002年
4 艾文;亮出你我的“杀手锏”多媒体制作软件大比拼[N];中国计算机报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978