收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于匹配跟踪的低位率语音编码研究

张文耀  
【摘要】: 语音编码技术在高速率和中速率上已经能够产生质量非常高的重构语音,但是低位率乃至极低位率的高质量语音编码仍然是一个具有前沿理论意义和潜在实际应用价值的挑战性研究课题,促使许多研究人员探索新的技术手段和方法,如新的正弦建模技术,新的参数量化方法等等,以期实现低位率高质量语音编码。本文正是沿着正弦建模正弦分析的方向,采用匹配跟踪技术,结合心理声学模型,研究了新的建模方法以及模型参数的量化编码,对低位率语音编码及相关问题进行了有益的探索,并取得了如下创新性研究成果: 1.运用匹配跟踪技术处理了语音信号增强问题,给出了匹配跟踪信号增强过程中相干比阈值的确定方法,实现了在未知信号与噪声统计特性的情况下,在相当大的范围内明显增强信号的目的。 2.研究了基于匹配跟踪的正弦建模问题,提出了动态掩蔽阈值、感知梯度等概念,以及感知梯度正弦建模算法。感知梯度正弦建模比较好地利用了心理声学模型,在建模过程中最大限度地增加合成信号的感知信息,提高了建模效率。即使在模型精度不高的情况下,该方法也能得到合成质量比较好的语音。 3.针对正弦模型参数的量化编码,提出了幅度参数矢量量化、频率参数差分量化等方法,并探讨了频率盒量化模型以及随机相位和零相位模型等。这些方法有效地降低了编码位率。 4.围绕编码位率的降低和语音质量的提高,以逐步求精层层递进的方式研究了一系列压缩编码方案,并最终提出一个位率在1.5~2.4kbps的综合编码方案。针对各种不同建模方法和参数量化技术,本文探讨了基于普通匹配跟踪正弦建模的压缩编码、感知梯度正弦建模压缩编码、基于动态字典匹配跟踪的压缩编码、分类动态字典压缩编码,以及结合感知梯度正弦建模和分类动态字典的综合编码方案。结果发现匹配跟踪正弦建模在低位率语音编码上具有很大潜力,为低位率高质量语音编码探索了一条新的技术路线。最后提出的综合编码方案比较多地考虑了心理声学因素,融合了分类处理、动态字典和感知梯度建模思想,在编码位率和合成语音质量上都比现有的一些国际编码方法和标准要好。 5.提出了CAMDF函数,以及基于CAMDF的语音分类与基音估计算法,并在本文的压缩编码方案中得以运用。由于CAMDF克服了传统AMDF函数的不足,新的基音检测算法不仅有效地降低了误判率,而且简化了基音检测过程,提高了估计值的精度。利用CAMDF的语音分类也取得了比较满意的结果。 最后,总结全文,分析了目前研究工作中有待进一步完善的地方,指出了下一阶段的研究方向以及对本领域的一些展望。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵胜辉,匡镜明,刘波涛;一种改进的规则脉冲激励-长时预测语音编码方案[J];北京理工大学学报;1995年02期
2 林嘉宇,易波,王跃科;低速率语音编码体制研究[J];系统工程与电子技术;1998年11期
3 倪维桢;语音编码综述[J];北京电信科技;1998年04期
4 倪维桢;语音编码综述[J];数字通信;1998年02期
5 张涛,王浩波;实用的语音编码介绍[J];无线电通信技术;1999年04期
6 邹霞,陈亮,张雄伟;甚低速率语音编码中的高效模拟退火算法研究[J];系统仿真学报;2004年10期
7 李国栋;韩金仓;白顺科;李振东;;一种全息声元语音编码方法[J];数据采集与处理;2006年S1期
8 郑国宏;陈亮;张翼鹏;;宽带语音编码技术专题讲座(四) 第8讲 移动通信中的宽带语音编码[J];军事通信技术;2012年01期
9 刘加,钱亚生,冯重熙;一种新型正弦语音编码模型[J];通信学报;1991年04期
10 钟咏;自适应多速率语音编码的原理和算法[J];电信快报;2001年08期
11 钟咏,汪纪锋;增强型全速率语音编码的原理及实现[J];重庆大学学报(自然科学版);2002年01期
12 ;MP3与MD[J];中国农业会计;2003年10期
13 ;人民邮电出版社新书讯[J];电信技术;2004年12期
14 李志宏,张雪英,王安红,齐向东;基于动态小波神经网络非线性预测的语音编码系统[J];电路与系统学报;2005年05期
15 苗勇;江洁;;基于SMV算法的嵌入式系统设计与实现[J];微计算机信息;2008年32期
16 赵哲峰;张刚;谢克明;王一平;;低延迟低码率语音编码研究[J];计算机工程与应用;2008年34期
17 彭坦;崔慧娟;唐昆;;基于桶形移位联合叠加多数判决的语音编码传输算法[J];清华大学学报(自然科学版);2008年10期
18 侯红芳;张太镒;;多带激励语音编码的实现[J];现代电子技术;2009年07期
19 叶蕾;杨震;孙林慧;;基于压缩感知的低速率语音编码新方案[J];仪器仪表学报;2011年12期
20 胡象源;;用时域谐波定标的数字语音编码[J];电讯技术;1988年04期
中国重要会议论文全文数据库 前10条
1 张清芳;杨玉芳;;汉语单音节词汇产生中音韵编码的单元[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
2 魏华武;蔡莲红;;汉语普通话全音语句合成系统及其语音编码方法[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 肖二平;张积家;;汉语发展性口吃者在不出声言语中的语音编码[A];第十一届全国心理学学术会议论文摘要集[C];2007年
4 陈悦;鲍长春;;WI语音编码中相位信息的量化与重建[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
5 侯红芳;张太镒;;基于MBE模型的低速率语音编码的研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
6 乔有田;丁恩杰;徐修国;闫广;;8kb/s CS-ACELP语音编码的原理及应用[A];第十四届全国煤矿自动化学术年会暨中国煤炭学会自动化专业委员会学术会议论文集[C];2004年
7 杨佳俊;;终端语音编码能力与系统间 切换KPI间关系的研究[A];中国通信学会第六届学术年会论文集(中)[C];2009年
8 王贵平;鲍长春;;低速率WI语音编码器中LP残差信号的SVD分解及量化[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
9 涂卫平;胡瑞敏;艾浩军;乐攀;;基于SIMD的低码率语音编码优化[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
10 石如亮;李弼程;王波;;语音编码对说话人识别系统的影响(英文)[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
中国博士学位论文全文数据库 前4条
1 齐峰岩;低速率波形内插语音编码关键技术的研究[D];北京工业大学;2007年
2 王都生;多带混合激励低速率语音编码的研究[D];西安电子科技大学;1998年
3 张文耀;基于匹配跟踪的低位率语音编码研究[D];中国科学院研究生院(软件研究所);2002年
4 昝飞;聋生汉字加工中语音编码作用的实验研究[D];华东师范大学;2002年
中国硕士学位论文全文数据库 前10条
1 章浩;通信系统中语音编码判别技术研究[D];北京邮电大学;2007年
2 张忠;单芯片语音密码机中低速率语音编码的研究与实现[D];西安电子科技大学;2012年
3 倪彦文;语音编码在军事指挥系统中的应用研究[D];浙江大学;2005年
4 程万灵;基于多带激励的低速率语音编码研究与实现[D];西安电子科技大学;2009年
5 肖博;低速率语音编码中的信息隐藏研究与实现[D];清华大学;2009年
6 任宝宝;自适应低速率语音编码关键技术研究[D];西安电子科技大学;2006年
7 景海丽;低速率语音编码的研究[D];西安电子科技大学;2004年
8 陈琳;低比特率宽带语音编码的研究[D];广西大学;2004年
9 汪憾铭;嵌入式系统中语音编码压缩技术的研究与应用[D];合肥工业大学;2007年
10 张崇武;基于单片机的语音编码系统实现[D];山东大学;2012年
中国重要报纸全文数据库 前2条
1 浙江 汤向锋 周宁;改善华为C8600智能手机通话质量的方法[N];电子报;2012年
2 彭;灵活与保密兼具[N];中国计算机报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978