收藏本站
收藏 | 论文排版

基于语音增强及小波变换基音检测的LPC-MBE低速语音编码算法

董婧  
【摘要】:引言 近几十年来语音编码技术发展非常迅速。目前2.4kb/s以上的编码速率其合成语音质量已得到人们的认可,并已得到广泛地应用。现在国内外研究的重点是突破2.4kb/s以下极低速率的语音编码技术和算法。 由于LPC和CELP模型本身的局限性,它们在低速语音编码中难有更好的表现。因此,人们不断探索更有潜力的新算法。多带激励MBE(Multi-Band Excitation)低速语音编码算法正是在上述两种算法的基础上,克服了它们的缺点而提出的。 多带激励语音编码技术 多带激励语音编码算法的基本思想是按基音的各谐波频率,将一帧语音的频谱分成若干个谐波带,再以若干个谐波带为一组进行分带处理,然后分别对各带进行清浊音判决。对于浊音带,用以基音周期为周期的脉冲序列谱作为激励信号频谱;对于清音带,则使用白噪声谱作为激励信号频谱,根据不同的激励信号产生合成语音,最后将各带信号相加形成全带语音。 二、语音分析 在MBE核心算法的基础上,本论文对其进行了改进。首先,对输入语音进行分析,建立合理的语音模型并准确地估计模型参数。在语音模型中,合成语音所需要的参数包括:基音频率、谱包络信息和各带的清浊音信息。 对语音信号进行预处理之后,首先做LPC分析来提取谱幅度系数。采用了时域中的共轭梯度算法进行参数估计,它可以精确快速地估计出每帧语音模型的参数,得到 和 做为表示语音信号的谱包络信息。 针对自相关函数、平均幅度差函数等典型的基音检测算法存在着复杂度较高,检测不够准确等缺陷,本论文研究的小波变换模极大值基音检测法是一种有效的改进方案,对于输入的加窗语音序列采用Mallat快速算法进行离散二进小波变换,对信号做5阶小波分解,并检测每个尺度下模极大值的位置,相 WP=76 邻最大值之间的间隔即为语音周期。该算法有效的降低基音检测的复杂度,并能避开噪声的干扰,更准确的提取语音基音频率。 清浊音判决的正确性在很大程度上影响合成语音质量。通过分带信号在频域上的波形不同来判定U/V信息。先对低通余量信号进行离散傅立叶变换,把它转换至频域。为了降低编解码器对语音基音的依赖性,将语音频谱划分为固定的9个子带,在每一子带上计算其自相关函数,根据信号频域波形有无明显的谱线结构来区分清音子带和浊音子带,获得清浊音信息。 三、参数编码 对于8kHz的采样率,以25ms为一帧,每帧200个样点,在一帧语音中,使用45比特分配技术,则传输速率约为2.0kb/s。 采用6比特非均匀标量量化的方法对基音周期进行量化,对低频段分配较多码率以进行细致分析;根据语音分析时固定的分带数来确定采用9比特传递U/V信息;对于能量系数,将其开平方后转化到对数域进行线性量化,把其结果线性映射到[0,31]的范围中,取这个范围内与映射结果最接近的整数作为量化结果,并分配5比特进行标量量化。 LPC系数的编码是参数编码的重点,由于其动态范围大,需要的计算量和存储量较多,需要转化为相应的等价形式LSF参数以保证合成滤波器的稳定性,采用了分裂矢量量化的方法。将一个10维的LSF特征矢量分裂成3个维数分别为3、3、4的低维矢量,然后对三个低维矢量分别进行矢量量化。采用LBG算法来得到所需要的三个码本,并通过全搜索方法从码本中搜索最佳码矢量来量化LSF参数。 四、语音合成 在语音合成端按清浊音分别对应的不同激励源构造激励信号,综合考虑时域和频域合成的优缺点,用频域合成法完成对清音带语音激励的重建。这种重建比较容易在频域中实现带通滤波器;采用时域合成法完成对浊音带语音激励的合成,以保证帧间语音的平滑过渡,叠加为全带激励信号后,将其作为合成语音的残差信号,经LPC综合逆滤波器得到最终合成语音。这样就产生了LPC-MBE 语音编码方案。这种编码方案不需要进行谱幅度重建,直接由LPC WP=77 系数作为合成滤波器的参数分量,对残差信号做整体拟合更为简单方便。 五、语音增强 为了在噪声背景中提高LPC-MBE 语音编码器的性能,引入语音增强算法作为语音编码器的预处理器。采用双通道卡尔曼滤波的语音增强技术,信号与噪声模型的参数由共轭梯度算法进行估计,为在噪声环境下,尽可能提供纯净的语音作为语音编码器的输入提供了一种选择可能性。 六、仿真结论 在8kHz的采样频率下分别输入一段男声和一段女声,在计算机上采用MATLAB语言模拟仿真该语音编码算法。仿真结果表明,合成语音的波形同原始语音波形基本保持一致,从语谱图中可以看出语音能量的损失很小,主观测听效果较为理想,并基本上能满足实时通话需要。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 马晓红,殷福亮,陆晓燕,王晓宁;基于小波变换的传声器阵列语音增强方法[J];大连理工大学学报;2003年04期
2 徐爽,韩芳芳,郑德忠;基于阈值的小波域语音增强新算法[J];传感技术学报;2004年01期
3 邹采荣;陈国明;赵力;;基于泄漏约束的DF-GSC语音增强(英文)[J];Journal of Southeast University(English Edition);2007年04期
4 彭煊,刘金福,王炳锡;基于独立分量分析的语音增强[J];信号处理;2002年05期
5 沈亚强;基于多分辨率子波变换的自适应滤波语音增强方法[J];浙江工商职业技术学院学报;2003年04期
6 钱永玲;面向NGN的三重播放——7302 ISAM语音增强型接入平台[J];通讯世界;2005年11期
7 李楠;;一种小波变换与维纳滤波结合的语音抗噪研究[J];电声技术;2007年05期
8 张丽艳;殷福亮;;一种改进的奇异值分解语音增强方法[J];电子与信息学报;2008年02期
9 徐岩,杨静,王维汉;基于谱相减改进算法的语音增强研究[J];铁道学报;2004年01期
10 石鸿凌,姜琳峰,孙洪;基于TVAR模型的语音增强技术[J];武汉大学学报(工学版);2004年02期
11 董婧,赵晓晖;基于自适应共轭梯度参数估计的顽健卡尔曼滤波语音增强算法[J];通信学报;2004年08期
12 赵光,贾林飞,王冬霞,王琼;基于神经网络的麦克风阵列语音增强方法[J];辽宁工学院学报;2005年03期
13 王惠琴;何继爱;张秋余;;小波变换在语音增强中的应用[J];甘肃科学学报;2005年04期
14 王月;屈百达;徐保国;;一种基于仿生小波变换的语音增强方法[J];计算机工程与应用;2008年11期
15 刘晓晖,周祎 ,郑明,吴道悌;语音增强系统中宽带噪声的滤除[J];西安交通大学学报;1998年12期
16 孙新德;一种改进的语音增强方法及实现[J];郑州航空工业管理学院学报(社会科学版);2005年04期
17 曹晓琳,吴平,张素莉,丁铁夫;一种基于自适应滤波的语音增强算法的DSP实现[J];电子器件;2005年03期
18 王侠,顾明亮;一种基于小波变换的语音增强新方法[J];徐州师范大学学报(自然科学版);2005年03期
19 陈立伟,赵春晖,杨洪利;一种基于模糊系统的语音增强方法[J];应用科技;2005年10期
20 王永琦 ,邓琛 ,李世超 ,杨洋;噪声环境中基于GMM汉语说话人识别[J];微计算机信息;2005年22期
中国重要会议论文全文数据库 前10条
1 周小星;王安娜;孙红英;杨鸿武;;基于压缩感知过程的语音增强[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
2 陶智;赵鹤鸣;;Bark子波变换在语音增强中的应用[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
3 欧贵文;柯登峰;;基于噪音估计和参数估计的优化语音增强算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 吴红卫;俞一彪;;基于Laplace-Gauss模型和简化相位判别的离散余弦变换域语音增强[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
5 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
6 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年
7 王安娜;周小星;孙红英;杨鸿武;;基于压缩感知过程的语音增强新算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 吴亚栋;吴旭辉;;一种基于自相关域动态噪声估计方式的语音增强法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 丁沛;曹志刚;;基于语音增强失真补偿的抗噪声语音识别技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
2 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年
3 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年
4 王娜;基于小波变换与约束方差噪声谱估计的语音增强算法研究[D];燕山大学;2011年
5 王海艳;基于统计模型的语音增强算法研究[D];吉林大学;2011年
6 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
7 申丽然;Hilbert-Huang变换及其在含噪语音信号处理中的应用研究[D];哈尔滨工程大学;2006年
8 崔玮玮;基于麦克风阵列的声源定位与语音增强方法研究[D];清华大学;2009年
9 王都生;多带混合激励低速率语音编码的研究[D];西安电子科技大学;1998年
10 马晓红;传声器阵列语音增强中关键技术的研究[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 董婧;基于语音增强及小波变换基音检测的LPC-MBE低速语音编码算法[D];吉林大学;2004年
2 邬鑫锋;基于短时谱估计的语音增强研究[D];湘潭大学;2010年
3 王春玲;井下载波电话语音增强问题的研究[D];山东科技大学;2003年
4 陶智;基于人耳听觉掩蔽效应的语音增强的研究[D];苏州大学;2003年
5 孔祥波;基于短时幅度谱估计的语音增强方法研究[D];大连理工大学;2000年
6 朱健华;语音增强方法的研究[D];大连理工大学;2002年
7 武睿;数学形态学在语音增强中的应用[D];河北工业大学;2004年
8 段国和;战场环境下的自适应语音增强[D];西北工业大学;2005年
9 王龙;基于DSP的语音增强系统的研究与设计[D];东华大学;2011年
10 缪春波;语音增强及其相关技术的研究[D];大连理工大学;2003年
中国重要报纸全文数据库 前10条
1 ;打造三重播放接入平台[N];中国电子报;2005年
2 ;7302 ISAM面向NGN支持三重播放[N];通信产业报;2005年
3 上海贝尔阿尔卡特股份有限公司 汤栩平;上海贝尔阿尔卡特全面备战融合宽带接入[N];通信产业报;2005年
4 曾;科健K3900打头阵[N];计算机世界;2001年
5 ;推进无锡电信网络转型[N];人民邮电;2006年
6 李文;华为EnerG GSM解决方案 持续提升移动网络价值[N];通信产业报;2006年
7 晓林;东信北邮:智能网专家[N];通信产业报;2003年
8 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
9 贝文;上海贝尔阿尔卡特助力江苏电信网络转型[N];通信产业报;2006年
10 王辉;融合通信:向概念化说“不”[N];通信产业报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978