收藏本站
《华南理工大学》 2000年
收藏 | 手机打开
二维码
手机客户端打开本文

基于特征提取的抗噪声语音识别研究

徐金甫  
【摘要】:噪声环境下的语音识别是一个很重要的课题,在许多场合有广泛的应用。本文主要研究基于特征提取的抗噪声语音识别问题。现有的语音识别系统对于清晰语音有着令人满意的识别结果,但在许多实际环境中,特别是在背景噪声存在的情况下,它们的性能将会大幅度地下降,这也是语音识别系统不能商业化的主要原因之一。解决噪声背景下的语音识别问题有三种方法,即采用抗噪声的语音特征和相似测度、语音增强、语音模板的噪声补偿等。本论文围绕前两种方法进行研究,主要贡献如下: 1.提出了一种改进的基于谱相减的语音特征提取方法。在谱相减法语音增强中,用无音期间的噪声信号作为目前帧的干扰噪声,这会导致清晰语音功率谱或幅度谱的估计值存在误差。本文提出的改进方法能够减小这种误差对提取的语音特征的影响。实验结果表明,和语音信号先谱相减增强再提取特征的方法相比,用这种方法从带噪语音中提取的MFCC特征矢量更接近于纯净语音的特征矢量,并且极大地提高了识别系统对带噪语音的识别率。 2.提出了功率谱差分的概念,并在此基础上,提出了一种抗噪声的语音特征。计算功率谱的差分相当于在功率谱域滤除带噪语音中的加性噪声。首先让语音信号的功率谱通过一组带通滤波器,再计算各滤波器输出的差分值。理论分析和实验一致证明,以此作为语音信号的特征,可以大幅度提高语音识别系统在噪声环境中的性能。 3.提出了基于单边自相关序列的语音特征OSA-MFCC。虽然Hernando等人提出的语音特征OSALPC也是基于单边自相关序列的抗噪声语音特征,但在提取OSA-MFCC特征和OSALPC特征时,单边自相关序列的计算方法不同,并且在提取特征时用到的单边自相关序列长度不同。带噪语音的识别实验表明,OSA-MFCC的抗噪声能力远远强于OSALPC。 4.提出了基于奇异值分解滤波的多模板语音识别的方法,推导了语音模板的参数重估公式。奇异值分解滤波虽然可以提高带噪语音信号的信噪比和对带噪语音的识别率,但不同的滤波参数只能保证识别系统在某一较小的信噪比范围内
【学位授予单位】:华南理工大学
【学位级别】:博士
【学位授予年份】:2000
【分类号】:TN912.34

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 邵淑华;;噪声消除的DSP算法研究[J];现代电子技术;2009年19期
中国博士学位论文全文数据库 前4条
1 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
2 邱政权;在噪声环境下的说话人识别[D];华南理工大学;2007年
3 马龙华;车载环境下语音识别方法研究[D];哈尔滨工程大学;2008年
4 古今;语音感知认证的关键技术研究[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前6条
1 袁铄;基于小波网络音频信号处理技术[D];大连理工大学;2010年
2 马治飞;基于概率模型的特征补偿算法在语音识别中的应用[D];解放军信息工程大学;2006年
3 刘丽娟;噪声环境下语音识别系统研究[D];西北大学;2007年
4 符聪;基于定点DSP的语音控制系统研究与设计[D];湖南大学;2008年
5 白顺先;汉语孤立字语音识别技术的研究[D];西南交通大学;2009年
6 邵松年;数字音频的真实性鉴定[D];上海交通大学;2010年
【参考文献】
中国期刊全文数据库 前7条
1 李苇营,易克初,胡征;神经网络与HMM构成的混合网络在语音识别中应用的研究[J];电子学报;1994年10期
2 李雪耀,花栅,杨崇林;听觉模型用于噪声环境下语音识别的研究[J];哈尔滨工程大学学报;1999年02期
3 钟林,刘润生;新神经网络结构及其在数码语音识别中的应用[J];清华大学学报(自然科学版);2000年03期
4 胡光锐,王昀;一种抗噪声语音识别方法[J];上海交通大学学报;1995年03期
5 李冲泥,胡光锐;一种改进的子波域语音增强方法[J];通信学报;1999年04期
6 王成友,汤叔祺,梁甸农;噪声对特征综合法语音识别性能的影响[J];声学学报;1997年03期
7 沈亚强,程仲文;建立在卡尔曼滤波基础上的语音增强方法[J];声学学报;1994年03期
【共引文献】
中国期刊全文数据库 前10条
1 倪志伟;;BP网络中激活函数的深入研究[J];安徽大学学报(自然科学版);1997年03期
2 王瑞梅;傅泽田;何有缘;;基于神经网络的模糊系统池塘淡水养殖溶解氧预测模型[J];安徽农业科学;2010年33期
3 于智恒;寇立娟;王钢钢;;农田水位及环境因素对小麦生理指标的影响预测[J];安徽农业科学;2010年34期
4 张丽;白雪莲;王悦钰;安可君;;灰色神经网络耦合模型在河套灌区引黄水量预测中的应用[J];安徽农业科学;2012年01期
5 张晓东,张建新,韦岗;基于最小二乘法的汉语声调判决[J];安徽教育学院学报(自然科学版);1998年02期
6 于洪梅,朱晓明,陈刚;人工神经网络光度法同时测定锆和钛[J];鞍山科技大学学报;2003年01期
7 胡钢,沈文轩;一种基于噪声动态检测的语音端点检测算法[J];鞍山科技大学学报;2004年02期
8 胡钢;;一种语音端点检测算法在DSP上的实现[J];鞍山师范学院学报;2009年06期
9 张志红;;基于随机初始中心的FCM算法及其应用[J];安徽水利水电职业技术学院学报;2008年01期
10 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
中国重要会议论文全文数据库 前10条
1 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 邓立新;杨震;郑宝玉;;一种判别语音静、清、浊三态的新方法[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
5 牟峰;俞铁城;杨道淳;;新型半波语音编解码的实现[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
6 邹绘华;李双田;;基于频谱斜率约束的变速率语音编码算法研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
7 李灿伟;杨震;;基于DCT的有色噪声消除算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 周珺;范京;刘惠华;;汉语语音音量和语速变化的自适应的调整[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 孙海;范京;刘惠华;;汉语连续语音中的单字起止点综合判别的新方法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
10 朱学勇;刘亚康;杨乐;;一种基于MBE模型的2.4Kbps语音编码器算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 高晓阳;甘肃河西大麦麦芽干燥控制系统研究[D];甘肃农业大学;2010年
3 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
4 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
5 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
6 张克俊;基因表达式编程理论及其监督机器学习模型研究[D];浙江大学;2010年
7 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
8 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
9 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
10 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
4 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
5 阎明;蒸汽发生器故障预报方法研究[D];哈尔滨工程大学;2010年
6 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
7 楼佳;基于网络QoS的AMR语音编码算法研究[D];哈尔滨工程大学;2010年
8 杨文强;基于AMBE-2000的OFDM水声语音通信平台研究[D];哈尔滨工程大学;2010年
9 周翠梅;说话人识别技术的研究与实现[D];大连理工大学;2010年
10 杨克强;LVQ神经网络在齿轮箱故障诊断中的研究[D];安徽农业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 陈志鑫,郭华伟;基于TMS320C54×DSP的实时语音识别系统[J];半导体技术;2001年04期
2 孙越,王玥,张春,王志华;基于定点DSP的实时噪声消除系统[J];半导体技术;2002年06期
3 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
4 吴淑珍,吴阿华;说话人识别的参量研究和语音库建设[J];北京大学学报(自然科学版);1995年03期
5 陈世雄;宫琴;;常见的听觉滤波器[J];北京生物医学工程;2008年01期
6 崔屹,张东,时良平,陈丽媛;语音识别中的抗噪声方法[J];北京邮电大学学报;1998年02期
7 李宏伟,赵晓晖;基于预处理VAD和自适应KLT的语音增强算法[J];吉林大学学报(信息科学版);2003年02期
8 金学骥,叶秀清,顾伟康;预加重与MMSE结合的语音增强方法[J];传感技术学报;2005年02期
9 李祖鹏,姚佩阳;一种语音段起止端点检测新方法[J];电讯技术;2000年03期
10 贺双赤;用Laguerre滤波器实现多径衰落信道自适应均衡[J];电讯技术;2004年01期
中国重要会议论文全文数据库 前1条
1 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
2 朱晓冬;数字水印技术的研究[D];吉林大学;2004年
3 李靓;高质量的2kb/s波形内插语音编码算法研究[D];北京工业大学;2005年
4 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
5 宁更新;抗噪声语音识别新技术的研究[D];华南理工大学;2006年
6 唐胜;多媒体数字签名技术研究[D];中国科学院研究生院(计算技术研究所);2006年
7 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
8 孙暐;听觉特性与鲁棒语音识别算法研究[D];东南大学;2006年
9 董婧;鲁棒语音识别技术的研究[D];吉林大学;2007年
10 雷红雨;指挥自动化系统中多媒体安全若干关键问题研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 周凯汀;基于遗传算法的最优化控制研究[D];华侨大学;2000年
2 周春健;基于小波变换的旋转机械故障诊断[D];南京航空航天大学;2004年
3 张韧;旋转机械故障特征提取技术及其系统研究[D];浙江大学;2004年
4 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
5 崔国辉;说话人识别方法与策略的研究[D];山东大学;2005年
6 焦志平;改进的ZCPA语音识别特征提取算法研究[D];太原理工大学;2005年
7 江官星;非特定人孤立词语音识别系统的研究[D];西南交通大学;2006年
8 吴迪;基于听觉特性及语谱特性的语音增强[D];苏州大学;2006年
9 王一平;用遗传算法改进HMM的语音识别算法研究[D];太原理工大学;2007年
10 孙颖;噪声环境下语音特征提取前端处理及优化帧算法研究[D];太原理工大学;2007年
【二级引证文献】
中国期刊全文数据库 前2条
1 张戟;杨腾飞;;车载自动语音识别系统设计[J];佳木斯大学学报(自然科学版);2011年02期
2 曾番;;小波包分析与能量算子结合的声目标特征参数[J];探测与控制学报;2010年06期
中国博士学位论文全文数据库 前1条
1 周晓君;强噪声环境机械早期故障微弱信号特征分离算法研究[D];重庆大学;2012年
中国硕士学位论文全文数据库 前10条
1 张增银;基因表达式编程与HMM融合技术应用研究[D];广西师范学院;2010年
2 朱蕊楠;车载蓝牙语音控制系统的语音识别算法研究与设计[D];吉林大学;2011年
3 陆春梅;与文本无关的开集说话人识别技术研究[D];西南交通大学;2011年
4 段万新;抗噪语音识别系统研究与实现[D];成都理工大学;2011年
5 刘其波;基于车载嵌入式的语音端点检测算法研究[D];哈尔滨工业大学;2011年
6 郭志强;家庭监护机器人关键技术的研究与实现[D];华南理工大学;2011年
7 柳奇芳;基于组合去噪方法的语音识别抗噪技术研究[D];电子科技大学;2008年
8 毕竞;应用于视频内容分析的话者辨识系统[D];北京邮电大学;2008年
9 王苏敏;噪声背景下孤立词语音识别方法研究与仿真[D];江西理工大学;2010年
10 王韵;基于Sphinx的汉语连续语音识别[D];太原理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前3条
1 顾良,刘润生;汉语数码语音识别:发展现状、难点分析与方法比较[J];电路与系统学报;1997年04期
2 胡光锐,林昱弘;一种改进的混合型语音识别方法[J];上海交通大学学报;1994年06期
3 王成友,汤叔祺,梁甸农,陈辉煌,唐朝京;语音识别中多种特征信息综合利用的方法[J];声学学报;1997年02期
【相似文献】
中国期刊全文数据库 前10条
1 徐金甫,韦岗,梁树雄;一种基于奇异值分解的带噪语音识别方法[J];华南理工大学学报(自然科学版);2001年01期
2 王亚迅;许军;;移动环境下基于模板的动态补偿用于改善语音识别的鲁棒性[J];现代计算机(专业版);2008年08期
3 张丽;王福忠;张涛;;基于小波分析和HMM的语音识别模型建立与仿真[J];计算机与现代化;2007年09期
4 张焱;张杰;黄志同;;基于听觉模型的鲁棒性语音识别的研究[J];模式识别与人工智能;1998年03期
5 张东;谢存禧;;基于特征值混和提升语音识别鲁棒性技术(英文)[J];陕西科技大学学报;2005年06期
6 胡光锐,周浩,严永红;MHMM和ANN法结合的语音识别方法[J];应用科学学报;1995年03期
7 胡光锐,王昀;一种抗噪声语音识别方法[J];上海交通大学学报;1995年03期
8 谢锦辉;高雨青;;关于HMM相对可靠性量度[J];自动化学报;1993年05期
9 韩兵,贾忠;噪声环境下鲁棒性语音特征提取的新方法[J];航空计算技术;1995年02期
10 胡光锐,吴硕,朱昕波;用于SOM神经网络语音识别的自适应局部搜索算法[J];上海交通大学学报;1996年07期
中国重要会议论文全文数据库 前10条
1 侯震;王之禹;李明;温源;俞铁城;;提高语音识别对声调变化鲁棒性的方法[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
3 赵军辉;匡镜明;黄石磊;;鲁棒语音识别中基于统计方法的时域滤波技术的研究[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
4 杜利民;;语音识别中的鲁棒性问题[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 范明;胡郁;王仁华;;语音识别前端基于方差规整权重的MVN方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 张化云;关存太;陈显治;;基于听觉感知的噪声环境语音识别[A];第四届全国人机语音通讯学术会议论文集[C];1996年
7 刘志敏;吴玺宏;甄斌;迟惠生;;关于外周听觉模型中语音信号处理的分帧问题[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 王月;屈百达;李金宝;蒋纯刚;;一种改进的基于频带方差的端点检测算法[A];2007中国控制与决策学术年会论文集[C];2007年
9 王兴斌;徐望;王炳锡;马治飞;;噪声环境下语音能量的MMSE估计及其在语音识别中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 许鑫;苏开娜;胡起秀;;几种改进的MFCC特征提取方法在说话人识别中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
2 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
3 邱诗文 DigiTimes 专稿;富迪车用语音识别IC出货放量[N];电子资讯时报;2006年
4 本报记者 刘洪宇;当机器听懂了我们的声音[N];辽宁日报;2008年
5 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
6 ;“超人类语音识别”计划[N];中国计算机报;2002年
7 ;Intel涉足语音识别[N];计算机世界;2003年
8 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
9 小雷;芝麻开门[N];电脑商报;2006年
10 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
中国博士学位论文全文数据库 前10条
1 徐金甫;基于特征提取的抗噪声语音识别研究[D];华南理工大学;2000年
2 张军;抗噪声语音识别技术的研究[D];华南理工大学;2003年
3 宁更新;抗噪声语音识别新技术的研究[D];华南理工大学;2006年
4 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
5 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
6 章熙春;翘曲离散傅立叶变换算法与语音处理新方法研究[D];华南理工大学;2005年
7 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
8 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
9 王霞;数学形态学在语音识别中的应用研究[D];河北工业大学;2008年
10 许超;带噪语音信号处理中的稳健性加权方法[D];清华大学;2005年
中国硕士学位论文全文数据库 前10条
1 杨东;基于神经网络的语音识别鲁棒性研究[D];山东师范大学;2005年
2 汤玲;基于HMM模型的语音识别系统研究[D];国防科学技术大学;2005年
3 修国浩;基于WD/HMM的语音识别算法研究[D];燕山大学;2004年
4 王洁丽;数学形态学在语音信号处理中的应用[D];河北工业大学;2006年
5 刘力军;基于无线通讯的语音识别算法研究及软件开发[D];南京工业大学;2005年
6 李玉贤;基于SPCE061A单片机的语音识别系统的研究[D];东北农业大学;2004年
7 王坤卿;小词汇量语音识别系统[D];中国石油大学;2010年
8 张琨磊;基于语音增强的基频提取算法在语音识别上的应用研究[D];中国科学技术大学;2011年
9 李秀珍;语音识别算法及应用技术研究[D];重庆大学;2010年
10 王霅煜;基于VQ和ASR的多媒体课件检索[D];上海交通大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026