收藏本站
《新疆大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

噪声环境下的鲁棒性语音端点检测算法研究

于迎霞  
【摘要】:起步于上世纪五十年代的语音识别技术,经历了几十年的研究历程,如今逐渐走出实验室,并慢慢趋向于大规模应用。然而,实际环境中并没有完全纯净的语音信号,往往都伴有噪声或其他干扰(Lombard效应及传输通道变化引起的畸变),实验环境和实际环境存在失配现象,导致语音识别系统在实用时性能急剧下降。而端点检测,作为语音识别系统预处理阶段遇到的第一个关键技术,其准确性在某种程度上直接决定了整个语音识别系统的成败。语音识别系统的处理对象是有效语音信号,即排除了纯噪声段的语音信号段,这就需要事先从输入信号中找到语音部分的起止点,确定有效语音段的边界,端点检测的目的就是从包含语音的一段信号中确定出语音的起点以及终点,又称语音活动检测(VAD,Voice Activity Detection)。端点检测不仅在语音识别中显得重要,在自适应语音增强和语音编码中也同样重要。 传统的端点检测算法都是针对实验室安静环境的,近几年人们才开始研究噪声环境下语音的端点检测,目前随着自动语音识别技术在车载电话通信,免提式语音识别等方面的应用逐渐广泛,研究背景噪声下的鲁棒性(Robustness)语音端点检测算法显得尤为重要。 本文首先介绍了近十年国内外学者提出的一些端点检测算法,并分析了其中几种端点检测算法所选用的特征,给出仿真结果和一些改进。随后,提出了噪声环境下的两种语音端点检测新方法。算法一: 在LPC倒谱进行端点检测的基础上提出了基于LPC美尔倒谱(LPCCMCC)的端点检测算法。该算法中对LPC倒谱系数进一步按符合人耳听觉特性的(MEL)尺度进行非线性变换,求得LPC美尔倒谱系数(LPCCMCC),并以此作为端点检测的特征,该特征既考虑了声道特性,又符合人耳听觉,仿真实验结果表明了它的优越性[文章已被录用]。算法二:针对汉语语音的特点,提出了基于汉语语音学知识的两级鲁棒性端点检测算法,选用时域短时能零比和频域短时浊音频带(200-1000Hz)谱幅作为特征,采取自适应门限,在常见噪声环境(交通,汽车,背景说话人噪声Babble,白噪声等)下效果较好,算法实现简单,环境适应性较强[文章部分内容被录用]。文章最后对近两年出现的一些研究新方向作了简单介绍和展望,指出了端点检测的发展前景。
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TN912.3

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 陈凤翥;;基于熵的语音端点检测方法探讨[J];技术与市场;2008年09期
2 聂惠娟;段世政;;语音信号端点检测方法研究[J];新乡师范高等专科学校学报;2007年02期
中国硕士学位论文全文数据库 前7条
1 唐平;基于特定人的汉语语音识别的研究与实现[D];西安电子科技大学;2009年
2 李宁;咳嗽音识别方法的应用研究[D];重庆大学;2010年
3 李晋;语音信号端点检测算法研究[D];湖南师范大学;2006年
4 李忠慧;基于静音检测技术的多带激励语音声码器的研究[D];南京师范大学;2006年
5 张铁威;基于小波分析与神经网络的语音端点检测研究[D];大连理工大学;2008年
6 董胡;强噪声环境下语音信号端点检测方法研究[D];湖南师范大学;2008年
7 王康;语音识别在多媒体播放器中的设计与实现[D];华南理工大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 黄新宇,吴淑珍;基于单边自相关线性预测噪声中汉语语音识别[J];北京大学学报(自然科学版);2000年05期
2 王毓芳,尹宝林;一种自适应的汉语普通话音节清浊音分段方法[J];北京航空航天大学学报;2001年04期
3 李雪耀,林娟,杨崇林;舰船指挥舱室强噪声环境下语音识别[J];船舶工程;1999年02期
4 李桦,安钢,樊新海;短时能频值在语音端点检测中的应用[J];测试技术学报;1999年01期
5 李祖鹏,姚佩阳;一种语音段起止端点检测新方法[J];电讯技术;2000年03期
6 梁维谦,许海国,陈一宁,刘加,刘润生;应用于语音识别片上系统的语音检测算法[J];电路与系统学报;2003年02期
7 陈雪勤,赵鹤鸣,陈小平;基于计算听觉场景分析的强噪声背景下基音检测方法[J];电路与系统学报;2003年03期
8 陈景东,徐波,黄泰翼;一种基于迟滞编码的自动语音端点检测方法[J];电路与系统学报;1996年04期
9 果永振,何遵文,毕志明;基于DSP实现语音端点检测[J];电声技术;2002年12期
10 丁琦,徐望,王炳锡;基于模糊分类器的能量可变噪声环境下的词边界检测[J];电声技术;2003年05期
中国重要会议论文全文数据库 前2条
1 杨伟东;陈永彬;;用于话者识别的一种自适应端点自动检测方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
2 贾川;张健;陈振标;徐波;;噪声环境下的端点检测算法研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国硕士学位论文全文数据库 前4条
1 岳子琪;3G中语音端点检测算法及其实现研究[D];西安电子科技大学;2002年
2 孙海;汉语连续语音端点检测技术的研究[D];西安电子科技大学;2002年
3 雷静;语音识别技术的研究及基本实现[D];武汉理工大学;2002年
4 陈雪勤;基于计算声场景分析的混叠语音分离研究[D];苏州大学;2002年
【共引文献】
中国期刊全文数据库 前10条
1 丁志中,易茂祥;线性预测误差与自相关函数矩阵之间的关系[J];安徽大学学报(自然科学版);1996年02期
2 相征;朗朗;王静;;基于基音频能值的端点检测算法[J];安徽工程科技学院学报(自然科学版);2008年03期
3 张聪;;储粮害虫声信号编解码系统的设计与实现[J];安徽农业科学;2006年21期
4 洪流;Collocation的语篇衔接功能[J];安徽工业大学学报(社会科学版);2001年04期
5 陈倩倩;;《围城》文言词选用特点[J];安徽文学(下半月);2008年09期
6 刘祖勤;胡勇;;英汉借词方式的相似性[J];安徽文学(下半月);2010年05期
7 党少兵,穆从军;从一次语音测试看英语语音教学[J];安康师专学报;1996年02期
8 赵苗;郑文兰;;浅谈英语语音教学[J];安康师专学报;2006年04期
9 韩蓉;英语语音教学中的汉辅问题[J];安庆师范学院学报(社会科学版);1999年06期
10 李英浩;;普通话舌尖前擦音的动态发音过程及其声学分析[J];安庆师范学院学报(社会科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 边红昌;程德福;祁玉林;张坤;;基于DSP和ZigBee无线智能语音控制系统设计[A];第二十六届中国控制会议论文集[C];2007年
2 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
3 田业;贾珈;江建博;蔡莲红;;汉语普通话声调增强算法的研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 刘博;杨鸿武;甘振业;李曼曼;孙红英;;面向藏语机读音标SAMPA-T的字音转换[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
8 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
9 邓立新;杨震;郑宝玉;;一种判别语音静、清、浊三态的新方法[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
10 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 齐伟钧;终身教育框架下成人外语教学研究[D];上海外国语大学;2010年
2 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
3 柳春;甘肃临夏方言回腔语音格局研究[D];西北民族大学;2010年
4 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
5 李云靖;北京话音节发音的时间结构[D];南开大学;2010年
6 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
7 龙又珍;现代汉语寒暄系统研究[D];武汉大学;2009年
8 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
9 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
10 姜燕;汉语口语美学研究[D];山东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
2 王萍;语音情感识别研究[D];山东科技大学;2010年
3 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
4 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
5 曹唯伟;基于拼音编码的水下语音通信发射端的设计与实现[D];哈尔滨工程大学;2010年
6 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
7 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
8 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
9 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
10 楼佳;基于网络QoS的AMR语音编码算法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 钟思军;赖克方;杜明辉;陈如冲;胡维平;陈荣昌;钟南山;;经验模态分解在咳嗽音检测中的应用[J];北京生物医学工程;2008年03期
3 李雪耀,林娟,杨崇林;舰船指挥舱室强噪声环境下语音识别[J];船舶工程;1999年02期
4 李祖鹏,姚佩阳;一种语音段起止端点检测新方法[J];电讯技术;2000年03期
5 梁维谦,许海国,陈一宁,刘加,刘润生;应用于语音识别片上系统的语音检测算法[J];电路与系统学报;2003年02期
6 古丽拉·阿东别克,于迎霞;基于LPC美尔倒谱特征的带噪语音端点检测[J];电声技术;2004年02期
7 于迎霞;基于语音学知识的鲁棒性两级语音起点检测方法[J];电声技术;2004年05期
8 肖述才,王作英;端点检测中的一种新的对数能量特征[J];电声技术;2004年06期
9 卢艳玲,侯榆青,王宾,唐升,史燕;一种基于多特征的带噪语音信号端点检测与音节分割算法[J];电声技术;2005年07期
10 张志敏;郭英;王博;;一种基于倒谱特征的语音端点检测改进算法[J];电声技术;2006年04期
中国硕士学位论文全文数据库 前10条
1 缪春波;语音增强及其相关技术的研究[D];大连理工大学;2003年
2 牛国君;神经网络方法在语音信号检测中应用的研究[D];西南交通大学;2003年
3 朱淑琴;语音识别系统关键技术研究[D];西安电子科技大学;2004年
4 钱俊;VoIP系统中静音检测的设计和实现[D];华中科技大学;2004年
5 杨树功;小波分析在语音信号基音检测中的应用研究[D];西北工业大学;2005年
6 夏敏磊;语音端点检测技术研究[D];浙江大学;2005年
7 欧世峰;多通道语音增强与语音盲分离算法的研究[D];吉林大学;2005年
8 高丙朋;基于DSP的小词汇量语音识别系统[D];新疆大学;2006年
9 赵高峰;基于小波分析的语音端点检测算法研究[D];太原理工大学;2006年
10 车龙;基于转速信号分析的柴油机故障诊断研究[D];大连海事大学;2008年
【二级引证文献】
中国期刊全文数据库 前10条
1 王彪;;一种改进的语音端点检测方法研究[J];电子设计工程;2012年04期
2 张梅;;一种语音端点检测算法及其在DSP上的实现[J];电子技术应用;2012年08期
3 肖玉娟;赵利;;基于MELP的变速率分类型语音编码算法[J];电声技术;2013年02期
4 黎林;朱军;;基于小波分析与神经网络的语音端点检测研究[J];电子测量与仪器学报;2013年06期
5 张梅;;一种基于模糊神经网络的语音端点检测方法[J];计算机工程与应用;2012年16期
6 王钟斐;王彪;李建文;;基于小波包的语音谱熵端点检测方法研究[J];计算机与数字工程;2011年04期
7 王彪;;基于小波分析的语音端点检测方法研究[J];科学技术与工程;2012年07期
8 黎林;朱军;刘颖;张磊;;改进动量粒子群优化神经网络的语音端点检测[J];计算机工程与应用;2013年05期
9 金敏;;多特征和神经网络相结合的语音端点检测算法[J];计算机应用与软件;2013年05期
10 朱玉颖;程强;;一种语音信号端点检测法的FPGA实现[J];软件导刊;2010年05期
中国硕士学位论文全文数据库 前10条
1 陈伟伟;基于鼾声检测的睡眠呼吸暂停低通气综合症诊断[D];大连理工大学;2010年
2 朝木日乐格;基于支持向量机的蒙古语语音端点检测方法研究[D];内蒙古大学;2011年
3 唐娜娜;基于稳健性PLPC的抗噪语音识别方法的研究[D];辽宁大学;2011年
4 李辉;基于支持向量机的说话人识别系统的开发[D];东北石油大学;2011年
5 刘其波;基于车载嵌入式的语音端点检测算法研究[D];哈尔滨工业大学;2011年
6 张振红;基于分形维数的语音端点检测算法研究[D];太原理工大学;2008年
7 李平;基于GMM的低码率语音编码器[D];南京师范大学;2008年
8 于雷;基于DSP的语音检测系统设计与实现[D];哈尔滨工程大学;2008年
9 张俊;基于HMM与ANN混合结构的语音识别系统研究[D];中南大学;2009年
10 陈吉成;孤立词语音识别系统关键模块的设计[D];西安理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 吴镇扬,张子瑜,李想,赵力;听觉场景分析的研究进展[J];电路与系统学报;2001年02期
2 顾良,刘润生;汉语数码语音识别:发展现状、难点分析与方法比较[J];电路与系统学报;1997年04期
3 吴锋,高下,李志宏,钱宗才,王锦玲;声音空间定位测听系统的设计与实现[J];第四军医大学学报;2001年07期
4 李建东,李明远,纪红;话音活动检测的模型及其在移动通信中的应用[J];电信科学;1995年10期
5 何强,张歆奕,张有为;基于定点DSP的实时语音命令识别模块[J];电子技术应用;2000年07期
6 刘加;汉语大词汇量连续语音识别系统研究进展[J];电子学报;2000年01期
7 袁晓;一类新的复解析子波构造及其性质研究[J];电子学报;2000年04期
8 王都生,铁满霞,樊昌信;一种实时基音检测算法[J];电子学报;2000年10期
9 胡光锐,韦晓东;基于倒谱特征的带噪语音端点检测[J];电子学报;2000年10期
10 战普明,王作英,陆大 ;语音识别隐马尔可夫模型的改进[J];电子学报;1994年01期
中国重要会议论文全文数据库 前1条
1 贾川;张健;陈振标;徐波;;噪声环境下的端点检测算法研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 罗翔飞;侯自立;;主动声纳信号捕捉中自动判决研究[J];北京邮电大学学报;1992年04期
2 管璇;巴晓辉;牟荣增;程亚奇;陈杰;;GPS接收机的自适应门限设定方法(英文)[J];电子器件;2007年02期
3 孙红光;卜倩;李欢利;张瑾;张慧杰;;基于OTSU分割的云层背景下弱目标检测算法研究[J];东北师大学报(自然科学版);2009年02期
4 宫明广;王琪;江民俊;李锦;;基于小波变换自适应门限信号预处理[J];计算机与现代化;2010年08期
5 董云朝,陈贺新;基于视觉灵敏度分类的IFS自适应图象编码算法[J];中国图象图形学报;2001年08期
6 胡进;潘联安;;ESM接收机数字式自适应恒虚警处理电路[J];电子信息对抗技术;1989年02期
7 陈沁梅;纪彦星;周仟;;新一代数字储频中两种新技术的应用[J];雷达与对抗;2008年01期
8 洪惠群;陈忠辉;陈新;;功率谱估计与自适应门限在扩频同步中的应用[J];应用科技;2008年09期
9 张震;汪斌强;陈庶樵;周粳迪;;基于滑动窗口的资源可控流量测量算法[J];计算机工程;2010年03期
10 丁海峰;陈勇;袁晨光;;基于独特码的突发信号检测实现[J];科技致富向导;2010年32期
中国重要会议论文全文数据库 前10条
1 吴霞;;2002年8月15日遂昌局地短时大暴雨过程分析[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“气候系统与气候变化”分会论文集[C];2003年
2 杨希;宁新宝;卞春华;;基本尺度熵方法用于短时HRV分析的临床应用研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年
3 阳欢;吴根秀;;模糊数学在道路通行网络中的应用[A];模糊集理论与应用——98年中国模糊数学与模糊系统委员会第九届年会论文选集[C];1998年
4 蔡志明;郑兆宁;杨士莪;;基于动力学模型的海洋混响序列短时预测[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
5 蔡小辉;周过海;;短时强降水特征分析及预报预警[A];中国气象学会2008年年会天气预报准确率与公共气象服务分会场论文集[C];2008年
6 程盛;陈树凯;冯海涛;;短时窗付氏变换在高分辨率处理技术中的研究与应用[A];2001年中国地球物理学会年刊——中国地球物理学会第十七届年会论文集[C];2001年
7 钱华峰;骆阳;;金衢6.11大到暴雨过程水汽云图特征分析[A];平安浙江气象保障学术论坛论文集[C];2005年
8 钱华峰;骆阳;;金衢6.11大到暴雨过程水汽云图特征分析[A];第二届浙江中西部科技论坛论文集第二卷(气象分卷)[C];2005年
9 许从方;徐贵贤;丛键;;一种基于高阶累积量的语音激活检测算法[A];2006’和谐开发中国西部声学学术交流会论文集[C];2006年
10 顾品强;费蕾;;基于市局指导预报的区县台冬夏季短时气温预测业务评估及应用分析[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“城市气象与科技奥运”分会论文集[C];2003年
中国重要报纸全文数据库 前10条
1 苏稻香 林良勋 杨绮薇;全省短时闪电9335次历史罕见[N];南方日报;2006年
2 记者 马德明通讯员 郭迎春;我省短时天气临近预报服务系统初步形成[N];河北经济日报;2008年
3 范晓艳;短时花费多 长期效果好[N];医药经济报;2003年
4 新华社环球财经专线分析师 冯莽;期价窄幅整理 短时突破无望[N];粮油市场报;2004年
5 记者 刘洋 张雪峰;部分地区供水短时紧缺[N];重庆日报;2005年
6 高顺年 许维俊;青海首播短时灾害天气警报[N];中国气象报;2003年
7 刘自国;短时雨雪不能有效缓解旱情 黄委全力抓好节约用水[N];中国水利报;2002年
8 记者 贾晓燕;地铁车公庄站周六起改造[N];北京日报;2006年
9 记者 冯建维;沙兰上游无水库垮坝[N];中国水利报;2005年
10 王建忠;编织都市天灾预警网[N];中国气象报;2002年
中国博士学位论文全文数据库 前10条
1 陈红;短时关联性错误记忆的认知和神经机制研究[D];首都师范大学;2012年
2 徐春光;非平稳信号的时频分析与处理方法研究[D];西安电子科技大学;1999年
3 董春娇;多状态下城市快速路网交通流短时预测理论与方法研究[D];北京交通大学;2011年
4 王甲池;基于天线阵的直扩系统多维快速捕获研究[D];华中科技大学;2006年
5 刘应梅;电能质量扰动检测和分析的研究[D];中国电力科学研究院;2003年
6 李怀琼;高性能凝视热像仪处理电子学关键技术研究[D];南京理工大学;2007年
7 李霞;基于连续小波变换的水下信号处理技术研究[D];西北工业大学;2003年
8 朱德兵;超浅层弹性波波振二相拟模态试验分析理论研究[D];中南大学;2002年
9 何成达;DASB、W-SFCW特性及联合工艺处理生活污水的研究[D];河海大学;2004年
10 许东星;基于GMM和高层信息特征的文本无关说话人识别研究[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 于迎霞;噪声环境下的鲁棒性语音端点检测算法研究[D];新疆大学;2004年
2 兰云;短时交通流量预测研究[D];西北工业大学;2002年
3 孔祥波;基于短时幅度谱估计的语音增强方法研究[D];大连理工大学;2000年
4 魏连娣;汉语短时识别中的偏好效应[D];东北师范大学;2002年
5 王夏慧;城市污水生物强化处理短时曝气试验研究[D];武汉理工大学;2004年
6 韩超;基于时间序列分析的短时交通流量实时自适应预测[D];北京工业大学;2004年
7 张文哲;电力系统短时负荷预测模型研究[D];重庆大学;2004年
8 钱瑾;应用语音特征诊断疲劳驾驶的研究[D];北京交通大学;2012年
9 夏田;高采样率音频信号的参数编解码方案设计与实现[D];清华大学;2004年
10 苏静;综合短时特征和长时特征的发音质量评价方法研究[D];北京理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026