收藏本站
《东南大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

噪声环境下说话人识别的研究

包永强  
【摘要】: 作为一种基于生物特征信息的身份识别方法,说话人识别通过语音来识别说话人的身份,说话人识别在电子商务、消费、银行等远程客户服务的身份认证、军事安全领域的说话人身份自动检测和认证中具有极大的应用价值和广泛的应用前景,是当今语音信号处理和生物特征信息检测和识别领域的重要研究方向。 由于说话人个性以及实际应用环境的复杂性,说话人识别技术虽然取得了一定的进步,其瓶颈效应也逐步显现,进一步提高比较困难,离真正的实际应用还有一段距离。 本文从端点检测、语音增强、特征提取、后端处理等角度对说话人识别进行了研究,取得了一些研究成果。 本文首先回顾了说话人识别的研究发展历程,指出了目前说话人识别研究的热点和难点。 语音信号具有混沌的特征,分形维理论是描述混沌信号的一种手段,本文从分形维的定义出发,提出了一种新的基于波形的算法(Improvement Fractal Dimension algorithm Based on Wave :IBW-FD)。该算法只需计算波形长度,与盒维、Katz维相比,计算更加简单。通过分形布朗曲线验证了该算法比盒维和Katz维具有更高的精确度,在高斯白噪声和三种非平稳噪声下该算法与盒维、Katz维相比抗干扰能力更强。端点检测是说话人识别系统的第一步,一直是语音信号处理研究的热点。本文根据语音和噪声的特点,将前面提出的IBW分形维引入端点检测,将之与能量的方法相结合,提出了一种基于能量和分维的联合端点检测方法(VAD way of unite energy and fractal dimension:UEFD)。 寻找新的有效的说话人识别特征参数和已有特征参数的有效组合是说话人识别参数提取研究的热点。本文将前面提出的IBW分形维与MFCC特征参数有机结合,作为说话人识别系统的混合特征参数。通过实验发现,新的混合特征具有一定优势。 基于离散余弦变换的语音增强方法是目前国内外语音增强领域内研究的热点,而对于离散分数余弦变换的研究国际上还比较少,而国内外对于离散分数余弦变换的应用研究就更少,本文基于态函数,提出了两种基于态函数的离散分数余弦变换方法——二周期离散分数余弦变换和三周期离散分数余弦变换;并把它们应用于语音增强中,结合了语音增强的特点,提出了四种基于离散分数余弦变换的语音增强方法——基于二周期离散分数余弦变换的语音增强算法(speech enhancement based on two cycles Discrete Fractional cosine Transform:FDCT2)、改进的基于二周期离散分数余弦变换的语音增强算法(speech enhancement based on modified two cycles Discrete Fractional cosine Transform:MFDCT2)、基于三周期离散分数余弦变换的语音增强算法(speech enhancement based on three cycles Discrete Fractional cosine Transform :FDCT3)和改进的基于三周期离散分数余弦变换的语音增强算法(speech enhancement based on modified three cycles Discrete Fractional cosine Transform :MFDCT3)等四种算法,结果表明本文提出的几种算法要优于常规的DCT算法。 在噪声环境下语音增强的研究中多级滤波方法具有明显的优势,其中欧洲电信标准化协会提出的两级MEL域维纳滤波结构具有较优良的降噪效果。但缺点是结构复杂,反复的时域-频域转换带来计算量的急剧上升;研究发现,单纯地从时域或变换域很难消除语音中存在的噪声和干扰,而分数余弦变换是一种非常优良的分析工具,本文将前面提出的基于态函数的分数余弦变换应用于语音增强中,提出了分数余弦变换
【学位授予单位】:东南大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP391.42

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 辛全超;吴萍;;基于GMM的说话人识别研究与实践[J];计算机与数字工程;2009年06期
中国硕士学位论文全文数据库 前10条
1 单进;基于压缩感知的鲁棒性说话人识别[D];苏州大学;2010年
2 李智海;基于语音信号监测脑疲劳的微电子系统设计与优化[D];苏州大学;2011年
3 曾番;噪声环境下说话人识别技术研究[D];兰州理工大学;2008年
4 周益武;语音信息隐藏技术的研究[D];复旦大学;2008年
5 种灿灿;高噪声背景下声纹识别系统的研究[D];山东科技大学;2008年
6 洪家高;说话人身份识别系统的设计及DSP实现[D];苏州大学;2009年
7 李健;与文本无关说话人识别技术的研究[D];东北林业大学;2009年
8 辛全超;基于GMM的说话人语音识别研究与实践[D];华东师范大学;2010年
9 李经智;说话人识别系统的研究及DSP实现[D];哈尔滨工程大学;2009年
10 宋宪晨;基于小波包分析和支持向量机的说话人识别[D];哈尔滨工程大学;2009年
【参考文献】
中国期刊全文数据库 前2条
1 韦岗,陆以勤,欧阳景正;混沌、分形理论与语音信号处理[J];电子学报;1996年01期
2 包永强,周晓彦,赵力,邹采荣;人耳对于不同频率成分分离知觉的定量分析[J];声学技术;2004年02期
【共引文献】
中国期刊全文数据库 前10条
1 赵晓群;王彦;苏彦莽;王霞;;基于分形理论的语音增强[J];电声技术;2005年12期
2 沈亚强;低信噪比语音信号端点检测和自适应滤波[J];电子测量与仪器学报;2001年01期
3 林嘉宇,黄芝平,王跃科,沈振康;语音信号相空间重构中嵌入维数的选择[J];电子科学学刊;1999年06期
4 闫润强;朱贻盛;;基于定量递归分析的清浊音判决[J];电子与信息学报;2007年07期
5 潘欣裕;赵鹤鸣;陈雪勤;徐敏;;基于EMD拟合特征的耳语音端点检测[J];电子与信息学报;2008年02期
6 王跃科,林嘉宇,黄芝平;混沌信号处理[J];国防科技大学学报;2000年05期
7 高俊芬;胡维平;;基于非线性动力学和GMM的病态嗓音识别与研究[J];广西师范大学学报(自然科学版);2011年03期
8 李轶,范影乐;基于倒谱与复杂性的说话人确认系统[J];杭州电子工业学院学报;2004年06期
9 陈亮,张雄伟;语音信号非线性特征的研究[J];解放军理工大学学报(自然科学版);2000年02期
10 吴碧宇;;基于浑沌学理论的中国语言学研究综述[J];集宁师专学报;2009年01期
中国重要会议论文全文数据库 前7条
1 牛继华;鲍长春;贾懋珅;;基于分形的帧擦除掩蔽方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
2 蒋纯纲;屈百达;李金宝;王月;;基于小波变换后的分形理论的语音端点检测[A];2007中国控制与决策学术年会论文集[C];2007年
3 沙宗先;韩俊涛;陈惠鹏;秦兵;;语音信号的混沌现象研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
4 陈亮;张雄伟;;基于超维相空间重构的语音识别研究[A];开创新世纪的通信技术——第七届全国青年通信学术会议论文集[C];2001年
5 杨吉斌;张雄伟;;基于相空间重构的SVM音素识别[A];第九届全国青年通信学术会议论文集[C];2004年
6 陈亮;张雄伟;;基于相空间重构的语音特征研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 王建波;林本浩;田春明;;软计算方法在语音信号处理中的应用[A];2009年中国智能自动化会议论文集(第一分册)[C];2009年
中国博士学位论文全文数据库 前7条
1 王强;基于混沌与分形理论的炉管泄漏检测与诊断系统的研究[D];华北电力大学(河北);2003年
2 杨志家;体表肌电信号中疲劳信息提取方法的研究[D];浙江大学;1999年
3 侯丽敏;基于非线性理论和信息融合的说话人识别[D];上海大学;2005年
4 李松;交通流混沌转化现象研究[D];天津大学;2006年
5 徐静波;语音时频及非线性增强处理方法研究[D];解放军信息工程大学;2005年
6 郭武;面向图像处理的独立分量分析方法[D];国防科学技术大学;2008年
7 薛丽芳;语音信号动态特征分析及其可视化的关键技术研究[D];东北大学 ;2010年
中国硕士学位论文全文数据库 前10条
1 李璐;基于语音识别的拼音学习系统设计与实现[D];北京邮电大学;2010年
2 李轶;说话人识别系统研究[D];浙江大学;2003年
3 吴景丰;汽轮发电机组常见振动故障诊断的研究[D];大连理工大学;2003年
4 张宾;Lyapunov特性指数的算法研究及其在弱信号混沌检测中的应用[D];吉林大学;2004年
5 李虎明;小信号混沌检测研究[D];西安理工大学;2005年
6 王彦;基于分形理论的语音增强[D];河北工业大学;2005年
7 雷涛;基于神经网络的语音识别研究[D];浙江工业大学;2005年
8 叶斌;语音增强技术在数字通信中的应用[D];东华大学;2006年
9 袁野;基于混沌理论的微弱信号检测与勘探地震学中同相轴的恢复[D];吉林大学;2006年
10 张文超;基于电话信道的语音识别研究[D];燕山大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 朱晓园;一个对隐马尔可夫模型用于自由语句说话人的研究[J];北方交通大学学报;1997年01期
2 柏逢明,马莉,潘毓学,陈玲;弹体药室容积音频检测仪的研制[J];兵工学报;1999年01期
3 吴淑珍,冯成林,黄新宇;噪声环境下语音识别方法研究[J];北京大学学报(自然科学版);2001年03期
4 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
5 王炜,刘峰,吴淑珍;RASTA滤波在语音通信质量客观评价中应用的研究[J];北京大学学报(自然科学版);2003年05期
6 吴淑珍,吴阿华;说话人识别的参量研究和语音库建设[J];北京大学学报(自然科学版);1995年03期
7 彭正旭,项欣,雷纪刚,许宝杰;小波变换与信号的时频分析[J];北京机械工业学院学报;1999年04期
8 任华新,鲜继清;一种改进的模极大值小波域的去噪算法研究[J];重庆邮电学院学报(自然科学版);2005年04期
9 柏逢明;;球墨铸铁内在质量音频检测方法研究[J];长春光学精密机械学院学报;1993年04期
10 胡柏青;魏峥;王伯雄;李安;;强噪条件下基于小波降噪的陀螺仪声信号处理方法[J];传感技术学报;2008年06期
中国博士学位论文全文数据库 前7条
1 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年
2 雷震春;支持向量机在说话人识别中的应用研究[D];浙江大学;2006年
3 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
4 王玥;说话人识别中语音特征参数提取方法的研究[D];吉林大学;2009年
5 马天义;低功耗软硬件划分算法研究[D];哈尔滨工业大学;2009年
6 张田昊;数据降维算法研究及其应用[D];上海交通大学;2008年
7 樊双义;连续作业与睡眠剥夺对认知功能的影响及机制研究[D];第三军医大学;2010年
中国硕士学位论文全文数据库 前10条
1 张晓枫;基于小波变换与GMM的说话人识别研究[D];西安电子科技大学;2002年
2 刘永红;说话人识别系统的研究[D];西南交通大学;2003年
3 章万锋;基于PCA与LDA的说话人识别研究[D];浙江大学;2004年
4 吴尊敬;说话人识别中的抗噪声技术[D];清华大学;2004年
5 张荣强;说话人识别中特征提取的方法研究[D];大连理工大学;2005年
6 马进;健康青年脑力疲劳认知能力评定指标的实验研究[D];第四军医大学;2005年
7 郭春霞;基于MFCC的说话人识别系统研究[D];西安电子科技大学;2006年
8 刘雪飞;基于小波分析方法的含噪声语音信号增强技术研究[D];燕山大学;2006年
9 丁爱明;基于MFCC和GMM的说话人识别系统研究[D];河海大学;2006年
10 曾海涛;说话人识别的研究与DSP实现[D];西南交通大学;2006年
【二级引证文献】
中国期刊全文数据库 前2条
1 徐欣;李枚亭;;基于频谱包络算法的语音转换研究[J];数字技术与应用;2011年09期
2 王松;孙传庆;朱正平;;基于GMM与改进MCE训练的说话人识别研究[J];自动化与仪器仪表;2010年06期
中国硕士学位论文全文数据库 前8条
1 申志生;文本相关说话人识别嵌入式系统及其关键技术研究[D];河北工业大学;2011年
2 牛鹏飞;信息隐藏技术在隐秘通信中的应用研究[D];北京化工大学;2011年
3 何心莹;基于DSP的语音编解码系统研究[D];北京化工大学;2011年
4 王坚;车载语音控制系统设计及DSP实现[D];苏州大学;2010年
5 王建青;基于图割理论的图像分割方法研究[D];陕西师范大学;2010年
6 姚黎;车载语音识别系统的语音增强方法研究[D];武汉理工大学;2012年
7 董少杰;基于DSP的通用语音编解码器的设计与实现[D];北京化工大学;2012年
8 戢琴;小型语音身份验证系统的研究及DSP实现[D];武汉科技大学;2012年
【二级参考文献】
中国期刊全文数据库 前5条
1 吴镇扬,张子瑜,李想,赵力;听觉场景分析的研究进展[J];电路与系统学报;2001年02期
2 李后强;分形理论在大分子科学及相关领域中的一些应用[J];大自然探索;1993年01期
3 裴留庆,顾勇;混沌与噪声[J];电子学报;1991年06期
4 郝柏林;分岔、混沌、奇怪吸引子、湍流及其它——关于确定论系统中的内在随机性[J];物理学进展;1983年03期
5 黄立基,丁菊仁;多标度分形理论及进展[J];物理学进展;1991年03期
【相似文献】
中国期刊全文数据库 前10条
1 王书诏;邱天爽;;说话人识别研究综述[J];电声技术;2007年01期
2 房晔;周亚滨;;基于概率神经网络说话人识别的算法研究[J];电子测量技术;2008年08期
3 李泽;崔宣;马雨廷;陈俊宇;;MFCC和LPCC特征参数在说话人识别中的研究[J];河南工程学院学报(自然科学版);2010年02期
4 陈皓,付中华,赵荣椿;基于G.729编码参数的语音特征及其应用[J];西北大学学报(自然科学版);2005年03期
5 王书诏;邱天爽;;与文本无关的说话人识别系统的设计[J];电声技术;2006年12期
6 谢迎春;;小波变换在说话人识别中的应用研究[J];武警工程学院学报;2009年02期
7 檀蕊莲;;小波消噪在说话人识别系统中的应用[J];科技资讯;2010年09期
8 赵立志;李辉;陈海东;魏士勇;;支持向量机在说话人识别系统中的应用[J];China's Foreign Trade;2011年14期
9 李战明;王贞;;矢量量化与神经网络相结合的说话人识别系统[J];计算机工程与应用;2006年15期
10 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
中国重要会议论文全文数据库 前10条
1 张彬桥;;基于主分量分析的说话人特征提取[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
2 许鑫;苏开娜;胡起秀;;几种改进的MFCC特征提取方法在说话人识别中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 张飞云;盛胜我;;混响声场中语音识别的未来与发展研究[A];2005年声频工程学术交流会论文集[C];2005年
4 赵美泽;王峰;;基于消除混响的语音识别技术研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
5 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
6 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
7 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
8 潘建军;孔宪梅;陈大融;;磨粒的分形纹理特征提取[A];第六届全国摩擦学学术会议论文集(上册)[C];1997年
9 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
10 王昌昌;王成儒;;一种改进的基于KPCA和SVM的文本无关说话人识别算法研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
6 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
7 新城;小声音 大前景[N];计算机世界;2006年
8 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
9 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
10 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
中国博士学位论文全文数据库 前10条
1 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年
2 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
3 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
4 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
5 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
6 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
7 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
8 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
9 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
10 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 王秀丽;说话人识别系统中特征提取和端点检测算法研究及系统的DSP实现[D];吉林大学;2006年
2 覃溪;基于文本无关的说话人识别研究[D];广西师范大学;2007年
3 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
4 张志霞;语音识别中个人特征参数提取研究[D];中北大学;2009年
5 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
6 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
7 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
8 陈卫;基于支持向量机的说话人识别系统研究[D];华北电力大学(河北);2005年
9 刘大鹏;会话语音中说话人识别的研究[D];重庆大学;2007年
10 王发智;说话人识别方法的研究[D];哈尔滨工程大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026