收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

噪声环境下说话人识别的研究

包永强  
【摘要】: 作为一种基于生物特征信息的身份识别方法,说话人识别通过语音来识别说话人的身份,说话人识别在电子商务、消费、银行等远程客户服务的身份认证、军事安全领域的说话人身份自动检测和认证中具有极大的应用价值和广泛的应用前景,是当今语音信号处理和生物特征信息检测和识别领域的重要研究方向。 由于说话人个性以及实际应用环境的复杂性,说话人识别技术虽然取得了一定的进步,其瓶颈效应也逐步显现,进一步提高比较困难,离真正的实际应用还有一段距离。 本文从端点检测、语音增强、特征提取、后端处理等角度对说话人识别进行了研究,取得了一些研究成果。 本文首先回顾了说话人识别的研究发展历程,指出了目前说话人识别研究的热点和难点。 语音信号具有混沌的特征,分形维理论是描述混沌信号的一种手段,本文从分形维的定义出发,提出了一种新的基于波形的算法(Improvement Fractal Dimension algorithm Based on Wave :IBW-FD)。该算法只需计算波形长度,与盒维、Katz维相比,计算更加简单。通过分形布朗曲线验证了该算法比盒维和Katz维具有更高的精确度,在高斯白噪声和三种非平稳噪声下该算法与盒维、Katz维相比抗干扰能力更强。端点检测是说话人识别系统的第一步,一直是语音信号处理研究的热点。本文根据语音和噪声的特点,将前面提出的IBW分形维引入端点检测,将之与能量的方法相结合,提出了一种基于能量和分维的联合端点检测方法(VAD way of unite energy and fractal dimension:UEFD)。 寻找新的有效的说话人识别特征参数和已有特征参数的有效组合是说话人识别参数提取研究的热点。本文将前面提出的IBW分形维与MFCC特征参数有机结合,作为说话人识别系统的混合特征参数。通过实验发现,新的混合特征具有一定优势。 基于离散余弦变换的语音增强方法是目前国内外语音增强领域内研究的热点,而对于离散分数余弦变换的研究国际上还比较少,而国内外对于离散分数余弦变换的应用研究就更少,本文基于态函数,提出了两种基于态函数的离散分数余弦变换方法——二周期离散分数余弦变换和三周期离散分数余弦变换;并把它们应用于语音增强中,结合了语音增强的特点,提出了四种基于离散分数余弦变换的语音增强方法——基于二周期离散分数余弦变换的语音增强算法(speech enhancement based on two cycles Discrete Fractional cosine Transform:FDCT2)、改进的基于二周期离散分数余弦变换的语音增强算法(speech enhancement based on modified two cycles Discrete Fractional cosine Transform:MFDCT2)、基于三周期离散分数余弦变换的语音增强算法(speech enhancement based on three cycles Discrete Fractional cosine Transform :FDCT3)和改进的基于三周期离散分数余弦变换的语音增强算法(speech enhancement based on modified three cycles Discrete Fractional cosine Transform :MFDCT3)等四种算法,结果表明本文提出的几种算法要优于常规的DCT算法。 在噪声环境下语音增强的研究中多级滤波方法具有明显的优势,其中欧洲电信标准化协会提出的两级MEL域维纳滤波结构具有较优良的降噪效果。但缺点是结构复杂,反复的时域-频域转换带来计算量的急剧上升;研究发现,单纯地从时域或变换域很难消除语音中存在的噪声和干扰,而分数余弦变换是一种非常优良的分析工具,本文将前面提出的基于态函数的分数余弦变换应用于语音增强中,提出了分数余弦变换


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王书诏;邱天爽;;说话人识别研究综述[J];电声技术;2007年01期
2 房晔;周亚滨;;基于概率神经网络说话人识别的算法研究[J];电子测量技术;2008年08期
3 李泽;崔宣;马雨廷;陈俊宇;;MFCC和LPCC特征参数在说话人识别中的研究[J];河南工程学院学报(自然科学版);2010年02期
4 陈皓,付中华,赵荣椿;基于G.729编码参数的语音特征及其应用[J];西北大学学报(自然科学版);2005年03期
5 王书诏;邱天爽;;与文本无关的说话人识别系统的设计[J];电声技术;2006年12期
6 谢迎春;;小波变换在说话人识别中的应用研究[J];武警工程学院学报;2009年02期
7 檀蕊莲;;小波消噪在说话人识别系统中的应用[J];科技资讯;2010年09期
8 赵立志;李辉;陈海东;魏士勇;;支持向量机在说话人识别系统中的应用[J];China's Foreign Trade;2011年14期
9 李战明;王贞;;矢量量化与神经网络相结合的说话人识别系统[J];计算机工程与应用;2006年15期
10 谢建勋;;浅谈说话人识别技术[J];电脑知识与技术;2011年11期
11 李姮;胡维平;;基于GMM的说话人识别[J];广西物理;2011年01期
12 丁爱明;;作为说话人识别特征参量的M FCC的提取过程[J];电子工程师;2006年01期
13 丁宁;沈二波;杨红卫;;小麦音频信号预处理方法的研究[J];农机化研究;2010年08期
14 何朝霞;潘平;;说话人识别中改进的MFCC参数提取方法[J];科学技术与工程;2011年18期
15 岳喜才;叶大田;;文本无关的说话人识别:综述[J];模式识别与人工智能;2001年02期
16 李守轩;张华;刘继忠;朱克华;;基于DTW的轮椅命令字识别系统研究[J];电声技术;2008年02期
17 郭春霞;;基于VQ的说话人识别系统实现[J];电脑知识与技术;2009年29期
18 郭春霞;;说话人识别算法的研究[J];西安邮电学院学报;2010年05期
19 檀蕊莲;;矢量量化在说话人识别中的应用[J];黑龙江科技信息;2010年14期
20 陈杰;张玲华;;说话人识别中语音特征参数的研究[J];信息技术;2006年11期
中国重要会议论文全文数据库 前10条
1 张彬桥;;基于主分量分析的说话人特征提取[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
2 许鑫;苏开娜;胡起秀;;几种改进的MFCC特征提取方法在说话人识别中的应用[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 张飞云;盛胜我;;混响声场中语音识别的未来与发展研究[A];2005年声频工程学术交流会论文集[C];2005年
4 赵美泽;王峰;;基于消除混响的语音识别技术研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
5 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
6 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
7 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
8 潘建军;孔宪梅;陈大融;;磨粒的分形纹理特征提取[A];第六届全国摩擦学学术会议论文集(上册)[C];1997年
9 崔玉红;胡光锐;;基于神经网络特征维数压缩方法及其在说话人识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
10 王昌昌;王成儒;;一种改进的基于KPCA和SVM的文本无关说话人识别算法研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年
2 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
3 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
4 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
5 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
6 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
7 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
8 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
9 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
10 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 王秀丽;说话人识别系统中特征提取和端点检测算法研究及系统的DSP实现[D];吉林大学;2006年
2 覃溪;基于文本无关的说话人识别研究[D];广西师范大学;2007年
3 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
4 张志霞;语音识别中个人特征参数提取研究[D];中北大学;2009年
5 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
6 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
7 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
8 陈卫;基于支持向量机的说话人识别系统研究[D];华北电力大学(河北);2005年
9 刘大鹏;会话语音中说话人识别的研究[D];重庆大学;2007年
10 王发智;说话人识别方法的研究[D];哈尔滨工程大学;2008年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
6 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
7 新城;小声音 大前景[N];计算机世界;2006年
8 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
9 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
10 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978