收藏本站
《三峡大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

说话人识别中特征参数的提取及优化研究

朱建伟  
【摘要】:说话人识别技术是语音信号处理一个研究热点。特征提取和模式匹配是说话人识别技术的关键,特征选取与优化处理能够提高识别率,本文所做的主要工作如下: 一、在语音信号前端处理时,为了提高在强噪声环境下语音端点检测的准确度,提出基于子带二次谱熵的端点检测算法。该算法把子带二次谱熵作为端点检测新的特征参数,将有限状态机判别方法与子带二次谱熵相结合,有效地解决单门限法易出现的两类误判。与传统的短时能量与过零率结合法、谱熵法两种方法相比,基于子带二次谱熵的端点检测算法具有准确性高,抗噪性强等优点。 二、提取基音轮廓特征时,分析了现有功率谱二次处理基音检测方法的不足:对于过渡语音,易产生半频或倍频误判;噪声干扰下,检测结果易失真;清、浊音的判断方法复杂。针对不足,提出一系列改进方法:时域非线性处理,频域加窗滤波,简化清、浊音判断。仿真实验结果表明,无论是高信噪比还是低信噪比语音,改进的二次谱法较传统的平均幅度差函数(AMDF)法和二次谱法更能清晰、准确地检测出基音轨迹。 三、提出了新的特征组合参数:基于人的听觉特性的Mel频率倒谱系数(MFCC)参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率作为说话人识别系统的特征参数,实验结果表明,使用该参数较单独使用MFCC参数的说话人识别系统识别率提高了2%-3%。 四、为了提高MFCC作为说话人识别特征参数的识别率,提出了基于Fisher比及相关距离的MFCC提取方法,并根据Fisher比及相关距离的值,采用两种方法对MFCC参数分析:降维、窗函数倒谱提升。仿真实验表明:降维方法能使识别率提高10%-15%;新的特征加权的识别率较传统的raised-sine和half raised-sine窗提高了10%-20%。 本文主要对说话人识别的特征提取与优化处理进行研究。在识别的前端,使用了较准确的端点处理方法;选取了基音轮廓、MFCC组合特征,并给出了MFCC优化方法。本文的研究工作有助于说话人识别率的提高,有助于特征提取与优化方法的进一步发展。
【学位授予单位】:三峡大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TN912.34

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 丁佩律,张立明;结合主分量分析及Fisher准则的说话人识别方法研究[J];电路与系统学报;2002年01期
3 李战明,王贞;基于小波包分析特征参数的说话人识别系统[J];电声技术;2005年06期
4 李昱;林志谋;黄云鹰;卢贵主;;基于短时能量和短时过零率的VAD算法及其FPGA实现[J];电子技术应用;2006年09期
5 刘鸣,戴蓓倩,李辉,陆伟,李霄寒;鲁棒性话者辨识中的一种改进的马尔科夫模型[J];电子学报;2002年01期
6 刘建;郑方;邓菁;吴文虎;;基于混合幅度差函数的基音提取算法[J];电子学报;2006年10期
7 汪峥,连翰,王建军;说话人识别中特征参数提取的一种新方法[J];复旦学报(自然科学版);2005年01期
8 黄秋安,姜波,汪秉文;基于有限状态机的汉语数字语音端点检测[J];湖北大学学报(自然科学版);2004年01期
9 张天骐;张战;林孝康;权进国;;一种语音信号基音检测的功率谱二次处理方法[J];计算机工程;2006年01期
10 杨志华;齐东旭;杨力华;;一种基于Hilbert-Huang变换的基音周期检测新方法[J];计算机学报;2006年01期
中国博士学位论文全文数据库 前3条
1 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
2 钱博;基于汉语元音映射的说话人识别技术研究[D];南京理工大学;2007年
3 许东星;基于GMM和高层信息特征的文本无关说话人识别研究[D];中国科学技术大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 相征;朗朗;王静;;基于基音频能值的端点检测算法[J];安徽工程科技学院学报(自然科学版);2008年03期
2 吕军;马晓娜;;汉语孤立词声韵分割算法的研究[J];安徽师范大学学报(自然科学版);2008年03期
3 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
4 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
5 邓勇,施文康;基于TMS320C50的语音频谱分析仪[J];兵工自动化;2000年03期
6 徐俊晓,谢锋,江建平,莫运明,郑中华;我国12种无尾类的鸣叫特征参数[J];动物学杂志;2005年03期
7 冯成林,吴淑珍;一种噪声环境下的语音识别方法(线性预测误差法)的研究[J];北京大学学报(自然科学版);2000年05期
8 黄新宇,吴淑珍;基于单边自相关线性预测噪声中汉语语音识别[J];北京大学学报(自然科学版);2000年05期
9 刘敬伟,程乾生;基于动态时间规划的基因芯片数据识别[J];北京大学学报(自然科学版);2002年05期
10 段新,黄新宇,吴淑珍;与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J];北京大学学报(自然科学版);2003年05期
中国重要会议论文全文数据库 前10条
1 韩志艳;王健;伦淑娴;王旭;;基于小波包变换的语音信号鲁棒特征提取[A];第二十九届中国控制会议论文集[C];2010年
2 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
3 徐晨;曹辉;;一种语音信号生成的数字模型的研究[A];第二届西安-上海两地声学学术会议论文集[C];2011年
4 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 哈妮克孜·伊拉洪;帕力旦·赛力提尼牙孜;那斯尔江·吐尔逊;吾守尔·斯拉木;;维吾尔人说汉语普通话发音特点的声学分析[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
8 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
9 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
10 牟峰;俞铁城;杨道淳;;新型半波语音编解码的实现[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 范迪;沉渣厚度超声检测信号处理技术研究及应用[D];山东科技大学;2010年
2 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
3 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
4 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
5 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
6 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
7 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
8 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
9 谢春辉;音频隐藏分析方法研究[D];中国科学技术大学;2011年
10 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
2 王萍;语音情感识别研究[D];山东科技大学;2010年
3 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
4 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
5 刘继芳;基于计算听觉场景分析的混合语音分离研究[D];哈尔滨工程大学;2009年
6 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
7 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
8 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
9 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
10 楼佳;基于网络QoS的AMR语音编码算法研究[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 张天骐,周正中;直扩信号伪码周期的谱检测[J];电波科学学报;2001年04期
3 刘鸣,戴蓓倩,李辉,李霄寒,陆伟;基于离散小波变换和感知频域滤波的语音特征参数[J];电路与系统学报;2000年01期
4 丁佩律,张立明;结合主分量分析及Fisher准则的说话人识别方法研究[J];电路与系统学报;2002年01期
5 马志友,杨莹春,吴朝晖;二次特征提取及其在说话人识别中的应用[J];电路与系统学报;2003年02期
6 陈永彬;;位片式线性预测声码器设计[J];南京工学院学报;1985年02期
7 胡光锐,韦晓东;基于倒谱特征的带噪语音端点检测[J];电子学报;2000年10期
8 李虎生,刘加,刘润生;高性能汉语数码串语音识别[J];电子学报;2001年05期
9 张文耀,许刚,王裕国;循环AMDF及其语音基音周期估计算法[J];电子学报;2003年06期
10 赵莹 ,高隽 ,汪荣贵 ,胡静;一种新的广义最近邻方法研究[J];电子学报;2004年S1期
中国博士学位论文全文数据库 前3条
1 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
2 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年
3 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
2 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期
3 单进;;说话人识别技术研究[J];科技资讯;2010年21期
4 毛大伟;曹华;木拉提.哈米提;童勤业;;基于美尔倒谱系数和复杂性的说话人识别[J];生物医学工程学杂志;2006年04期
5 罗利;张友纯;;基于改进后的VQ说话人识别系统研究[J];软件导刊;2008年12期
6 武妍,金明曦,王洪波;基于KL-小波包分析的文本无关的说话人识别[J];计算机工程与应用;2005年04期
7 崔玉红,胡光锐,何旭明;基于混合进化计算的GMM优化方法及其在说话人辨认中的应用[J];应用科学学报;2002年02期
8 马建,郭建东;说话人识别技术研究[J];福建电脑;2005年01期
9 王吉林;利用矢量量化的说话人识别系统的研究[J];安徽工业大学学报(自然科学版);2005年03期
10 李财莲;赵小阳;王丽娟;岳振军;;说话人识别中关键技术的现状与发展[J];军事通信技术;2005年02期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
5 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
6 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
7 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 鲍福良;方志刚;徐洁;;说话人识别综述[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
4 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
5 新城;小声音 大前景[N];计算机世界;2006年
6 本报记者 王璐;科大讯飞:挖掘“说话”技术的商机[N];上海证券报;2008年
7 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
8 任效良;科大科研成果填补国际空白[N];北方经济时报;2007年
9 陈泰 记者 吴长锋;安徽隆起创新人才高地[N];科技日报;2009年
10 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
3 蒋晔;基于短语音和信道变化的说话人识别研究[D];南京理工大学;2013年
4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
5 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
6 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
7 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年
8 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
9 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
10 王玥;说话人识别中语音特征参数提取方法的研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
2 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
3 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
4 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
5 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
6 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
7 陈强;基于GMM的说话人识别系统研究与实现[D];武汉理工大学;2010年
8 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
9 黄肖忠;基于韵律特征的SVM说话人识别[D];中国科学技术大学;2010年
10 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026