收藏本站
《苏州大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

耳语音说话人识别的研究

丁国梁  
【摘要】: 耳语音说话人识别是指根据包含在耳语音中的同说话人有关的信息来自动识别说话人,可以应用于电话银行、特殊场合的身份确认、公众场合下的通讯和国家安全的某些特殊需要等方面。它是一个较新的课题,有许多问题有待解决。 因为耳语音发音方式与正常音不同,所以两者在说话人识别上有着很大的差异。本文建立了基于GMM模型的说话人识别系统,通过研究文本无关的说话人辨认,比较了耳语音和正常音的区别并通过特征的修正优化了耳语音说话人识别系统。本文的工作主要体现在以下方面: 建立了22人的耳语音库和正常语音库,使用Mel倒谱系数(MFCC)、线性预测倒谱系数(LPCC)、差分Mel倒谱系数(ΔMFCC)、差分线性预测系数(ΔLPCC)和组合特征MFCC+LPCC作为特征参数,比较了正常音和耳语音的说话人识别效果。 利用耳语音库和正常语音库,本文比较了MFCC维数的变化对正常音和耳语音的说话人识别的影响。实验中正常音的说话人识别率在16维最高,而耳语音的说话人识别率在50维最高。 提出了一种MFCC的改进方法,分频段完成滤波器组的设计。将滤波器组的设计任务分配给各频段独立完成,使改进后的MFCC能更好的表现信号的局部频率特性。实验表明,改进后的MFCC可以有效地提升耳语音说话人识别系统的性能。
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TN912.34

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 董桂官;沈勇;;基于耳语频谱比较的话者识别方法[J];电声技术;2011年04期
中国硕士学位论文全文数据库 前1条
1 郭仲廉;越南南方人学习汉语语音的常见错误分析及其教学策略[D];广西大学;2011年
【参考文献】
中国期刊全文数据库 前5条
1 沙丹青,栗学丽,徐柏龄;耳语音声调特征的研究[J];电声技术;2003年11期
2 樊星;卢晶;徐柏龄;;汉语耳语音转换为正常音的研究[J];电声技术;2005年12期
3 郑方 ,张国亮 ,宋战江;Comparison of Different Implementations of MFCC[J];Journal of Computer Science and Technology;2001年06期
4 杨莉莉,李燕,徐柏龄;汉语耳语音库的建立与听觉实验研究[J];南京大学学报(自然科学版);2005年03期
5 林玮;杨莉莉;徐柏龄;;基于修正MFCC参数汉语耳语音的话者识别[J];南京大学学报(自然科学版);2006年01期
中国重要会议论文全文数据库 前1条
1 温源;侯震;李明;王之禹;俞铁城;;Mel刻度上非均匀分布滤波器组在MFCC参数提取中的应用[A];第六届全国人机语音通讯学术会议论文集[C];2001年
【共引文献】
中国期刊全文数据库 前10条
1 张小燕;普通话上声变调与轻声分析[J];阿坝师范高等专科学校学报;2004年02期
2 孔慧芳;张萍;;合肥方音中特有韵母变化的社会语言学分析[J];安徽农业大学学报(社会科学版);2006年03期
3 王银霞;;河南方言中“个”的弱化与音系-句法协同[J];安徽工业大学学报(社会科学版);2009年06期
4 王伟华;;法语二外语音教学刍议[J];安徽文学(下半月);2008年03期
5 胡建;;关于音位归纳中语音相似性判定的尝试[J];安徽文学(下半月);2010年06期
6 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
7 胡钢,沈文轩;一种基于噪声动态检测的语音端点检测算法[J];鞍山科技大学学报;2004年02期
8 张士东;;从语音角度看英、日、汉语的差别和联系[J];鞍山师范学院学报;2006年01期
9 胡钢;;一种语音端点检测算法在DSP上的实现[J];鞍山师范学院学报;2009年06期
10 左岩;浅析韵律研究中的几个概念[J];北京大学学报(外国语言文学专刊);1999年S1期
中国重要会议论文全文数据库 前10条
1 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
2 李冰锋;谢磊;周祥增;付中华;张艳宁;;实时语音驱动的虚拟说话人[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 李雅;卢颖超;许小颖;陶建华;;连续语流中韵律层级和调型组合对重音感知的影响[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 郑玉玲;周学文;;调音部位的分区与命名[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 李冰锋;谢磊;周祥增;付中华;张艳宁;;实时语音驱动的虚拟说话人[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
8 李雅;卢颖超;许小颖;陶建华;;连续语流中韵律层级和调型组合对重音感知的影响[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
9 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
10 周杰;;留学生语音教学之我见[A];语言与文化研究(第一辑)[C];2007年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 柳春;甘肃临夏方言回腔语音格局研究[D];西北民族大学;2010年
3 于辉;汉语借词音系学[D];南开大学;2010年
4 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
5 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
6 姜燕;汉语口语美学研究[D];山东师范大学;2011年
7 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
8 秦曰龙;清抄本《五音通韵》研究[D];吉林大学;2011年
9 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
10 金星;听障儿童韵律词重音的声学特征及生成特征的研究[D];华东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 王萍;语音情感识别研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
4 宝乐儿;初级阶段蒙古学生汉语发音偏误分析及相应的教学对策[D];上海外国语大学;2010年
5 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
6 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
7 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
8 杨文强;基于AMBE-2000的OFDM水声语音通信平台研究[D];哈尔滨工程大学;2010年
9 陈伟伟;基于鼾声检测的睡眠呼吸暂停低通气综合症诊断[D];大连理工大学;2010年
10 翟文博;基于SIP协议框架的语音通信系统的研究与设计[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 沈丽娜;于艳华;;对外汉语语音教学中声母教学研究[J];长春理工大学学报(社会科学版);2009年03期
2 李太生;;现代越南语新词发展趋势及其越汉翻译探讨[J];东南亚纵横;2008年05期
3 杨阳;陈永明;;声纹识别技术及其应用[J];电声技术;2007年02期
4 周忠诚;王孟杰;于水源;;汉语双音节中第一音节的元音共振峰轨迹研究[J];电声技术;2007年03期
5 许建中;现代汉语语音教学艺术探讨[J];达县师范高等专科学校学报;2003年03期
6 黄惠明,王瑛,赵思伟,张知易;语音系统客观音质评价研究[J];电子学报;2000年04期
7 关英伟;;对外汉语语音教学的盲点——试论朗读教学在对外汉语语音教学中的作用[J];桂林师范高等专科学校学报;2008年03期
8 刘莉芳;;现代汉语语音教学的几点思考[J];桂林师范高等专科学校学报;2009年01期
9 韦树关;论越南语中的汉越音与汉语平话方言的关系[J];广西民族学院学报(哲学社会科学版);2001年02期
10 张万里,刘桥;Mel频率倒谱系数提取及其在声纹识别中的作用[J];贵州大学学报(自然科学版);2005年02期
中国博士学位论文全文数据库 前3条
1 花玉山;汉越音与字喃研究[D];南京师范大学;2005年
2 Nghiem Thuy Hang(严翠恒);汉越语音系及其与汉语的对应关系[D];北京语言大学;2006年
3 汪云路;语音隐藏分析方法研究[D];中国科学技术大学;2008年
中国硕士学位论文全文数据库 前8条
1 傅氏梅;论越南学生对汉语声母的听觉与发音偏误[D];北京语言文化大学;2001年
2 严翠恒;汉越语音系及其与现代汉语的声母对应关系[D];北京语言文化大学;2002年
3 赵博;中文语音合成系统的评测方法研究[D];清华大学;2005年
4 戚建宇;普通话单字发音客观评价方法研究[D];苏州大学;2006年
5 陈翠珠;越南语语调对学习汉语语调的影响研究[D];云南师范大学;2006年
6 潘欣裕;汉语耳语音特征分析与应用研究[D];苏州大学;2007年
7 黎翠云;越南人学习汉语语音的偏误分析及教学策略[D];天津大学;2007年
8 杜梅芳;论汉越词辅音的演变[D];天津师范大学;2009年
【二级参考文献】
中国期刊全文数据库 前9条
1 沙丹青,栗学丽,徐柏龄;耳语音声调特征的研究[J];电声技术;2003年11期
2 刘莹,李国锋;用线性预测法实现气声语音的重建[J];电声技术;1995年09期
3 刘鸣,戴蓓倩,李辉,陆伟,李霄寒;鲁棒性话者辨识中的一种改进的马尔科夫模型[J];电子学报;2002年01期
4 黄金才,陈文伟,赵侠,黄宏斌,张维明,邓苏;基于高维空间划分的神经网络分类学习模型[J];南京大学学报(自然科学版);2003年02期
5 栗学丽,徐柏龄;混响声场中语音识别方法研究[J];南京大学学报(自然科学版);2003年04期
6 杨莉莉,李燕,徐柏龄;汉语耳语音库的建立与听觉实验研究[J];南京大学学报(自然科学版);2005年03期
7 梁之安;;汉语普通话中声调的听觉辨认依据[J];生理学报;1963年02期
8 栗学丽,丁慧,徐柏龄;基于熵函数的耳语音声韵分割法[J];声学学报;2005年01期
9 于华;耳语不利于声嘶治疗与嗓音恢复[J];中央民族大学学报(自然科学版);1996年02期
【相似文献】
中国期刊全文数据库 前10条
1 沙丹青,栗学丽,徐柏龄;耳语音声调特征的研究[J];电声技术;2003年11期
2 杨莉莉,李燕,徐柏龄;汉语耳语音库的建立与听觉实验研究[J];南京大学学报(自然科学版);2005年03期
3 孙静;陶智;顾济华;赵鹤鸣;;基于AD神经网络的耳语音增强的研究[J];计算机工程与应用;2007年29期
4 樊星;卢晶;徐柏龄;;汉语耳语音转换为正常音的研究[J];电声技术;2005年12期
5 林玮;杨莉莉;徐柏龄;;基于修正MFCC参数汉语耳语音的话者识别[J];南京大学学报(自然科学版);2006年01期
6 孙静;陶智;顾济华;赵鹤鸣;;基于LMS自适应滤波的耳语音增强的研究[J];通信技术;2007年12期
7 荣薇;陶智;顾济华;赵鹤鸣;;基于概率神经网络的汉语耳语音识别系统[J];计算机工程与应用;2008年17期
8 吕岗;赵鹤鸣;刘建新;龚呈卉;;有效提取耳语音共振峰的改进方法[J];计算机工程与应用;2009年19期
9 丁国梁;;基于修正MFCC的耳语说话人识别方法[J];苏州大学学报(工科版);2009年04期
10 谈雪丹;顾济华;赵鹤鸣;陶智;沈圆圆;;基于HHT瞬时能频值的含噪耳语音声韵分割[J];通信技术;2010年06期
中国重要会议论文全文数据库 前7条
1 邵怀宗;卢志恒;彭启琮;;基于最小均方误差幅度谱的耳语音增强算法[A];2010年通信理论与信号处理学术年会论文集[C];2010年
2 吕岗;赵鹤鸣;;汉语耳语音共振峰频率的提取[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
3 杨莉莉;徐柏龄;;汉语耳语音声调识别研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
4 谈雪丹;顾济华;陶智;吴迪;;基于HHT的耳语音声韵分割[A];2009年度全国物理声学会议论文集[C];2009年
5 尹辉;茹婷婷;谢湘;;汉语耳语音数字串识别研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
6 林玮;;新型汉语耳语音频率尺度在说话人识别中的应用[A];2011'中国西部声学学术交流会论文集[C];2011年
7 陈雪琴;赵鹤鸣;;基于听觉模型的汉语耳语音声调检测[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
中国博士学位论文全文数据库 前1条
1 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年
中国硕士学位论文全文数据库 前10条
1 黄程;汉语耳语音重建的研究[D];安徽大学;2013年
2 谈雪丹;基于扩展型双线性变换法的耳语音转换为正常语音的研究[D];苏州大学;2010年
3 王敏;基于瞬时频率估计的耳语音说话人识别研究[D];苏州大学;2010年
4 钱晓红;分数阶傅里叶变换在耳语音说话人识别研究中的应用[D];苏州大学;2012年
5 徐娟;清辅音特征分析及其在耳语音说话人识别中的应用[D];苏州大学;2013年
6 荣薇;基于概率神经网络的汉语耳语音识别的研究[D];苏州大学;2008年
7 顾晓江;不匹配信道下耳语音说话人识别研究[D];苏州大学;2011年
8 丁国梁;耳语音说话人识别的研究[D];苏州大学;2009年
9 韩韬;基于RBF神经网络的汉语耳语音转换为正常语音的研究[D];苏州大学;2009年
10 龚呈卉;汉语耳语音声道特性分析及其在汉语耳语感知研究中的应用[D];苏州大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026