收藏本站
《重庆大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

说话人识别算法研究及SOPC设计

顾彦飞  
【摘要】: 说话人识别技术属于生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。凭借其独特的经济性、准确性和方便性等优势,说话人识别技术已广泛应用于通信、公安、金融、司法及其它民用安全认证领域。 本文围绕文本无关的说话人识别系统展开研究工作。在对语音预处理、说话人特征提取和识别算法深入研究和实验验证的基础上,设计了一套切实可行的系统小型化架构方案;结合Nios II嵌入式处理器和FPGA自身特点,对整个算法进行了合理的选择与优化,设计了基于SOPC的文本无关的开集说话人识别系统。论文的主要研究内容包括以下几个方面: 1.研究了基于高斯统计模型的VAD算法,并针对语音中的噪声存在性以及DD参数估计算法的帧延迟特性,构建了基于TSNR估计方法的子频带加权VAD算法,提高了高斯统计模型VAD算法的鲁棒性。实验表明,此子频带加权算法优于Sohn、Cho以及G.729B等全频带算法。 2.研究了常见的说话人特征提取以及识别算法,重点分析和验证了MFCC类和声源类特征参数以及基于VQ和GMM算法的二级识别结构对说话人识别系统的影响。实验表明,采用MFCC及其差分系数、帧对数能量和Renyi熵构成的混合特征参数,能够充分刻画说话人的声道和声源特征,使说话人识别系统达到最佳的识别性能;MFCC与帧对数能量构成的混合特征参数占用空间及识别时间最少,系统识别性能较好,最适合嵌入式系统实现;二级识别算法在保证或优于GMM识别算法精度的同时,降低了系统实现的计算复杂度。 3.在基于SOPC的设计平台上,采用MFCC与帧对数能量混合特征参数以及基于VQ和GMM的二级识别算法,构建了完整的开集说话人识别系统以及良好的人机交互接口,实现了语音的实时采集与处理、用户键盘注册与系统输出显示等功能,并通过实际测试验证了说话人识别系统工作的可靠性。 系统实验结果表明,本文所设计的系统整体方案有效可行,基于SOPC的说话人识别系统在速度、精度、可扩展性等方面具有独特的优势,是说话人识别系统小型化的一种切实可行的解决方案,具有良好的发展空间。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TN912.34

【相似文献】
中国期刊全文数据库 前10条
1 崔玉红,胡光锐,何旭明;基于混合进化计算的GMM优化方法及其在说话人辨认中的应用[J];应用科学学报;2002年02期
2 马建,郭建东;说话人识别技术研究[J];福建电脑;2005年01期
3 林平澜;王仁华;;动态HMM及其在说话人识别中的应用[J];信号处理;1993年04期
4 周静芳,陈一宁,李科,刘加;基于高斯语音滤波的稳健文本无关说话人识别[J];计算机工程;2005年02期
5 邓浩江,王守觉,邢藏菊,李倩;基于聚类统计与文本无关的说话人识别研究[J];电路与系统学报;2001年03期
6 王炜,王炳锡,王波;信道补偿技术的发展及其在说话人识别上的应用[J];电声技术;2004年04期
7 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
8 廖贵成,罗文广;一种基于说话人识别技术的自动音量控制系统[J];桂林电子工业学院学报;2004年06期
9 韩雁,陈利华;说话人计算机识别系统的设计与实现[J];浙江大学学报(工学版);2001年02期
10 吴晓娟,韩先花,聂开宝;模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别[J];电子与信息学报;2002年06期
中国重要会议论文全文数据库 前10条
1 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
2 李剑;郭西进;;基于SOPC的实时说话人识别系统的研究[A];2009全国虚拟仪器大会论文集(二)[C];2009年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 周昊朗;王岚;陈珂;;一个面向说话人识别的汉语语音数据库[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 周昊朗;王岚;吴玺宏;迟惠生;;一个面向说话人识别的汉语语音数据库[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
6 侯丽敏;谢娟敏;;共振峰瞬时频率特征用于说话人识别[A];第九届中国语音学学术会议论文集[C];2010年
7 周静芳;陈一宁;刘润生;;一种新的说话人识别信道补偿技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
8 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
9 卓群;欧贵文;;基于模糊高斯混合模型的说话人识别算法的一些改进[A];第六届全国人机语音通讯学术会议论文集[C];2001年
10 王宏;潘金贵;;基于矩阵正态分布的文本有关说话人识别[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 吴长锋;科大讯飞勇夺说话人识别国际大赛第一[N];科技日报;2008年
2 汪永安;科大讯飞说话人识别技术世界领先[N];安徽日报;2008年
3 本报记者 王小庆;PLD厂商“热炒”SOPC[N];中国电子报;2002年
4 王朝选;科大讯飞语音识别技术取得重大进展[N];中国高新技术产业导报;2008年
5 见习记者 向南;科大讯飞语音识别技术国际领先[N];证券时报;2008年
6 新城;小声音 大前景[N];计算机世界;2006年
7 文宇;不断突破:PLD发展主旋律[N];中国电子报;2001年
8 本报记者 王璐;科大讯飞:挖掘“说话”技术的商机[N];上海证券报;2008年
9 本报记者 池安云;FPGA与ASIC厂商联合发展[N];中国电子报;2000年
10 赵艳秋;PLD厂商纷纷变招[N];中国电子报;2003年
中国博士学位论文全文数据库 前10条
1 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
2 姜涛;网络环境下说话人识别关键技术研究[D];哈尔滨工业大学;2011年
3 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
4 黄挺;情感说话人识别中的基频失配及其补偿方法研究[D];浙江大学;2011年
5 李邵梅;文本无关短语音说话人识别技术研究[D];解放军信息工程大学;2011年
6 綦声波;SOPC Plus协同设计架构及在AMT中的应用研究[D];山东大学;2011年
7 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
8 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
9 付中华;说话人识别系统鲁棒性研究[D];西北工业大学;2004年
10 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 顾彦飞;说话人识别算法研究及SOPC设计[D];重庆大学;2010年
2 胡又文;基于FPGA的嵌入式说话人识别系统实现[D];重庆大学;2007年
3 张伟伟;说话人识别技术的研究[D];燕山大学;2010年
4 李伟娟;基于智能群体和盲源分离的说话人识别[D];兰州理工大学;2010年
5 王芳;说话人识别中一种特征参数的研究[D];安徽工业大学;2010年
6 傅庚申;说话人识别算法研究[D];大连理工大学;2005年
7 潘鹏;会议室环境下基于音频视频信息融合的多说话人识别[D];兰州理工大学;2011年
8 杨延龙;与文本无关的说话人识别的关键技术研究[D];西安电子科技大学;2010年
9 徐良军;基于语音信号时变特性的说话人识别[D];苏州大学;2010年
10 陈文翔;面向OPHONE手机的说话人识别技术移植研究[D];浙江大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026