收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

声纹识别在声控系统中的研究与实现

付浩楠  
【摘要】:随着人类数字化生活需求的增加和多媒体时代的来临,人们越来越渴望打破过去传统的人机交互模式,寻找一种更加自然、友好、稳定的交互方式。近期iphone4s的Siri语音控制功能的推出再一次引领了语音识别的研究热潮。本文正是在这种背景之下,通过构建基于Windows的语音控制系统作为声纹识别的具体应用环境,将声纹识别和语音识别结合起来,实现一个具有声纹识别功能的分权限语音控制系统。同时将本文的研究重心放在声纹识别相关技术的研究中,以寻求一种具备声纹识别功能的人性化交互模式。本文的具体工作如下: 本文首先介绍了基于GMM(Gaussian Mixture Model)的声纹识别和基于Speech SDK(Software Development Kit)的语音控制的关键技术。针对传统GMM和GMM-UBM(Universal Background Model)受训练样本量的制约和说话人被强制趋于统一分布的弱点,本文提出了基于区分性GMM的建模方法和区分性识别方法,以增加说话人之间的差异性为出发点,使模型能够更好的拟合说话人特征矢量的空间分布。同时将建模过程中衍生的两个具有区分性的子UBM作为特征空间性别分类器,来划分特征空间和模板库,从而提高系统的识别率和响应速度。 其次本文针对传统的K-means聚类算法只具备局部寻优能力和对初始聚类中心及噪声点敏感的弱点,本文提出了基于密度和方差的加权距离聚类、基于模拟退火思想的全局优化聚类算法应用到声学特征类的形成。通过改进的聚类算法使呈现椭圆形分布的高维语音数据能够更精确的形成声学特征类,使各阶单高斯分量承担更精确的数据,进而提高系能性能,同时此算法也可被推广到其他领域中。 最后本文基于区分性GMM和Speech SDK语音识别引擎及Windows API(Application Program Interface)函数和消息响应机制的基础之上,构建了具有声纹识别功能的分权限语音控制系统,完成了具备声纹识别功能的人机交互的目标。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张万里,刘桥;Mel频率倒谱系数提取及其在声纹识别中的作用[J];贵州大学学报(自然科学版);2005年02期
2 于哲舟,杨佳东,蒲东兵,周春光,王纲巧;多门限声纹识别方法[J];吉林大学学报(信息科学版);2005年02期
3 陈幼松;从“芝麻开门”到声纹识别[J];百科知识;2003年01期
4 任培花;孙宏志;;基于言语过滤、情感补偿的活体声纹识别系统的设计[J];重庆科技学院学报(自然科学版);2007年01期
5 侯波;普运伟;;基于模糊聚类的矢量量化的声纹识别研究[J];昆明理工大学学报(理工版);2010年05期
6 刘杰;声纹识别技术实现呼叫中心个性化服务[J];互联网周刊;2001年31期
7 蔡耿平,黄顺珍,徐志鸿,蓝波,范国华,梁凡;声纹识别系统[J];深圳大学学报(理工版);2002年02期
8 黄成玉;张全柱;赖斌;;声纹识别中MEL参数的提取研究[J];电源技术;2011年04期
9 于哲舟,杨佳东,周春光,王纲巧;智能仪器嵌入式声纹识别技术方法[J];仪器仪表学报;2004年S2期
10 张震;王化清;;语音信号特征提取中Mel倒谱系MFCC的改进算法[J];计算机工程与应用;2008年22期
11 冯清技;声纹识别技术在电话侦听系统中的应用[J];警察技术;2002年05期
12 胡进;胡桂明;毛世榕;;基于RBF神经网络的声纹识别的研究[J];网络安全技术与应用;2010年12期
13 黎粤华,谷志新,刘淑清,王述洋;声纹认证技术[J];水利科技与经济;2005年06期
14 郭慧娟;;声纹识别的特征参数提取[J];太原师范学院学报(自然科学版);2008年01期
15 ;SJ/T 11380-2008《自动声纹识别(说话人识别)技术规范》概述[J];信息技术与标准化;2008年08期
16 窦光宇;利用电脑识别声纹[J];家庭电子;2003年05期
17 李青;邓月明;王赟;莫崇晟;刘斌;贺洪平;李慧玲;;基于声纹识别的智能小区认证系统设计[J];网络安全技术与应用;2011年04期
18 何好义;计算机语音识别技术及其应用[J];大众科技;2005年06期
19 胡恒滔;龙建忠;;基于蚁群算法的模糊C-均值聚类算法在声纹识别中的应用[J];四川大学学报(自然科学版);2007年03期
20 董桂官;沈勇;;基于耳语频谱比较的话者识别方法[J];电声技术;2011年04期
中国重要会议论文全文数据库 前10条
1 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
2 于哲舟;杨佳东;周春光;王纲巧;;智能仪器嵌入式声纹识别技术方法[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
3 淡艳;康弘俊;;基于声纹识别的身份认证技术[A];2007’促进西部发展声学学术交流会论文集[C];2007年
4 彭诗雅;;声纹识别技术研究[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
5 郭皓婷;;基于声纹识别技术的应用难点研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
6 张南;张晓洲;史元春;;基于声纹识别技术的麦克风阵列说话人实时定位[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
7 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
8 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
9 卢咪咪;谢磊;郑李磊;杨玉莲;张艳宁;;基于Alize工具包的广播音频播音员自动标注系统[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
10 林会杰;贾珈;王晓慧;蔡莲红;;基于B/S模式的3D双语虚拟说话人的研究与实现[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
中国博士学位论文全文数据库 前10条
1 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年
2 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
3 徐望;连续语音识别的稳健性技术研究[D];解放军信息工程大学;2006年
4 何新;基于内容的音频信息分类检索技术研究[D];南京理工大学;2007年
5 吴强;基于听觉感知与张量模型的鲁棒语音特征提取方法研究[D];上海交通大学;2010年
6 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
7 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
8 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
9 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
10 陈凌辉;说话人转换建模方法研究[D];中国科学技术大学;2013年
中国硕士学位论文全文数据库 前10条
1 付浩楠;声纹识别在声控系统中的研究与实现[D];黑龙江大学;2012年
2 徐卫中;基于矢量量化与神经网络的声纹识别系统的研究[D];重庆大学;2012年
3 彭诗雅;基于声纹识别的身份认证技术研究[D];南京航空航天大学;2010年
4 侯康;基于声纹识别的汉语普通话口语测评系统的研究与实现[D];湖南大学;2011年
5 石燕;声纹识别技术研究[D];南京航空航天大学;2004年
6 王为学;基于嵌入式声纹识别系统的研究与实现[D];广东工业大学;2012年
7 徐鹤;城市交通环境下声纹识别算法研究[D];吉林大学;2013年
8 周芬;基于电话信道的声纹识别算法研究[D];南京理工大学;2012年
9 唐夫乾;声纹识别系统与模式识别算法研究[D];浙江理工大学;2012年
10 庞玄萌;声纹识别中的基音检测算法研究[D];辽宁大学;2013年
中国重要报纸全文数据库 前10条
1 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;声纹识别听声辨人[N];计算机世界;2001年
2 吴玺宏;声纹识别应用前景[N];计算机世界;2001年
3 邢方亮;以声辨人[N];计算机世界;2003年
4 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
5 实习生 沈春梅;鉴定萨达姆录音真假[N];科技日报;2003年
6 本报记者 刘洪宇;当机器听懂了我们的声音[N];辽宁日报;2008年
7 清华大学 刘加;语音识别应用促进技术发展[N];计算机世界;2006年
8 金朝力;客客通出击音乐播放器市场[N];北京商报;2007年
9 李爱军;面向言语工程的情感语音[N];中国社会科学院院报;2006年
10 ;人机对话无障碍[N];中国计算机报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978