收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

声纹密码技术研究

潘逸倩  
【摘要】:在生物特征认证技术领域,声纹密码具备快速、便捷、双重加密等优势,在刑侦、安全、经济、生活等各个方向拥有广阔的应用前景。经典的声纹密码系统首先采用语音识别系统对密码内容进行确认,再利用文本无关的说话人识别系统对说话人个性特征进行确认,两次确认策略确保了声纹密码系统的高性能。然而现有的声纹密码系统过多地依赖于语音识别对密码内容的预判决功能,如果冒认者已经获得密码内容,系统错误接收率将显著增加。在此背景下,本文针对冒认者已知密码文本的声纹密码任务,分别在特征域、模型域和得分域进行深入研究和创新,提升了密码文本已知时的系统性能。 首先,本文在声纹密码系统特征前端提出特征域偏差估计(FSBE)的信道补偿方法。利用卷积信道噪声在倒谱域表现为线性偏移的现象,传统的CMS、CMVN、双高斯CDF-Matching等信道补偿方法基于单高斯或双高斯特征分布假设,利用各种特征参数归一化方法削弱信道和噪声干扰。相对于传统方法因单高斯或双高斯特征分布假设与实际数据分布不符带来的局限性,本文提出的FSBE方法利用最大化每条测试语音相对于说话人模型和冒认者模型似然度,将测试语音自动投影至目标模型各高斯分量对应的信道空间,训练获得线性或分段线性特征偏移参数。FSBE方法不再依赖参数归一化思想,通过训练获得较好的特征优化效果,也可用作传统信道补偿技术的补充方法。实验验证了特征域偏移估计方法对声纹密码系统信道失配问题具有一定的改善效果。 其次,本文对声纹密码系统中说话人模型建模方法进行了研究,提出了高斯混合帧模型(GMFM)的新方法。传统的非参数与参数模型估计方法在密码已知的声纹密码系统中都存在不足之处,前者仅能反映有限注册数据的分布结构,无法描述潜在变化规律以及说话人内部差异,后者在数据稀疏情况下难以获得准确的参数估计,比如GMM-UBM方法中仅调整均值向量不更新协方差矩阵的近似策略导致说话人模型与实际数据分布差异较大,且GMM模型存在忽略文本相关瞬时信息的缺陷。本文结合非参数方法与参数估计方法提出了GMFM建模方法,以每帧训练样本注册一个高斯分量,令每个高斯密度函数的均值向量为对应帧特征向量。为了避免参数估计过拟合的问题,该策略假定所有高斯分量共享少量数目的协方差对角阵,利用最大似然准则进行训练,从而获得较为准确的说话人模型。GMFM方法兼顾了文本相关瞬时信息和说话人内部差异,并且通过绑定方差缓解了数据稀疏的影响,尤其适合短时声纹密码任务。实验表明基于GMFM模型的声纹密码系统相对基线系统获得较大性能提升。 再次,本文在声纹密码任务中提出一种基于最小分类错误(MCE)准则的区分性声纹密码模型训练策略。传统区分性训练方法对数据量需求较大,在声纹密码这类短语音任务中难以发挥效用。本文提出的区分性训练新策略将训练集所有说话人的原始特征转换为一种表征其相对于注册模板距离的说话人无关新特征,从而可以集中所有说话人数据组成正例训练集和反例训练集,最终基于MCE准则进行两类区分性训练获得一对通用的正例和反例模型。该策略不仅巧妙地解决了声纹密码任务中区分性训练数据量不足的问题,而且将说话人相关的确认任务转化为说话人无关的经典分类任务,更加灵活有效、节省资源、适合大规模测试任务。实验表明基于区分性模型的声纹密码系统与GMM-UBM系统具有良好的互补性,融合后相对基线系统有明显性能提升。 最后,本文引入得分域多维特征分类器方法以增强声纹密码系统的区分能力。传统声纹密码系统直接采用测试语音平均帧得分作为确认判决依据,由于不同类型的语音对目标说话人的区分能力不同,直接赋予所有帧得分相同权重会导致系统性能受损。本文提出的得分域多维特征分类器方法在两种帧分类策略基础上利用各类似然比得分构建得分域多维特征,并选择经典的支持向量机(SVM)方法实现训练和测试。相比于传统声纹密码系统得分域一维特征加阂值的判断策略,新方法引入并定义了合理的得分域多维特征,并辅之以稳定的区分性分类器,将传统的似然比检验策略转换成为多维特征空间上的二类分类问题,进一步提升了声纹密码系统的区分能力和鲁棒性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 侯遵泽;声纹鉴别及其应用[J];武警学院学报;2002年06期
2 ;得意声纹加密钥匙[J];信息网络安全;2004年10期
3 韩小康;声纹[J];知识就是力量;1998年08期
4 杨洪臣,韩啸,金阳天,于凯;利用普通软件进行声纹鉴定[J];警察技术;2001年06期
5 林焕祥,马志友;言语过滤识别[J];远程教育杂志;2004年04期
6 吕声,尹俊勋;同语种说话人转换的实现[J];移动通信;2004年S3期
7 钱江,张明;自动声纹认证与网络安全[J];南京工业大学学报(自然科学版);2004年04期
8 崔桂香,丁晓明;声纹识别技术应用及一些关键问题[J];计算机安全;2004年07期
9 吴玺宏,罗定生;信息时代的身份认证[J];电子世界;2004年02期
10 冯清技;声纹识别技术在电话侦听系统中的应用[J];警察技术;2002年05期
11 田松乾;语用学在英语语法教学中的作用[J];现代情报;2000年05期
12 夏菁,尹俊勋,黄建成,黄锋;基于正弦加噪声模型的说话人转换方法[J];电声技术;2005年02期
13 勾轶,刘晓丽,陈长征;基于小波与神经网络的说话人身份识别[J];沈阳工业大学学报;2005年01期
14 李益惠;声纹识别技术在宁通过部级鉴定[J];警察技术;1994年02期
15 黄金明;说话人身份识别系统的设计与实现[J];计算机工程;2004年S1期
16 俞振利,张礼和;从任意连续语音中实时提取说话人特征及三维显示[J];浙江大学学报(理学版);1992年04期
17 岳喜才,伍晓宇,郑崇勋;用神经阵列网络进行文本无关的说话人识别[J];声学学报(中文版);2000年03期
18 范影乐;武传艳;李轶;庞全;;基于C_0复杂度的语音端点检测技术研究[J];传感技术学报;2006年03期
19 黄颖,殷瑞祥,颜刚华,陈虎;基于GMM的与文本无关的变阈值说话人确认[J];成都信息工程学院学报;2004年04期
20 陈幼松;网络时代的火眼金睛——认证技术的最新发展[J];天津科技;1999年02期
中国重要会议论文全文数据库 前10条
1 林会杰;贾珈;王晓慧;蔡莲红;;基于B/S模式的3D双语虚拟说话人的研究与实现[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
2 吴敏玲;;くゐ·いく’‘~てくゐ·ていく’表动作空间范畴移动语言形式的日语语言特点——和汉语“来、去”、“~来、~去”比较[A];福建省外国语文学会2002年会论文集[C];2002年
3 陈文翔;杨莹春;;声纹漂移现象初探[A];第九届中国语音学学术会议论文集[C];2010年
4 刘大力;赵力;;与文本无关说话人识别系统的性能比较[A];2004年全国物理声学会议论文集[C];2004年
5 尹巧萍;赵力;;利用语音基音统计特征的说话人性别判识的研究[A];2007’促进西部发展声学学术交流会论文集[C];2007年
6 邓英;;基于说话人的对话语音分割[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
7 蒋冬梅;赵荣椿;;基于尺度描述的说话人归一化语音特征[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
8 周绍良;;修绠山房梓《宣和遗事》跋[A];水浒争鸣(第一辑)[C];1982年
9 李斌;陈小荷;;汉语褒贬词语的褒贬指向问题初探[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 王洪海;刘刚;郭军;;基于二次弯折函数的频率弯折方法[A];第二十六届中国控制会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 潘逸倩;声纹密码技术研究[D];中国科学技术大学;2012年
2 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
3 杨继臣;说话人信息分析及其在多媒体检索中的应用研究[D];华南理工大学;2010年
4 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
5 冯哲;基于内容的视频检索中的音频处理[D];复旦大学;2004年
6 金乃高;音视频联合说话人定位与跟踪方法研究[D];大连理工大学;2008年
7 闵星雅;助动词“能”和“会”的认知研究[D];上海师范大学;2007年
8 李海辉;电视访谈中话语缓和的语用研究[D];广东外语外贸大学;2008年
9 祝东平;汉语时间感知模式与相关汉语因素研究[D];吉林大学;2009年
10 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
中国硕士学位论文全文数据库 前10条
1 毛永刚;基于相关向量机的说话人判别研究[D];电子科技大学;2012年
2 章钊;声纹密码识别的关键问题研究[D];中国科学技术大学;2011年
3 陆亮;多信道条件下的说话人认证[D];北京邮电大学;2010年
4 默盼;论宋代说话人[D];渤海大学;2012年
5 张力;说话人分段与聚类技术研究[D];解放军信息工程大学;2012年
6 高娅;说话人转变检测的研究与实现[D];南京邮电大学;2013年
7 赵洪刚;基于对话型语音的说话人在线识别技术研究[D];黑龙江大学;2010年
8 李向格;关于“レてもぃぃ”与“レてぃぃ”的意义分析[D];吉林大学;2012年
9 黄雪莲;韩国语‘(?)’的话语功能分析[D];延边大学;2012年
10 刘大龙;基于感知哈希的音乐声纹检索[D];南京邮电大学;2013年
中国重要报纸全文数据库 前10条
1 本报记者 李婵;用声音当钥匙声纹锁是否更安全[N];北京科技报;2005年
2 张泽民;伪装语音研究[N];人民公安报;2004年
3 ;解密声纹锁 一声令下,“芝麻开门”[N];广东科技报;2011年
4 黄中;指纹 声纹 味纹和DNA纹[N];中国知识产权报;2001年
5 邢方亮;以声辨人[N];计算机世界;2003年
6 ;美科学家要研制无声感应“手机”[N];新华每日电讯;2005年
7 本报记者 皮泽红;莫“伸手”,伸手必被捉[N];广东科技报;2004年
8 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;声纹识别听声辨人[N];计算机世界;2001年
9 中科院自动化所生物特征认证与测评中心 白俊梅;听到的真实吗?[N];计算机世界;2003年
10 张申 蔡莲红;富于表情的虚拟人脸合成[N];计算机世界;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978