收藏本站
《中国科学技术大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

对话电话语音的话者确认研究

高二中  
【摘要】:文本无关的话者确认是目前说话人识别中的一个重要研究方向,为此,美国国家标准与技术署从1996年开始组织了说话人识别评测,用于衡量当前说话人识别技术的发展水平。他为每个参赛单位提供了统一的数据,测试平台以及评测规则等,并且设立了许多子任务,用于探索和研究不同语音条件下的研究方法。对话电话语音的说话人确认作为NIST SRE的一个子任务,具有重要的研究意义。 本文从基本的单话者话者确认技术入手,介绍了单说话人确认的系统框架并且对其中各个部分予以详细的介绍,随后,根据对话语音话者确认与单话者确认上的异同,从两个方面对识别系统进行了深入的工作。针对对话语音说话人确认与单话者确认的不同点,对话语音话者确认需要将语音先切分聚类,该操作是将对话语音话者确认转化为常规单话者确认的关键,因此,本文详细介绍了目前常用的切分聚类方法,以及其中的不足之处,并且给出了将其合适的应用于确认的一些改进方案。 针对对话语音话者确认与单话者确认的共同点,单话者确认系统性能的改进措施也会使得对话语音确认系统的性能相应得到改进,本文借用语音质量测量的概念,引入了新的评分准则,对系统的识别性能有较大程度的提高。 本文提出了两种适合于后续确认过程的对初步切分聚类语音的再处理方法, 一,提出了二次提纯的方法,由于语音的纯净度是影响识别性能的关键因素之一,对原始语音的切分聚类结果不再追求寻找准确的说话人转化点,而是追求话者语音切分的纯度,将纯净度低的语音部分予以抛弃,只保留纯净度高的部分作为确认系统的输入,从而提高确认系统的性能。 二,采用基于融合策略的切分方法,将利用不同的方法切分的结果通过对比,找出判定结果相同的部分,利用此部分语音分别训练两个话者的模型,对判定结果不同的部分重新归类,最终得到准确的两个话者的语音。 本文利用语音质量测量的概念,提出了GMM-UBM框架下新的基于语音信号质量的系统评分方法,通过利用辅助信息,对每一条测试语音动态的衡量其与话者模型的适配度(质量值),并利用所得到的该值调整系统的评分,使得系统的识别性能有了较大的改进。 本文建立了一个性能稳定的对话电话语音的说话人确认系统,大量实验表明,所建立的系统具有良好的效果和鲁棒性。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TN912.3

手机知网App
【参考文献】
中国博士学位论文全文数据库 前1条
1 许东星;基于GMM和高层信息特征的文本无关说话人识别研究[D];中国科学技术大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 施俊强,池明敏;基于TMS320C54x DSKplus的实时TCM语音编解码算法的实现[J];半导体技术;2001年08期
2 邓勇,施文康;基于TMS320C50的语音频谱分析仪[J];兵工自动化;2000年03期
3 徐俊晓,谢锋,江建平,莫运明,郑中华;我国12种无尾类的鸣叫特征参数[J];动物学杂志;2005年03期
4 冯成林,吴淑珍;一种噪声环境下的语音识别方法(线性预测误差法)的研究[J];北京大学学报(自然科学版);2000年05期
5 黄新宇,吴淑珍;基于单边自相关线性预测噪声中汉语语音识别[J];北京大学学报(自然科学版);2000年05期
6 刘敬伟,程乾生;基于动态时间规划的基因芯片数据识别[J];北京大学学报(自然科学版);2002年05期
7 段新,黄新宇,吴淑珍;与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J];北京大学学报(自然科学版);2003年05期
8 王炜,刘峰,吴淑珍;RASTA滤波在语音通信质量客观评价中应用的研究[J];北京大学学报(自然科学版);2003年05期
9 刘惠华,潘建军,周冰,范京;稀疏谱线合成对元音频域信息分布的探讨[J];北京机械工业学院学报;2005年01期
10 何强,毛士艺,张有为;汉语语音识别的平滑声韵基元HMM算法[J];北京航空航天大学学报;2001年02期
中国重要会议论文全文数据库 前10条
1 郭巧;张立伟;陆际联;;汉语语音信号的端点检测与切分[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 张连海;王杰锋;王炳锡;;基于语音多带激励模型的基音周期估计算法研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
3 司罗;胡起秀;金琴;;完全无监督的双人对话中的说话人分隔[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 牟峰;俞铁城;杨道淳;;新型半波语音编解码的实现[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 邹绘华;李双田;;基于频谱斜率约束的变速率语音编码算法研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
6 李灿伟;杨震;;基于DCT的有色噪声消除算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
7 周珺;范京;刘惠华;;汉语语音音量和语速变化的自适应的调整[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
8 孙海;范京;刘惠华;;汉语连续语音中的单字起止点综合判别的新方法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 朱学勇;刘亚康;杨乐;;一种基于MBE模型的2.4Kbps语音编码器算法[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
10 张玲华;杨震;郑宝玉;;一种修正的倒谱公式及其在说话人识别中的应用[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 洪弘;基于Hilbert-Huang变换的汉语动态特征分析[D];南京大学;2010年
3 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
4 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
5 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
6 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
7 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
8 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
9 魏宇;基于小波变换的舰船航行数据记录仪数字水印算法的研究[D];哈尔滨工程大学;2011年
10 韩志艳;语音信号鲁棒特征提取及可视化技术研究[D];东北大学;2009年
中国硕士学位论文全文数据库 前10条
1 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
4 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
5 楼佳;基于网络QoS的AMR语音编码算法研究[D];哈尔滨工程大学;2010年
6 周翠梅;说话人识别技术的研究与实现[D];大连理工大学;2010年
7 庞敏辉;语音库自动构建技术的研究[D];中国海洋大学;2010年
8 郭秋雨;小词汇量非特定人的孤立词语音识别系统研究[D];中国海洋大学;2010年
9 单进;基于压缩感知的鲁棒性说话人识别[D];苏州大学;2010年
10 杨成;嵌入式平台语音识别系统及优化研究[D];华南理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前2条
1 陈继旭;刘明辉;戴蓓蒨;李辉;;文本无关说话人确认中的一种新的评分规整方法[J];信号处理;2006年04期
2 吴礼福;姚志强;戴蓓蒨;李辉;;音源特征用于提高话者确认系统的鲁棒性[J];中国科学技术大学学报;2006年05期
中国博士学位论文全文数据库 前1条
1 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 马继涌,高文;基于快速DGMM的随机提示文本的话者确认系统[J];计算机学报;1999年11期
2 黄伟,戴蓓蒨;基于GMM统计特性参数和SVM的话者确认[J];数据采集与处理;2004年04期
3 张保轩,王连军,田岚;基于PC机的汉语话者确认系统[J];山东电子;1995年03期
4 吴礼福;解焱陆;戴蓓蒨;李辉;;基于CGMM-UBM的电话短语音说话人确认[J];电路与系统学报;2007年05期
5 李勃,杨腾祥,胡建华,赵琳;智能卡话者确认系统的研究[J];昆明理工大学学报;1999年02期
6 李霄寒,戴蓓倩,方绍武,刘鸣;基于子带HMM和MLP的话者确认系统的噪声鲁棒性研究[J];电路与系统学报;2002年02期
7 上官葳;戴蓓蒨;;基于话者聚类的多系统输出评分融合话者确认[J];兰州大学学报(自然科学版);2008年03期
8 刘明辉,陈继旭,戴蓓蒨,李辉;基于TZ Normalization规整的话者确认阈值选取[J];数据采集与处理;2005年03期
9 刘明辉;戴蓓蒨;解焱陆;;基于GMM多维概率输出的SVM话者确认[J];模式识别与人工智能;2008年01期
10 司虎,戴蓓倩,李辉;一种基于遗传算法的话者身份确认系统建模方法[J];小型微型计算机系统;2000年01期
中国重要会议论文全文数据库 前10条
1 刘洪涛;张保轩;;在PC机上实现的汉语话者确认系统[A];第四届全国人机语音通讯学术会议论文集[C];1996年
2 王金明;张雄伟;;基于子带加权和GMM的鲁棒性话者确认的研究[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
3 王昌昌;王成儒;;一种改进的基于KPCA和SVM的文本无关说话人识别算法研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
4 孙辉;徐明星;燕鹏举;吴文虎;;电话语音数据库的收集和标注[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 张化云;韩兆兵;徐波;;电话语音翻译中的语音识别研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年
6 张涛;王岚;迟惠生;;基于VQ的说话人确认系统的硬件实现[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 王侠;李明琴;肖熙;王作英;;电话语音库的设计与实现[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
8 赵亚丽;付中华;谢磊;张健;张艳宁;;双麦克风语音增强和杂混模型训练相结合的顽健说话人确认[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
9 杨艺敏;景新幸;杨海燕;;PSO-SVM在说话人确认系统中的研究[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年
10 陈胜;徐明星;;基于Feature Warping和ICA的发音方式鲁棒的说话人确认[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
中国重要报纸全文数据库 前10条
1 ;IP 电话语音质量的测试[N];中国计算机报;2001年
2 周兰;五岳鑫USB二线电话语音盒 更简单 更实用[N];中国计算机报;2002年
3 通讯员 黄明雁 记者 黄祯光;广西电信电话语音短信受欢迎[N];人民邮电;2003年
4 记者汲传排通讯员张浩;电话提示交费不侵权[N];北京日报;2003年
5 记者 史颂光 通讯员 成利军;济源:走通畜牧信息“最后一公里”[N];河南日报;2006年
6 李爱峰;语音秘书在于个性化[N];中国计算机报;2005年
7 通讯员  钟进威 记者  黄祯光;梧州电信推进农业信息进村入户建设[N];人民邮电;2006年
8 记者 杨哲;“e校通”搭起家校沟通的桥梁[N];天津教育报;2007年
9 ;双屏蔽阻挡电磁干扰[N];中国计算机报;2005年
10 王凌;哈尔滨局为用户提供八种欠费通知方式[N];东北电力报;2007年
中国博士学位论文全文数据库 前10条
1 高二中;对话电话语音的话者确认研究[D];中国科学技术大学;2011年
2 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
3 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
4 刘明辉;基于GMM和SVM的文本无关的说话人确认方法研究[D];中国科学技术大学;2007年
5 许东星;基于GMM和高层信息特征的文本无关说话人识别研究[D];中国科学技术大学;2009年
6 解焱陆;基于特征变换和分类的文本无关电话语音说话人识别研究[D];中国科学技术大学;2007年
7 刘青松;话者识别中失配信息补偿理论和方法研究[D];中国科学技术大学;2011年
8 陆伟;基于缺失特征的文本无关说话人识别鲁棒性研究[D];中国科学技术大学;2008年
9 姚志强;说话人识别中提高GMM性能方法的研究[D];中国科学技术大学;2006年
10 贺苏宁;基于语音识别基元声学整体结构特征的识别模型研究[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈伟;信道失配条件下的话者确认研究[D];中国科学技术大学;2011年
2 吴德辉;基于因子分析的鲁棒性话者确认方法研究[D];中国科学技术大学;2009年
3 周毓;基于因子分析的说话人确认[D];中国科学技术大学;2010年
4 贺庆玮;基于分类特征映射和SVM的说话人确认方法研究[D];中国科学技术大学;2009年
5 郭玉峰;基于DSSA的软件开发在电话语音服务领域中的研究和应用[D];西安电子科技大学;2005年
6 李成;基于SoPC技术的便携式说话人确认系统研究与实现[D];北京交通大学;2010年
7 余巍;基于排序GMM的说话人确认的研究[D];中国科学技术大学;2011年
8 路立峰;软件模式理论的研究及其在开发应用电话语音服务系统中的应用[D];西安电子科技大学;2005年
9 李轶;说话人识别系统研究[D];浙江大学;2003年
10 田伟东;声道频响合成方法在军队姓名语音库的应用[D];东北大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026