收藏本站
《中国科学技术大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于音素层信息的语种识别

仲海兵  
【摘要】:自动语种识别,作为智能语音处理的一个重要方向,是指利用计算机自动地识别一段语音所属语言种类的过程。随着全球化进程的加速,全球各个国家和地区人们之间的交往变得越来越频繁,突破语言障碍变得极为迫切;因此,语种识别在多语种语音识别前端、信息检索、军事情报收集、公共安全等领域的应用价值逐渐体现,受到了相关应用领域的广泛关注。 根据使用的特征不同,可以将主流的语种识别方法分为两大类:基于声学特征信息的语种识别方法和基于音素层信息的语种识别方法。其中,基于音素层信息的语种识别方法首先利用音素识别器将一段语音识别为一段音素序列,然后利用不同语种间的音素搭配存在差异这一特点进行语种识别。基于音素层信息的语种识别方法以其性能优异稳定、推广性好等优点受到越来越多研究人员的重视。 本文对基于音素层信息的语种识别方法进行了较为系统的研究,搭建了从音素识别器到语种分类模型的语种识别系统,并在提高语种识别系统性能、降低算法复杂度等方面取得了一定的进展。具体的研究工作包括以下几个方面: 第一,针对音素识别器的训练语料挑选问题,提出了基于音素平衡准则的数据选择方法,从大量语音数据中挑选出适量数据,提高了语种识别性能。 第二,对一段特定语音,音素识别的结果及其搭配关系会受到说话人、信道等因素干扰而引入不必要的噪声。针对于此,提出采用因子分析方法去除噪声:首先在词图输出的序列基础上建立基于bagofN‐Grams的向量表示形式,然后在此向量空间中,采用因子分析方法估计说话人、信道等非语种因素差异所产生的噪声子空间并加以消除,显著提高了语种识别性能。 第三,在PR‐SVM系统中,针对特征矢量高维、稀疏带来的计算和存储问题,提出了一种特征选择方法,通过对表征语音段的低阶特征矢量进行区分性选择,将具有较高区分度的低阶特征上升到高阶特征,将特征维数控制在可接受的范围内,提高了特征的区分性,进一步改善了语种识别系统的性能。
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TN912.34

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 付强;宋彦;戴礼荣;;因子分析在基于GMM的自动语种识别中的应用[J];中文信息学报;2009年04期
【共引文献】
中国期刊全文数据库 前10条
1 庄振华;王年;李学俊;梁栋;王继;;癌症基因表达数据的熵度量分类方法[J];安徽大学学报(自然科学版);2010年02期
2 陈乐;王年;苏亮亮;王蕊平;;基于邻接谱主分量分析的肿瘤分类方法[J];安徽大学学报(自然科学版);2011年04期
3 叶爱霞;王年;苏亮亮;;基于非负矩阵分解和Normal_Matrix的肿瘤基因分类[J];安徽大学学报(自然科学版);2012年03期
4 牟少敏;田盛丰;尹传环;;基于协同聚类的多核学习[J];北京交通大学学报;2008年02期
5 胡德焜;关于含有欠测值及参数约束的因子分析的MLE之统一算法[J];北京大学学报(自然科学版);1988年01期
6 尚坤;李培军;程涛;;基于合成核支持向量机的高光谱土地覆盖分类[J];北京大学学报(自然科学版);2011年01期
7 陈斌;阎兆立;程晓斌;;旋转设备声学故障特征提取与优化方法[J];北京邮电大学学报;2011年04期
8 赵三元;沈庭芝;孙晨升;刘朋樟;岳雷;;Feature subset selection method for AdaBoost training[J];Journal of Beijing Institute of Technology;2011年03期
9 童姗姗;窦霁虹;贾玲;王佳颖;;基于实例的基因分类及确定基因标签模型[J];纯粹数学与应用数学;2011年04期
10 陈淑飞;韩斌;厉力华;Rebecca Sutphen;祝磊;代琦;;基于磷脂质类数据的早期卵巢癌特征提取研究[J];传感技术学报;2010年10期
中国重要会议论文全文数据库 前9条
1 武进;尹恺;王长明;张家才;;SVDM在蔬菜病害图像分类中的应用[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
2 任伟;闫桂英;;利用聚类算法来研究基因选择问题[A];中国运筹学会第八届学术交流会论文集[C];2006年
3 ;Final Sulfur Content Prediction Model in Hot Metal Desulphurization Process Based on IEA-SVM[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
4 陈益定;郑树;余捷凯;;血清蛋白质指纹图谱在大肠癌早期诊断中的应用[A];第三届中国肿瘤学术大会教育论文集[C];2004年
5 张睿;陈雪;马建文;;基于递归SVM的高光谱数据特征选择算法研究[A];第八届成像光谱技术与应用研讨会暨交叉学科论坛文集[C];2010年
6 尹雪岩;刘飞;;FA监控方法的改进及其应用[A];2009中国过程系统工程年会暨中国mes年会论文集[C];2009年
7 李文法;段洣毅;刘悦;孙春来;;一种面向流分类的特征选择算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 折闪电;郭岩;夏天;程学旗;;A CRF-based Feature Selection Algorithm for Web Information Extraction[A];第六届全国信息检索学术会议论文集[C];2010年
9 杨昆;李建中;王朝坤;徐继伟;;基因表达数据的基于类别树和SVMs的多类癌症分类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
3 章鹏;多尺度特征检测:方法和应用研究[D];中国科学技术大学;2010年
4 吕宁;基于数据驱动的故障诊断模型及算法研究[D];哈尔滨理工大学;2009年
5 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
6 吕青;思维进化和支持向量机理论及其在炼焦配煤优化中的应用研究[D];太原理工大学;2011年
7 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年
8 程砚秋;基于支持向量机的农户小额贷款决策评价研究[D];大连理工大学;2011年
9 王立鹏;特征提取及分类算法在膜蛋白分类预测问题中的应用[D];兰州理工大学;2010年
10 戴俊程;基于全基因组关联研究的中国女性乳腺癌风险预测模型研究[D];南京医科大学;2011年
中国硕士学位论文全文数据库 前10条
1 李海燕;互信息特征选择的研究及在代谢组学中的应用[D];大连理工大学;2010年
2 严康;基于支持向量机的特征选择算法研究[D];大连理工大学;2010年
3 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
4 赵丹;基于SVM分类机的DNA序列分类方法[D];南昌大学;2010年
5 王明黔;口令认证系统的安全性研究与实现[D];昆明理工大学;2009年
6 田昊;雷达辐射源特征选择和在线学习算法研究[D];西安电子科技大学;2011年
7 焦昂;针对包含异常值数据的优化K-MEANS聚类算法[D];西安电子科技大学;2009年
8 周萍;基于频度与联合效应的基因选择[D];西安电子科技大学;2009年
9 尹雪岩;因子分析多元统计方法在过程监控中的应用研究[D];江南大学;2011年
10 张翔;特征提取新方法及其应用研究[D];江南大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 何新,王晓兰,周献中;汉语语音识别中的一种音节分割方法[J];火力与指挥控制;2004年06期
2 才智杰;;《藏文音素拼读法》多媒体教学软件的设计与实现[J];青海师范大学民族师范学院学报;2009年01期
3 陆锋;徐筱麟;沈平林;;一种短波语音检测方法的研究与实现[J];军事通信技术;2002年01期
4 赵秋奇;电脑中文化的音素拼音键盘[J];中文信息;1997年02期
5 张卫斌,陈春晓;电脑语音合成系统[J];浙江气象;1997年03期
6 严普强,施昊;浊音的基频同步分析及普通话的音素——音节识别方案(摘要)[J];中文信息学报;1987年02期
7 谢锦辉;采用上下文相关音素HMM的连续语音识别[J];通信学报;1994年02期
8 田时秀;语言的机器识别[J];计算机工程与应用;1976年11期
9 郑全录;英语正文音素转换的规则表示及其推理[J];信息工程学院学报;1996年04期
10 周宏廷;智能机器人的語音系統[J];电子科技大学学报;1987年01期
中国重要会议论文全文数据库 前10条
1 安丽丽;梁维谦;吴延年;;基于不同音素概率分布的发音质量分数映射方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
2 陈肖霞;王霞;;对朗读语料的音素标注与研究[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
3 刘明辉;黄中伟;;基于GMM和VOT的音素发音错误检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 包叶波;胡郁;刘聪;江辉;戴礼荣;刘庆峰;;中文连续语音识别系统音素建模单元集的构建[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 包叶波;胡郁;刘聪;江辉;戴礼荣;刘庆峰;;中文连续语音识别系统音素建模单元集的构建[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
6 李吉全;;浅谈“字母、音素、音标”三位一体教学法的实践与体会[A];萃英集——青海省教育委员会、青海省教育学会优秀教育论文集[C];2000年
7 李净;徐明星;张继勇;郑方;吴文虎;方棣棠;;汉语连续语音识别中声学模型基元比较:音节、音素、声韵母[A];第六届全国人机语音通讯学术会议论文集[C];2001年
8 彭吳忠谋;;训练用汉语语音资料之音素标示[A];第四届全国人机语音通讯学术会议论文集[C];1996年
9 李海洲;;语音识别的高斯音素状态新算法[A];第二届全国人机语音通讯学术会议论文集[C];1992年
10 游之墨;李宗葛;;智能化汉语语音合成系统的实现[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
中国重要报纸全文数据库 前10条
1 北京师范大学教育科学研究所 郑一丹;三位一体教学法:为学英语快速奠基[N];中国教育报;2007年
2 叶向荣 郑民军;大破语音关[N];中国教育报;2001年
3 记者 罗霞 实习生 方明连;百余名民族教师接受双语培训[N];云南日报;2005年
4 梅容;耐心纠正孩子的口吃[N];中国石油报;2003年
5 蔺玉红;中文有望成为网络第一语种[N];光明日报;2005年
6 记者 郭人宏通讯员 丁巍巍;地税局推出4语种《纳税指南》[N];泰州日报;2008年
7 郑玉玲;基于EPG的普通话语音研究[N];中国社会科学院院报;2004年
8 章超英李雪芬;建议12366增加服务语种[N];中国税务报;2008年
9 金寅;现代汉语中辅音能否自成音节及其他[N];语言文字周报;2006年
10 何广见;取人名应兼顾语音美[N];语言文字周报;2007年
中国博士学位论文全文数据库 前10条
1 吕声;说话人转换方法的研究[D];华南理工大学;2004年
2 刘庆升;计算机辅助普通话发音评测关键技术研究[D];中国科学技术大学;2010年
3 瞿仰;基于声调识别的汉语计算机辅助学习系统研究[D];华东师范大学;2012年
4 王尔玉;基于若干声纹信息空间的说话人识别技术研究[D];中国科学技术大学;2012年
5 严可;发音质量自动评测技术研究[D];中国科学技术大学;2012年
6 李超雷;交互式语言学习系统中的发音质量客观评价方法研究[D];中国科学院研究生院(电子学研究所);2007年
7 张峰;基于统计模式识别发音错误自动检测的研究[D];中国科学技术大学;2009年
8 刘政怡;中文整句智能输入方法研究[D];安徽大学;2007年
9 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
10 雷江华;听觉障碍学生唇读汉字语音识别的实验研究[D];华东师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 仲海兵;基于音素层信息的语种识别[D];中国科学技术大学;2011年
2 冯鑫;基于音素的错误发音自动检测方法研究与应用[D];西安电子科技大学;2009年
3 胥文华;基于自动语音识别的在线软件对中国大学生音素学习的有效性研究[D];湖南大学;2010年
4 刘琳;基于自动语音识别技术的计算机辅助语音培训软件在大学非英语专业音素教学中成效性的实证研究[D];山东大学;2012年
5 徐婷婷;语种识别中的若干问题研究[D];北京邮电大学;2011年
6 陈栩茜;句子背景下缺失音素词理解的音、义激活进程[D];华南师范大学;2004年
7 刘杰;自动语种识别系统设计与实现[D];哈尔滨工业大学;2011年
8 寇芳玲;基于CV音节特征的少数民族语种识别研究[D];云南大学;2012年
9 徐颖;语种识别声学建模方法研究[D];中国科学技术大学;2011年
10 殷凤玲;基于支持向量机的民族语语种识别研究[D];云南大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026