收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

语音识别中基于支持向量机的声学模型分析与实现

李昊洋  
【摘要】: 语音识别系统分为两个重要的组成部分,一个是声学模型;另外一个是语言模型。声学模型就是一个描述语音的模型,通过对语音状态的识别,状态的输出来描述语音,从而判别出语音;语言模型就是对于声学模型中输出的各个语音进行判定,计算各个连接的语音成为语言的概率,判定它是否可以成为一个语言。 我们本文主要阐述声学模型部分,声学模型是语音识别系统的基础,具有很重要的作用,在语音识别中,声学模型通常使用隐马尔科夫模型(HMM),其分为状态(senone),跳转矩阵,和状态的输出概率,隐马尔科夫模型的状态输出大都采取高斯混合模型(GMM)实现的。此模型采用若干个基于高斯概率密度函数形成的模型的结果,可以使复杂的样本简单化,但是该模型只能单一的描述本类样本的概率,缺少了和其他样本的关联性,这也使得高斯混合模型(GMM)比较单一化,推广性差。 基于GMM的局限性,我们本文将对支持向量机在声学模型的应用进行研究,支持向量机(Support Vector Machine,SVM)可以利用有限数量样本,对未知或无法测量的的数据进行最优解。其在训练模型的时候并不是只考虑属于此集的样本,而是也考虑了不属于此集的样本。 在SVM训练过程中,如果直接对原问题求解的话,需要存储一个元素个数为n 2的矩阵,因为如果内存不能存储下此矩阵时,SVM训练就无法完成。那么该如何进行SVM训练呢?解决SVM大数据量的方法最直观的方法就是把问题分解成多个小问题,通过解决每个小问题实现对SVM大数据量的训练。我们主要应用SMO算法实现,SMO(Sequential Minimal Optimization)算法将其分解为一个个最小的子问题,使在此情况下的SVM训练变为可能。当训练数据不能完全读入内存时,本文先对样本分块处理,迅速丢弃对模型没有贡献的样本,只保留支持向量,作为下一步的训练样本,然后在剩余样本上找出最优目标函数训练出一个SVM模型。极大地提高了SVM训练的效率。 对于senone多类判别的特性,我们本文采用的方法是用每一个senone对应多个SVM的两类判决,对应模型的标记位+1,不对应的为-1,测试时选取得分最高的senone。相应地对于数据不平衡问题和后验概率也给出了解决方案。 实验证明,利用SVM模型能够很好地判别senone的状态,区分性要优于GMM。尤其是使用了改进后的SMO算法,随着样本量的增加,得到最优解时间复杂度明显低于SMO算法和直接解最优化。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张问银;金宁德;刘印锋;;基于支持向量机的CD4细胞图像识别方法[J];计算机工程与科学;2009年07期
2 韩永章;;基于支持向量机的旋转机械故障诊断研究[J];科技信息;2010年12期
3 刘磊;;多类分类支持向量机方法研究[J];福建电脑;2010年08期
4 潘浪;单明霞;;支持向量机在资源评价中的应用研究[J];长江大学学报(自然科学版)理工卷;2009年04期
5 盘善荣;傅明;史长琼;;支持向量机在P2P流量识别中的应用[J];计算机工程与科学;2010年02期
6 周珂;彭宏;胡劲松;;支持向量机在心电图分类诊断中的应用[J];微计算机信息;2006年09期
7 曾文;彭辉;;支持向量机在手写签名的应用研究[J];中国高新技术企业;2009年15期
8 王东霞;张楠;路晓丽;;基于育种算法的SVM参数优化[J];安徽大学学报(自然科学版);2009年04期
9 乔冠军;那健;俞赛赛;;基于SVM的信息化装备状态趋势预测方法研究[J];自动化技术与应用;2007年11期
10 谢书娟;;SVM理论在图书馆馆藏图像标引方面的应用[J];甘肃科技;2010年01期
11 万力;盘善荣;傅明;;基于SVM的P2P流量识别[J];计算技术与自动化;2009年01期
12 李之波;;多因素支持向量机模型在江苏省中长期电力负荷预测中的应用[J];华北水利水电学院学报;2009年01期
13 谢书娟;;图像自动分类在数字化图书馆中的应用[J];甘肃科技;2011年05期
14 李程;叶中华;;基于多小波变换和支持向量机的鲁棒水印算法[J];西安文理学院学报(自然科学版);2009年04期
15 黄秀丽;王蔚;;SVM在非平衡数据集中的应用[J];计算机技术与发展;2009年06期
16 田红军;王锡怀;肖健梅;;基于SVM的内模控制算法在船舶航向中的应用[J];仪器仪表用户;2010年05期
17 孔凡芝;王以忠;何静;;基于离散余弦变换和支持向量机的人脸识别方法研究[J];仪器仪表用户;2006年06期
18 李卓,刘斌,刘铁男,朱秀华,魏坤;支持向量机及其在油田生产中的应用[J];大庆石油学院学报;2005年03期
19 宁朝;基于SVM技术的英文字符识别方法[J];大众科技;2005年08期
20 张秋水;罗林开;刘晋明;;基于支持向量机的中国上市公司财务困境预测[J];计算机应用;2006年S1期
中国重要会议论文全文数据库 前10条
1 司爱威;冯辅周;江鹏程;饶国强;王建;;基于可变风险SVM模型的故障识别方法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
2 周广春;潘登;;面外均布荷载作用下砌体墙板破坏模式特征值提取的SVM方法[A];工程设计与计算机技术:第十五届全国工程设计计算机应用学术会议论文集[C];2010年
3 胡俊杰;周红;周林军;;支持向量机方法研究物质结构水溶解性关系模型[A];中国化学会第27届学术年会第02分会场摘要集[C];2010年
4 邵杰;叶宁;容亦夏;;基于SVM的多波束测深数据滤波[A];第二十九届中国控制会议论文集[C];2010年
5 王红伟;董慧;;一种提高SVM分类精度的调制信号识别方法[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
6 于湘涛;周峰;张兰;魏超;;基于SVM和田口方法的石英挠性加速度计健壮性设计[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
7 蔡志理;姜桂艳;丁秋实;;基于SVM和数据融合技术的高速公路AID算法设计[A];第二十七届中国控制会议论文集[C];2008年
8 张睿;陈雪;马建文;;基于递归SVM的高光谱数据特征选择算法研究[A];第八届成像光谱技术与应用研讨会暨交叉学科论坛文集[C];2010年
9 蔡志理;姜桂艳;;多SVM分类器融合技术在高速公路AID中的应用[A];第二十七届中国控制会议论文集[C];2008年
10 ;A Tool Wear Predictive Model Based on SVM[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中国博士学位论文全文数据库 前10条
1 魏思;基于统计模式识别的发音错误检测研究[D];中国科学技术大学;2008年
2 邢永忠;最小二乘支持向量机的若干问题与应用研究[D];南京理工大学;2009年
3 王开义;基于支持向量机的农产品生产关键控制点发现研究[D];北京工业大学;2011年
4 曹葵康;支持向量机加速方法及应用研究[D];浙江大学;2010年
5 王冬丽;基于可扩展的支持向量机分类算法及在信用评级中的应用[D];东华大学;2011年
6 常甜甜;支持向量机学习算法若干问题的研究[D];西安电子科技大学;2010年
7 刘叶青;原始空间中支持向量机若干问题的研究[D];西安电子科技大学;2009年
8 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
9 胡运红;支持向量机的若干算法研究[D];山东科技大学;2011年
10 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 李昊洋;语音识别中基于支持向量机的声学模型分析与实现[D];吉林大学;2010年
2 曾玉祥;盲抽取与SVM方法在地球化学异常下限提取中的应用[D];成都理工大学;2010年
3 蔡磊;SVM及其扩展算法在图像处理中的应用研究[D];西安石油大学;2010年
4 杨飞;基于SVM的煤炭销售分析预测系统的研究[D];太原科技大学;2011年
5 高洁;基于SVM的基因表达谱分析和函数集VC维研究[D];华东师范大学;2011年
6 武晓娟;基于支持向量机(SVM)的火电电厂工程造价预测研究[D];华北电力大学(河北);2009年
7 张坤;基于支持向量机(SVM)理论的个人信用评估研究[D];辽宁工程技术大学;2011年
8 朱健康;基于支持向量机的音乐自动分类[D];天津大学;2010年
9 刘艳伟;支持向量机方法在感潮河段洪峰水位预报中的应用[D];浙江大学;2010年
10 张华军;支持向量机在FSK解码中的应用研究[D];武汉理工大学;2006年
中国重要报纸全文数据库 前10条
1 郭涛;利用SVM虚拟化技术实现容灾[N];中国计算机报;2008年
2 清华大学 刘加;识别语音的几种依据[N];计算机世界;2006年
3 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
4 北京清华大学电子工程系副教授 刘加 教授 刘润生;让机器听懂我的话[N];科技日报;2001年
5 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
6 本报记者 陈磊;2008奥运,实现语言交流无障碍[N];科技日报;2006年
7 本报记者 刘洪宇;当机器听懂了我们的声音[N];辽宁日报;2008年
8 魏衍亮;奥运IT技术领域的专利部署[N];中国知识产权报;2008年
9 王俊杰;TTS助力CIC[N];中国信息报;2002年
10 李水根;计算机详解配伍与药效关系[N];健康报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978