收藏本站
《上海师范大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于模糊理论的语音关键词识别

徐毅  
【摘要】: 关键词识别是语音识别研究中的一个重要领域,其目的是从连续语音中检测并确认给定的若干个特定关键词。连续语音识别与之相比,资源耗费大,速度慢,抗噪能力不强,这导致连续语音识别短期内难以突破。 本文对关键词识别算法进行了深入研究。针对聚类过程中出现的类间交叠现象,本文采用模糊模式识别,很好地解决了此问题,并对仿生模式识别算法进行了一些改进。本文的工作主要集中在以下几个方面: 本文以汉语音节作为识别基元,为了准确地检测出每一个音节,采用一种基于能频积的二次端点检测方法,能很好地检测出单个音节。 简单介绍了所提取的特征,其中时域特征能量和过零率用来进行端点检测,而在建模过程中采用频域特征Mel倒谱系数和短时谱临界带特征矢量,因为频域特征跟时间无关,所以从特征提取的角度避免了动态时间规整的复杂计算。 完善了仿生模式识别过程中高维超椭球建模的方法,推导出了高维超椭球的方程和判别函数,考虑到其实现的复杂性,用小超球链来代替超椭球,大大简化了算法。另外对仿生模式识别中所存在的类间交叠现象进行了分析,并提出了解决办法。 (1)提出了类内隶属度的概念,通过比较类内隶属度的大小来判别落入交叠区域的样本的归属; (2)在超球和超椭球两种情形下,提出了基于距离、基于体积和基于判别函数的隶属函数,并从可行性和算法的复杂度两方面进行了比较,确定了一个最优的隶属函数,而且给出了完整的判别算法; (3)对识别结果的确认进行了详细的说明,因为有了类内隶属度的概念,所以直接用隶属度跟阈值进行比较就可实现对结果的确认。 实验表明,采用模糊模式识别算法以后,系统拒识率降低了11个百分点。
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP391.42

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 叶小秋;;基于内容的音频搜索在数字图书馆中的应用[J];农业图书情报学刊;2009年06期
2 陈晗;戴在平;;家电控制系统的语音关键词识别算法研究[J];电声技术;2008年04期
3 程庆祥;;语音识别电路简介[J];家电科技;1990年02期
4 张连海,韩华,王炳锡;过零周期转移概率矩阵语音识别方法的改进[J];信息工程学院学报;1994年01期
5 闫守华;语音控制系统的研制[J];成都气象学院学报;1997年03期
6 李晓霞,王东木,李雪耀;语音识别技术评述[J];计算机应用研究;1999年10期
7 李虎生,刘加,刘润生;利用多层感知机映射提高不匹配环境下的语音识别性能[J];电路与系统学报;1999年04期
8 陈海英,于金辉;利用语音识别进行信息检索[J];情报学报;2003年01期
9 刘占军;;我的Word更“听话”[J];电脑知识与技术(经验技巧);2010年10期
10 赵显富;;译者的话[J];计算技术与自动化;1985年04期
中国重要会议论文全文数据库 前10条
1 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
2 余鹏;王作英;;语音识别码本状态间的线性和非线性相关性[A];第六届全国人机语音通讯学术会议论文集[C];2001年
3 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 靳慧龙;;基于DSP的电视语音拨号遥控技术[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
5 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
6 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 郭晨;;汉语语音技术[A];第一届学生计算语言学研讨会论文集[C];2002年
9 赵海滨;王宏;闻绍飞;;嵌入式语音识别控制机械手的系统设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
10 刘秉权;张凯;王晓龙;;语音识别中基于规则的语言模型的研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
中国重要报纸全文数据库 前10条
1 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
2 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
3 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
4 ;“超人类语音识别”计划[N];中国计算机报;2002年
5 ;Intel涉足语音识别[N];计算机世界;2003年
6 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
7 小雷;芝麻开门[N];电脑商报;2006年
8 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
9 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
10 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
2 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
3 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
4 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
5 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
6 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
7 刘庆升;计算机辅助普通话发音评测关键技术研究[D];中国科学技术大学;2010年
8 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
9 陈伟;语音识别声学建模中的主动学习研究[D];北京邮电大学;2011年
10 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
中国硕士学位论文全文数据库 前10条
1 施凝;中等词汇量的汉语连续语音关键词识别系统[D];同济大学;2006年
2 陈晗;基于嵌入式的家电关键词语音识别系统的研究与设计[D];华侨大学;2008年
3 王霅煜;基于VQ和ASR的多媒体课件检索[D];上海交通大学;2010年
4 郭恒飞;基于非特定人车载电器语音集成控制系统的设计与实现[D];合肥工业大学;2011年
5 王秋杰;TD-SCDMA网络测试软件中语音识别模块的设计与实现[D];北京邮电大学;2011年
6 彭峰;基于SALT的交互式语音应答系统——SALT技术的分析与应用[D];四川大学;2004年
7 江超;视频语义提取分析研究[D];西安电子科技大学;2011年
8 朱晗鸣;嵌入式小词汇量语音识别系统的设计与实现[D];大连理工大学;2005年
9 龙丽霞;基于实例语境的语音识别后文本检错与纠错研究[D];北京邮电大学;2010年
10 宋叔飚;神经网络在语音识别中的应用研究[D];西北工业大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026