收藏本站
《广西师范大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

语音关键词识别技术研究

郑明东  
【摘要】:关键词识别技术的主要任务就是识别出一段连续语音中的一个或多个特定词语或者单个字。关键词识别技术的研究,具有十分重要的实用性,是目前语音识别领域中一个热门的研究方向。本文重点使用了两种不同的声学模型实现了关键词识别实验系统——航班查询系统。 第一章介绍了语音特征提取方式,重点是论文使用的特征——平滑梅尔倒谱系数。通过实验比较肯定了论文中使用的特征提取方式的优势。 第二章介绍了两种不同的声学模型:基于改进的高斯混合模型和条件随机场模型。高斯混合模型已被证明能在关键词识别中取得很好的识别效果,而改进的高斯混合模型的引入可以改进孤立词的识别性能。条件随机场模型具有比HMM模型更好的分类能力,故也引入到关键词识别系统研究中。 第三章介绍了补白模型。在关键词识别模型中,补白模型占据着十分重要的位置。本章通过对汉语语言所具有的特殊性分析着手,通过对汉语拼音的分类以及聚合,建立了针对汉语这种语言有效的补白模型。实验结果表明,本文提出的补白模型比传统补白模型具有更好的性能。 第四章给出了关键词识别的最后一个阶段——语音置信度的确认。它是用来提高关键词准确率降低误识率的十分重要一环。在这章中,分别介绍了两种传统的置信度计算方法:基于后验概率的和基于似然比的。重点研究了基于互信息的置信度计算新方法,理论和实验都证明,可以提高置信度确认。 最后,在录制和建立一定数量的关键词识别语音训练样本库和测试样本库的基础上,建立了基于改进的高斯混合模型和基于条件随机场模型的关键词识别系统。在matlab软件环境下进行实验仿真。通过系统仿真来分析讨论在两种不同模型情况下实现的系统各自具有的性能,以及各自能够运用到的特殊领域。还对本文研究工作中存在的问题进行了分析,及进一步的改进和深入工作进行了一些展望。
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TN912.34

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 马晓梅;沈洁;;垃圾模型技术在关键词检测系统中的应用[J];信息技术;2009年06期
3 王金明;张雄伟;;一种模糊高斯混合说话人识别模型[J];解放军理工大学学报(自然科学版);2006年03期
4 刘小芳,曾黄麟,吕炳朝;点密度函数加权模糊C-均值算法的聚类分析[J];计算机工程与应用;2004年24期
5 张学锋;王芳;夏萍;;融合LPC与MFCC的特征参数[J];计算机工程;2011年04期
6 付辉;;模糊C-均值(FCM)聚类算法的改进[J];科学技术与工程;2007年13期
7 马晓梅;王洋;;基于词表树结构填料模型的关键词检测技术[J];科学技术与工程;2011年13期
8 黄湘松;赵春晖;张磊;刘柏森;;基于互信息置信度的网格连续汉语语音检索[J];计算机应用研究;2009年12期
9 陈文锋;李兵;武海锋;;基于最大互信息的连续型隐马尔可夫模型参数训练方法[J];云南大学学报(自然科学版);2006年S1期
10 陈立伟;王文姝;王颖芳;;基于模糊理论的关键词识别算法[J];应用科技;2010年09期
中国重要会议论文全文数据库 前1条
1 王海龙;苗振江;王琛;;汉语关键词识别系统建模方法的研究与分析[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
中国硕士学位论文全文数据库 前8条
1 江雪峰;关键词识别中语音确认技术的研究[D];华北电力大学(北京);2011年
2 赵强;语音端点检测和关键词检出技术的研究[D];辽宁大学;2011年
3 张佳宝;基于条件随机场的中文命名实体识别研究[D];国防科学技术大学;2010年
4 施凝;中等词汇量的汉语连续语音关键词识别系统[D];同济大学;2006年
5 陈迪;语音参数提取算法研究及系统实现[D];重庆大学;2007年
6 章洁;大词表自然语音关键词识别系统的研究与实现[D];北京交通大学;2009年
7 刘健;语音识别置信度研究[D];北京邮电大学;2010年
8 郭永生;基于条件随机场的汉语短语识别研究[D];东北大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 相征;朗朗;王静;;基于基音频能值的端点检测算法[J];安徽工程科技学院学报(自然科学版);2008年03期
2 张聪;;储粮害虫声信号编解码系统的设计与实现[J];安徽农业科学;2006年21期
3 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
4 孔令志;罗森林;张冰;王耀威;;纯音乐与语音-音乐混合片段的高准确识别方法[J];北京理工大学学报;2009年01期
5 牛滨;孔令志;罗森林;潘丽敏;郭亮;;基于MFCC和GMM的个性音乐推荐模型[J];北京理工大学学报;2009年04期
6 杨得国;姜金娣;曹文泉;曾玥;万红娟;;基于音频特征和逼近信号统计特征的数字零水印算法[J];江西师范大学学报(自然科学版);2011年06期
7 刘琨;金文标;;基于脉冲耦合神经网络的孤立词语音识别研究[J];重庆邮电大学学报(自然科学版);2008年02期
8 冯哲;孙吉贵;张长胜;王岩;;汉语语音合成的研究进展[J];吉林大学学报(信息科学版);2007年02期
9 刘筠;卢超;;一种新型语音识别系统[J];成都大学学报(自然科学版);2008年03期
10 张余生;夏秀渝;杨莎;;基于神经网络和卡尔曼滤波算法的说话人识别[J];成都信息工程学院学报;2008年04期
中国重要会议论文全文数据库 前10条
1 边红昌;程德福;祁玉林;张坤;;基于DSP和ZigBee无线智能语音控制系统设计[A];第二十六届中国控制会议论文集[C];2007年
2 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
3 田业;贾珈;江建博;蔡莲红;;汉语普通话声调增强算法的研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 刘博;杨鸿武;甘振业;李曼曼;孙红英;;面向藏语机读音标SAMPA-T的字音转换[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
6 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 方杰;李英;陶泯;;语音信号的一种加权的鲁棒特征参数W_RAS_MFCC[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 安镇宙;杨鉴;王红;余映;;一种新的基于分段排序裁剪的分层构筑DTW识别算法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
9 杨威明;;基于阈值的小波变换语音增强方法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
10 潘欣裕;董兴法;赵鹤鸣;;基于谱能比例加权的谱减法语音增强研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 宋清昆;自适应结构优化神经网络控制研究[D];哈尔滨理工大学;2009年
3 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
4 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
5 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
6 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
7 张雪梅;供应链环境中满足顾客差异化需求的产品设计策略[D];中国科学技术大学;2011年
8 梁彦霞;低速率多带激励线性预测语音编码技术的研究[D];西安电子科技大学;2011年
9 李烨;基于多带激励模型的低速率语音编码技术研究[D];西安电子科技大学;2011年
10 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
中国硕士学位论文全文数据库 前10条
1 王萍;语音情感识别研究[D];山东科技大学;2010年
2 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
3 蔡静颖;模糊c-均值算法的研究[D];辽宁师范大学;2010年
4 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
5 曹唯伟;基于拼音编码的水下语音通信发射端的设计与实现[D];哈尔滨工程大学;2010年
6 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
7 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
8 孙大为;数字化单边带水声语音通信系统的研究与实现[D];哈尔滨工程大学;2010年
9 陈伟伟;基于鼾声检测的睡眠呼吸暂停低通气综合症诊断[D];大连理工大学;2010年
10 袁铄;基于小波网络音频信号处理技术[D];大连理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱晓园;一个对隐马尔可夫模型用于自由语句说话人的研究[J];北方交通大学学报;1997年01期
2 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
3 段新,黄新宇,吴淑珍;与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J];北京大学学报(自然科学版);2003年05期
4 张春涛,吴善培;最大互信息用于语音识别[J];北京邮电大学学报;1998年03期
5 郭春霞,裘雪红;基于MFCC的说话人识别系统[J];电子科技;2005年11期
6 赵庆卫,王作英,陆大 ;汉语连续语音识别中上下文相关的识别单元(三音子)的研究[J];电子学报;1999年06期
7 刘加;汉语大词汇量连续语音识别系统研究进展[J];电子学报;2000年01期
8 王守觉,李兆洲,陈向东,王柏南;通用神经网络硬件中神经元基本数学模型的讨论[J];电子学报;2001年05期
9 王守觉,王柏南;人工神经网络的多维空间几何分析及其理论[J];电子学报;2002年01期
10 刘鸣,戴蓓倩,李辉,陆伟,李霄寒;鲁棒性话者辨识中的一种改进的马尔科夫模型[J];电子学报;2002年01期
中国博士学位论文全文数据库 前3条
1 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
2 曲福恒;一类模糊聚类算法研究及其应用[D];吉林大学;2009年
3 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
中国硕士学位论文全文数据库 前7条
1 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
2 徐毅;基于模糊理论的语音关键词识别[D];上海师范大学;2007年
3 王海龙;汉语关键词识别与主题信息提取的研究及应用[D];北京交通大学;2007年
4 杨华;基于最大熵模型的中文命名实体识别方法研究[D];哈尔滨工程大学;2008年
5 李星星;基于HMM的汉语语音关键词检测研究与实现[D];武汉理工大学;2009年
6 曾冠明;基于条件随机场的中文命名实体识别研究[D];北京邮电大学;2009年
7 刘勇;语音识别技术在安防监控系统中的应用研究[D];中南大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 于迎霞,史家茂;一种改进的基于倒谱特征的带噪端点检测方法[J];计算机工程;2004年19期
2 马道钧;陈天策;高婕;;语音端点检测方法的分析与实现[J];北京电子科技学院学报;2007年04期
3 邓艾东;包永强;赵力;;基于高斯混合模型的转子碰摩声发射识别方法[J];机械工程学报;2010年15期
4 吴龙梅,张建军,赵风光,张云雁;一类新的实时语音端点检测方法[J];上海大学学报(自然科学版);2005年04期
5 徐静波,于洪涛,冉崇森;语音识别中谱包自相关技术[J];数据采集与处理;2004年04期
6 雷传华,张秀彬,孙济宇;连接数字语音识别系统的DSP实时实现[J];上海交通大学学报;1999年12期
7 邵央,刘丙哲,李宗葛;基于MFCC和加权矢量量化的说话人识别系统[J];计算机工程与应用;2002年05期
8 段金凤;;语音端点检测方法探讨[J];电脑与电信;2009年04期
9 原玲;自组织特征映射神经网络用于非特定人语音识别[J];军事通信技术;1997年04期
10 易鸿锋;谷春燕;金力军;易克初;;基于倒谱递推的逆滤波器设计[J];空间电子技术;2006年S1期
中国重要会议论文全文数据库 前10条
1 郑成诗;胡笑浒;常道庆;李晓东;;语音倒谱系数均值的DD估计算法[A];中国声学学会2009年青年学术会议[CYCA’09]论文集[C];2009年
2 姜薇;徐柏龄;;适于远场语音识别的倒谱系数零均值化改进算法[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
3 许飞;;语音信号特征提取技术简介[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 纪红;吴善培;;语音识别中三种倒谱系数特征参量性能的比较[A];第二届全国人机语音通讯学术会议论文集[C];1992年
5 管鲁阳;鲍明;李晓东;田静;;基于双耳模型倒谱系数的车辆识别技术研究[A];中国声学学会2006年全国声学学术会议论文集[C];2006年
6 张敏瑞;易克初;;倒谱在数字水印算法中的应用[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(下册)[C];2002年
7 王仁华;;语声身份确认系统[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
8 何佳若;曾向阳;张春雷;;室内语音报警词识别系统设计[A];第二届西安-上海两地声学学术会议论文集[C];2011年
9 李桂春;郑能恒;李霞;;基于模糊隶属值加权的MFCC特征提取算法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
10 郑成诗;李晓东;;倒谱系数自适应平滑算法及其在语音增强的应用[A];2008年声频工程学术交流年会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 钱真;视频多模态信息处理的关键技术研究[D];哈尔滨工程大学;2012年
2 宁更新;抗噪声语音识别新技术的研究[D];华南理工大学;2006年
3 赵欢;面向嵌入式计算平台的自动语音识别关键技术研究[D];湖南大学;2010年
4 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年
5 吴强;基于听觉感知与张量模型的鲁棒语音特征提取方法研究[D];上海交通大学;2010年
6 陈歆普;基于肌电信号的多模式人机接口研究[D];上海交通大学;2011年
7 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
8 武淑红;延迟2.5ms 8Kbps语音编码算法研究[D];太原理工大学;2012年
9 关欣;音乐信号自动分类相关算法研究[D];天津大学;2009年
10 李新欣;船舶及鲸类声信号特征提取和分类识别研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 段淑斐;听觉—声学混合LPC方法研究[D];太原理工大学;2010年
2 李丹;基于VQ与HMM的说话人识别系统的研究[D];武汉理工大学;2005年
3 李香萍;说话人识别算法研究[D];天津大学;2006年
4 张众;小型语音识别系统的研究和开发[D];天津大学;2004年
5 蒋伟;基于高斯混合模型的说话人识别研究[D];电子科技大学;2008年
6 刘刚;说话人识别系统设计研究[D];华东师范大学;2004年
7 张卫清;语音识别算法的研究[D];南京理工大学;2004年
8 孙智华;数字音频信息隐藏技术的研究[D];浙江工业大学;2007年
9 胡优;语音识别算法及其在嵌入式中的应用[D];电子科技大学;2010年
10 于迎霞;噪声环境下的鲁棒性语音端点检测算法研究[D];新疆大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026