收藏本站
《五邑大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于STRAIGHT谱的语音识别算法研究

姚建霄  
【摘要】:人类利用语言相互交流信息。在高度信息化的今天,语音信息处理的一系列技术及其应用已经成为信息社会不可或缺的重要组成部分。语音识别技术能让计算机把语音信号转变为相应的文本或命令的技术,使人们能够摆脱对键盘的依赖,通过语音与计算机进行对话。在各种描述语音信号的特征参数中,语谱图具有其他种类参数所不具备的特点。它综合了时域分析和频域分析的优点,更全面的表达出信号时域和频域特征之间的关系,缺点是包含更多的冗余性。随着计算机存储容量和计算速度的逐渐改进,这个缺点对语谱图的应用限制已经不明显。 从原理上讲,语音识别系统中应用最多的特征参数线性预测倒谱系数和梅尔倒谱系数,它们都是通过各种方法将语音信号分解得到激励信号和声道冲击响应,并从反映声道冲击响应的信息中得到倒谱系数。同样,STRAIGHT算法也是将语音分解为相互独立的频谱参数和一系列脉冲的卷积,并以谱图的形式表示这些频谱参数(STRAIGHT谱)。这就提供了将STRAIGHT谱应用于语音识别的理论依据。差别子空间法是一种有效的模型训练方法,理论证明和实验结果均表明用这种方法训练得到的模板与训练样本的选择无关,并且随着训练样本数的增多,所得到的模板能更好的表示该类的特点。 本文中笔者设计的语音识别系统选择STRAIGHT谱作为语音特征参数,用差别子空间法进行模板训练。除此之外,本文又引入了对应点映射方法,这种方法能比DTW方法更好地解决不同语音样本比较时子单元之间的对准问题,从而更好地解决了非特定人识别问题。 在Matlab环境下,笔者搭建了基于上述方法的语音识别系统。用于验证的语音材料来自于多位同学于不同时间多次录制的汉语数字1~10的录音。实验结果表明用这种方法可以达到满意的郊果。
【学位授予单位】:五邑大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TN912.34

【参考文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 陈向民;张军;韦岗;;基于语谱图的语音端点检测算法[J];电声技术;2006年04期
3 柳春;;语音识别技术研究进展[J];甘肃科技;2008年09期
4 潘凌云,孙达传,吴美朝;语音识别中基于语谱图的语音音素分割方法[J];杭州大学学报(自然科学版);1995年01期
5 马义德,袁敏,齐春亮,刘悦,刘映杰;基于PCNN的语谱图特征提取在说话人识别中的应用[J];计算机工程与应用;2005年20期
6 凌震华,戴礼荣,王仁华,双志伟,周斌;基于自适应加权谱内插的宽带语音编码算法[J];数据采集与处理;2005年01期
7 李富强 ,万红 ,黄俊杰;基于MATLAB的语谱图显示与分析[J];微计算机信息;2005年20期
8 张歆奕,吴今培,张其善;一种基于差别子空间的语音识别算法研究和实现[J];五邑大学学报(自然科学版);2002年01期
9 甘振业;杨鸿武;蔡莲红;;基于STRAIGHT算法的汉语语音morphing方法[J];西北师范大学学报(自然科学版);2008年05期
10 詹新明;黄南山;杨灿;;语音识别技术研究进展[J];现代计算机(专业版);2008年09期
中国博士学位论文全文数据库 前1条
1 梁毅雄;基于子空间分析的人脸特征提取及识别研究[D];重庆大学;2005年
中国硕士学位论文全文数据库 前6条
1 吕杰;不变性子空间识别方法研究[D];华中科技大学;2005年
2 丁爱明;基于MFCC和GMM的说话人识别系统研究[D];河海大学;2006年
3 甘振业;兰州方言语音生成方法研究[D];西北师范大学;2007年
4 阮柏尧;脉冲耦合神经网络(PCNN)在基于语谱图的说话人识别中的应用[D];五邑大学;2008年
5 曲玉强;线性子空间法人脸识别的研究[D];山东大学;2008年
6 张愿茹;基于HMM和ANN的数字语音识别研究[D];长春理工大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 冉志红;李乔;单德山;唐亮;;影响矩阵法在南京长江三桥状态识别中的应用[J];四川建筑科学研究;2008年04期
2 罗云贵;张友纯;;嵌入式语音门禁系统的设计与实现[J];安防科技;2010年02期
3 张道信,周爱毓;语音信号实时降噪软件的设计[J];安徽大学学报(自然科学版);2004年04期
4 薛蕊;;一类线性混合模型中方差分量的估计[J];安庆师范学院学报(自然科学版);2010年02期
5 李新海;;双反对称矩阵的性质分析与推广[J];白城师范学院学报;2007年06期
6 斯彩英;;关于左、右伪逆矩阵的阶数递推算法[J];保定学院学报;2008年02期
7 秦翰林;周慧鑫;刘上乾;杨廷梧;;基于奇异值分解的红外弱小目标背景抑制[J];半导体光电;2009年03期
8 程广利;蔡志明;;改进的层次分析法在水下信息战人才胜任力评估中的应用[J];兵工自动化;2010年03期
9 辛怡;陶然;王越;;多重分数阶傅里叶变换在Shamir三次传递协议中的应用[J];兵工学报;2008年06期
10 叶中付;李春辉;贾红江;刘超;;空间非平稳噪声下的信源数估计算法[J];兵工学报;2009年07期
中国重要会议论文全文数据库 前10条
1 姚智颖;刘冬;;基于Kazakov线性化的迭代滤波[A];第二十九届中国控制会议论文集[C];2010年
2 逄海萍;王璐萍;;一类不确定仿射非线性系统的鲁棒近似最优滑模控制[A];第二十九届中国控制会议论文集[C];2010年
3 查星云;;一种钢铁企业金属损耗平衡分析方法[A];全国冶金自动化信息网2012年年会论文集[C];2012年
4 王刚;邬晓钧;郑方;王琳琳;张陈昊;;基于参考说话人模型和双层结构的说话人辨认[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
5 马治飞;徐望;王炳锡;王兴斌;;一种基于概率模型和倒谱差分的特征补偿算法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
6 王兴斌;徐望;王炳锡;马治飞;;噪声环境下语音能量的MMSE估计及其在语音识别中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
7 闵刚;蒋永生;杨吉斌;张雄伟;;分段声码器中的语音分段算法研究[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
8 徐小峰;胡央芳;刘守快;郑翔;俞一彪;王宇岭;王庆才;戴云;李道明;;基于VQ算法的病症脉象识别[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
9 沙志超;彭耿;徐神;黄知涛;;基于信号子空间维数估计的单通道盲信号检测[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
10 董杰;孙怡;;一种高频谱效率的OFDM载波频偏盲估计方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
中国博士学位论文全文数据库 前10条
1 范迪;沉渣厚度超声检测信号处理技术研究及应用[D];山东科技大学;2010年
2 殷复莲;同步CDMA系统NBI识别及抑制技术研究[D];哈尔滨工程大学;2010年
3 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
4 于志明;无线通信系统中的信号识别技术研究[D];哈尔滨工程大学;2010年
5 李关防;模态域信号处理在水声中的应用[D];哈尔滨工程大学;2009年
6 刘德铸;声学多普勒流速测量关键技术研究[D];哈尔滨工程大学;2010年
7 于蕾;OFDM系统的信道估计技术研究[D];哈尔滨工程大学;2009年
8 郭文卓;多天线多用户通信系统关键技术研究[D];哈尔滨工程大学;2009年
9 王文标;基于视觉测量的快速再制造成形系统关键技术研究[D];大连海事大学;2010年
10 张进;宽带阵列信号波达方向估计算法研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
2 蒋静;基于子空间的二阶统计量盲信道辨识算法研究[D];郑州大学;2010年
3 赵金平;基于矩阵变换的MIMO-OFDM系统信号检测[D];郑州大学;2010年
4 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
5 曹唯伟;基于拼音编码的水下语音通信发射端的设计与实现[D];哈尔滨工程大学;2010年
6 左国辉;基于子空间方法的人脸识别技术研究[D];哈尔滨工程大学;2009年
7 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
8 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
9 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
10 陈晶;基于词片网格的语音文档主题分类[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
2 陈绵书,陈贺新,桑爱军;计算机人脸识别技术综述[J];吉林大学学报(信息科学版);2003年S1期
3 顾晓东,余道衡,郭仕德;关于PCNN应用于图像处理的研究[J];电讯技术;2003年03期
4 李晶皎,孙杰,张俐,姚天顺;语音识别中HMM与自组织神经网络结合的混合模型[J];东北大学学报;1999年02期
5 宇缨;;支持向量机及其在自然语言处理中的应用[J];东莞理工学院学报;2007年01期
6 顾晓东,余道衡;PCNN的原理及其应用[J];电路与系统学报;2001年03期
7 赵力,邹采荣,吴镇扬;HMM在说话人识别中的应用[J];电路与系统学报;2001年03期
8 林奕琳;韦岗;杨康才;;语音情感识别的研究进展[J];电路与系统学报;2007年01期
9 高西奇,周洪祥,何振亚;基于小波变换的主元分析人脸图象识别[J];东南大学学报;1996年02期
10 向建军,袁晓,封益民;基于数学形态学的复子波语音谱图特征提取与分析[J];电声技术;2002年02期
中国博士学位论文全文数据库 前1条
1 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
中国硕士学位论文全文数据库 前9条
1 张晓枫;基于小波变换与GMM的说话人识别研究[D];西安电子科技大学;2002年
2 余冰;基于统计的人脸识别方法[D];浙江大学;2002年
3 刘永红;说话人识别系统的研究[D];西南交通大学;2003年
4 王吉林;利用矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究[D];东南大学;2004年
5 孙玲;汉语数字语音识别技术与实现方法研究[D];华中科技大学;2004年
6 张荣强;说话人识别中特征提取的方法研究[D];大连理工大学;2005年
7 谷志新;基于声纹信息的身份认证模式与算法的研究[D];东北林业大学;2005年
8 尹克重;基于ICA的人脸识别算法研究[D];重庆大学;2006年
9 臧晓艳;基于CDHMM/SOFM神经网络的语音识别研究[D];燕山大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 程庆祥;;语音识别电路简介[J];家电科技;1990年02期
2 戴经国;语音信号处理技术及应用[J];电脑与信息技术;2000年06期
3 李晓霞,王东木,李雪耀;语音识别技术评述[J];计算机应用研究;1999年10期
4 陈海英,于金辉;利用语音识别进行信息检索[J];情报学报;2003年01期
5 王磊;;语音识别中的情感信息分析[J];互联网天地;2008年04期
6 战普明,王作英,陆大 ;语音识别隐马尔可夫模型的改进[J];电子学报;1994年01期
7 张连海,韩华,王炳锡;过零周期转移概率矩阵语音识别方法的改进[J];信息工程学院学报;1994年01期
8 张会清,于洪珍;语音识别及自组织映射神经网络的应用[J];计算机工程与应用;2002年19期
9 张杰;告别键盘、鼠标 与计算机人性化交流[J];中国计算机用户;2004年39期
10 张忠平;文成义;;基于BP神经网络的汉语语音识别的研究[J];电声技术;1992年09期
中国重要会议论文全文数据库 前10条
1 靳慧龙;;基于DSP的电视语音拨号遥控技术[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
2 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
3 赵海滨;王宏;闻绍飞;;嵌入式语音识别控制机械手的系统设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
4 茹海峰;殷业;;基于与图像相结合的语音端点检测方法研究[A];第三届全国信息获取与处理学术会议论文集[C];2005年
5 杨大利;徐明星;吴文虎;;噪音环境下的语音识别研究概述[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
6 朱杰;韦晓东;;采用HMM模型方法进行语音信号的端点检测[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 张化云;关存太;陈显治;;基于听觉感知的噪声环境语音识别[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
9 陈亮;张雄伟;;基于超维相空间重构的语音识别研究[A];开创新世纪的通信技术——第七届全国青年通信学术会议论文集[C];2001年
10 余鹏;王作英;;语音识别码本状态间的线性和非线性相关性[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
2 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
3 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
4 ;“超人类语音识别”计划[N];中国计算机报;2002年
5 ;Intel涉足语音识别[N];计算机世界;2003年
6 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
7 小雷;芝麻开门[N];电脑商报;2006年
8 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
9 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
10 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
2 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
3 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
4 李伟;基于内容的汉语语音检索技术研究与系统实现[D];清华大学;2011年
5 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
6 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
7 刘庆升;计算机辅助普通话发音评测关键技术研究[D];中国科学技术大学;2010年
8 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
9 陈伟;语音识别声学建模中的主动学习研究[D];北京邮电大学;2011年
10 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
中国硕士学位论文全文数据库 前10条
1 银兵;基于μ’nSP~(TM)处理器的嵌入式语音控制技术研究[D];河南理工大学;2010年
2 郭恒飞;基于非特定人车载电器语音集成控制系统的设计与实现[D];合肥工业大学;2011年
3 王秋杰;TD-SCDMA网络测试软件中语音识别模块的设计与实现[D];北京邮电大学;2011年
4 江超;视频语义提取分析研究[D];西安电子科技大学;2011年
5 王霅煜;基于VQ和ASR的多媒体课件检索[D];上海交通大学;2010年
6 王坚;车载语音控制系统设计及DSP实现[D];苏州大学;2010年
7 康燕;基于HMM的情感语音识别[D];太原理工大学;2011年
8 熊飞丽;语音识别技术在语言教学软件中的应用研究[D];国防科学技术大学;2002年
9 彭峰;基于SALT的交互式语音应答系统——SALT技术的分析与应用[D];四川大学;2004年
10 刘文姝;基于FPGA的DSR系统前端算法实现[D];苏州大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026