收藏本站
《湖南大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

面向嵌入式计算平台的自动语音识别关键技术研究

赵欢  
【摘要】:在未来几十年,先进通信将迅速改变人们的生活和工作方式,随时、随地使用一定范围内的设备进行实时通信和实时数据处理将逐渐成为现实,基于嵌入式计算平台的自动语音识别(Automatic Speech Recognition, ASR)是关键技术之一。 许多在实验室表现优异的ASR系统,一旦应用到复杂的实际噪声环境就马上变得不稳定;另一方面,鲁棒性高的识别系统往往依赖于高计算量,只适合运行于PC平台甚至高性能服务器。如何降低ASR系统的计算复杂度使之适合嵌入式平台,并提高其在复杂噪声环境下的鲁棒性,是嵌入式ASR研究的重点和难点。目前,嵌入式ASR应用系统多为分布式结构,即在目标设备上装载语音识别前端,将复杂的语音识别后端放置在服务器。本文着重研究基于嵌入式计算平台的自动语音识别前端关键技术。 作为ASR的第一步,有效的语音端点检测可减少系统后续处理时间,排除无声段噪声干扰,提高语音识别准确率。本文提出了两种语音端点检测新方法。其一,将时域对数能量特征与频域谱熵特征相结合,提出基于对数能量谱熵的端点检测方法,由于其计算简单可应用于中低端嵌入式平台;其二,针对抗噪性能优良但计算稍复杂的非线性语音特征端点检测,提出基于样本熵的语音端点检测方法,有望应用于高端嵌入式平台。仿真实验表明,两种新方法在低信噪比环境下,比传统的能量法、谱熵法、能量谱熵法、对数能量法等都具有更好的鲁棒性,能更好地区分语音和噪声,检测准确率更高。 语音增强是从含有噪声的语音信号中尽可能消除噪声,还原出纯净语音信号。完全消噪是不可能的,实际系统中的语音增强以抑制背景噪声、保护和提高感知语音质量为目的。基于短时谱估计的语音增强算法由于计算简单最适宜嵌入式平台,但有时会造成语音失真。本文分析比较了几种典型短时谱估计算法计算复杂度,针对其中乘加计算量最小的RL算法进行改进,引入人耳掩蔽效应,提出基于Bark域的RL改进算法,并进一步降低了计算量。实验表明,改进后的算法能显著抑制噪声,并有更好的语音质量,有效减少了语音失真。 语音特征提取是ASR前端的最后一个环节也是最重要的环节,特征提取质量对识别结果起决定性作用。美尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)以其良好的性能成为ASR系统标准前端,本文针对标准MFCC提取过程进行了两点改进:一是调整了汉明窗系数,提高窗函数性能;二是将子带频谱质心(Subband Spectrum Centroid, SSC)加入MFCC过程。传统语音特征提取利用了语音幅度信息却忽略了频谱信息,由于各频带频谱峰值位置受背景噪声影响相对较小,具有更好的鲁棒性,而SSC非常接近频谱中的峰值位置,本文将SCC引入MFCC,提出基于美尔子带频谱质心(Mel Subband Spectrum Centroid, MSSC)的语音特征提取新方法。HTK仿真实验表明,新汉明窗及MSSC语音特征提取新方法与传统MFCC法比较,低信噪比环境下的识别率平均提高了17.13%。 将上述语音端点检测算法、语音增强算法和语音特征提取算法集成为一个ASR前端实验系统。本文选择ADI公司的多媒体高性能ADSP-BF533作为嵌入式平台,将该前端系统进行优化并成功移植,验证了其在嵌入式平台上实现的可行性。最后,将上述部分研究成果用于移动学习平台原型系统设计,并进一步研究了教学资源知识表示技术,提出了一种本体概念相似度计算新方法;研究了AMR-WB编码器优化技术,提出了一种快速固定码本搜索方法。该原型系统在中山读书郎公司的儿童早教机、学生掌上电脑和数码读书机系列产品中得到成功应用,产生了巨大的经济效益。产品开发的实践证明,本文研究成果可广泛应用于嵌入式计算平台。
【学位授予单位】:湖南大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TN912.34

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 范影乐;武传艳;李轶;庞全;;基于C_0复杂度的语音端点检测技术研究[J];传感技术学报;2006年03期
2 李桦,安钢,樊新海;短时能频值在语音端点检测中的应用[J];测试技术学报;1999年01期
3 李祖鹏,姚佩阳;一种语音段起止端点检测新方法[J];电讯技术;2000年03期
4 肖述才,王作英;端点检测中的一种新的对数能量特征[J];电声技术;2004年06期
5 张志敏;郭英;王博;;一种基于倒谱特征的语音端点检测改进算法[J];电声技术;2006年04期
6 陈向民;张军;韦岗;;基于语谱图的语音端点检测算法[J];电声技术;2006年04期
7 范锦秀;赵欢;张波涛;;AMR-WB编码算法研究和复杂度分析[J];电声技术;2009年07期
8 王俊翔;;GSM新技术及应用前景展望[J];电信网技术;2007年06期
9 刘加;汉语大词汇量连续语音识别系统研究进展[J];电子学报;2000年01期
10 胡光锐,韦晓东;基于倒谱特征的带噪语音端点检测[J];电子学报;2000年10期
【共引文献】
中国期刊全文数据库 前10条
1 王全凤;郑浩;;基于径向基函数神经网络的高层建筑结构选型[J];四川建筑科学研究;2010年05期
2 罗云贵;张友纯;;嵌入式语音门禁系统的设计与实现[J];安防科技;2010年02期
3 张根耀,李竹林,赵宗涛;遮挡情况下运动目标的跟踪[J];安徽大学学报(自然科学版);2003年03期
4 张道信,周爱毓;语音信号实时降噪软件的设计[J];安徽大学学报(自然科学版);2004年04期
5 相征;朗朗;王静;;基于基音频能值的端点检测算法[J];安徽工程科技学院学报(自然科学版);2008年03期
6 陈弋兰;王鸣;孙书诚;;朴素贝叶斯分类器的误差估计[J];安徽工程科技学院学报(自然科学版);2008年04期
7 张聪;;储粮害虫声信号编解码系统的设计与实现[J];安徽农业科学;2006年21期
8 张红涛;胡玉霞;张恒源;顾波;;储粮害虫图像识别中的特征压缩研究[J];安徽农业科学;2008年27期
9 张昭;何东健;;基于计算机视觉的竹块颜色分类方法研究[J];安徽农业科学;2010年26期
10 吕军;马晓娜;;汉语孤立词声韵分割算法的研究[J];安徽师范大学学报(自然科学版);2008年03期
中国重要会议论文全文数据库 前10条
1 刘志斌;金连文;;候选字静态生成技术及其在两级LDA汉字识别中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
3 边红昌;程德福;祁玉林;张坤;;基于DSP和ZigBee无线智能语音控制系统设计[A];第二十六届中国控制会议论文集[C];2007年
4 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
5 梁禹;王义刚;王娜;;基于支持向量机的电力电子电路故障诊断[A];第二十六届中国控制会议论文集[C];2007年
6 张利军;岳宏达;雷正林;;基于短时傅立叶变换的人工电子耳蜗言语处理器设计[A];第二十七届中国控制会议论文集[C];2008年
7 刘华;张建华;王娆芬;王行愚;;人机系统操作员功能状态的模糊聚类方法[A];第二十九届中国控制会议论文集[C];2010年
8 韩志艳;王健;伦淑娴;王旭;;基于小波包变换的语音信号鲁棒特征提取[A];第二十九届中国控制会议论文集[C];2010年
9 晋朝勃;胡刚强;史广智;李玉阳;;一种采用支持向量机的水中目标识别方法[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
10 徐晨;曹辉;;一种语音信号生成的数字模型的研究[A];第二届西安-上海两地声学学术会议论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 范迪;沉渣厚度超声检测信号处理技术研究及应用[D];山东科技大学;2010年
2 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
3 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
4 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
5 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
6 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
7 乔小燕;基于生物形态学的赤潮藻显微图像分割与特征提取研究[D];中国海洋大学;2010年
8 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
9 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
10 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
2 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
3 廖甜甜;白细胞图像语义识别分类的研究[D];南昌航空大学;2010年
4 黄正荣;基于振动波的高速公路车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
5 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
6 刘桂珍;颅骨三维重建与信息提取[D];山东科技大学;2010年
7 张海峰;空间三维信息重构与飞行器路径规划[D];山东科技大学;2010年
8 田文娟;基于支持向量机的人民币序列号识别方法的研究[D];山东科技大学;2010年
9 陈楠楠;互动音乐桌[D];山东科技大学;2010年
10 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 张韬,裘正定;自适应多速率宽带编码标准AMR-WB及应用[J];电声技术;2004年10期
2 柏静,韦岗;一种基于线性预测与自相关函数法的语音基音周期检测新算法[J];电声技术;2005年08期
3 曹志刚,郑文涛;基于短时谱最小均方误差估计的语音增强和剩余噪声衰减[J];电子学报;1993年04期
4 胡光锐,韦晓东;基于倒谱特征的带噪语音端点检测[J];电子学报;2000年10期
5 平先军,陶然,周思永,王越;一种新的分数阶傅立叶变换快速算法[J];电子学报;2001年03期
6 李虎生,刘加,刘润生;语音识别说话人自适应研究现状及发展趋势[J];电子学报;2003年01期
7 马晓红,陆晓燕,殷福亮;改进的互功率谱相位时延估计方法[J];电子与信息学报;2004年01期
8 卜凡亮,王为民,戴启军,陈砚圃;基于噪声被掩蔽概率的优化语音增强方法[J];电子与信息学报;2005年05期
9 阎兆立;杜利民;;改进的后滤波波束形成器语音增强算法[J];电子与信息学报;2006年12期
10 徐京华,吴祥宝;以复杂度测度刻划人脑皮层上的信息传输[J];中国科学(B辑 化学 生命科学 地学);1994年01期
【相似文献】
中国期刊全文数据库 前10条
1 费珍福,王树勋,何凯;分形理论在语音信号端点检测及增强中的应用[J];吉林大学学报(信息科学版);2005年02期
2 吕勇;方元;;基于最小频带能量的变噪声电平语音增强[J];电声技术;2006年02期
3 刘志坤;唐小明;朱洪伟;;基于改进谱减法的语音增强研究[J];计算机仿真;2009年06期
4 李晔;崔慧娟;唐昆;;基于谱减的语音增强算法的改进[J];清华大学学报(自然科学版);2006年10期
5 董胡;钱盛友;;一种基于小波和时频分解的端点检测方法[J];微计算机信息;2007年30期
6 李建文;白璐;;皮肤听声器的数字化及去噪研究[J];计算机测量与控制;2011年03期
7 李强;黄冰;王苗;;一种基于小波的改进型带噪话音激活检测算法[J];微型机与应用;2010年08期
8 李晔,张仁智,崔慧娟,唐昆;低信噪比下基于谱熵的语音端点检测算法[J];清华大学学报(自然科学版);2005年10期
9 周为;邱秀清;朱敬锋;马义德;;一种基于噪声快速跟踪的语音增强算法[J];电声技术;2007年11期
10 范立;侯强;吴题;李娟;;变噪声环境下语音增强算法性能比较[J];武汉理工大学学报(信息与管理工程版);2009年02期
中国重要会议论文全文数据库 前10条
1 尹巧萍;吴海宁;赵力;;含噪语音信号端点检测方法的研究[A];2008’促进中西部发展声学学术交流会论文集[C];2008年
2 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 王旭芳;张兆宁;李军;;语音信号端点检测阈值问题的研究[A];全国第二届信号处理与应用学术会议专刊[C];2008年
4 贾川;张健;陈振标;徐波;;噪声环境下的端点检测算法研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年
5 国雁萌;潘接林;颜永红;韩疆;张建平;;基于子带能量的自适应端点检测[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
6 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
7 董大庆;窦慧晶;吴朝阳;;噪声环境下基于语音增强的说话人识别[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
8 崔光照;吴晓平;路康;;基于改进的DTW算法的仿真与分析[A];第十六届电工理论学术年会论文集[C];2004年
9 王卓;李鹏;苏牧;徐波;;噪音环境下基于高阶谱的端点检测算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 韩润强;张志平;吴玺宏;迟惠生;;一种改进的语音增强方法及其在语音识别中的应用[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 杨光;推进云计算及嵌入式计算研究[N];人民邮电;2011年
2 本报记者 潘永花;移动之旅轻松启程[N];网络世界;2003年
3 ;方之熙:为中国嵌入式计算探路[N];中国电脑教育报;2010年
4 ;嵌入式计算之产品篇[N];中国计算机报;2004年
5 薛斐;给地球镶上“电子皮肤”[N];中国计算机报;2004年
6 ;打造三重播放接入平台[N];中国电子报;2005年
7 顾莹;英特尔服务嵌入式计算市场30年[N];通信产业报;2007年
8 ;7302 ISAM面向NGN支持三重播放[N];通信产业报;2005年
9 上海贝尔阿尔卡特股份有限公司 汤栩平;上海贝尔阿尔卡特全面备战融合宽带接入[N];通信产业报;2005年
10 ;无线JAVA向移动企业应用挺进[N];人民邮电;2006年
中国博士学位论文全文数据库 前10条
1 赵欢;面向嵌入式计算平台的自动语音识别关键技术研究[D];湖南大学;2010年
2 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年
3 董婧;鲁棒语音识别技术的研究[D];吉林大学;2007年
4 马龙华;车载环境下语音识别方法研究[D];哈尔滨工程大学;2008年
5 张波涛;片上高性能嵌入式计算—面向软基带的应用并行处理模型及体系结构[D];国防科学技术大学;2011年
6 徐静波;语音时频及非线性增强处理方法研究[D];解放军信息工程大学;2005年
7 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
8 陶智;低信噪比环境下语音增强的研究[D];苏州大学;2011年
9 方瑜;语音增强相关问题研究[D];北京邮电大学;2012年
10 王玥;说话人识别中语音特征参数提取方法的研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 谭乔来;语音增强方法研究及应用[D];湖南师范大学;2008年
2 崔志栋;语音信号增强及端点检测的DSP应用系统设计[D];江南大学;2008年
3 郝明远;基于小波变换的语音增强研究[D];吉林大学;2007年
4 陈鹏飞;基于动态环境自适应端点检测的语音识别系统研究[D];武汉理工大学;2009年
5 刘静;机载环境下语音噪声抑制技术研究及实现[D];电子科技大学;2008年
6 蔡妍;语音信号端点检测方法的研究[D];江南大学;2008年
7 蔡文龙;低信噪比下的语音增强技术研究[D];燕山大学;2005年
8 王达伟;噪音环境下的说话人识别[D];成都理工大学;2005年
9 董胡;强噪声环境下语音信号端点检测方法研究[D];湖南师范大学;2008年
10 王春玲;井下载波电话语音增强问题的研究[D];山东科技大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026