收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

语音信号数字化处理关键技术研究

柏顺  
【摘要】:近年来,数字语音信号处理技术得到了深入的研究和广泛的应用,目前研究方向主要集中在语音端点检测、语音降噪、语音识别和语音合成等领域,其中作为语音信号处理系统前端的语音端点检测技术至关重要。但是由于背景噪声复杂、检测算法不够完善等因素的影响,目前语音端点检测的准确率还不够理想,还不能很好保证语音信号处理系统的稳定性。因此,提高语音端点检测的准确率对提高语音信号处理系统的稳定性具有重要意义。本文首先对传统语音端点检测算法进行了综述,在此基础上提出了一种改进方法,提高了低信噪比环境下的语音端点检测的准确率,进而基于谱减法对低信噪比环境下的语音降噪进行了研究,最后结合语音端点检测与语音降噪,设计了一种孤立词语音识别系统。本文主要工作如下:(1)提出了一种基于梅尔能量比的低信噪比环境下的语音端点检测算法。在低信噪比环境下,传统语音端点检测算法无法保证较高的准确率。针对这一问题,本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCC_a),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测。实验结果表明,本算法在不同类型的低信噪比噪音环境下的端点检测准确率较其他传统算法整体提高了约30%。此外,本文还将神经网络应用到语音端点检测当中,设计了神经网络和语音特征参数混合的语音端点检测模型,来比较采用不同语音特征参数时的端点检测准确率。实验结果表明,使用梅尔能量比作为语音特征参数进行语音端点检测的准确率较其他特征参数的准确率整体提高了约10%,进一步验证了选取梅尔能量比作为端点检测的特征参数的优越性。(2)基于谱减法提出了一种低信噪比环境下的语音降噪算法。目前较为成功的语音降噪算法有谱减法、维纳滤波法以及LMS自适应滤波法等。其中谱减法是最常用的算法,但是也存在着无话段误判、噪音估计不准确等问题。本文提出了一种基于谱减法的语音降噪算法,该算法基于高准确率的语音端点检测来对噪音进行准确估计,自适应的更新背景噪声谱,提升降噪效果。实验结果表明,经过本方法降噪后的语音信号的信噪比在整体上较传统谱减法提高了1d B。(3)设计了一种基于DTW的语音识别系统。基于高效的语音端点检测算法和语音降噪算法,本文对传统的动态时间规整(DTW)语音识别算法提出改进,设计出一种新的语音识别系统。该系统不仅提高了语音识别的准确率,而且提高了系统在低信噪比环境下的稳定性。


知网文化
【相似文献】
中国期刊全文数据库 前18条
1 程亮;廖福成;;车载语音点歌系统的实现[J];微计算机信息;2009年13期
2 R·H·哈默斯利;J·D·里德;张志杰;;检验证人对语音的识别的一些实用方法[J];环球法律评论;1985年06期
3 史星平;;公安视野下的语音本体研究[J];北方文学;2019年03期
4 ASK;;爱,就大声喊出来 IT语音控[J];电脑迷;2010年19期
5 蓝天;彭川;李森;叶文政;李萌;惠国强;吕忆蓝;钱宇欣;刘峤;;单声道语音降噪与去混响研究综述[J];计算机研究与发展;2020年05期
6 ;语音Web冲浪[J];个人电脑;2000年03期
7 Takao ,刘吉峰;语音接口[J];今日电子;1996年Z1期
8 张旭;王力华;赵东阳;;基于微信小程序的医院移动语音录入应用探索与实践[J];中国卫生信息管理杂志;2021年04期
9 陈文;学会使用语音——IBM-ViaVoice[J];电脑技术;2004年04期
10 樊贵卿,路庆凤,毋茂盛,刘润生;语音拨号器的研制[J];电子技术;2000年06期
11 David Haskin ,黄国胜;VoiceType:语音数字化新进展[J];个人电脑;1995年05期
12 侯彬锋;赵东慧;;检务语音云平台的设计方案[J];现代信息科技;2018年06期
13 宋连党;;时尚Office应用系列——用语音写封信[J];电脑爱好者(普及版);2007年07期
14 徐东伟;房若尘;蒋斌;宣琦;;语音对抗攻击与防御方法综述[J];信息安全学报;2022年01期
15 赵从健;雷菊阳;李明明;;基于无监督学习的语音签到系统[J];软件;2019年12期
16 朱英豪;王嘉祺;杨天寒;贾张玮;李圆;曲银娥;;基于32单片机的病患语音支付系统[J];中国医药导刊;2020年08期
17 赵文朋;吴姚平;甘鸣驹;;语音拣选系统在汽车零部件首批仓库拣选业务中的应用[J];物流技术;2017年01期
18 ;英腾语音拣货系统[J];物流技术(装备版);2011年22期
中国重要会议论文全文数据库 前20条
1 徐近霈;刘明宝;杨子云;;高噪环境下顽健语音特征抽取[A];第三届全国人机语音通讯学术会议(NCMMSC1994)论文集[C];1994年
2 江源富;黄泰翼;;一种基于词的统计属性模型的语音-文本转换方法[A];第二届全国人机语音通讯学术会议(NCMMSC1992)论文集[C];1992年
3 张歆奕;吴今培;张其善;;语音的共性特征及其在语音识别中的应用[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
4 柳凤兰;;“语音通”业务的实现[A];内蒙古通信学会2005年年会论文集[C];2005年
5 简世杰;邱中人;涂家章;李青宪;张信常;张森嘉;;语音对话技术的应用研究——电话请假服务系统[A];第九届全国人机语音通讯学术会议论文集[C];2007年
6 徐明;胡瑞敏;黄云森;;基于音素识别的语音评价方法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
7 郑秋豫;;神经语言学与语音工程[A];第六届全国人机语音通讯学术会议论文集[C];2001年
8 段成;;语用学视角下的语音隐喻[A];外国语文论丛(第2辑)[C];2009年
9 王引波;张伟;;语音情感分析在电信增值业务中的应用[A];天津市电视技术研究会2016年年会论文集[C];2016年
10 劳新亮;彭少华;彭海棠;;核电站语音通信保障方案的研究[A];软件定义 面向未来——2014电力行业信息化年会论文集[C];2014年
11 云冠民;;含无限词汇的汉英语音发生器[A];全国计算机辅助教育学会第四届学术年会论文集[C];1990年
12 王晖;;语音代答业务的方案设计[A];第九届中国通信学会学术年会论文集[C];2012年
13 秦兵;沙宗先;;连续小波变换在语音分形特征分析及语音分割中应用[A];第三届全国人机语音通讯学术会议(NCMMSC1994)论文集[C];1994年
14 陈科旭;简世杰;张森嘉;;个人数位助理上的语音辨识[A];第六届全国人机语音通讯学术会议论文集[C];2001年
15 石锋;;语音格局的分析方法[A];第六届全国现代语音学学术会议论文集(上)[C];2003年
16 简世杰;;一种适用于长语音串流的切割方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
17 李海峰;房春英;马琳;郑丽红;马晓梅;王海强;;病理语音的特征及其提取与优化[A];第九次全国中西医结合诊断学术研讨会论文集[C];2015年
18 于子桐;郭龙祥;李会锋;;水声语音通信信源编码优化[A];中国声学学会2017年全国声学学术会议论文集[C];2017年
19 ;中国移动语音社交应用行业研究报告[A];艾瑞咨询系列研究报告(2015年第3期)[C];2015年
20 马啸空;郭武;;复杂噪声场景下的活动语音检测方法[A];第十三届全国人机语音通讯学术会议(NCMMSC2015)论文集[C];2015年
中国博士学位论文全文数据库 前20条
1 古今;语音感知认证的关键技术研究[D];中国科学技术大学;2009年
2 潘欣裕;谎言语音检测分析研究[D];苏州大学;2016年
3 张静;昆曲语音体系研究[D];上海戏剧学院;2020年
4 李光泽;中国青少年英语学习者语音加工技能与阅读能力的关系研究[D];广东外语外贸大学;2009年
5 陶冶;文本语音匹配的研究和应用[D];山东大学;2009年
6 田立斌;语音通信质量客观评价、有效接收及错误恢复算法研究[D];华南理工大学;2004年
7 何俊;声纹身份识别中非常态语音应对方法研究[D];华南理工大学;2012年
8 钟智翔;论缅语语音的历史分期与历史发展[D];中国人民解放军外国语学院;2007年
9 陈华伟;语音通信中音质客观评价研究[D];西南交通大学;2007年
10 张希翔;面向语音环境的情感补偿推荐模型及方法研究[D];湖南大学;2017年
11 柳春;甘肃临夏方言回腔语音格局研究[D];西北民族大学;2010年
12 赖布尔(Muhammad Nabeel Talib);语义支持的一种面向盲人使用者的电子商务语音浏览方法研究[D];华中科技大学;2011年
13 纪翔;语音智能助手的评测框架[D];清华大学;2018年
14 朱铮宇;语音唇动关联性分析方法研究及其在录音回放检测中的应用[D];华南理工大学;2016年
15 韩勇;基于笔和语音的交互应用研究[D];北京交通大学;2006年
16 高伟勋;智能家居环境中个性化语音生成关键技术研究[D];东华大学;2015年
17 李波;语音转换的关键技术研究[D];国防科学技术大学;2005年
18 李宝祥;语音关键词检索若干问题的研究[D];北京邮电大学;2013年
19 许春冬;嘈杂声学环境下的时频语音出现概率与噪声功率谱估计[D];北京理工大学;2016年
20 张景宣;序列到序列的语音生成声学模型研究[D];中国科学技术大学;2021年
中国硕士学位论文全文数据库 前20条
1 柏顺;语音信号数字化处理关键技术研究[D];南京邮电大学;2021年
2 任雪妮;语音相似度评价算法研究[D];西安建筑科技大学;2013年
3 穆培婷;语音唤醒技术在语音助手系统中的应用与实现[D];西安电子科技大学;2020年
4 于雷;基于Google Speech-API的简单语音对话系统的实现[D];华南理工大学;2012年
5 康帅;语音对抗攻击技术研究[D];西安电子科技大学;2020年
6 李泫才;端到端语音翻译研究[D];哈尔滨工业大学;2020年
7 朱敏;语音助手的系统设计与实现[D];山东大学;2013年
8 赵玲丽;基于高斯混合模型的语音转换技术研究[D];南京邮电大学;2011年
9 杨帅;聋儿语音恢复系统的语音识别研究[D];山东大学;2009年
10 胡玉龙;基于特征比较的语音评分在嵌入式系统中的应用研究[D];兰州大学;2007年
11 王超;基于模糊综合评价的语音评测模型的研究与实现[D];东华理工大学;2017年
12 唐闻欣;浅议博物馆中的语音导览[D];南京师范大学;2016年
13 王雪娇;俄语广告语中语音隐喻的研究[D];东北师范大学;2016年
14 杨仕芳;歌唱语音形态研究[D];西南大学;2013年
15 热合曼·吾拉音;基于在线的维吾尔语语音语料库的建立及应用[D];新疆大学;2017年
16 惠琳;谱参数联合韵律特征实现年龄语音转换的研究[D];苏州大学;2016年
17 李清华;语音转换技术研究及实现[D];湖南师范大学;2015年
18 马倩倩;基于个性特征的语音转换技术研究[D];河北经贸大学;2013年
19 冯大伟;喉振式话筒语音的修复研究[D];山东大学;2012年
20 李翠翠;语音情感分析业务系统的设计与实现[D];北京邮电大学;2011年
中国重要报纸全文数据库 前20条
1 本报记者 彭芳;语音开拓应用最重要[N];中国计算机报;2001年
2 本报记者 段佳;车载语音机器人不再“有耳无脑”[N];科技日报;2015年
3 本报记者 齐洁;在线语音创业大扎堆[N];中国经营报;2013年
4 本报记者 曹术华 陈友梅;语音互联再造Internet[N];中国计算机报;2001年
5 本报记者 王慧;微信交流,发语音还是发文字?[N];新华日报;2022年
6 本报记者 韩鑫;突破核心技术 做强语音产业[N];人民日报;2022年
7 记者 刘娟 胡林果;微信也有假的,会盗取机主语音诈骗[N];新华每日电讯;2019年
8 本报记者 赵昂;语音社交平台会是新风口吗?[N];工人日报;2021年
9 中青报·中青网记者 周易;超八成受访者体验过语音交友[N];中国青年报;2020年
10 记者 刘霞;新设备可将大脑信号直接转换为语音[N];科技日报;2019年
11 本报见习记者 程唯珈;寻求智能时代的语音空间[N];中国科学报;2019年
12 南方日报记者 许隽 叶丹;语音助手新升级:无需反复唤醒,可连续对话[N];南方日报;2019年
13 本报记者 许政 通讯员 邱雨森;18岁男子利用语音包秒变“可爱萌妹”大肆行骗[N];人民公安报;2019年
14 本报见习记者 王彤旭;“黑灰产”聚集 语音社交乱象知多少[N];中国商报;2019年
15 本报记者 孙佳薇;创办“的士语音e支部”的热心“的哥”[N];黑龙江日报;2019年
16 本报赴合肥特派记者 刘扬;在世界声博会体验AI黑科技[N];环球时报;2019年
17 IT时报记者 李丹琦;同学发来微信语音借钱,别轻信![N];IT时报;2019年
18 证券时报记者 胡飞军;消费金融行业首现“语音催款”机器人[N];证券时报;2018年
19 本报记者 任翀;语音秒转文字很方便 自有社交圈子待建立[N];解放日报;2018年
20 记者 张璐;语音生成国际研讨会在津召开[N];天津日报;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978