收藏本站
《哈尔滨理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于矢量量化的音频信号辨析系统的研究

姜海鹏  
【摘要】: 随着互联网技术的发展,各种类型的数据海量增加,如何从海量的信息中寻找出与我们所需求的音频类型逐渐成为音频辨析系统所关心的问题,于是就有了音频场景分析技术,音频场景分析技术对机器自动感知环境特征具有重要意义。由于人类所接受的信息80%都来自于视觉和听觉,由于音频信息具有直观的特点,从音频角度解决这一问题成为最理想的途径,其中语音和非语音分类的问题属于音频场景分类研究的范畴。 针对在语音控制过程中无关的非语音信号容易被误识为语音信号从而引起系统的误操作的问题。本文以说话人识别理论为基础,提出了一种采用矢量量化来对音频信号类型(噪音或语音)进行确认的方法,以便于后期对非语音信号的噪音进行鉴别并且予以消除,提高语音信号处理系统的工作效率。系统首先对采集到的音频波形序列提取美尔倒谱系数mfcc得到音频特征矢量序列,再使用矢量量化(VQ)中的lbg算法分别得到语音和非语音信号的模板,将待识别的音频特征矢量序列和每个模板之间进行失真测度,选取量化误差最小的模板类型为待识别的音频类型。从而实现了音频信号类型的辨析和确定。 本文在matlab平台上对此系统进行了系统仿真,测试结果表明,本系统实现了语音与非语音辨析的功能,达到较好的工作效果,并且提出后期在DSP实验平台上实现该系统的方案,使在仿真中得到验证的方法在实际的硬件系统中得以应用。
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TN912.3

免费申请
【参考文献】
中国期刊全文数据库 前10条
1 吴淑珍,吴阿华;说话人识别的参量研究和语音库建设[J];北京大学学报(自然科学版);1995年03期
2 刘雪燕;张娜;袁宝玲;;说话人识别综述[J];电脑知识与技术;2009年01期
3 徐海华,何玉明;LBG算法中空包腔的优化处理[J];电声技术;2004年03期
4 王书诏;邱天爽;;与文本无关的说话人识别系统的设计[J];电声技术;2006年12期
5 杨熙;苏娟;赵鹏;;MATLAB环境下的语音识别系统[J];电声技术;2007年02期
6 丁爱明;;作为说话人识别特征参量的M FCC的提取过程[J];电子工程师;2006年01期
7 郭春霞,裘雪红;基于MFCC的说话人识别系统[J];电子科技;2005年11期
8 齐俊英,孙劲光,高爱东;基于内容的音频自动分类方法[J];辽宁工程技术大学学报;2005年S1期
9 高宏涛;张德贤;;语音识别技术研究及实现[J];光盘技术;2007年03期
10 李鹏怀,徐佩霞;基于DSP的嵌入式语音识别系统的实现[J];计算机工程;2005年16期
中国博士学位论文全文数据库 前1条
1 冯哲;基于内容的视频检索中的音频处理[D];复旦大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 王全凤;郑浩;;基于径向基函数神经网络的高层建筑结构选型[J];四川建筑科学研究;2010年05期
2 尹辉娟;贾宇琛;张菊;;基于指纹识别的网络式汽车防盗报警系统设计[J];安防科技;2009年01期
3 张根耀,李竹林,赵宗涛;遮挡情况下运动目标的跟踪[J];安徽大学学报(自然科学版);2003年03期
4 孙静静;;频移随机共振在信号检测中的应用[J];安徽大学学报(自然科学版);2010年01期
5 相征;朗朗;王静;;基于基音频能值的端点检测算法[J];安徽工程科技学院学报(自然科学版);2008年03期
6 陈弋兰;王鸣;孙书诚;;朴素贝叶斯分类器的误差估计[J];安徽工程科技学院学报(自然科学版);2008年04期
7 张红涛;胡玉霞;张恒源;顾波;;储粮害虫图像识别中的特征压缩研究[J];安徽农业科学;2008年27期
8 张昭;何东健;;基于计算机视觉的竹块颜色分类方法研究[J];安徽农业科学;2010年26期
9 吕军;马晓娜;;汉语孤立词声韵分割算法的研究[J];安徽师范大学学报(自然科学版);2008年03期
10 汪洁;朱军;;基于Linux的中文垃圾邮件过滤系统设计与实现[J];安徽农业大学学报;2011年02期
中国重要会议论文全文数据库 前10条
1 王成磊;郭治富;董彦良;赵克定;;基于定量反馈理论的双液压马达等同式同步控制器的设计研究[A];第十五届流体动力与机电控制工程学术会议论文集[C];2011年
2 刘志斌;金连文;;候选字静态生成技术及其在两级LDA汉字识别中的应用[A];第二十六届中国控制会议论文集[C];2007年
3 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
4 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
5 梁禹;王义刚;王娜;;基于支持向量机的电力电子电路故障诊断[A];第二十六届中国控制会议论文集[C];2007年
6 刘华;张建华;王娆芬;王行愚;;人机系统操作员功能状态的模糊聚类方法[A];第二十九届中国控制会议论文集[C];2010年
7 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
8 晋朝勃;胡刚强;史广智;李玉阳;;一种采用支持向量机的水中目标识别方法[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
9 何佳若;曾向阳;张春雷;;室内语音报警词识别系统设计[A];第二届西安-上海两地声学学术会议论文集[C];2011年
10 徐晨;曹辉;;一种语音信号生成的数字模型的研究[A];第二届西安-上海两地声学学术会议论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 范迪;沉渣厚度超声检测信号处理技术研究及应用[D];山东科技大学;2010年
2 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
3 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
4 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
5 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
6 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
7 乔小燕;基于生物形态学的赤潮藻显微图像分割与特征提取研究[D];中国海洋大学;2010年
8 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
9 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
10 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
2 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
3 廖甜甜;白细胞图像语义识别分类的研究[D];南昌航空大学;2010年
4 黄正荣;基于振动波的高速公路车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
5 刘棉;人机划拳系统的实现[D];山东科技大学;2010年
6 刘桂珍;颅骨三维重建与信息提取[D];山东科技大学;2010年
7 王春力;基于P2P的网络音频捕获与多路混音算法研究[D];山东科技大学;2010年
8 张海峰;空间三维信息重构与飞行器路径规划[D];山东科技大学;2010年
9 王萍;语音情感识别研究[D];山东科技大学;2010年
10 田文娟;基于支持向量机的人民币序列号识别方法的研究[D];山东科技大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 吴淑珍,邱小军;加权倒谱距离用于普通话客观音质评价[J];北京大学学报(自然科学版);1992年03期
2 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
3 孙光民,董笑盈;基于神经网络的汉语孤立词语音识别[J];北京工业大学学报;2002年03期
4 芮贤义,俞一彪;基于小波变换的鲁棒型特征提取及说话人识别[J];电路与系统学报;2005年05期
5 丁琦,徐望,王炳锡;基于模糊分类器的能量可变噪声环境下的词边界检测[J];电声技术;2003年05期
6 肖述才,王作英;端点检测中的一种新的对数能量特征[J];电声技术;2004年06期
7 邝航宇,张军,韦岗;一种基于检测元音的孤立词端点检测算法[J];电声技术;2005年03期
8 张仁志,崔慧娟;基于短时能量的语音端点检测算法研究[J];电声技术;2005年07期
9 卢艳玲,侯榆青,王宾,唐升,史燕;一种基于多特征的带噪语音信号端点检测与音节分割算法[J];电声技术;2005年07期
10 邱政权,尹俊勋;针对说话人识别进行的加权小波去噪方法[J];电声技术;2005年09期
中国硕士学位论文全文数据库 前5条
1 盛青;语音自动识别技术(ASR)及其软件实时实现[D];西北工业大学;2001年
2 徐爽;小波分析理论在说话人识别中的应用研究[D];燕山大学;2004年
3 许艳红;HHT变换在说话人识别中的应用[D];浙江大学;2005年
4 李丹;基于VQ与HMM的说话人识别系统的研究[D];武汉理工大学;2005年
5 崔国辉;说话人识别方法与策略的研究[D];山东大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 杜军;;基于模板的音频检索方法研究[J];山东师范大学学报(自然科学版);2008年02期
2 ;Bona SB-008音频信号线[J];视听技术;2001年01期
3 韩金模;实用音频信号转发器[J];音响技术;1999年03期
4 刘雅琴,周炜;基于小波变换的说话人语音特征参数提取[J];河南科技大学学报(自然科学版);2005年04期
5 杨彦;赵力;;一种改进的模糊C-均值聚类算法在说话人识别中的应用[J];电声技术;2006年01期
6 宋敏;刘幺和;谭保华;;MATLAB环境下基于矢量量化的说话人识别系统[J];湖北工业大学学报;2006年06期
7 张克功;;矢量量化和压缩编码技术在语音信号中的应用[J];兰州石化职业技术学院学报;2008年02期
8 檀蕊莲;;基于VQ的说话人识别技术研究[J];信息技术;2010年08期
9 唐熙曾;姜建新;;矢量量化在语音识别中的应用[J];西北大学学报(自然科学版);1989年04期
10 韩纪庆,徐希利;一种基于矢量量化的音频场景分析方法[J];电声技术;2002年03期
中国重要会议论文全文数据库 前10条
1 朱妹丽;马晓红;;一种音频信号剪切与粘贴的检测方法[A];2010年通信理论与信号处理学术年会论文集[C];2010年
2 柳永娟;马晓红;;基于Benford定律的音频重量化检测方法[A];2010年通信理论与信号处理学术年会论文集[C];2010年
3 仇波;许勇;吕亚东;杨军;;多声道音频压缩的声级差和时间差参数研究[A];中国声学学会2007年青年学术会议论文集(下)[C];2007年
4 陆汝华;杨胜跃;樊晓平;;基于CGHMM的轴承故障音频信号诊断方法[A];第二十六届中国控制会议论文集[C];2007年
5 宋英辉;;视频会商系统终端设备音频信号强度集中监控技术研究[A];2011年中国气象学会气象通信与信息技术委员会暨国家气象信息中心科技年会论文摘要[C];2011年
6 孔建民;;音频处理器的原理及在广播系统中作用[A];2007第二届全国广播电视技术论文集2(上)[C];2007年
7 黄玫;李双田;;一种改进的正弦分析/合成语音方法及在音频时域修正中的应用[A];2006年声频工程学术交流会论文集[C];2006年
8 茹国宝;杨锐;张永强;孙洪;黄天锡;;基于频率掩盖模型的自适应音频水印算法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
9 冯雨;赵胜辉;匡镜明;;一种基于分段自仿射分形模型的音频编码方法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
10 陈荆勇;谢湘;刘家康;;基于最近特征线法的语音/音乐分类[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 新疆 阿不力孜·牙生;一路主及三路备份音频信号按权限智能切换[N];电子报;2010年
2 四川 刘光乾;用音频信号做光电耦合器演示[N];电子报;2002年
3 叶深沉;视频采集卡音频信号故障的处理[N];电脑报;2002年
4 广西 农兵;缩短音频信号线传输长度的措施[N];电子报;2005年
5 四川 贺学金;网影HD360全高清多媒体播放器音频、视频信号处理电路分析与故障检修(续)[N];电子报;2011年
6 山东 桂云;电话自动留言电路[N];电子报;2002年
7 辽宁 徐涛;创维CTV8299彩电伴音功放块的代换[N];电子报;2002年
8 线择;怎样选择音箱线[N];经济信息时报;2000年
9 湖北 成岭;自己动手DIY 5.1音箱[N];电脑报;2004年
10 四川 贺学金;爱华JS345随身听AM收音轻的检修[N];电子报;2003年
中国博士学位论文全文数据库 前10条
1 刘继新;基于矢量量化技术的音频信息隐藏算法的研究[D];哈尔滨工业大学;2010年
2 王冬芳;基于矢量量化技术的图像实时压缩芯片的研究[D];西安理工大学;2009年
3 郑勇;小波图像分类矢量量化与网络编码量化的研究[D];电子科技大学;2002年
4 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
5 计哲;低速率语音编码算法研究[D];清华大学;2011年
6 陆哲明;矢量量化编码算法及应用研究[D];哈尔滨工业大学;2001年
7 唐琳琳;基于小波变换的多描述图像编码研究[D];哈尔滨工业大学;2010年
8 梁彦霞;低速率多带激励线性预测语音编码技术的研究[D];西安电子科技大学;2011年
9 冯前进;基于小波变换的医学图像编码[D];中国人民解放军第一军医大学;2003年
10 李靓;高质量的2kb/s波形内插语音编码算法研究[D];北京工业大学;2005年
中国硕士学位论文全文数据库 前10条
1 姜海鹏;基于矢量量化的音频信号辨析系统的研究[D];哈尔滨理工大学;2010年
2 袁铄;基于小波网络音频信号处理技术[D];大连理工大学;2010年
3 丁宁;小麦碰撞音频信号预处理方法研究[D];河南工业大学;2010年
4 孙慧慧;基于音频信号的居室状态识别研究[D];北方工业大学;2012年
5 万统斌;音频生命探测仪中一些信号处理方法的研究[D];西安建筑科技大学;2011年
6 付涛;基于DSP的音频信号快速评测系统的硬件设计[D];哈尔滨工程大学;2011年
7 陈立维;音频信号检测技术研究[D];哈尔滨工业大学;2009年
8 段盼爽;人工语音带宽扩展算法研究[D];大连理工大学;2009年
9 赵帆;单片音频信号编解码芯片的实现[D];北方工业大学;2010年
10 杨敏;多小波预处理方法的研究及其在矢量量化中的应用[D];西北大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026