收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于隐马尔可夫模型的音频检索

宋文静  
【摘要】:作为多媒体媒质之一的音频信号几乎无处不有,它有效的丰富和补充了人们在信息社会的语义感知和获取。但当前人们对多媒体信息检索获取仍是以视觉为主要途径,特别是常以文本方式进行检索,而基于大量音频信息库的检索形式却未能引起人们的足够重视。为此,本文针对音频检索问题展开了讨论,从音频信号特征提取着手,分析了音频信号的时域和频域特征以提取短时能量、短时过零率、短时能频值和Mel系数等为特征数据,把音频信息流分割为广告、主持人介绍、天气预报、足球比赛、音乐或戏曲等六大类。利用具有较强的时间序列结构建模能力的隐马尔可夫模型和具有并行性、强分类能力的BP神经网络实现了广播电视节目音频信息流分类检索。同时考虑到基于梯度下降法的BP算法训练速度慢,为加强检索手段的时效性,我们进行了BP算法加速收敛的分析应用,得到了适用于音频检索的改进BP算法,数值实验结果表明有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李晓雪;徐文;金丽玲;李建龙;;联合宽带到达方向估计和语音特征增强的传声器阵处理方法[J];声学学报;2011年04期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 费玉莲;凌云;王勋;;基于增强隐马尔可夫模型的视频数据挖掘研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
2 马勇;金赟;顾明亮;赵力;;基于隐马尔可夫模型的汉语方言辨识[A];2009’中国西部地区声学学术交流会论文集[C];2009年
3 徐东风;周萍;景新幸;;改进隐马尔可夫模型的非线性分段技术应用[A];中国声学学会2007年青年学术会议论文集(下)[C];2007年
4 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
5 林文永;石志国;薛为民;陈锋军;;隐马尔可夫模型实现语音和视频识别[A];第一届学生计算语言学研讨会论文集[C];2002年
6 郁正庆;戴蓓倩;张劲松;王长富;;语音模糊观察序列应用于隐马尔可夫模型快速训练的方法[A];第二届全国人机语音通讯学术会议论文集[C];1992年
7 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 杨文强;邓明华;钱敏平;;隐马尔可夫模型与剪切位点识别[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
9 林雪燕;刘正光;;基于小波域隐马尔可夫模型的脑部MR图像体 数据分类及体绘制[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
10 李帅;王精业;王丽娟;;基于马尔可夫模型的文本信息提取算法概述[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 李杰;隐马尔可夫模型的研究及其在图像识别中的应用[D];清华大学;2004年
2 刘小军;人脸识别技术研究[D];中国科学院电子学研究所;2001年
3 肖文斌;基于耦合隐马尔可夫模型的滚动轴承故障诊断与性能退化评估研究[D];上海交通大学;2011年
4 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
5 赫泉玲;多元小波的构造、提升及其应用[D];吉林大学;2005年
6 丁明石;基于移动通信技术的远程实时心电监护系统设计[D];天津大学;2005年
7 周韶园;基于HMM的统计过程监控研究[D];浙江大学;2005年
8 刘立芳;生物信息学中的多序列比对与模体识别问题研究[D];西安电子科技大学;2006年
9 栾方军;在线手写签名认证算法的研究[D];吉林大学;2007年
10 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
中国硕士学位论文全文数据库 前10条
1 宋文静;基于隐马尔可夫模型的音频检索[D];南京理工大学;2004年
2 任振刚;基于SAPI引擎的语音交互方法的研究与实现[D];沈阳工业大学;2005年
3 刘波;基于隐马尔可夫模型的系统调用异常检测系统[D];兰州大学;2006年
4 余浩;说话人识别的自适应算法研究[D];武汉理工大学;2005年
5 凌广杰;基于分段半马尔可夫模型的在线序列模式检测方法研究[D];浙江大学;2006年
6 纪灵军;隐非齐次马尔可夫模型的混合性[D];江苏大学;2008年
7 张军;基于MFCC的语音识别加速技术研究[D];北京化工大学;2009年
8 朱义鑫;基于网络的隐马尔可夫异常检测技术研究[D];新疆大学;2005年
9 徐欣;基于HMM的中医临床疗效评价分析研究[D];北京交通大学;2009年
10 闫三锋;基于单片机语音识别系统设计[D];西北工业大学;2004年
中国重要报纸全文数据库 前3条
1 王向东 栾焕博 林守勋 钱跃良;语音识别:抗噪音能力有待加强[N];计算机世界;2006年
2 晓业;TTS提升基金CIC服务[N];计算机世界;2002年
3 北京大学信息科学中心视觉与听觉信息处理国家重点实验室 吴玺宏;声纹识别听声辨人[N];计算机世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978