收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于内容的海量音频高效检索

王运生  
【摘要】:新世纪以来随着互联网在全世界范围的广泛普及、音频编解码技术的迅猛发展以及高容量存储介质的诞生,使得网络中的数字音频资源数量呈现指数级别的增长。海量的网络数字音频资源给人们带来了极大地便利,然而由于互联网数字音频管理体系和版权保护制度的不规范和不完善,网络用户可以随意的上传下载数字音频资源甚至对音频内容进行更改,这在无形中严重侵犯了数字音频资源版权拥有者的合法权益。数字音频的版权保护,如今已经引起社会各界的广泛关注,已经成为亟待解决的重要问题。 依据新闻出版总署重大科技工程项目“数字版权保护技术研发工程”及国家科技部支撑项目课题“数字版权服务关键支撑技术研究”需求,本课题主要研究音频特征备案及高效检索的相关关键技术,最终实现在普通配置服务器设备存储的10万条规模的数字音频内容版权核心资源数据库中对未知信息音频片段进行检索定位,所需查询时间小于1秒,同时保证检索准确率达到90%以上。课题的研究对网络环境下的海量数字音频资源的规范管理、数字音频版权的有效保护以及数字音频内容的快速准确的访问等问题具有不容忽视的推进作用和重大意义。 课题首先对基于内容的音频检索系统的国内外研究现状进行了详细的阐述,通过对目前现有的音频指纹提取方法及相关快速检索方法的全面总结与分析,围绕经典的Philips音频指纹,重点对其相关的快速检索方法进行深入探讨。最后设计了一种基于Philips指纹的海量音频高效检索系统,并进行大量实验验证。课题的主要贡献有:1)在Philips指纹的基础上引入bag-of-features算法,提出一种数据量相比Philips指纹成倍减少的高效、鲁棒的中间指纹进行过滤检索,可以在短时间内快速过滤不相关音频;2)相应地设计了一种基于阈值的固定间隔抽样匹配算法,大幅减少检索过程中相似度匹配的计算量,并有效地促进了中间指纹的过滤速度;3)结合Fibonacci哈希索引算法、中间过滤指纹、Philips指纹及基于阈值的固定间隔抽样匹配算法,设计并实现了一套高效的阶梯式音频过滤检索系统。 经大量反复的实验验证,基于BoF和Philips指纹的中间过滤指纹具有极高的过滤速度和过滤幅度,同时保证检索的召回率和准确率,基于阈值的固定间隔抽样匹配算法在略微降低过滤幅度的基础上,可以有效地提高过滤速度和检索速度,最终设计的高效阶梯式音频过滤检索系统,在一台存储约为10万条音频指纹的普通配置PC上对10秒的未知信息音频片段进行批量检索,平均检索时间仅为0.15秒,检索召回率可达99.47%以上,检索准确率接近100%,圆满完成项目相关指标任务。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 冰河;;看高清别忘了音频设置[J];电脑迷;2009年06期
2 胡宏文;;电台数字采访机录音技巧与后期音频处理[J];科技创业家;2012年14期
3 孙江胜;韩月秋;;GSM手机音频设计和测试[J];河北工业大学学报;2005年06期
4 ;新型音频编解码软件驱动器改善音频能力[J];电子设计技术;2006年11期
5 ;手机芯片平台强化音频处理水平[J];电子设计技术;2006年12期
6 唐秀林;;Nuendo音频片段的编辑[J];音响技术;2007年08期
7 周艳香;;音频混响效果的原理及实现[J];通信技术;2009年08期
8 张涛;杨东明;贺家琳;李海;彭鹏;;音频码流分析工具设计与实现[J];电声技术;2009年08期
9 彭岚;;多媒体技术之音频处理技术浅析[J];科技信息;2009年29期
10 郭洪荣;;浅析多媒体应用中的音频处理技术[J];民营科技;2012年11期
11 陈庆新,沈加夫;音频处理器的音频处理与实践[J];广播电视信息;1997年10期
12 张有录;音频教学信息的数字化处理[J];中国有线电视;2003年Z3期
13 倪宁宁;音频的嵌入技术与应用[J];广播与电视技术;2005年11期
14 汪晓峰;;电子综合设计实验设备的研制音频处理电路的设计[J];硅谷;2008年01期
15 郭华帅;王晖;李传珍;;音频原声变速软件的设计与应用[J];广播与电视技术;2008年01期
16 丁润英;程显文;;发射机信号入口端配接音频处理装置[J];科技资讯;2010年35期
17 熊蓉;;异地节目的音频处理要点[J];现代电视技术;2012年01期
18 李娇;王铎;;基于云计算的音频管理体系研究[J];河南科技;2012年09期
19 容宝华;;基于最小距离的音频分类方法的研究[J];电声技术;2012年11期
20 张德成;;巧用Nero Wave Editor进行音频编辑[J];中小学电教;2005年12期
中国重要会议论文全文数据库 前7条
1 廉明涛;;音频处理在中波转播台的应用[A];2005年广播电视技术论文汇编[C];2005年
2 何冬梅;高文;;MPEG音频编码器的软件实时实现[A];第五届全国人机语音通讯学术会议论文集[C];1998年
3 王兴国;蒋伟峰;刘济林;顾伟康;;现代音频处理的DSP方案[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
4 张承云;;TMS320C54xx DSP的音频数据收发技术及实现[A];2006年声频工程学术交流会论文集[C];2006年
5 吴烁宇;;基于C-SKY CPU的音频处理SoC设计[A];《IT时代周刊》2013年度论文集[C];2013年
6 于建华;;电视广播中的音频嵌入技术[A];中国电影电视技术学会影视科技论文集[C];2002年
7 舒平;钟民主;杨琳;;舱音记录器译码系统的改进[A];探索创新交流--中国航空学会青年科技论坛文集[C];2004年
中国博士学位论文全文数据库 前3条
1 李辉;改进的离散余弦反变换迭代算法研究与音频DSP核设计[D];电子科技大学;2010年
2 郑贤中;高指向性音频声波理论与控制研究[D];华中科技大学;2006年
3 杨艳秋;强鲁棒的音频掩密与扩频掩密分析研究[D];重庆大学;2009年
中国硕士学位论文全文数据库 前10条
1 沈玥;基于手机音频处理原理的音频缺陷分析与检测方法改进[D];天津大学;2007年
2 陈芳;基于数字指纹的音频识别与认证研究[D];复旦大学;2008年
3 黄千;基于支持向量机的音频分类技术研究与应用[D];北京邮电大学;2010年
4 蔡彩;音频结构化技术研究[D];解放军信息工程大学;2009年
5 贾兰兰;广播音频的分割分类算法研究[D];西安电子科技大学;2009年
6 张小梅;基于小波和支持向量机模型的音频分类研究[D];燕山大学;2009年
7 胡小强;基于内容的音频分割与分类[D];华中科技大学;2009年
8 姬鹏宇;色情视频的音频辅助识别[D];北京邮电大学;2011年
9 白亮;音频分类与分割技术研究[D];国防科学技术大学;2004年
10 张瑞杰;广播新闻音频结构化技术研究[D];解放军信息工程大学;2009年
中国重要报纸全文数据库 前10条
1 小新;打造个人音频工作室[N];中国电脑教育报;2003年
2 ;德州仪器推出全新DSP[N];人民邮电;2006年
3 罗清岳;3D环绕功能与扬声放大器的单芯片设计[N];电子资讯时报;2007年
4 宁夏 杨勇杰;清华紫光8017B超级VCD机维修两例[N];电子报;2006年
5 四川 贺学金;网影HD360全高清多媒体播放器音频、视频信号处理电路分析与故障检修(下)[N];电子报;2011年
6 湖北 王绍华;日立VT-M757E(DH)录像机 检修一例[N];电子报;2004年
7 ;飞思卡尔半导体24位音频数字信号处理器产品简介[N];电子资讯时报;2004年
8 龙哥;软件应用问答[N];中国计算机报;2004年
9 ADI高级应用工程师 Ke Ning Gabby Yi;先进压缩标准引发音视频同步化技术热[N];中国电子报;2007年
10 重庆 杨清德;创维DVD-948P碟机信号流程及IC引脚数据(下)[N];电子报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978