收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

视频广告内容分析与理解

刘楠  
【摘要】:视频广告已经成为当今人类社会最为流行的一种商业媒介,为人们的现代生活带来了不可或缺的商业信息,时时刻刻都在潜移默化的影响着人们的工作和生活方式。每年世界各国的企业都会花费上亿美元的资金,生产、投放成千上万条的视频广告并在各国电视台循环不断的播出,在向民众推介各种各样新颖的商品及服务的同时,也带动了相关产业的迅速发展。 同时,随着数字化浪潮的发展,人们已经可以通过各种手段录制海量的视频广告以便随时获取重要的商业咨询。但是,由于缺少有效的广告内容自动分析技术,录制广告数量的爆炸性增长导致了不同用户群对于视频广告自动滤除、采集以及索引等多方面的迫切需求。如何针对他们各具特色的需求,开发一系列有效的视频广告内容分析与理解技术,从而快速有效的监视、分析、存储、查询视频广告的内容、播出时间、质量等已经成为当前多媒体内容分析领域的一个热点问题。 针对当前视频广告内容分析与理解技术中存在的不足,本文尝试和探索从视频广告各种潜在语义特性的分析入手,借助计算机视觉、机器学习以及多媒体处理技术,跨媒体挖掘视频广告中存在的各种语义概念,构造中层描述子,实现不同媒体模态下的信息交互融合,提出行之有效的解决方案。本文主要成果和创新之处包括以下几个方面: 1)视频广告识别技术中的由粗及细匹配策略 为提高视频广告识别技术的效率,通过将局部敏感哈希函数(Locality Sensitive Hash, LSH)与精细尺度连续滤除技术(Fine Granularity Successive Elimination, FGSE)进行有机的融合,提出一种由粗及细的匹配策略。在粗匹配阶段,利用LSH加快初始检索速度,大量过滤无关内容,得到全局近似的查询结果;在精匹配阶段,引入FGSE技术解决粗匹配过程中的冲突问题,通过逐层分解匹配特征,快速寻找局部差异,获得精确匹配结果,实现对于视频广告的快速识别。 2)基于协同学习的视频广告文本检测 视频广告中的文本是一种重要的语义信息。为实现对这类复杂文本的有效定位,提出一种基于协同学习的视频广告文本检测方法。通过将文本检测视为一种特殊纹理的分类问题,引入协同学习机制,采用两种相对独立的视角强化对于文本区域特性的描述。针对协同学习机制中容易引入噪声样本的问题,结合Bootstrap思想,提出一种改进的协同学习算法,在两个相对独立的视角中交互选择典型样本,提高分类器的泛化能力。 3)融合视觉-音频-文本模态信息的视频广告段落检测 提出一种基于视觉、音频以及文本模态交互式融合的广告段落检测方法。通过充分挖掘广告各模态中本质的播放特性,首次在视频广告的文本模态中,结合视频文本区域在时空域随机变化的特性,提出一个全面的文本描述子,同广告音视频模态特征构成完整的描述空间。此外,为解决现有融合方式中,简单将各模态信息进行叠加的不足,提出一种交互集成式学习算法Tri-AdaBoost,交互挖掘各种模态的中级描述子所蕴含的互补信息,实现这些模态的有机融合,从而提升分类器的性能。 4)视频广告段落分割技术中跨媒体特性分析与融合研究 通过融合广告视觉、音频以及文本模态,提出一种有效的视频广告段落分割方法。为了加强对于广告分割具有重要作用的描述子——产品信息帧(Frame Marked with Product Information, FMPI)检测的鲁棒性,首次将文本模态与一些重要的视觉特性引入FMPI的构造过程,并结合音频模态描述子形成一个对于广告边界特性的完整描述空间。此外,利用不同模态下描述子之间时域的上下文信息,实现各模态的有效融合,自动分割广告段落。 5)基于稀疏视觉词包描述的广告语义分类方法 为提高传统视觉词包的描述能力,利用更加符合人类理解图像方式的稀疏学习技术,提出一种基于稀疏视觉词包描述的广告语义分类方法。基于对于大量广告中视觉语义单元共生规律之间的分析,将不同类别广告中出现的各具特色的语义单元映射为一种过完备化的视觉词典表示,并利用这个词典中基本元素的稀疏线性组合描述广告中潜在的语义,在不同类别广告中蕴含的语义信息与稀疏视觉词包描述之间建立潜在的映射关系,实现对于广告语义内容的分类。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张明;唐振民;杨习贝;;不完备信息系统中的否定决策规则和知识约简[J];控制与决策;2011年06期
2 闻帆;屈桢深;闫纪红;;基于CKPCA-HOG和支持向量机的运动目标分类算法[J];哈尔滨工程大学学报;2011年05期
3 王晓卫;吴晓中;王宏宇;;基于ADSP-BF561的图像平移系统的设计与实现[J];现代电子技术;2011年10期
4 邓莉琼;陈丹雯;袁志民;吴玲达;;相似视频关联分析技术综述[J];计算机工程;2011年15期
5 许允喜;陈方;;基于CenSurE特征的SAR/INS组合导航景象匹配算法[J];控制与决策;2011年08期
6 宋阳;;浅谈基于DVB的数据广播技术[J];黑龙江科技信息;2011年22期
7 王小林;;一种新型成人图像自动检测系统[J];电脑知识与技术;2011年17期
8 任彦荣;;混合微粒群神经网络系统的构建及其在HLA-A~*0201限制性T细胞表位活性预测中的应用[J];计算机与应用化学;2011年06期
9 邓莉琼;陈丹雯;袁志民;吴玲达;;面向语义属性查询的动画场景图像检索系统[J];计算机工程与应用;2011年19期
10 程德志;李言俊;余瑞星;;基于改进SIFT算法的图像匹配方法[J];计算机仿真;2011年07期
11 杨云涛;冯莹;曹毓;陈运锦;;车载摄像平台序列图像快速拼接方法[J];应用光学;2011年04期
12 朱宁波;张春凤;郑碧娟;;基于自适应LBP的视频文本检测算法[J];计算机工程;2011年18期
13 冯振;王宇新;郭禾;贾棋;;结合抠像技术的图像分类方法[J];中国图象图形学报;2011年06期
14 彭欣;刘富强;宋华军;;基于SURF目标跟踪算法研究[J];长春理工大学学报(自然科学版);2011年02期
15 戴幻尧;李永帧;薛松;王雪松;;相控阵天线空域极化特性的高频仿真分析[J];电波科学学报;2011年02期
16 支力佳;张少敏;赵大哲;于红绯;赵宏;林树宽;;基于最小生成树的DoG关键点医学图像配准[J];中国图象图形学报;2011年04期
17 朱齐丹;李科;蔡成涛;程甘霖;;采用改进的尺度不变特征变换算法计算物体旋转角度[J];光学精密工程;2011年07期
18 朱齐丹;李科;雷艳敏;孟祥杰;;基于全景视觉的机器人回航方法[J];机器人;2011年05期
19 乔维维;秦小文;陆静逸;;印刷电路板图像模式识别研究[J];电子测试;2011年07期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 王建;朱明清;赵宇宙;郭明玮;陈宗海;;基于含时切割平面和区域协方差描述子的跳跃行为识别方法[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
2 戴岳刚;明东;;基于数学描述子的步态图像处理方法研究[A];天津市生物医学工程学会第29届学术年会暨首届生物医学工程前沿科学研讨会论文集[C];2009年
3 李瑞;王朝坤;郑伟;王建民;王伟平;;基于MapReduce框架的近似复制文本检测[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
4 张静茹;何耀;刘兴涛;朱明清;陈宗海;;基于区域协方差描述子的视频静止目标检测[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
5 熊刚强;齐东旭;;基于分段多项式描述子和BP网络的形状识别方法[A];第十五届全国图象图形学学术会议论文集[C];2010年
6 原琨;姚鸿勋;纪荣嵘;;基于时空关联的角色关系挖掘[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
7 张聪;明东;万柏坤;;基于小波描述子和人体骨架模型的多视角融合步态识别[A];天津市生物医学工程学会第29届学术年会暨首届生物医学工程前沿科学研讨会论文集[C];2009年
8 朱辉;李在铭;;视频图像中文本检测与分割技术研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
9 欧梅芳;宋瑞霞;;V-系统在信息重构与字符识别中的应用探索[A];中国图学新进展2007——第一届中国图学大会暨第十届华东六省一市工程图学学术年会论文集[C];2007年
10 于佳;王燕;;基于SOM的视频中人工文本区域检测方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 刘楠;视频广告内容分析与理解[D];北京交通大学;2012年
2 洪晓鹏;新型二阶统计描述子及其在物体检测与跟踪方面的应用[D];哈尔滨工业大学;2010年
3 孙巧榆;复杂背景图像的文本信息提取研究[D];华东师范大学;2012年
4 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
5 彭青松;Bayesian网及其在图像分析中的应用研究[D];合肥工业大学;2005年
6 王军伟;融合全局与局部信息的形状轮廓特征分析与匹配[D];华中科技大学;2012年
7 李朝晖;基于视频文本检测和视频对象分割方法研究[D];华南理工大学;2004年
8 黄剑华;自然场景中文本信息提取方法[D];哈尔滨工业大学;2007年
9 陈国华;手性药物分子结构表征及定量构效关系研究[D];重庆大学;2010年
10 戴鹏;货车典型故障图像识别算法研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 郭兴伟;基于视觉的手势识别算法研究[D];上海海事大学;2003年
2 冯冰;基于时空特征和词袋模型的多模态视频内容识别算法研究[D];上海交通大学;2011年
3 张波;对称集及其在形状识别中的应用研究[D];北方工业大学;2008年
4 陈丽娇;基于极大稳定极值区的视频文本检测算法研究[D];大连理工大学;2012年
5 倪江荣;基于时空描述子的动作识别模型研究[D];华东师范大学;2012年
6 于佳;基于SOM的视频中人工文本检测方法研究[D];哈尔滨工程大学;2010年
7 赵妍;视频文本检测研究[D];南京大学;2012年
8 王瑾;局部轮廓信息描述结合学习分类的文本检测技术研究[D];燕山大学;2010年
9 孙小亮;基于多帧融合的视频文本检测[D];北京邮电大学;2011年
10 李娟;基于特征描述子的指纹算法研究[D];西安电子科技大学;2012年
中国重要报纸全文数据库 前1条
1 太原有线电视网络中心 卫明慧;EPG在机顶盒中的实现[N];山西科技报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978