收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于内容多媒体应用的语义视频对象提取及评价

杨高波  
【摘要】:传统的视频压缩编码标准MPEG1/2和H.26x都采用基于帧的技术,不要求对场景进行分割。它们能获得较高的压缩比,并在许多领域得到了广泛的应用。随着多媒体信息的日益丰富,人们不再满足于对视频信息的简单浏览,而要求提供基于对象的操纵、交互等功能。为此,MPEG-4引入视频对象的概念,以支持基于对象的交互性和可分层性。MPEG-7则对各种媒体对象进行统一和规范化的描述。按照MPEG-4的校验模型,视频序列必须先分割成具有语义意义的视频对象,然后对其运动、形状和纹理分别进行编码。视频对象的应用价值主要有:对不同的视频对象按其对视觉重要性分配不同的码率,可提高压缩编码效率;支持对象可分级,在较低的网络带宽时获得更好的视觉效果;用视频对象来组织视频内容,能实现基于视频内容的存储、交互和查询等功能。 然而,MPEG-4尽管引入了视频对象的概念,它并没有指定从视频序列获取视频对象的具体方法。一方面,视频对象的语义一致性难以通过视频的低级物理特性来建模,使得针对各种视频序列的通用视频对象分割算法是一个尚未解决的经典难题;另一方面,针对特定的应用,往往可以利用先验知识设计相应的算法。 本论文重点研究MPEG-4框架下的从视频序列中分割出视频对象的方法和技术,以及其在基于内容多媒体中的应用。研究目标是:对特定类型的序列如头肩序列,算法满足实时性要求;对背景静止的序列,全自动分割算法取得较好的分割效果;对复杂背景和前景运动视频序列,采用半自动分割算法,要求得到较好的分割质量,而且人机交互简单。具体地,本文研究的主要内容和贡献包括: 提出了两种全自动的视频对象分割算法。第一种采用背景记录和变化检测,主要由预处理、背景记录、背景缓冲、变化检测和后处理等几部分组成。它不需要诸如运动估计、特征空间分析等计算量大的操作,并能有效去除阴影和光照变化造成的影响。它能够生成背景信息,支持MPEG-4的精灵编码。第二种是一种基于时空分割融合的视频对象提取改进算法。时间分割基于变化检测,其关键的阈值选取是通过直方图分析得到的。空间分割是本算法的核心,采用基于小波变换的分水岭变换算法。 提出了一种半自动的视频对象分割算法。为方便用户定义初始对象轮廓,提出了一种修 杨高波 基于内容多媒体应用的语义视频对象提取及评价 改的智能剪.它通过引入边界框、简化代价函数和改进搜索策略等,可提高优化路径搜索速 度约6一8倍,而几乎不损失分割精度,完全满足半自动分割算法对初始对象轮廓勾勒的要求。 为克服对象跟踪过程中的误差积累,按视频对象的刚性、非刚性以及全局、局部直方图比较 进行视频分解得到后续帧的视频对象。由于视频分解以及人工参与,它可以在很大程度上解 决遮挡问题,取得了比COSTZll AM更好的分割效果。 针对目前的视频分割算法大多数难以满足实时性要求,采用了一种新的计算体系结构, 即将细胞神经网络引入视频对象分割.细胞神经网络是一种非线性模拟电路,由大量胞元组 成,且只允许最邻近的胞元间直接通信。由于它具有的高度并行的实时处理能力和机理类似 于人类视觉系统,特别适合于图像处理等领域。然而,与传统的CISC处理器相比,CNN只 能利用一些简单的基于像素的函数,有相对狭窄的指令集一尽管有很高的速度。因此,基于 O四体系结构的视频对象分割算法的关键是充分考虑到经胞神经网络的特点,将复杂的视频 分割算法分解为一些CNN胞元能够完成的低级操作。论文提出基于彩色边缘变化检测的视频 分割算法。所有的模板都是3x3的线性模板,并能在CNN的模板库中得到,因此,其易于 CNN实现。 本文提出了一种客观的存在参考分割时分割算法评价方法。视频分割算法往往只适合特 定的应用,其性能依赖于具体的序列。目前,视频分割算法的性能评价以对己知序列的分割 结果的主观评价为主,尚没有一种广泛接受的客观评价方法。视频分割算法的评价是重要的, 它有助于针对具体的应用选取合适的算法并设置恰当的参数,以及有利于通过融合各种算法 的优点发展新的算法;而且,自动分割算法采用性能评价作反馈可改进分割性能。空间精确 度通过相对前景面积、位置、边界像素距离以及像素分类来进行,并将其按对人类视觉系统 的重要性线性加权。而时间一致性反映分割算法分割各帧时的稳定性,它通过空间准确度的 变化‘来刻画。实验证明,其评价结果与主观评价结果一致,而且计算量小。 综上所述,本论文系统地研究了MPEG4框架下的语义视频对象分割问题,根据具体的 问题提出了满足实际需要的全自动、半自动分割算法,并探讨了在存在参考分割的情况下客 观地评价视频分割算法性能的方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 余妹兰;叶群;张思扬;王利元;;一种基于混沌Chebyshev与CNN交错映射的图像加密技术[J];中南林业科技大学学报;2011年07期
2 徐思;王利;;一类具有时滞的细胞神经网络的稳定性分析[J];中国西部科技;2011年23期
3 吴唯;李香泉;;智能手机流媒体技术的设计与实现[J];景德镇高专学报;2011年02期
4 杨谦;张晓;;变电站图像监控系统技术的应用研究[J];机电信息;2011年24期
5 宋建斌;詹舒波;马丽;;基于通用DSP的视频解码器的优化实现[J];电信科学;2011年08期
6 陈婷;阿里甫·库尔班;;基于照片的特定三维人脸建模方法[J];计算机技术与发展;2011年07期
7 张清勇;苏明霞;;基于VW2010的视频存储系统的设计[J];电子产品世界;2011年09期
8 王玲玲;张元一;陆建德;;MPEG-4形式化同步描述信息的研究与设计[J];计算机应用与软件;2011年08期
9 李金群;;多媒体远程监控系统设计[J];科技促进发展(应用版);2011年02期
10 于洪波;;论5种视频系统图像文件的存储格式与图像存储[J];智能建筑与城市信息;2011年07期
11 陈俊生;周健;彭莉芬;;一种基于i.MX21的视频硬件编码方法的设计与实现[J];福建电脑;2011年06期
12 黄旭光;张南生;冯朝文;;SETMOS器件在混沌保密通信中的应用研究[J];现代电子技术;2011年10期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 杜润林;刘展;姜雪洋;;细胞神经网络方法在提取油气重力异常信息中的应用[A];中国地球物理2010——中国地球物理学会第二十六届年会、中国地震学会第十三次学术大会论文集[C];2010年
2 栗国星;石秉学;;一种用于手写体数字识别的电流型CNN特征提取器[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
3 马野;;细胞神经网络无性模板改进的设计方法及仿真研究[A];2001中国控制与决策学术年会论文集[C];2001年
4 王天汉;赵建业;余道衡;;三细胞自治神经网络电路中的混沌现象研究[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 周冬明;马克力;;具有时滞和时变输入的细胞神经网络的κ-全局指数稳定性[A];数学·物理·力学·高新技术研究进展——1998(7)卷——中国数学力学物理学高新技术交叉研究会第7届学术研讨会论文集[C];1998年
6 徐振;李惠忠;;一种基于MPEG-4的可视通信便携终端的实现[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
7 刘洪臣;冯勇;李林静;;多涡卷混沌发生器的滞环细胞神经网络实现[A];2006中国控制与决策学术年会论文集[C];2006年
8 费文东;孟相如;;基于细胞神经网络文字识别的特征提取技术[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
9 倪伟;郭宝龙;;MPEG-4形状编码中的自适应二值运动估计算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
10 何卫锋;梁圃;毛志刚;;面向流媒体的MPEG-4 AS Profile视频编/解码器的解决方案[A];中国通信集成电路技术与应用研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 杨高波;基于内容多媒体应用的语义视频对象提取及评价[D];上海大学;2004年
2 张庆利;视频对象自动分割技术及其细胞神经网络实现方法的研究[D];上海大学;2005年
3 张建华;基于细胞神经网络的非线性时滞系统自适应控制[D];燕山大学;2011年
4 周冬明;细胞神经网络的非线性动力学机制及应用研究[D];复旦大学;2004年
5 李雪梅;细胞神经网络的稳定性[D];湖南大学;2002年
6 王宏霞;混沌技术在现代保密通信中的应用研究[D];电子科技大学;2002年
7 孟蜀锴;细胞神经网络在视频运动对象分割中的应用研究[D];上海大学;2004年
8 刘炳文;时滞细胞神经网络的周期解、概周期解和全局指数稳定性[D];湖南大学;2005年
9 包红强;基于内容的视频运动对象分割技术研究[D];上海大学;2005年
10 郝家胜;基于几何流的医学图像分割方法及其应用研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 李锋垚;基于ARM9的MPEG-4视频解码播放系统设计[D];西北工业大学;2005年
2 张志芳;基于MPEG-4的网络视频监控系统(服务器端)[D];北方工业大学;2005年
3 吴则举;基于MPEG-4的视频对象分割算法研究[D];青岛科技大学;2005年
4 孙哲;基于MPEG-4的运动估计和码率控制技术的研究[D];电子科技大学;2005年
5 傅蓉;文本-可视语音合成系统的研究及实现[D];新疆大学;2005年
6 胡俊;基于MPEG-4的视频可伸缩性编码的研究[D];武汉理工大学;2006年
7 李华;基于MPEG-4的视频监控系统设计和实现[D];西南交通大学;2006年
8 马媛媛;基于智能手机的流媒体系统研究和实现[D];北京交通大学;2006年
9 何伟;MPEG-4 FGS视频流量模型的研究与仿真验证[D];国防科学技术大学;2003年
10 王钢;基于TMS320DM642 DSP的MPEG-4视频编码器实现与优化[D];吉林大学;2005年
中国重要报纸全文数据库 前10条
1 本报记者 王健;能插卡的MPEG-4播放器[N];中国计算机报;2005年
2 ;威视50便携式MPEG-4网络广播系统在企业通讯方面的应用[N];中国计算机报;2004年
3 本报记者 罗 兵;“MP4”揭开神秘面纱[N];中国质量报;2005年
4 本报记者 李献;IP网上的警卫眼[N];计算机世界;2004年
5 文/周悟;PMP成本结构分析[N];计算机世界;2005年
6 本报记者 刘小如;安全用户关注的重点[N];中国计算机报;2004年
7 执一;中国碟机企业破茧出新[N];中国电子报;2005年
8 烽火网络;烽火网络IPTV领先应用推动市场多赢[N];通信产业报;2005年
9 晓瑜;手机电视徘徊两种标准间[N];通信产业报;2004年
10 ;中国手机元器件市场一枝独秀[N];中国电子报;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978