数字视频转换编码及可分级编码技术研究
【摘要】:
随着Internet技术的迅猛发展,基于Internet的多媒体应用,如视频点播、网上购物、电视会议、远程教育以及实况转播等迅速发展,并不断出现新的服务形态和系统。由于视频通信系统传输的数据量大,并需连续传送,对实时性和可靠性要求也较高,因而成为这类多媒体应用中极具挑战性的课题。
另一方面,传输网络和接收终端的多样性又需视频流能适应多种不同传输、解码和显示的要求。为此,本文首先简要介绍了MPEG-2 TM5中使用的传统的可分级编码方案。这种编码技术将编码的比特流以“层”的形式构造,一般一个视频流包括一个“基本”层和一个或多个“增强”层数据流[1], [2]。这种分级编码的视频数流,使得解码器能有选择的解码编码数据流中的一部分。例如只解码基本层得到基本质量的视频,也可以解码基本层和一个或多个增强层,得到高质量的视频。
传统的可分级编码技术层数有限,且不够灵活,而视频转换编码则可提供码率在更宽范围内变化的压缩视频流。视频转换编码是将一个输入的已压缩视频码流转换成另一种不同视频格式、不同传输码率或不同编码标准码流的过程。这个过程一般无需完全解码和完全重新编码。
视频转换编码可以分为同类、异类、错误恢复和应用于多媒体通信的四种类型。本文详细分析了同类视频转换编码技术,给出了码率、空间分辨率和时间分辨率下变换转换编码器结构,着重研究了其间漂移误差的产生与补偿。针对评价转换编码算法性能的两个最主要方面——转换速度和转换后码流的质量,本文提出了加快转换编码速度的新算法——宏块编码模式的利用及重新判断;改善转换后码流质量的新算法——利用运动矢量进行重构内部宏块;以及既能改善转换质量、又能一定程度上控制目标码流码率的新算法——综合利用运动矢量和残差信息重构内部宏块。论文论证了所提算法的原理,并给出了相应的实验结果。本文还介绍了异类、错误恢复和应用于多媒体通信的视频转换编码技术。
为克服传统可分级编码技术的局限性,近年来提出的FGS算法是实现视频流图像质量精细可分级的有效算法,有望在网络传输环境下,特别是低码率视频传输领域,得到应用。小波变换是信号处理技术另一热点研究领域,将其多分辨率分解性质应用于视频编码,可实现视频流的时间和空间分辨率分层。面向有应用前景的这两种算法,本文将它们作为“高级可分级编码技术”,也作了一定深度的理论分析和算法研究。