首页 理论教育 MPEG-4视频压缩编码标准简介

MPEG-4视频压缩编码标准简介

时间:2023-07-01 理论教育 版权反馈
【摘要】:图1-16 MPEG-4基于对象编码体系2.视频对象面编码MPEG-4为了实现对象编码,引入了视频对象、视频对象面、视频对象层的概念。MPEG-4采用同一种算法来对每一层的形状、运动和纹理信息进行编码。此时,MPEG-4的视频编码算法具有与MPEG-1、MPEG-2及H.263相似的结构,这往往应用于那些对编码效率要求很高而不需要基于内容的扩展功能的场合。MPEG-4的压缩算法采用了基于块的混合DPCM/Transform编码技术,图1-18给出了VOP的编码框图。这一特征由MPEG-4句法描述语言提供。

MPEG-4视频压缩编码标准简介

MPEG-4与MPEG-1和MPEG-2有很大的不同,它兼顾了工具、算法、层面3个方面的编码对象,除了传统的数字视频编解码的功能之外,MPEG-4更具备了许多引人注目的功能,包括有以对象内容为基础的视频对象存取、以场景内容为基础的可升级性、视频存取、纠错能力等。

1.对象编码

MPEG-4标准与其他标准最重要的差别是关于对象(或称“物体”、“景物”)的概念,在编码时将一幅景物分成若干在时间和空间上相互联系的视频、音频对象,分别编码后,再经复用传输到接收端然后再对不同的对象分别解码,从而组合成所需要的视频和音频,如图1-16所示。

例如在一项有趣的演示中,一个足球比赛的场面被处理成球与其他景物分开,背景(无球的场面)作为一个吸引按次付费的用户,谁都能看到运动员和场地,但只有付费的用户才能看到球。

978-7-111-33721-8-Chapter01-17.jpg

图1-16 MPEG-4基于对象编码体系

2.视频对象面(VOP)编码

MPEG-4为了实现对象编码,引入了视频对象(VO)、视频对象面(VOP)、视频对象层(VOL)的概念。属于同一对象的连续VOP,称为VO,图1-17是VOP的概念简图。

由图1-17所知,每一个VOP都代表了图像序列中的特定内容,通过对它的轮廓、运动和纹理信息编码,可将其编码到单独的VOL层。通过对所有VOP进行解码就可以重新恢复原始的图像系列。

978-7-111-33721-8-Chapter01-18.jpg

图1-17 VOP概念简图(www.xing528.com)

为了支持VO单独解码,每一VO的形状、运动和纹理信息都被编码成单独的VOL层。MPEG-4采用同一种算法来对每一层的形状、运动和纹理信息进行编码。如果待编码的输入图像系列只包含标准的矩形帧,那就不必进行形状编码。此时,MPEG-4的视频编码算法具有与MPEG-1、MPEG-2及H.263相似的结构,这往往应用于那些对编码效率要求很高而不需要基于内容的扩展功能的场合。

MPEG-4的压缩算法采用了基于块的混合DPCM/Transform编码技术,图1-18给出了VOP的编码框图。

MPEG-4编码算法对第一个VOP进行帧内编码(I-VOP),而对接下来的帧采用帧间预测编码(P-VOP),同时也支持双向预测编码(B-VOP)。为了对任意形状VOP的形状,运动和纹理信息编码进行编码,MPEG-4引入了“VOP图形窗”和“形状自适应”宏块栅格的概念。每一个VOP形状信息编码是在基于VOP图形窗宏块栅格的运动矢量编码之前进行的。在编码器和解码器中均可获得该VOP的形状信息。MPEG-4采用于基于块的运动估计和运动补偿技术来有效去除各个独立的VOL层的视频内容中的时间冗余成分,但与标准的MPEG块匹配处理技术不同的是,MPEG-4引入了形状自适应宏块栅格的概念来完成具有不同位置、大小和形状的VOP间的运动估计和运动补偿。形状自适应功能是通过图像填充技术和多边形匹配技术来实现。纹理编码采用了基于8×8块的DCT方法,这与现有的MPEG和H.263标准相同。

978-7-111-33721-8-Chapter01-19.jpg

图1-18 MPEG-4 VOP编码框图

3.时间和空间的可分级性

可分级性指的是接收机可视具体情况对编码数据流进行部分解码,以获得较低的解码复杂度和由此而导致的较低的重建图像质量、空间分辨率、时间分辨率,以及相同的时间和空间的分辨率。

分级编码的一个重要目标就是要对具有不同的带宽,显示能力和用户需求的接收机提供灵活的支持,从而使得在多媒体应用环境中可以实现视频数据库浏览和多分辨率回放功能。分级编码的另一个重要目标是对视频比特流提供分层的数据结构,也就是给数据内容分配优先级,对比较重要的内容以高分辨率方式存储。这样在解码端就可以对具有最高优先级的对象以可接受的质量显示,第二优先级的对象则以较低的质量显示,而其余内容(对象)则不予显示,可见,这种方式可最有效地利用有限的资源。

这一特征由MPEG-4句法描述语言(MSDL)提供。根据MSDL的规范文件,MSDL对解码器的编程能力定义了3个级别:0级为不可编程级,解码器仅具有一种标准算法,该算法在商议阶段需经编码器同意;1级为灵活级,解码器能够提供一系列标准化的工具,编码器编码过程中可以灵活地将其配置成某种算法;2级为扩展级,编解码器能为解码器提供可下载新工具和新算法的机制。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈