首页 理论教育 MPEG系列标准概述及MPEG-4的应用与优势

MPEG系列标准概述及MPEG-4的应用与优势

时间:2023-06-29 理论教育 版权反馈
【摘要】:MPEG组织制订的各个标准都有不同的目标和应用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准等。(三)MPEG-4标准活动图像专家组MPEG于1999年2月正式公布了MPEG-4标准第一版本,并于2000年年初正式成为国际标准。MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用、交互式多媒体等整合及压缩技术的需求而制订的国际标准。同时MPEG-4还能对同时发生的数据流进行编码。而MPEG-4为因特网视频应用提供了一系列的标准工具,使视音频码流具有规范一致性。

MPEG系列标准概述及MPEG-4的应用与优势

MPEG(Moving Picture Exports Group)即活动图像专家组。MPEG组织最初得到的授权是制订用于“活动图像”编码的各种标准,后来成为制订“活动图像和音频编码”标准的组织。MPEG组织制订的各个标准都有不同的目标和应用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准等。

(一)MPEG-1标准

MPEG-1标准于1993年8月公布,是ISO/IEC开发的第一个视频压缩标准,用于传输1.15Mbit/s数据传输速率的数字存储媒体运动图像及其伴音的编码。该标准主要应用于数字媒体上动态图像与音频的存储和检索,如VCD(速率为1.15Mbit/s、CIF格式分辨率)和MP3上。MPEG-1支持逐行视频,但不支持隔行视频。

(二)MPEG-2标准

MPEG组织于1994年推出的MPEG-2压缩标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,编码码率为3~100Mbit/s。MPEG-2既能够满足逐行视频的需求,又能够满足电视领域常用的隔行视频的需求。MPEG-2特别适用于广播级数字电视的编码和传送。其也被认定为SDTV和HDTV的编码标准。

MPEG-2图像压缩利用了图像的空间相关性和时间相关性两种特性。图像中存在大量的冗余信息,如果我们能将这些冗余信息去除,只保留少量非相关信息进行传输,就可以大大节省传输频带。而接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。

MPEG-2标准在广播电视领域中的主要应用如下:①视音频资料的保存;②电视节目的非线性编辑系统及其网络;③卫星传输;④电视节目的播出。

(三)MPEG-4标准

活动图像专家组MPEG于1999年2月正式公布了MPEG-4(ISO/IEC14496)标准第一版本,并于2000年年初正式成为国际标准。

MPEG-4与MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用(影音合成内容)、交互式多媒体(资料抽取与分散)等整合及压缩技术的需求而制订的国际标准。它能满足三个族群的需求:多媒体内容创作者、网络服务供货商和终端消费者。MPEG-4系统的一般框架:对自然或合成的视听内容的表示;对视听内容数据流的管理,如多点、同步、缓冲管理等;对灵活性的支持和对系统不同部分的配置。

MPEG-4的编码原理:编码时将一幅景物分成若干个在时间和空间上相互联系的视频音频对象分别编码,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。这样既便于对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,这样就可以方便地实现对于各种对象的操作及编辑。

MPEG-4编码的特征如下:

(1)基于内容的交互性:MPEG-4提供了基于内容的多媒体数据访问工具,如索引、超级链接、上传下载、删除等。利用这些工具,用户可以方便地从多媒体数据库中有选择地获取自己所需的与对象有关的内容,并提供了内容的操作和位流编辑功能,可应用于交互式家庭购物,淡入淡出的数字化效果等。

(2)高效的压缩性:MPEG-4具有更高的编码效率。同已有的或即将形成的其他标准相比,在相同的比特率下,它基于更高的视觉听觉质量,这就使得在低带宽的信道上传送视频、音频成为可能。同时MPEG-4还能对同时发生的数据流进行编码。一个场景的多视角或多声道数据流可以高效、同步地合成为最终数据流。

(3)通用的访问性:MPEG-4提供了易出错环境的鲁棒性,来保证其在许多无线和有线网络以及存储介质中的应用。此外,MPEG-4还支持基于内容的可分级性,即把内容、质量、复杂性分成许多小块来满足不同用户的不同需求,支持具有不同带宽,不同存储容量的传输信道和接收端。

MPEG-4主要应用如下:①应用于因特网视音频广播。由于上网人数与日俱增,传统电视广播的观众逐渐减少,随之而来的便是广告收入的减少,所以现在的固定式电视广播最终将转向基于TCP/IP的因特网广播,观众的收看方式也由简单的遥控器选择频道转为网上视频点播。视频点播的概念不是先把节目下载到硬盘,然后再播放,而是流媒体视频(Streaming Video),点击即可观看,边传输边播放。现在因特网中播放视音频的有Real Net-work公司的Real Media、微软公司的Windows Media和苹果公司的QuickTime,但它们定义的视音频格式互不兼容,有可能导致媒体流中难以控制的混乱。而MPEG-4为因特网视频应用提供了一系列的标准工具,使视音频码流具有规范一致性。因此在因特网播放视音频采用MPEG-4,应该说是一个安全的选择。②应用于无线通信。MPEG-4高效的码率压缩、交互和分级特性尤其适合于在窄带移动网上实现多媒体通信,未来的手机将变成多媒体移动接收机,不仅可以打移动电视电话、移动上网,还可以移动接收多媒体广播和收看电视。③应用于静止图像压缩。静止图像在因特网中大量使用,现在网上的图片压缩多采用JPEG(Joint Photographic Expert Group)技术。MPEG-4中的静止图像压缩是基于小波变换的,在同样质量条件下,压缩后的文件大小约为JPEG压缩文件的1/10。把因特网上使用的JPEG图片转换成MPEG-4格式,可以大幅度提高图片在网络中的传输速度。④应用于电视电话。传统用于窄带电视电话业务的压缩编码标准(如H.261),采用帧内压缩、帧间压缩、减少像素和抽帧等办法来降低码率,编码效率和图像质量都难以令人满意。MPEG-4的压缩编码可以做到以极低码率传送质量可以接受的声像信号,使电视电话业务可以在窄带的公用电话网上实现。⑤应用于计算机图形、动画和仿真。MPEG-4特殊的编码方式和强大的交互能力,使得基于MPEG-4的计算机图形和动画可以从各种来源的多媒体数据库中获取素材,并实时组合出所需要的结果。因而未来的计算机图形可以在MPEG-4语法所允许的范围内向所希望的方向无限发展,产生出今天无法想象的动画及仿真效果。⑥应用于电子游戏。MPEG-4可以进行自然图像与声音同人工合成的图像与声音的混合编码,在编码方式上具有前所未有的灵活性,并且能及时从各种来源的多媒体数据库中调用素材。这可以在将来产生像电影一样的电子游戏上,实现极高自由度的交互式操作。

MPEG三种图像压缩编解码技术比较,见表3-3。

表3-3 MPEG三种图像压缩编解码技术比较

978-7-111-36226-5-Chapter03-16.jpg(www.xing528.com)

(四)MPEG-7标准

视频监控数据呈现爆炸式增长,信息的传播也通过各种途径大量扩散,然而信息的检索方式仍然没有太大的改进。目前,基于文本格式或结构化处理数据的检索技术已很成熟,但多媒体等非结构化数据的检索仍然比较困难。MPEG-7正是为管理这些多媒体信息内容及其传播而开发的。

MPEG-1、MPEG-2和MPEG-4等都是针对信息本身的。MPEG-1和MPEG-2几乎完全用于信息压缩,MPEG-4用于对象的编码,并使对象能够在视听屏幕上实现单独或群体的操作。MPEG-1、MPEG-2和MPEG-4使信息内容变得更方便可用,而MPEG-7可以帮助人们很方便地找到想要的信息内容。MPEG-7标准的目的是要制定一种针对各类多媒体信息的描述标准,该描述与内容有关,并能够快速高效地搜索用户感兴趣的素材。

MPEG-7是一个基于XML(Extensible Markup Language)的多媒体内容数据标准,用于描述多媒体内容的特征并提供可用的最全面视听描述工具。这些描述工具基于视听内容的目录(题名、作者、版权)、语义(关于对象和事件的人物、时间、地点以及动作信息)、结构(图像的颜色数据或所录制歌曲的音质信息)等诸多特征。

MPEG-7框架包括描述符(Descriptor)、描述方案(Description Scheme)、描述定义语言(Description Definition Language)和编码描述等。描述符是一个特征的表示单元,它定义了该特征所表示的语法和语义。描述方案则详细说明了描述符之间联系的语义,甚至可以是描述符合描述方案间联系的语义。描述定义语言对描述方案进行了详细说明。此外,它还可以对已有的描述方案进行扩充和修正。这种描述定义语言吸收了XML框架语言,并在XML基础上进行了专用扩展,以满足MPEG-7的所有需求。这些扩展通过MPEG和W3C(XML标准化组织)之间的联络来讨论。

MPEG-7主要是对多媒体信息分类的表达方法进行标准化,而特征提取算法和声音图像内容识别工具不属于MPEG-7标准的界定范围。同样搜索机制和视音频回放技术也不包括在MPEG-7标准中,而只确定描述与搜索机制之间的接口。

MPEG-7标准在处理大容量文件(公众现在可以访问这些文件)、多媒体目录(顾客用以确定内容以便购买)时特别有用。搜索到内容的信息还可以用于代理、选择或过滤传播中增加的材料,或者实现个性化广告。更进一步,MPEG-7的描述能够通过激活半自动多媒体显示和编辑等功能,实现潜在数据的快速和有效利用。

MPEG-7工作组已有几个可视工具,用户可以通过图像颜色或图像中颜色的定位对图像进行搜索,其他可能的查询还包括搜索带有确定构造图案的图像。例如,从卫星图像数据库中搜索确定构造图案可以发现地质和下层构造结构的有用信息。

用户也可以搜索包含确定对象和形状的图像,例如所有含有一家商业公司特有标识图案的图像,这对代理商很有用,通过搜索这些特定标识图,他们可以找到有用的信息。

采用MPEG-7标准还可以将一个视频中的运动区域索引成运动区域的子集。运动区域里的对象可以用颜色、构造、形状和运动区域里的轨道特性等进一步加以索引,甚至包括视频流中对象的时空关系。这种类型搜索对于远程监控系统特别有效,可以跟踪公共场所中的不明物体并自动标记以便安全人员调查。

MPEG-7标准的最终目的是把网上的多媒体内容变成像现在的文本内容一样,具有可搜索性。

(五)MPEG-21标准

MPEG-21标准称为多媒体框架,标准号为ISO/IEC 21000。MPEG-21标准的基本框架包括数字项目说明、内容表示、数字项目的识别和描述、内容管理与使用、知识产权管理和保护、终端和网络资源抽取、事件报告等部分。

MPEG-21标准的最终目标是要为多媒体信息的用户提供透明且有效的电子交易和使用环境。举例来说,如果您想制作一张收录自己喜爱乐曲的CD,那么您可以在家中通过网络收集乐曲。利用MPEG-21标准的数字项声明、标记和描述工具,用曲名、演奏者、歌词或旋律等不同方法来描述你所要查找的内容。在支持MPEG-21标记和描述的网络搜索引擎的帮助下,您可以收集到分布在世界各地异构网络上的数字化乐曲。接下来,您可以使用支持MPEG-21内容展现方法的媒体播放器来试听。当您选定乐曲之后,可以通过网络的电子支付手段购买乐曲的某种程度的使用权。在这一过程中传递的信用卡账号、密码等信息都是保密而安全的。完成该过程之后,您就可以将乐曲刻录到光盘上了。此外,您还可以在网上将乐曲所在的URL(Uniform Resource Location)路径以及您对它们的注解、点评等信息保存为一个工程文件,再从网上收集一些相关的图片甚至视频片段,一并放入这个CD工程文件,然后将这个文件向您的朋友开放。这样您就可以与朋友们一起分享您喜欢的音乐了。以上这个简单的例子涉及了多媒体数字信息的标记、描述、内容展现、内容管理和使用、网络和终端、知识产权管理和保护等MPEG-21多媒体框架标准的各项要素。通过这个例子,我们可以预见,MPEG-21标准将在未来的电子商务活动中发挥重要作用。

常见的几种编解码格式比较分析见表3-4。

表3-4 常见的几种编解码格式比较分析

978-7-111-36226-5-Chapter03-17.jpg

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈