登陆注册
13955600000013

第13章 多媒体数据压缩编码技术(6)

当选定某种预测算法后,利用前面的像素样点就可以预测当前样点。利用当前样点的真实值与预测值相减,便求出了差值。这个过程与前面已说明的差分脉冲编码过程是一样的。

但是,这里由预测器输出的差值还要进一步进行无失真(熵)编码,以便达到更好的压缩效果。通常所用的熵编码方法是哈夫曼编码或算术编码。

这种编码所使用的源图像数据样本精度有很大的灵活性,JPEG规定其每样本精度可为2~16bit。在开始进行无失真编码前,可有意地减少1位或多位输入样本值,从而可获得更大的数据压缩比,而重建图像的误差仍在允许的范围之内。

3.其他编码方法

JPEG还提出了其他编码方法。

1)基于DCT的累进编码运行方式

前面已经描述了基本的顺序编码方式,它是以DCT为核心实现压缩编码的。在顺序方式里通过一次扫描量化DCT系数实现压缩编码,而在累进方式下要进行多次扫描。

JPEG规定了两种累进编码方法。

(1)累进的频谱选择法

在此方法中,每次扫描时,在DCT之后仅选择某些频段内的系数进行编码并传送;然后再以累进的方式选择其他一些频带的系数进行编码、传送;这样累进进行,直至系数全都传送完。从接收数据的一端来看,在这种方式下,传送来的图像精度逐渐提高。

(2)逐次逼近法

这种编码方法是按位进行逼近,即首先扫描、编码某几个最高有效位并进行传送,而后再逐次扫描、编码较低和更低的DCT系数位。对DCT系数分批编码、分批传送后便可达到所要求的精度。

2)基于DCT分层编码方式

这种编码方式的基本步骤是:

①首先在低分辨率下获取源图像数据;

②利用基于DCT的顺序方式或累进方式,也可以采用无失真编码方式对此低分辨率图像进行编码;

③对编码后的图像进行译码并重构原始图像,然后利用插值方式使重构图像的分辨率提高一倍;

④在分辨率提高一倍的情况下重构图像,作为源图像的预测图像。求取源图像与预测图像的差值并对其进行编码;

⑤再以此差分编码重构图像,用插值使分辨率提高一倍,重复前面的过程直至达到某种精度要求。

以上就是JPEG标准中所采用的几种静态图像的编码方法。

3.5.3源图像数据

在图318中已表示过JPEG的编码过程,主要是三个大的侧面。前面已说明最重要的JPEG所规定的编码方法,现在简单介绍源图像数据。

1.单分量源图像数据

在单分量源图像数据中,认为源图像数据是仅具有灰度的单分量数据。源图像经采集数字化后就可以产生源图像数据。在有失真的基于DCT的编码中,每次取8×8个样本进行处理,而在无失真一维线性预测编码中,每次取一个样本进行处理。将一次处理的数据叫做一个数据单元(或数据单位)。

在单一分量的源图像数据的编码中,编码过程是一个数据单元接一个数据单元顺序进行的。

2.多分量源图像数据

除了单分量源图像数据外,今后遇到更多的是多分量源图像数据,其中彩色图像数据是最常见的一种,因此,JPEG的专家们更注重多分量源图像数据。JPEG规定了多分量源图像处理的两种方式:非交插方式和交插方式。

1)非交插方式

假定源图像由三个分量A、B、C组成,如图325所示。

图325源图像的三个分量

非交插方式处理就是先将A分量的所有数据处理(在这里就是JPEG编码)完后,再处理B分量的所有数据,最后再处理C分量。其处理顺序是A1,A2,…,An→B1,B2,…,Bn→C1,C2,…,Cn。

用非交插方式处理彩色图像并不好,因为在恢复图像时会使某一彩色先恢复,从而产生强的彩色。

2)交插方式

交插方式是对构成图像的各分量在处理过程中穿插进行处理。例如,处理完A分量的一个数据单元后,就去处理B分量的一个数据单元,再去处理C分量的一个数据单元。处理过程交插进行,图325所示的三个分量源图像数据的交插处理顺序是:A1,B1,C1;A2,B2,C2;…,An,Bn,Cn。

在交插处理不同分量的数据时,要调用不同的量化表和哈夫曼表。例如,处理亮度时,要调用亮度相对应的表,而当处理色差时,又需要调用色差所对应的表。

另外,在交插处理不同分量时,有可能遇到源图像各分量大小不同的情况。例如,在图325中,若分量B和分量C只有分量A的一半,也就是说A有n个数据单元,B和C只有n/2个数据单元,此时的交插处理可以按如下顺序进行:

A1A2B1C1→A3A4B2C2→…→An-1AnBn/2Cn/2

3.源图像数据的精度

JPEG规定,对于基本的DCT编码过程,每个数据样本的精度为8位(bit);对于扩展的DCT编码过程,数据样本的精度为8位或12位。很显然,采用12位数据精度进行编码必然要花费更多的处理时间。

对于无失真编码,JPEG标准规定,数据样本的精度为2位到16位。由用户根据自己的应用需要进行选择。

3.5.4压缩数据的数据格式

制定统一的数据格式是进行数据交换的先决条件。如果每个人都用自己专用的格式存储和传送数据,则存储的数据或传送到其他终端的数据很难为别人所理解,更无法使用。计算机网络的发展势不可当,这是不可逆转的发展趋势。要将JPEG标准处理的静态压缩图像数据经网络传向遥远的对方,使对方接收到已压缩的图像数据时能解释这些数据的结构,了解数据的细节,也必须有一定的数据格式才能解压缩恢复源图像。

即使要将已压缩的数据进行存储(例如,存储在硬磁盘中),也必须按一定的数据格式写在磁盘上并形成一个JPEG数据格式文件,这样,才能供自己或他人使用。

在本节开始就特别指出,JPEG标准的主要内容包括三部分:源图像数据、编码算法和已压缩数据的格式。现在,我们来解决最后一部分--JPEG的标准数据格式。JPEG数据格式的规定要涉及大量细节,因此,为简单起见,本书中只对其进行概要介绍。

1.一般(非分层)的JPEG数据格式

一般数据格式包括顺序DCT、累进DCT和无失真编码过程最后编码输出的数据格式。一般数据格式的结构如图326所示。

由图326可以看到,描述一幅已压缩图像的数据从图像数据的起始标识符SOI开始,它标志着压缩图像的起始。此后是一帧已压缩的图像数据,也就是一幅压缩图像的数据。最后是压缩图像的结束标识符EOI,表示一帧图像的结束。

一帧压缩数据的结构同样表示在图326上。一帧压缩数据包括开始的帧头和一次或多次扫描。帧头的前面可以附加一个或多个表说明,还可以附加其他具有标识符的段。在数据帧中,如果有定义线数的数据段DNL,则它必须放在第一次扫描之后。

最简单的情况是单色的顺序DCT方式,这种方式一次扫描即可完成对图像数据的压缩。对多分量的彩色图像,通常在扫描中采用交插方式。而对于累进的DCT方式,则完成一幅图像的压缩就需要多次扫描,而且当处理的是多分量图像时,每次扫描又需要交插进行,这些最终要体现在输出的数据帧中。

每次扫描的特征由扫描的数据结构来描述。每次扫描都包括扫描头和一个或多个熵编码段。与帧头前面类似,扫描头的前面可以有一个或多个表说明,还可以有各种具有标识符的段出现。如果扫描中有RSTm(重新启动)标识符(其中,m=1,2,…,N),则除最后一段熵编码外,其他各熵编码段后均有重新启动标识符,用来指定重新启动参数。扫描由熵编码段构成,熵编码段则由经压缩编码的最小编码单元组成。最小编码单元MCU这样定义:

①对于非交插图像数据,它就是一个数据单元,对DCT为8×8样本,对无失真编码为一个样本,这在前面已有说明;

②对于交插图像数据来说,它由来自各分量的多个数据单元构成,例如,对于图325,一个最小编码单元为AiBiCi。

熵编码段就是由这些经压缩编码--最后是熵编码的最小编码单元构成的。

以上仅从大的方面说明了一般(非分层)压缩数据的JPEG格式。至于细节,在图326中的每一部分都还有更加详细的描述。

2.分层方式的JPEG数据格式

JPEG规定分层编码方式的压缩数据格式如图327所示,图中的SOI、表说明、帧的概念以及EOI在上面的数据格式中已作了说明。

在分层方式中,一幅压缩图像数据要由许多帧构成。这一点,在前面编码的分层方式中也已作了说明。

在分层方式的数据格式里,需要附加DHP段和EXP段。DHP段用于定义分层级数;EXP段只有在水平或垂直方向上扩张参数时才会使用。JPEG对这些段有详细的定义。

当弄清楚不同数据格式的规定后,利用硬件或软件便可以形成JPEG数据格式的数据。现有的软件及硬件可为用户产生这些数据格式。3.6动态图像信号的处理

最常见的动态图像有电视图像、多媒体视频卡中采集与回放的每秒十几或几十帧画面的图像以及每秒几至十几帧的可视电话画面图像等。总之,动态图像要求几到几十帧画面进行变更,以便利用人眼的视觉暂留特性产生活动的图像。

3.6.1动态图像处理应考虑的问题

前面已经提到视频图像信号的特点中最重要的是数据量大,而动态图像信号就更加突出。例如,像比较简单的每帧352×240像素点,每个像素点16bit的图像,就有1.3Mb,因而每秒30帧,就构成高达40Mbps的数据量。因此,对动态图像,就当前技术来说,必须采取必要的数据压缩手段,否则,无论是对动态图像数据的存储还是传送,都将是不现实的。

1.帧间预测编码

前面已经提到,相邻图像帧间的时间冗余信息很大。有人作了统计,某电视图像的帧间变化部分平均约为总画面的5%,这说明帧间的数据压缩有很大的潜力。

帧间预测编码就是利用前一帧图像预测当前图像,并对当前图像与预测图像的差值进行编码的。由于两者基本相同,其差值必然很小,故可获得较大的压缩效率。帧间预测示意图如图328所示。

如图328所示,要对本帧的像素点X进行预测,可用本帧的a、b、c点进行空间预测,也可用前一帧的a′、b′、c′、d′、e′、f′点进行时间预测,亦可以将两者混合进行预测。若X点的预测值用X表示,则当前值就用X^表示。预测算法可有许多种,例如以下3种。

1)只进行空间预测

这种预测算法已在本章的图315中表述过。

2)帧间预测

帧间预测算法有:

X^=d′

X^=e′+c′2

X^=a′+e′+c′2b′+f′2

类似的帧间预测算法还可以写出很多。

3)帧内和帧间混合预测

帧内和帧间混合预测也有多种预测算法。例如:

X^=(a+d′)a′

X^=(d+c′)c

当采用上述某种算法时,由于很接近X,故ε=XX^就会很小,甚至为0。对差值ε进行编码,便可达到压缩的目的。

在此基础上,还可以考虑当画面活动不大时,用帧间预测;当画面变化剧烈时,采用帧内编码。两种预测方式分别适应两种不同的图像情况。

另外,由于在动态图像中一般图像的活动部分都比较小,因此,可以利用帧间预测的方法标出当前帧与前一帧变化大的部分,而仅对这些变化大的区域进行编码、存储或传送,这样就可有效地减少数据量。

2.运动补偿

前面所描述的帧间预测编码很容易理解,在大多数情况下也行之有效。但是,当图像画面剧烈变化时,例如,当摄像机快速移动时,就会使图像的分辨率大大降低,严重地影响图像的质量。

为了解决这个问题,科技人员提出了一种称为运动补偿的预测编码方法。这种编码方法的关键思路就是将动态图像理解成一幅静态图像和一幅动态图像的运动部分的叠加,因此,关键在于找出图像的运动部分。利用当前帧和前一帧对图像的运动进行估算,找出图像运动部分的移动规律,便可以对其进行预测。

运动矢量的估算方法有许多种,而且有许多人正在致力于运动矢量算法的研究。目前用得比较多的有块匹配算法、递归算法等。包括运动补偿的预测编码框图如图329所示。

图329包括运动补偿的预测编码框图

具有运动补偿的预测编码,用于动态图像的压缩已由硬件实现,并用于后面将要提到的动态图像压缩标准中。

运动补偿的简单原理可用图330来说明,图像的运动部分(阴影所示)由前一帧的x,y位置移动到x+dx,y+dy位置。这时,如果不考虑图像的运动,而用前一帧的x,y点与当前帧的x,y点求差,则由于图像已经移动而差值的幅度会很大。同样,当前帧x+dx,y+dy点与前一帧相对应点的差值同样很大。只有找到x+dx,y+dy,用它们的值与前一帧的x,y所决定的点求差值,才能获得好的结果。

如前所述,可利用块匹配算法求得图像移动到何处。将当前帧分成m×n的若干像素块,再用此图像块上下左右移动进行匹配,达到最佳匹配就算找到了帧间的移动位置。最佳匹配的准则有均方误差最小、平均两帧差最小等,还可以利用两帧间的归一化相关函数来进行最佳匹配。

接下来的问题是利用什么方法搜索匹配块,哪种方法速度快,运算量最小。匹配搜索方法有全搜索法、三步法、二维对数法、正交搜索法及共轭方向法等。其中,全搜索法最细致,但也最花时间,其他方法都是快速方法。

另外,当由于速率限制使得每秒传送的帧数较少时,在显示动态图像时,就会影响图像的质量。采用运动自适应帧间内插可以较好地解决这个问题。

对于运动图像的自适应帧间内插的原理,可用图331说明。在图331中,要在当前帧和前一帧中利用内插的方法构成内插帧。对于图像中的静止部分,是容易进行内插的。但对于运动部分(图331中的阴影部分),就不能用两图像的x,y点和的均值来形成内插值,而应当用两帧阴影部分进行计算来形成内插帧的阴影部分。

利用帧间内插,可消除图像的闪烁,保证运动图像的质量。

3.6.2H.261标准

H.261标准是为适应可视通信发展的需要,由CCITT制定并于1990年底正式批准的。该标准称为“视听业务速率为P×64kbps的视频编译码”,其中P=1,2,…,30。当P为1或2时,速率比较低,适用于QCIF分辨率格式,用于要求不高的可视电话。当采用P≥6的传输速率时,支持CIF分辨率格式,多用于电视会议。

1.H.261视频编码格式

同类推荐
  • 玩转手机

    玩转手机

    本书主要包括:手机的发展历史、手机知识、手机的选购与巧用、手机与网络、手机短信等内容。
  • 中文版AutoCAD2011基础与应用案例教程

    中文版AutoCAD2011基础与应用案例教程

    本书采用项目教学方式,通过大量案例全面介绍了AutoCAD2011软件的功能和应用技巧。全书共分8个项目,内容涵盖AutoCAD2011基本操作,绘制与编辑图形,标注尺寸,添加文字注释与应用表格,创建与应用块,绘制与编辑三维图形,图形输出等。
  • 组态软件控制技术

    组态软件控制技术

    监控组态软件是完成数据采集与过程控制的专用软件,它以计算机为基本工具,为实施数据采集、过程监控、生产控制提供了基础平台和开发环境。本书从应用角度出发,详细介绍了组态软件应用程序的开发过程。对窗口界面编辑、动画链接、实时和历史趋势、安全机制、I/O设备连接,以及生产应用等内容都做了非常详细的介绍。MCGS是优秀的监控组态软件之一,它功能强大、使用方便,可以非常容易地实现监视、控制、管理的各项功能,并可提供软、硬件的全部接口,方便、快速地进行系统集成,构成不同需求的数据采集与监控系统。本书可作为高等学校计算机应用、自动控制、电子技术、机电技术专业的教材,同时还可作为相关专业工程技术人员的自学用书。
  • 一本书读懂24种互联网思维

    一本书读懂24种互联网思维

    本书整合的改变世界的24种互联网思维,让我们对互联网新思维的认识变得立体、系统起来;同时深入浅出、通俗易懂地从技术和实践分析互联网新思维与传统思维相比较的优势,医治互联网焦虑症。未来属于既能深刻理解传统商业的本质,同时又具备互联网思维的人。
  • 互联网创业前奏曲(第二部)——网站运营之人性、策略与实战

    互联网创业前奏曲(第二部)——网站运营之人性、策略与实战

    本书是《互联网创业前奏曲》系列的第二本书,是作者多年互联网实践经验和业界观察的总结,是国内罕有的关于互联网网站运营和用户心理结合的书籍,用通俗的语言阐述互联网运营背后的人性驱动。你想互联网创业吗?你是否在为找不到好的互联网运营策略和方法而发愁?你非常想了解互联网行业?你是否在为自己不了解互联网运营而苦恼?本书针对这些问题列举了很多互联网运营的案例,帮你制定运营策略,更好的修炼和提升运营功力。
热门推荐
  • 血凤逆天嗜血皇妃

    血凤逆天嗜血皇妃

    “爵寒,你想要这圣冥大陆吗?”“那你想要吗?”“要!那我便把这圣冥大陆,夺来,当做我嫁你时的聘礼,赠与你,可好?”“好!”可她却为了救他死在了别人手中,他疯一般找她……“钟离笙!没有你,我要这天下有何用!你给我出来!本尊想你了……你回来好不好啊,笙儿……”华夏幽棠阁主钟离笙和掌握整个血樱帝国的白痴废物钟离笙到底谁是谁?一招穿越却成了一个假废柴,消失多年,涅槃重生,踏血归来,只为还她一个公道;只为找到那人的家人却不想后面尽也把自己身世揭开,一路上他陪她闯地狱,过刀山,下火海;上穷碧落下黄泉,永不分离……
  • 异界转生奏鸣曲

    异界转生奏鸣曲

    在转生的劳模——大货车的帮助下。穿越到了魔法的世界。本想专心钻研魔法,一路攻读到魔法博士学位。可却深陷异世界纸醉金迷,掌控魔法之路逐渐偏离常轨。
  • 从火影无敌开始

    从火影无敌开始

    不需要轮回眼,超神罗天征,超地爆天星,超尾兽玉无限用无敌多么寂寞……
  • 全城戒备开始之战

    全城戒备开始之战

    公元3016年,银河帝国大乱之中,人类的生存与灭亡一瞬之间,英雄拯救这个世界
  • GodsNight

    GodsNight

    存在于千年前的诸神在与死敌巨神一族的最终战斗中近乎灭亡,只留下了神的血脉于人类。而巨神一族同样留下了血脉基因。拥有神的血脉的人类即为半神。半神们在觉醒之后都会进入一所名为赫尔墨斯的学院学习。每批学生都会选拔出最强的七个人加入圣堂成为圣堂骑士,每五届的圣堂骑士都会进行一次选拔,选出七名最强的圣堂骑士,称为使者。巨神一族的继承者被称作恶魔。恶魔同样有着名为魔武者的组织,每五年也会选出七名使魔与使者对抗。奇迹圣杯是传说中可以使持有者获得无限力量,而获得奇迹圣杯的只有一组。使者与使魔为了获得奇迹圣杯而互相残杀。
  • 何故扇清秋

    何故扇清秋

    谢鸢凝,谢氏不可或多的天之骄女,若是没有那一次的意外,或许她会有着溺爱她的父母,娇宠她的妹妹,无条件惯着她的弟弟,成功的事业。但那一次的仙魔之战,彻底毁了她,毁了她的一生……
  • 军婚玉缘

    军婚玉缘

    算命的说张小宁命中有贵人!她小的时候坚信不疑,可到底念了十几年的书,长大后,她对此嗤之以鼻!可是算命的说对了一半,她命中有贵鬼,而她,是徐子阳的命中贵人!这个贵鬼让她直接从贫困阶级大跳跃,然后还有了一个持续生财的手艺——赌石!可是她这个贵人却当的有些窝囊,被徐子阳骗了做媳妇外,还得被徐家人欺负,她是脾气好不错,可是再好的脾气也不能这样压榨吧?于是,一直躲在龟壳里被保护的张小宁决定出来履行她贵人的义务,用平民的心机来对抗贵族的手段,保护她的便宜老公!感谢悠然小君同学制作的封面可是,徐子阳宠溺的看着她,笑笑,转身,笑话,欺负他,他可以当做没看见,但欺负他老婆算怎么回事?
  • 下辈子别再爱了

    下辈子别再爱了

    进一次鬼门关,走一遭黄泉路,过一次奈何桥,喝一碗孟婆汤,所有的恩怨就此了结。如果说今生的一切都是轮回中欠下的债,那么今生告别是不是也意味着一切了结。身价亿万的他坚定的选择回家乡发展事业,当往事历历在目的时候,一边是自己曾许下的诺言,一边是花好月圆的天伦之乐,他也不知道自己怎么做才是对的,他摸着自己的良心祈求答案,希望神明能够给他指点迷津。所有生活中的人都祈求能够找到一个出口,解脱。这世上所有的恩恩怨怨,爱恨情仇,会不会因为时间都淡去了样子,又会不会因为去往天堂而销声匿迹…
  • 树人文库-运筹一生的战争故事

    树人文库-运筹一生的战争故事

    一年之计莫如树谷,十年之计莫如树木,终身之计莫如树人!本套图片共分为:妙语故事、神话故事、寓言故事、义勇故事、智慧故事、历史故事、知识故事、妙答故事、成败故事、中药故事、破案故事、成语故事、民间故事、名人故事、哲理故事、亲情故事、处世故事、战争故事、发现故事、伟人故事,在各方面论述了树人实践的内容和方法论。
  • 不做帝王妃:偏爱平民郎

    不做帝王妃:偏爱平民郎

    莫名其妙的穿越鸟,结果竟是个冷宫疯妃,好吧,那就让她李萌萌改变命运吧!蛮横无理的皇上竟然要她侍寝,NO,坚决、绝对NO……十七年的清白不能就这样给了去……那是第一次呃……怎么回事?心里竟然不知什么时候跑进了一个人,还是个平民,没财没权的,这叫人摔得……一个皇上,一个平民,已经够头痛的,为嘛又要掺和进来一王爷……