小波转换影像压缩模式之研究
更新时间:2005-12-28 14:41:37作者:未知
摘要
由於在现今资讯流通普遍的社会中,影像的需求量越来越大,影像的数位化是必然的趋势。然而在数位化过的影像所占的资料量又相当庞大,在传输与处理上皆有所不便。将资料压缩是最好的方法。如今有一新的模式,在压缩率及还原度皆有不错的表现,为其尚未有一标准的格式,故在应用上尚未普及。但在不久的未来,其潜力不可限量。而影像之於印刷有密不可分的关系。故以此篇文章介绍小波(WAVELET)转换的历史渊源。小波转换的基础原理。现今的发展对印刷业界的冲击。影像压缩的未来的发展。
壹、前言
由於科技日新月异,印刷已由传统印刷走向数位印刷。在数位化的过程中,影像的资料一直有档案过大的问题,占用记忆体过多,使资料在传输上、处理上都相当的费时,现今个人拥有True Color的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了,而使用者对影像图形的要求,不仅要色彩繁多、真实自然,更要搭配多媒体或动画。但是相对的高画质视觉享受,所要付出的代价是大量的储存空间,使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间;美丽的图档在亲朋好友之间互通有无,是天经地义的事,但是用网路传个640X480 True Color图形得花3分多钟,常使人哈欠连连,大家不禁心生疑虑,难道图档不能压缩得更小些吗?如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的,可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式,在压缩的比率上并不理想,失去压缩的意义。不然就是压缩比例过大而造成影像失真,即使数学家与资讯理论学者日以继夜,卯尽全力地为lossless编码法找出更快速、更精彩的演算法,都无可避免一个尴尬的事实:压缩率还是不够好。再说用来印刷的话就造成影像模糊不清,或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路?请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用,山不转路转,科学家便将注意力移转到WAVELET转换法,结果不但发现了满意的解答,还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。可达到完全不失真,压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了,而到现在才有人将其应用於实际上,其理论仍有相当大的发展空间,而其实际运用也属刚起步,其後续发展可说是不可限量。故研究的动机便由此而生。
贰、 WAVELET的历史起源
WAVELET源起於Joseph Fourier的热力学公式。傅利叶方程式在十九世纪初期由Joseph Fourier (1768-1830)所提出,为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式,甚至是画出不连续图形的方程式,都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年,法国地球物理学J. Morlet在分析地震波的局部性质时,发现传统的傅利叶转换,难以达到其要求,因此引进小波概念於信号分析中,对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩,平移系 { a -1/2 Ψ[(x-b)/a] ;a,b?R ,a≠0}展开的可行性进行了研究,为小波分析的形成开了先河。
1986年,Y. Meyer建构出具有一定衰减性的光滑函数Ψj,k(x),其二进制伸缩与平移系 {Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}构成L2(R)的规范正交基。1987年,Mallat巧妙的将多分辨分析的思想引入到小波分析中,建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性(Orthonormal)及紧支集(Compactly Supported);及只有在一有限区域中是非零的小波,如此,小波分析的系统理论得到了初步建立。
三、 WAVELET影像压缩简介及基础理论介绍
一、 WAVELET的压缩概念
WAVELET架在三个主要的基础理论之上,分别是阶层式边码(pyramid coding)、滤波器组理论(filter bank theory)、以及次旁带编码(subband coding),可以说wavelet transform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号,分解成不相同频率的信号,因此能有效的应用於编码、解码、检测边缘、压缩数据,及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号,弥补傅利叶转换中的缺失,也因此小波转换被誉为数学显微镜。
WAVELET并不会保留所有的原始资料,而是选择性的保留了必要的部份,以便经由数学公式推算出其原始资料,可能不是非常完整,但是可以非常接近原始资料。至於影像中什度要保留,什麽要舍弃,端看能量的大小储存(跟波长与频率有关)。以较少的资料代替原来的资料,达到压缩资料的目的,这种经由取舍资料而达到压缩目地的作法,是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。
WAVELET转换在数位影像转换技术上算是新秀,然而在太空科技早已行之有年,像探测卫星和哈柏望远镜传输影像回地球,和医学上的光纤影像,早就开始用WAVELET的原理压缩/还原影像资料,而且有压缩率极佳与原影重现的效果。
以往lossless的编码法只着重压缩演算法的表现,将数位化的影像资料一丝不漏的送去压缩,所以还原回来的资料和原始资料分毫无差,但是此种压缩法的压缩率不佳。 将数位化的影像资料转换成利於编码的资料型态,控制解码後影像的品质,选择适当的编码法,而且还在撷取图形资料时,先帮资料「减肥」。如此才是WAVELET编码法主要的观念。
二、 影像压缩过程
原始图形资料 → 色彩模式转换 → DCT转换 → 量化器 → 编码器 → 编码结束
三、 编码的基本要素有三点
(一) 一种压缩/还原的转换可表现在影像上的。
(二) 其转换的系数是可以量化的。
(三) 其量化的系数是可以用函数编码的。
四、 现有WAVELET影像压缩工具主要的部份
(一) Wavelet Transform(WAVELET转换):将图形均衡的分割成任何大小,最少压缩二分之一。
(二) Filters(滤镜):这部份包含Wavelet Transform,和一些着名的压缩方法。
(三) Quantizers(量化器):包含两种格式的量化,一种是平均量化,一种是内插量化,对编码的架构有一定的影响。
(四) Entropy Coding(熵编码器):有两种格式,一种是使其减少,一种为内插。
(五) Arithmetic Coder(数学公式):这是建立在Alistair Moffat's linear time coding histogram的基础上。
(六) Bit Allocation(资料分布):这个过程是用整除法有效率的分配任何一种量化。
肆、 WAVELET影像压缩未来的发展趋势
一、 在其结构上加强完备性。
二、 修改程式,使其可以处理不同模式比率的影像。
三、 支援更多的色彩。可以处理RGB的色彩,像是YIQ、HUV的色彩定义都可以分别的处理。
四、 加强运算的能力,使其可支援更多的影像格式。
五、 使用WAVELET转换藉由消除高频率资料增加速率。
六、 增加多种的WAVELET。如:离散、零元树等。
七、 修改其数学编码器,使资料能在数学公式和电脑的位元之间转换。
八、 增加8X8格的DCT模式,使其能做JPEG的压缩。
九、 增加8X8格的DCT模式,使其能重叠。
十、 增加trellis coding。
十一、 增加零元树。
现今已有由中研院委托国内学术单位研究,也有不少的研究所的硕士论文发表。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。
伍、 影像压缩研究的方向
1. 输入装置如何捕捉真实的影像而将其数位化。
2. 如何将数位化的影像资料转换成利於编码的资料型态。
3. 如何控制解码影像的品质。
4. 如何选择适当的编码法。
5. 人的视觉系统对影像的反应机制。
小波分析,无论是作为数学理论的连续小波变换,还是作为分析工具和方法的离散小波变换,仍有许多可被研究的地方,它是近几年来在工具及方法上的重大突破。小波分析是傅利叶(Fourier)分析的重要发展,他保留了傅氏理论的优点,又能克服其不足之处。
陆、 在印刷输出的应用
WAVELET影像压缩格式尚未成熟的情况下,作为印刷输出还嫌太早。但是後续发展潜力无穷,尤其在网路出版方面,其利用价值更高,WAVELET的出现就犹如当时的JPEG出现,在影像的领域中掀起一股旋风,但是WAVELET却有JPEG没有的优点,JPEG乃是失真压缩,且解码後复原程度有限,能在网路应用,乃是由於电脑的解析度并不需要太高,就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩,但是解码後却可以还原资料到几乎完整还原,如此的压缩才有存在的价值。
有一点必须要提出的就是,并不是只要资料还原就可以用在印刷上,还需要有解读其档案的RIP,才能用於数位印刷上。等到WAVELET的应用成熟,再发展其适用的RIP,又是一段时间以後的事了。
在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了,不过还是测试版,可是以後会在网路上大量使用,应该是未来的趋势。对於网路出版应该是一阵不小的冲击。
图像压缩的好处是在於资料传输快速,减少网路的使用费用,增加企业的利润,由於传版的时间减少,也使印刷品在当地印刷的可能性增高,减少运费,减少开支,提高时效性,创造新的商机。
柒、 结论
WAVELET的理论并不是相当完备,但是据现有的研究报告显现,到普及应用的阶段,还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上,均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译,各自有各自的翻译,故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度,远落在外国的後面,国外已成立不少相关的网站,国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机,国内仍是可以朝这一方面发展的。站在一个使用其成果的角度,印刷业界也许并不需要去了解其高深的数理理论。但是在运用上,为了要使用方便,和预估其发展趋势,影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式,目的在为了使後进者有一参考的依据,也许在不久的将来此一模式会成为主流,到时才不会手足无措。
参考文献:
1.Geoff Davis,1997,Wavelet Image Compression Construction Kit,。
2.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(上), 峰资讯股份有限公司。
3.张维谷.小宇宙工作室,初版1994,影像档宝典.WINDOWS实作(下), 峰资讯股份有限公司。
4.施威铭研究室,1994,PC影像处理技术(二)图档压缩续篇,旗标出版有限公司。
5.卢永成,民八十七年,使用小波转换及其在影像与视讯编码之应用,私立中原大学电机工程学系硕士学位论文。
6.江俊明,民八十六年,小波分析简介,私立淡江大学物理学系硕士论文。
7.曾泓瑜、陈曜州,民八十三年,最新数位讯号处理技术(语音、影像处理实务),全欣资讯图书。
附录:
嵌入式零元树小波转换、 阶层式嵌入式零元树小 波转换、阶层式影像传送 及渐进式影像传送
目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像,其资料量是不变的,其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时,我们常常都是先接收到文字後,其网页上的图形才,慢慢的一小部份一小部份显示出来,有时网路严重塞车,图形只显示一点点後就要再等非常久的时间才再有一点点显示出来,甚至可能断线了,使得使用者完全不知道在接收什麽图案的图形,无形中造成网路资源的浪费。此缺点之改善,可以使用嵌入式零元树小波转换(EZW)来完成。
阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号,如此不需要对於不同的解码器设计不同的编码器配合利用之,进而增加了其应用的 范围,及减低了所架设系统的复杂度,也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时,其编码的效果不是很好。主要的原因是,利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的,这使得拥有不同解析度与码率要求的解码器,无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之,但是该技术对於同一影像以不同解析度独立编码时,将使得共同的低通次频带(Lowpass Subband)被重复的编码与传送,而产生了相当高的累赘(Redundancy)。
基於上述情况,有人将嵌入式零元树小波转换(EZW)技术加以修改之,完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(Layered Embedded Zerotree Wavelet,简称 LEZW技术。这个技术使我们所设计出来的阶层式影像传送系统,可以在编码传送前预先指定图层数目、每层影像的解析度与码率。
LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之,而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中,从基层(Base Layer)开始SAQ一次仅用於一个 图层(Layer)的编码,直到最高阶析度的图层为止。当编码的那一图层码率利用完时,即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率,在较低图层的SAQ结果应用於较高图层的SAQ过程中,基於这种编码的程序,LEZW演算法则可以在每一图层平均码率的限制下,重建出不同解析度的影像。因此,LEZW非常适合用於设计阶层式影像传送系统。
LEZW技术也可以应用於渐进式传送,对於一个渐进式影像传送系统而言,控制其解析度将可以改善重建影像的视觉品质。而常用的渐进式传送方法有使用向量量化器或零元树资料结构编码演算法则。但是向量量化器需要较大的记忆体及对与传送中的错误敏威,而利用EZW技术所设计的渐进式影像传送系统,可以改善这些缺点,所以享有较好的效能。但是它也有缺点就是,应用於渐进式传送时是根据全解析度来做编码及传送,因此在低码率的限制之下时,若用全解析度来显示影像将使得影像模糊不清。所以在低码率传送时的影像以较低的解析度来显示时,则可以使影像的清晰度有所改善。
所以将LEZW技术延伸至渐进式传送,在编码之前可以先设定每一级(Stage)的解析度与传送每一级所累加的码率(Accumulated Rate),然後再编码与传送之。该系统在低码率时用低解析度来显示影像,在较高码率时则以高解析度来显示影像,将改善渐进式传送的视觉品质。此系统在编码传送的过程中,允许传送的位元流在任一点位置被中断停止,而接收端可以由所接收到的资料,将影像重建在资料中断时的解析度下。
渐进式影像传送与阶层式影像传送的设计方法是相似的,只不过在传送方法上两者有相当大的不同。在阶层式影像传送系统中,所有图层的资料是平行的一起传送出去的。而渐进式影像传送则是以级对级(Stage-by-Stage)的方式传送的。因此,利用LEZW技术所设计的渐进式传送可看做是单一图层(Single-Layer)系统,其解析度与传送都是可以控制的。如此网路资源的浪费,便可得到某种程度上的解决。
本文标签: