Dict.CN 在线词典, 英语学习, 在线翻译

学海苦作舟,书山勤为径

留下点回忆

常用链接

统计

积分与排名

Denoise

English study

Web技术

数据压缩

一些连接

最新评论

JPEG2000中如何计算失真的?

 

JPEG2000中如何计算失真的?

概述

JPEG2000失真的计算是其EBCOT算法的基础,因此了解如何计算失真才能真正理解EBCOT算法。

首先描述wmse的计算公式:

Wmse  = ( Delta *1<<K_max)^2 * G_b * W_b^2

Pass_wmse = wmse/1<<32

Pass_wmse = Pass_wmse * (0.25^miss_msb)

再描述失真的公式:

Delta_D = Pass_wmse*(Ts +Tm)

 

失真的计算牵涉到很多概念,主要包括:

1. 能量计算(G_b)

2. 解码的差异

3. 子带的权重(W_b)

4. Delta的值(Delta) K_max

5. Miss_msbPass_wmse

6. TsTm

 

能量的计算

首先看一下能量的计算;能量的计算与选择的DWT小波核有关系,这里以5/3小波为例。

看一下5/3小波变换的过程:

正变换公式:

C(2i+1) = P(2i+1) + (1 - P(2i) - P(2i+2))>>1           (1)

C(2i) = P(2i) + (C(2i-1) + C(2i+1) + 2)>>2             (2)

 

变换公式:

Q(2i) = C(2i) - (C(2i-1) + C(2i+1) + 2)>>2              (3)

Q(2i+1) = C(2i+1) - (1 - Q(2i) - Q(2i+2))>>1           (4)

 

JPEG2000中对于这种变化叫做提升;5/3变换的提升步骤有两步,分别对应公式12,其提升因子分别是-0.50.25

 

同样JPEG2000使用单位脉冲响应来计算能量的变换;这种能量的变换对于高频和低频是不同的。分别在奇数位置和偶数位置设置一个1来模拟高频和低频脉冲响应。下表演示了在整合过程中单位脉冲的响应:这里假设DWT Lelvel3

 

L1 cof

L1

L2 cof

L2

L3 cof

L3

0

 

 

 

 

 

 

1

 

0.5

 

0.25

 

0.125

2

1

1

0.5

0.5

0.25

0.25

3

 

0.5

 

0.75

 

0.325

4

 

 

1

1

0.5

0.5

5

 

 

 

0.75

 

0.625

6

 

 

0.5

0.5

0.75

0.75

7

 

 

 

0.25

 

0.875

8

 

 

 

 

1

1

9

 

 

 

 

 

0.875

10

 

 

 

 

0.75

0.75

11

 

 

 

 

 

0.625

12

 

 

 

 

0.5

0.5

13

 

 

 

 

 

0.325

14

 

 

 

 

0.25

0.25

15

 

 

 

 

 

0.125

上表是一个在偶数位置模拟一个脉冲的过程,也就是在低频子带中。

Lx表示DWT的第几层

Lx cof表示DWT的整合系数;第一次的整合系数是1,在综合之后得到L1层真正DWT系数;而L1层的系数作为L2层的输入系数,因为有一个放大的过程,所以对应的位置需要乘以,也就是偶数位置,实际上对应低频子带。

由于5/3变换是整数变化,情况和上面有点不同。

 

JPEG2000中认为DWT变换是线性的,实际上从上面的计算可以发现这个事实;因此它认为各层之间的能力是可以线性相加的,从而得到整个过程的能量。

能量是通过系数的平方累加得到。

再来看高频子带中的一个模拟脉冲情况:

 

L1 cof

L1

L2 cof

L2

L3 cof

L3

-5

 

 

 

 

 

 

-4

 

 

 

 

 

 

-3

 

 

 

 

 

 

-2

 

0

-0.125

-0.125

 

 

-1

0

-0.125

0

 

 

 

0

0

-0.25

-0.25

 

 

 

1

1

0.75

0

 

 

 

2

0

-0.25

0.75

 

 

 

3

0

-0.125

0

 

 

 

4

0

0

-0.25

 

 

 

5

0

 

0

 

 

 

6

 

 

-0.125

 

 

 

7

 

 

0

 

 

 

8

 

 

 

 

 

 

9

 

 

 

 

 

 

10

 

 

 

 

 

 

11

 

 

 

 

 

 

12

 

 

 

 

 

 

13

 

 

 

 

 

 

14

 

 

 

 

 

 

15

 

 

 

 

 

 

 

如果当前的LEVEL1,而且是低频子带,那么能量系数是:

L_G_b = 0.5*0.5 + 1*1 + 0.5*0.5 = 1.5

如果是高频子带,那么能力系数是:

H_G_b = (-0.125)^2 * 2 + 0.75^2 + (-0.25)^2 = 0.03125+0.5625+0.125=0.71875

 

现在知道如何计算单位冲击的能量了,这些系数可以作为其他系数变化的基数。

 

DWT变换中某些子带兼有高频和低频部分,可以通过这个公式来计算某个子带的具体能量:

假设子带具有索引xy0表示低频,1表示高频,因此x=0y=0表示LL子带,x=1并且y=1表示HH子带,那么:

G_b = (x? H_G_b: L_G_b) * (y? H_G_b: L_G_b)

分配到子带就是:

子带

G_b

LL

2.25

HL/LH

1.078125

HH

0.5166015625

 

 

不同的分量采用不同的G_b系数:

Y分量:Y_G_b = G_b

UV分量:G_b = G_b * (0.75^2+0.25^2+0.25^2)

子带的权重

JPEG2000可以为不同的子带分配不同的权重。理论上可以根据CSF来分配权重,但这个值一般都设置为1

 

DeltaK_max

Delta对于5/3变换实际采用的一个固定的值1/256.

K_max用来表示子带样本范围,不同子带范围是不同的,基本上这样定义:

LL: K_max bit B1 1-G

HL/LH: K_max bit + B2 +1-G

HH: K_max bit + B3 + 1 – G

G为保护位,一般取1,而B1B3是最坏的BIBO位扩展,根据计算得到,B1从来不大于2B2从来不大于3B3从来不大于4。因此有:

LL: K_max bit 2 1-G = bit +2

HL/LH: K_max bit + 3 +1-G = bit + 3

HH: K_max bit + 4 + 1 – G= bit + 4

 

Wmse

有来以上各值,我们看一下WMSE是什么值。

这里假设图像的分量精度是8,那么:

对于不同的子带K_max为:

子带

K_max

LL

10

HL/LH

11

HH

12

Wmse = ( Delta *1<<K_max)^2 * G_b * W_b^2

1/256 ×K_max^2 *G_b (W_b=1)

结合上面的子带能量分布有:

子带

WMSE

LL

64*G_b=64*2.25 = 144

HL/LH

256* G_b  = 256*1.078125=276

HH

1024*G_b = 1024*0.5166015625=529

Miss_msb

JPEG2000中采用的是位平面编码,其编码是从不是所有像素都为0的位平面开始编码。例如,8位的像素值;如果每个值都小于128,那么开始编码位就是第60为基数)位。通常情况在DWT分析的低层,系数一般比较小,他们在高位都位0,因此使用Miss_msb来记录这个事实,从而节省编码。

Miss_msb表示从最高位开始到第一个不全为0的位平面的位平面数量。

Pass_wmse

JPEG2000使用的是位平面编码,并且将每个位平面分为3个过程编码,分别是清除过程、显著过程合量值改进过程。对于第一个编码的位平面只有清除过程,然后从第二个开始编码的位平面开始,都是有:显著过程、量值改进过程合清除过程组成。因此如果有K个位平面需要编码,那么就有:3K-2个编码过程。

Wmse值是对应到每个编码过程就被称为pass_wmse;这个值主要是计算当前过程编码对整个过程的失真改进的情况。

Pass_wmse的计算公式如下:

Pass_wmse = (wmse /2^32)*0.25^miss_msb

由于采用16位整数运算的,所以首先需要将wmse对应到16位整数的变化,因此除以2^16的平方(因为wmse也是一个平方);然后对于从编码位平面的最高位开始,每前进一个位能量相当于是原来的1/2(因为从数值上来看,例如:0x1000x080,确实后者是前者的一半),同样需要取平方值。因此有多少个miss_msb就需要缩小次。

这个pass_wmse再编码过程中也是逐渐减小的,每次编码一个位平面完成以后,减少一次。

 

 

TsTm

首先看一下JPEG2000认为如何计算失真的?

D G_b (yp[j]-y[j]) 2

其中第一个y是解码后的值,第二个y是原来的样本值;当然这些都是针对DWT系数的。

这里考察从位平面p+1p时候失真的改进。

Delta_D G_b×[(yp+1[j]-y[j]) - (yp[j]-y[j]) ]

G_b是能量因子,与我们前面的计算值同一个含义。

yp+1是解码到p1位平面时的值,yp是编码到位平面p时候的值。而y表示原来的DWT系数。

 

如果采用重点重建的算法,那么有:

如果vp>0 yp signy × 2p×△(vp+1/2

如果vp=0 yp 0

因此向下编码到位平面p的时候,由样本y产生的失真为:

G_b ×(yp[j]-y[j]) 2

= G_b × y-2p×△(vp+1/2))2 ,其中vp>0

G_b × y2 =(y2p×△×vp2  ,其中vp>0

 

上面各式中y的值都是绝对值。

现则假设:v_py/2p×△的小数部分,也就是说:

其:v_p |y|/2p×△ –vp

其中vp表示|y|/2p×△的整除结果。

 

因此将上面两个结果代入前面的表达式中。这里分为几种情况来计算:

1. vp0vp+1都为0,这个时候实际上式没有失真的;这中情况不表示

2. vp1,表示vp+10

3. 如果vp+11,而且vp0,表示从p+1p位平面没有改进

4. 如果vp大于1,表示vp+1大于0

下面对24来求最中的失真改进。

 

对于2有:

(yp+1[j]-y[j]) 2 ( |y| 2p+1vp+1 )2 = 22(p+1)×△×(|y|/2p+1 –vp+12 =22(p+1)×△×v_p+12

= 22p×△×(2v_p+1)2

(yp[j] - y[j]) 2 (|y| 2p(vp+1/2) )2 = 22p×△×(|y|/2p –(vp+1/2))2= 22p×△×(v_p–1/2)2

 

因此有:

Delta_D G_b×[(yp+1[j]-y[j]) - (yp[j]-y[j]) ]

G_b ×22p×△×[(2v_p+1)2- (v_p–1/2)2]

 

对于4有:

(yp+1[j]-y[j]) 2 ( |y| 2p+1(vp+1 +1/2))2 = 22p×△×(2v_p+1–1/2)2

(yp[j] - y[j]) 2 (|y| 2p(vp+1/2) )2 = 22p×△×(|y|/2p –(vp+1/2))2= 22p×△×(v_p–1/2)2

Delta_D G_b×[(yp+1[j]-y[j]) - (yp[j]-y[j]) ]

= G_b ×22p×△×[(2v_p+1–1/2)2- (v_p–1/2)2]

 

有一个事实是不可忽略的,也就是:v_pv_p+1之间的关系。我们知道v_p|y|/2p△的小数部分,也就是:

v_p = |y|/2p – [|y|/2p]

v_p+1|y|/2P+1 – [|y|/2p+1]。因此2 ×v_p+1是由最第有效位整数位和v_p构成,也就是:

V_p = 2v_p+1 – [2v_p+1],其中[2v_p+1]表示取整。

 

例如:设y22p2p+13

那么v_p = float22/4 int22/4 0.5

v_p+1 float22/8 int22/8 0.75

因此v_p 2 ×v_p+1(int)2×v_p+1 1.51 0.5

 

如果样本在位平面p变成显著位,你们vp 1 并且2×v_p+1 >=1(至少应该是1,因为p位至少是p+1位的1/2)。那么失真可表示位:

Delta_D G_b ×△2×22p× Tsv_p+1

其中Tsv_p+1)可表示为:

2×v_p+12-(v_p -1/22 =(2×v_p+12 [2×v_p+1)-11/2]2

因为2×v_p+1 >=1,所以其整数部分肯定是1

对于vp大于1的过程,一般是量值改进过程,对应的失真计算方法有:

Delta_D G_b ×△2×22p× Tmv_p+1

其中Tmv_p+1)为:

2v_p+1-12 - (2×v_p+1)-x1/22

其中x表示(int(v_p+1<<1)。如果p位也为1,那么x1,否则x 0

 

JPEG2000中的TsTm

JPEG2000中通过两个小的查找表来近似计算;这里取5位作为显著过程和清除过程的计算基数。

Ts的计算:

假设将最中的结果转换到1<<16范围内。

n大于等于0小于32

       n 32n

       v doublen/(double)32

       s_lut[n] = (long)((v2 – (v – 1.5)2)×f_scale0.5

 

Tm的计算。计算Tm的时候使用的是6位来近似整个失真过程的变化。同样将结果转换到1<<16范围内。

n大于0小于64

       V=(doublen/double32

       如果n大于等于32,那么

       R_lut[n] v-1.02-(v-1.52

       如果n小于32,那么:

       R_lut[n] v-1.02-(v-0.52

 

这里的计算位56根据精度选择。

 

最中的失真表达式

现在已经知道了所有失真计算的变量,可以用来表示最中的失真表达式了。如下:

对于清除和显著过程为:

Delta_D = Pass_wmse *Ts

对于量值改建过程为:

Delta_D = Pass_wmse* +Tm

 

失真长度斜率

失真的改进和长度的变化比值就是失真长度改进,使用lambda来表示,如下:

Lambda Delta_D/Delta_L

标准的斜率曲线应该式下中心原点内凹的曲线,但上面的Lambda式一个小数值,不便于调试和观察,JPEG2000中使用对数形式来将其转换到065536之间的数,具体转换过程如下:

logscale256/ln2

那么log_lambda logscale×(ln lambdaln232)+65536

Log_lambda是不能小于2和大于65535的整数。

 

 

posted on 2007-06-25 14:47 笨笨 阅读(2409) 评论(3)  编辑 收藏 引用 所属分类: 压缩算法

评论

# re: JPEG2000中如何计算失真的? 2007-06-26 08:14 liuliu

你好!我想问一下你用过Kakadu源代码程序进行图像压缩吗?在这进行压缩的话小波基怎么样选择的呢?  回复  更多评论   

# re: JPEG2000中如何计算失真的? 2007-06-26 09:12 笨笨

可以选择5/3或9/7
通过设置可逆还是不可逆变换来确定  回复  更多评论   

# re: JPEG2000中如何计算失真的? 2008-04-21 17:46 vfdff

我们知道在 位平面截断算法 中
如果剩下的比特数不足以提取整个位平面, 则按照先
低通子带帧后高通子带帧、先低通空间子带后高通
空间子带、先亮度分量后色度分量的顺序依次分配
编码比特,直到剩余比特数为零.

那么在 率失真优化截断中如果剩下的比特数不足以提取整个包packet该怎么处理呢 ?  回复  更多评论   


只有注册用户登录后才能发表评论。
网站导航: 博客园   IT新闻   BlogJava   知识库   博问   管理