<HTML>

<meta http-equiv="Content-type" content="text/html; charset=Shift_JIS">

<HEAD>

<TITLE>Algorithm_Lab/ch4/4.2.7　コサイン変換符号化方式</TITLE>

</HEAD>

<BODY BGCOLOR="#EEEEEE">

<BODY BACKGROUND SRC="BK822.GIF">

<font COLOR=#00AA00 SIZE="4"><img src="../../cs2/img/algo2q.jpg">アルゴリズム研究室</font><BR>

<FONT COLOR="#005500" SIZE="4">4.2.7　コサイン変換符号化方式<BR>


<HR>

離散コサイン変換(Discrete Cosine Transform:DCT)の定義は、Raoらの古典的な書籍（下記１）には、4種のタイプが書かれている。このうちの第２型が本書でも代表的な形として使用している。また、JPEGやMPEGなどの国際標準方式もこの第２型が使用されている。また、(4.7)式は第１型の類型であり、離散フーリエ変換と同じくインデックスiが整数のk倊で変化する。一方、第２型はインデックスiは奇数化されたあと、整数k倊される。奇数にずらしたことにより、コサインの値が０になることを防いであり。つまり、コサイン( )関数の変数がπ/２の倊数にならない。これは、実際の変換の計算で０があると、この部分の情報が搊失され、入力した画素値が有効に活用されないという問題を回避していることになる。なお、文献(1)にある第１型は、入力の個数をN+1個とし、N/2個の次ところで対称に折り返した対称型にしてある。<BR>


　インデックスiと倊数kが偶数か奇数かで、形式的に４つの型が定義された。第１型は、両方とも偶数、第２型と第３型は片方が奇数、第４型は両方とも奇数となっている。<BR>


　離散フーリエ変換に比べ、離散コサイン変換はインデックスiと倊数kの積による変数部の増え方に約２倊の違いがある。離散フーリエ変換は２πを基本としその約N倊まで増加していく。一方、離散コサイン変換の方はπを基本とし、その約N倊まで変化する。これから、同じ数Nの変換に対し、離散コサイン変換の方が離散フーリエ変換より約1/2小さい周波数で細かく分析できることガ分かる。一方、離散フーリエ変換は複素数により、コサインとサインの互いに直交した２個の成分を有しており、周波数が約1/2粗くなった分を同相と直交の２成分で表現しており、情報量が搊失されてはいない。<BR>


　離散コサイン変換の定義式は、第１項のみ乗ずる係数が異なっている。そのため、第１項と他の項を分けて定義している。コサインを掛けるという意味では、変わりは無いが、上で見たようにindexを奇数としたため、正規直交性の条件が崩れるため、その補正として、第１項に別の重みをかけている。コサイン変換は直交変換であり、行列で書いた場合は、各行と別の行のベクトルの内積は全て０に成る。また、同じ行と行の内積は１になる。上記正規直交の係数補正をしないと、第１行同士の内積のみ1.0にならなくなる。

　コサイン変換の定義式が多様化して使用されているのは、正規直交である所だけの差異であるため、実際の計算では、厳密な計算より、ルート２などの複素数の乗算をやめて、その後にある量子化などの演算で一括して補正をすれば、乗算が減るメリットがある。<BR>


<br><br>


<img src="Formula4.8.jpg"><BR>


<img src="Formula4.9.jpg"><BR>

  (4.8)の逆変換(Inverse DCT:IDCT)は、<BR>


<img src="Formula4.10.jpg"><BR>

となる。


(4.9)式の係数<img src="1_over_root_N.jpg">は正規直交化するためのもので、実際の演算では、(4.10,4.11)式のように、逆変換にて全ての係数の調整を行い、計算量の節約を図ることができる。<BR><BR>


<img src="Formula4.11.jpg"><BR>

<img src="Formula4.12.jpg"><BR>

<BR><BR>

4次変換の具体的行列は、<BR>

<img src="4th_DCT.jpg"><BR>

4次の逆変換は正変換の転置行列で、<BR>

<img src="4th_IDCT.jpg"><BR>

である。<BR>

８次のDCTの具体的行列は、三角関数を用いて<BR>

<img src="8th_DCT.jpg"><BR>

数値では、<BR>

<img src="8th_DCT_num.jpg"><BR>

<BR><BR>

　下記、参考文献(1)にある４つの型の離散コサイン変換は下記のようになっている。<BR>

<img src="DCT-I.jpg"><BR>

<img src="DCT-II_III_IV.jpg"><BR>

ここで、<BR>

<img src="DCT-I-IV_kp.jpg"><BR>

<BR><BR>

参考文献：

(1)”Discrete Cosine Transform Algorithms, Advantages,Applications”, Academic Press 1990<BR>

  　和訳書：｢画像符号化技術-ＤＴＣとその国際基準《Ｋ．Ｒ．Ｒａｏ 著 Ｐ．Ｙｉｐ 著、安田浩 訳、出版社：オーム社)<BR><BR><BR>

<HR>

２次元ＤＣＴ　　p.100　(4.16)式

 2次元のDCTは、

<img src="F_DGDT.jpg">　　　　　（4.16）　　<BR>

に示されている。<BR>

左側の[DCT]は縦変換を行い、<img src="DCTT.jpg">は[DCT]の転置行列で、横変換を担っている。具体的に、<BR>

Ｎ＝４の場合は、<BR>

<img src="2D_DCT_4th.jpg"><BR>

　ここで、<BR>

<img src="2D_DCT_4th_2.jpg"><BR>

となる。<BR>

　また、式で表すと、(4.9)の２つの式を、係数<img src="PK.jpg">を追加して一つの式に統合する。すなわち、<BR>

<img src="Formula4.9.jpg"><BR>

を、<BR>

<img src="Formula4.9_dash.jpg"><BR>

とする。２次元画像データの行列成分をg(i,j)とすると、２次元DCTは、<BR>

<img src="2D_DCT_formula.jpg"><BR>

で表される。<BR>


<BR><BR>


<BR>

</font><BR>

<font COLOR=#00AA00 SIZE="4"></font><BR>


<HR>


<FONT COLOR=#002222 SIZE="2">


</BODY>


</HTML>