1.2 線性轉換
對於許多壓縮系統,第一步工作就是識別存在於視頻信號的空間冗餘,這是利用分別對整幅影像做DCT(Discrete Cosine Transform)來完成。
在線性代數中所指的線性轉換,有兩個特性就是轉換前後加法運算不變,且純量乘法不變。而在函數空間上,其維度為無限大,多項式函數使用函數空間其中一組基底,變換基底的動作就叫做線性轉換,最顯而易見的例子就是座標轉換,座標轉換就是變換不同的基底。常見的傅利葉轉換就是轉換到以三角函數sin與cos為基底的表示法,但傅利葉轉換並不適合視訊壓縮來使用,一個優秀的線性轉換具有以下幾個特性:
- 經線性轉換後,非零數值可以局限在矩陣某一區域,減少因量化造成的資訊損失。
- 運算必需簡單,容易由DSP實作,進而容易設計硬體來加速。
- 經反轉換運算後,在區塊邊緣不能有明顯的假輪廓。
故經眾多學者實驗後,發現只存有cos項的離散餘弦轉換(DCT;Discrete Cosine Transform)較符合以上幾個條件,故MPEG-2仍採用離散餘弦轉換。其他如小波轉換則運用於其他更高階的影像或視訊標準中,如JPEG-2000。
離散餘弦轉換是一個無損的,可逆的數學過程,它把空間幅度資料轉化為時間頻率資料。在用於視頻壓縮時,這一運算過程是以亮度採樣和相應的色差採樣構成的8*8 點的方塊單位進行。
圖6.10 MPEG-2所使用的標準DCT矩陣 |
圖6.11 轉換前後的矩陣係數
轉換方式Y=AXAT ,由上圖可觀查到轉換前後矩陣內的係數約略相同大小,轉換後右邊矩陣內的大係數集中於右上角。
沒有留言:
張貼留言