2018/6/22

視訊壓縮標準概述.1.1



  • [視訊壓縮標準概述.1.1]

1.
視訊編碼概念
當一個二維亮度函數被取樣、量化而變成數位影像時,就會產生很大的資料。事實上,這個資料可能會大到無法進行儲存,處理與通訊傳輸。例如:一張512x512 pixel,8 位元/pixel,3 顏色的影像所需的儲存空間為:512*512*8*3/8約786432個位元組。一段數位視訊若以640x480,每秒15 張,90 分鐘的一段全彩數位視訊而言,其需要的頻寬為:
640*480(pixels/frame)*3(bytes/pixel)*15(frames/sec) =13824000 bytes/sec=13.18 MB/sec
而所需的儲存空間為13.18*90*60=69.50GB。顯然地,這樣的儲存方式極不具經濟效益,且若直接在網路上的傳輸視訊資料,所耗費的頻寬對絕大部分的人而言根本是無法負擔的。對於數位視訊的高儲存空間,不但儲存是一個問題,傳輸更是一個不可能的任務,因此我們需要將資料壓縮。資料壓縮的目的是減少表示數位資料所需的資料量,可能是減少表示一個訊息所需要之訊號空間量,或者是傳送該訊息所需之頻寬。對於數位視訊而言,有許多的技術被運用來壓縮視訊。
由於連續視訊是一連串靜止畫面所組成,相臨的畫面間會有極大的相似性,因此會產生時間域冗餘(temporal redundancy),若先計算前後畫面間不同的地方,只對不同的地方做編碼,如此就可以達到減少資料量的目的。
clip_image002
圖6.2 時間域冗餘與空間域冗餘
再者,同一張的畫面中,鄰近的像素間相關性也極高,會有空間域冗餘(spatial redundancy),我們可以利用此特性來進一步的壓縮,其次是我們觀察人對視訊的感覺,發現人眼的反應相當差,我們將畫面間人眼不易察覺的資訊去除,雖然會失去資料的完整性,但人眼是無法辦別的。最後使用非失真壓縮技術再來對資料做編碼,以最有效率的方式來儲存這些資訊。
1.1 取樣方式
人類視覺系統對於亮度較彩度為敏感,故在視訊之儲存上,常將亮度分離出來,更甚者,使用較多空間儲存亮度資料。例如ITU-R recommendation BT.601定義色差表示法的運算式如表6.1,其中R為紅色,G為綠色,B為藍色,也就是亮度三原色,Y為亮度,可以看出綠色代表的是比較亮的色彩原色,Cb與Cr分別是藍色與紅色的色度通道。
表6.1 ITU-R recommendation BT.601定義色差表示法
clip_image004

clip_image006
圖6.3 隔行掃描模式
MPEG-2支援隔行掃描和逐行掃描。在逐行掃描模式下,編碼的基本單元是Frame。在隔行掃描模式下,基本編碼可以是Frame,也可以是場(field)。
clip_image008
圖6.4 Top field與Bottom field
原始輸入影像首先被轉換到YCbCr顏色空間。其中Y是亮度通道,Cb和Cr是兩個色度通道。對於每一通道,首先採用塊分割,然後形成「巨圖塊」(macroblocks),巨圖塊構成了編碼的基本單元。每一個巨圖塊再分割成8x8的小塊。色度通道分割成小塊的數目取決於初始參數設定。例如,在常用的4:2:0格式下,每個色度巨圖塊只採樣出一個小塊,所以三個通道巨圖塊能夠分割成的小塊數目是4+1+1=6個。
clip_image010
clip_image012
圖6.5 取樣方式
clip_image014
圖6.6 Macroblack

沒有留言:

張貼留言