網站首頁 文學常識 簡歷 公文文書 文學名著 實用文 人生哲理 作文 熱點話題作文
當前位置:文萃咖 > 實用範文 > 論文

S視頻編碼技術發展淺談論文

欄目: 論文 / 發佈於: / 人氣:2W

論文摘要:是基於我國創新技術和部分公開技術的自主標準,瞭解AVS應用的主要技術,對提高壓縮效率,改進AVS解碼速度,推動我國數字音視頻標準AVS的應用具有重要意義。

S視頻編碼技術發展淺談論文

論文關鍵詞:視頻編碼,壓縮技術

一、引言

所謂視頻編碼方式就是指通過特定的壓縮技術,將某個視頻格式的文件轉換成另一種視頻格式文件的方式。視頻壓縮發展到現在己有幾十年的歷史。1948年,Oliver提出了第一個編碼理論脈衝編碼調製(PulseCodingModulation,簡稱PCM);同年,Shannon的經典論文“通信的數學原理”首次提出了信息率失真函數的概念;1959年,Shannon進一步確立了碼率失真理論;而Berger在1971年所著的《信息率失真理論》一書則對率失真理論做了系統地論述和擴展;以上各項工作奠定了信息編碼的理論基礎。

二、AVS基本介紹

AVS是基於我國創新技術和部分公開技術的自主標準,技術方案簡潔,芯片實現複雜度低,達到了第二代標準的最高水平;而且,AVS通過簡潔的一站式許可政策,是開放式制訂的國家、國際標準,易於推廣;此外,AVS是一套包含系統、視頻、音頻、媒體版權管理在內的完整標準體系,為數字音視頻產業提供更全面的解決方案。綜上所述,AVS可稱第二代信源標準的上選。

三、AVS主要技術

AVS採用的主要技術包括:8x8整數變換量化技術、幀內預測、半像素與1/4精度像素插值、特殊的幀間預測運動補償、二維熵編碼、去塊效應環內濾波等:

1.整數變換量化:AVS為了避開H.264的專利問題,選擇了以往標準廣泛採用的8×8變換,這樣可以在16位處理器上無失配地實現。AVS採用的64級量化,可以完全適應不同的應用和業務對碼率和質量的要求。目前AVS所採用的8x8變換與量化方案大大降低了芯片的實現難度。

2.幀內預測:AVS採用的幀內預測技術,是用相鄰塊的像素預測當前塊,同時採用代表空間域紋理方向的多種預測模式。AVS亮度和色度幀內預測都是以8x8塊為單位的。亮度塊採用5種預測模式,色度塊採用4種預測模式,而這4種模式中有3種和亮度塊的預測模式相同。在編碼質量相當的前提下,AVS採用較少的預測模式,使方案更加簡潔、實現的複雜度大為降低。

3.幀間預測運動補償:幀間運動補償編碼是混合編碼技術框架中最重要的部分之一。AVS標準採用了16×16,16×8,8×16和8×84種用於運動補償的宏塊模式,去除了MPEG-4AVC/H.264標準中的8×4,4×8,4×4的塊模式,這樣可以更好地刻畫物體運動,提高運動搜索的準確性。

4.半像素與1/4精度像素插值:AVS通過4抽頭濾波器(-1,5,5,-1)得到半像素點,再通過4抽頭濾波器(1,7,7,1)和均值濾波器得到1/4像素點,在不降低性能的情況下減少插值所需要的參考像素點,減小了數據存取帶寬需求,這在高分辨率視頻壓縮應用中是非常有意義的。

5.預測模式:AVS的B幀雙向預測使用了直接模式、對稱模式和跳躍模式。使用對稱模式時,碼流只需要傳送前向運動向量,後向運動向量可由前向運動向量導出,從而節省後向運動向量的編碼開銷;對於直接模式,前塊的前、後向運動向量都是由後向參考圖像相應位置塊的運動向量按比例分配導出,因此也可以節省運動向量的編碼開銷;跳躍模式的`運動向量導出方法和直接模式的相同,跳躍模式編碼塊都不編碼運動補償的殘差,也不傳送運動向量,即該模式下宏塊只需要傳輸模式信號則可。

6.二維熵編碼:AVS熵編碼採用自適應變長編碼技術。在AVS熵編碼過程中,定長碼用來編碼具有均勻分佈的語法元素,指數哥倫布碼用以編碼可變概率分佈的語法元素。採用指數哥倫布碼的優勢在於:一方面,它的硬件複雜度比較低,可以根據閉合公式解析碼字,無需查表;另一方面,它可以根據編碼元素的概率分佈靈活確定k階指數哥倫布碼編碼,如果k選得恰當,編碼效率可以逼近信息熵。預測殘差的塊變換系數後,經掃描形成(level、run)對串,level、run不是獨立事件,而存在很強的相關性,在AVS中level、run採用二維聯合編碼,並根據當前level、run的不同概率分佈趨勢,自適應改變指數哥倫布碼的階數。

四、總結與展望

目前AVS技術可實現標準清晰度、相當清晰度、低清晰度等不同格式視頻的壓縮,但針對此類應用的壓縮效率還有待不斷提高,這應當是AVS視頻技術進一步發展的重點所在:着力AVS編解碼的實際應用研究,優化AVS運動搜索算法,提高AVS解碼速度,從而推動我國數字音視頻標準AVS的推廣和應用。

參考文獻

1 陳亮 AVS先進編碼技術研究 華中科技大學

2 申青平 AVS-M關鍵技術及多平台應用研究 湘潭大學

3 GB /T 200090. 222006. Information Technology Advanced Coding of Audio and Video2Part 2: Video[ S]. Feb.