avav588con,最近2019中文免费字幕在线观看,欧美一道本一区二区三区,九九热在线观看,经典好看免费AV

移動(dòng)端

H.264視頻編碼基本知識(shí)

2007年01月10日 10:13深圳市特瑞森電子技術(shù)有限責(zé)任公司點(diǎn)擊量:1598

h.264視頻編碼基本知識(shí)
 
[轉(zhuǎn)載]
  h.264視頻編碼基本知識(shí)

一、視頻編碼技術(shù)的發(fā)展歷程  

  視頻編碼技術(shù)基本是由iso/iec制定的mpeg-x和itu-t制定的h.26x兩大系列視頻編碼標(biāo)準(zhǔn)的推出。從h.261視頻編碼建議,到h.262/3、mpeg-1/2/4等都有一個(gè)共同的不斷追求的目標(biāo),即在盡可能低的碼率(或存儲(chǔ)容量)下獲得盡可能好的圖像質(zhì)量。而且,隨著市場(chǎng)對(duì)圖像傳輸需求的增加,如何適應(yīng)不同信道傳輸特性的問(wèn)題也日益顯現(xiàn)出來(lái)。于是ieo/iec和itu-t兩大標(biāo)準(zhǔn)化組織聯(lián)手制定了視頻新標(biāo)準(zhǔn)h.264來(lái)解決這些問(wèn)題。


        h.261是zui早出現(xiàn)的視頻編碼建議,目的是規(guī)范isdn網(wǎng)上的會(huì)議電視和應(yīng)用中的視頻編碼技術(shù)。它采用的算法結(jié)合了可減少時(shí)間冗余的幀間預(yù)測(cè)和可減少空間冗余的dct變換的混合編碼方法。和isdn信道相匹配,其輸出碼率是p×64kbit/s。p取值較小時(shí),只能傳清晰度不太高的圖像,適合于面對(duì)面的電視;p取值較大時(shí)(如  p>6),可以傳輸清晰度較好的會(huì)議電視圖像。h.263  建議的是低碼率圖像壓縮標(biāo)準(zhǔn),在技術(shù)上是h.261的改進(jìn)和擴(kuò)充,支持碼率小于64kbit/s的應(yīng)用。但實(shí)質(zhì)上h.263以及后來(lái)的h.263+和h.263++已發(fā)展成支持全碼率應(yīng)用的建議,從它支持眾多的圖像格式這一點(diǎn)就可看出,如sub-qcif、qcif、cif、4cif甚至16cif等格式。


        mpeg-1標(biāo)準(zhǔn)的碼率為1.2mbit/s左右,可提供30幀cif(352×288)質(zhì)量的圖像,是為cd-rom光盤的視頻存儲(chǔ)和播放所制定的。mpeg-l標(biāo)準(zhǔn)視頻編碼部分的基本算法與h.261/h.263相似,也采用運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)、二維dct、vlc游程編碼等措施。此外還引入了幀內(nèi)幀(i)、預(yù)測(cè)幀(p)、雙向預(yù)測(cè)幀(b)和直流幀(d)等概念,進(jìn)一步提高了編碼效率。在mpeg-1的基礎(chǔ)上,mpeg-2標(biāo)準(zhǔn)在提高圖像分辨率、兼容數(shù)字電視等方面做了一些改進(jìn),例如它的運(yùn)動(dòng)矢量的精度為半像素;在編碼運(yùn)算中(如運(yùn)動(dòng)估計(jì)和dct)區(qū)分"幀"和"場(chǎng)";引入了編碼的可分級(jí)性技術(shù),如空間可分級(jí)性、時(shí)間可分級(jí)性和信噪比可分級(jí)性等。近年推出的mpeg-4標(biāo)準(zhǔn)引入了基于視聽對(duì)象(avo:audio-visual  ob-ject)的編碼,大大提高了視頻通信的交互能力和編碼效率。  mpeg-4中還采用了一些新的技術(shù),如形狀編碼、自適應(yīng)dct、任意形狀視頻對(duì)象編碼等。但是mpeg-4的基本視頻編碼器還是屬于和h.263相似的一類混合編碼器。


        總之,h.261建議是視頻編碼的經(jīng)典之作,h.263是其發(fā)展,并將逐步在實(shí)際上取而代之,主要應(yīng)用于通信方面,但h.263眾多的選項(xiàng)往往令使用者無(wú)所適從。mpeg系列標(biāo)準(zhǔn)從針對(duì)存儲(chǔ)媒體的應(yīng)用發(fā)展到適應(yīng)傳輸媒體的應(yīng)用,其核心視頻編碼的基本框架是和h.261一致的,其中引人注目的mpeg-4的"基于對(duì)象的編碼"部分由于尚有技術(shù)障礙,目前還難以普遍應(yīng)用。因此,在此基礎(chǔ)上發(fā)展起來(lái)的新的視頻編碼建議h.264克服了兩者的弱點(diǎn),在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,面向?qū)嶋H應(yīng)用。同時(shí),它是兩大標(biāo)準(zhǔn)化組織的共同制定的,其應(yīng)用前景應(yīng)是不言而喻的。

二、h.264介紹


  h.264是itu-t的vceg(視頻編碼專家組)和iso/iec的mpeg(活動(dòng)圖像編碼專家組)的聯(lián)合視頻組(jvt:joint  video  team)開發(fā)的一個(gè)新的數(shù)字視頻編碼標(biāo)準(zhǔn),它既是itu-t的h.264,又是iso/iec的mpeg-4的第10  部分。1998年1月份開始草案征集,1999年9月,完成*個(gè)草案,2001年5月制定了其測(cè)試模式tml-8,2002年6月的  jvt第5次會(huì)議通過(guò)了h.264的fcd板。2003年3月正式發(fā)布。


        h.264和以前的標(biāo)準(zhǔn)一樣,也是dpcm加變換編碼的混合編碼模式。但它采用"回歸基本"的簡(jiǎn)潔設(shè)計(jì),不用眾多的選項(xiàng),獲得比h.263++好得多的壓縮性能;加強(qiáng)了對(duì)各種信道的適應(yīng)能力,采用"網(wǎng)絡(luò)友好"的結(jié)構(gòu)和語(yǔ)法,有利于對(duì)誤碼和丟包的處理;應(yīng)用目標(biāo)范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲(chǔ))場(chǎng)合的需求;它的基本系統(tǒng)是開放的,使用無(wú)需版權(quán)。


        在技術(shù)上,h.264標(biāo)準(zhǔn)中有多個(gè)閃光之處,如統(tǒng)一的vlc符號(hào)編碼,高精度、多模式的位移估計(jì),基于4×4塊的整數(shù)變換、分層的編碼語(yǔ)法等。這些措施使得h.264算法具有很的高編碼效率,在相同的重建圖像質(zhì)量下,能夠比h.263節(jié)約50%左右的碼率。h.264的碼流結(jié)構(gòu)網(wǎng)絡(luò)適應(yīng)性強(qiáng),增加了差錯(cuò)恢復(fù)能力,能夠很好地適應(yīng)ip和無(wú)線網(wǎng)絡(luò)的應(yīng)用。

三、h.264的技術(shù)亮點(diǎn)


1、分層設(shè)計(jì)


  h.264的算法在概念上可以分為兩層:視頻編碼層(vcl:video  coding  layer)負(fù)責(zé)的視頻內(nèi)容表示,網(wǎng)絡(luò)提取層(nal:network  abstraction  layer)負(fù)責(zé)以網(wǎng)絡(luò)所要求的恰當(dāng)?shù)姆绞綄?duì)數(shù)據(jù)進(jìn)行打包和傳送。在vcl和nal之間定義了一個(gè)基于分組方式的接口,打包和相應(yīng)的信令屬于nal的一部分。這樣,高編碼效率和網(wǎng)絡(luò)友好性的任務(wù)分別由vcl和nal來(lái)完成。


        vcl層包括基于塊的運(yùn)動(dòng)補(bǔ)償混合編碼和一些新特性。與前面的視頻編碼標(biāo)準(zhǔn)一樣,h.264沒有把前處理和后處理等功能包括在草案中,這樣可以增加標(biāo)準(zhǔn)的靈活性。


        nal負(fù)責(zé)使用下層網(wǎng)絡(luò)的分段格式來(lái)封裝數(shù)據(jù),包括組幀、邏輯信道的信令、定時(shí)信息的利用或序列結(jié)束信號(hào)等。例如,nal支持視頻在電路交換信道上的傳輸格式,支持視頻在internet上利用rtp/udp/ip傳輸?shù)母袷健al包括自己的頭部信息、段結(jié)構(gòu)信息和實(shí)際載荷信息,即上層的vcl數(shù)據(jù)。(如果采用數(shù)據(jù)分割技術(shù),數(shù)據(jù)可能由幾個(gè)部分組成)。


2、高精度、多模式運(yùn)動(dòng)估計(jì)


        h.264支持1/4或1/8像素精度的運(yùn)動(dòng)矢量。在1/4像素精度時(shí)可使用6抽頭濾波器來(lái)減少高頻噪聲,對(duì)于1/8像素精度的運(yùn)動(dòng)矢量,可使用更為復(fù)雜的8抽頭的濾波器。在進(jìn)行運(yùn)動(dòng)估計(jì)時(shí),編碼器還可選擇"增強(qiáng)"內(nèi)插濾波器來(lái)提高預(yù)測(cè)的效果。


        在h.264的運(yùn)動(dòng)預(yù)測(cè)中,一個(gè)宏塊(mb)可以按圖2被分為不同的子塊,形成7種不同模式的塊尺寸。這種多模式的靈活和細(xì)致的劃分,更切合圖像中實(shí)際運(yùn)動(dòng)物體的形狀,大大提高了運(yùn)動(dòng)估計(jì)的程度。在這種方式下,在每個(gè)宏塊中可以包含有1、2、4、8或16個(gè)運(yùn)動(dòng)矢量。


        在h.264中,允許編碼器使用多于一幀的先前幀用于運(yùn)動(dòng)估計(jì),這就是所謂的多幀參考技術(shù)。例如2幀或3幀剛剛編碼好的參考幀,編碼器將選擇對(duì)每個(gè)目標(biāo)宏塊能給出更好的預(yù)測(cè)幀,并為每一宏塊指示是哪一幀被用于預(yù)測(cè)。


3、4×4塊的整數(shù)變換


        h.264與先前的標(biāo)準(zhǔn)相似,對(duì)殘差采用基于塊的變換編碼,但變換是整數(shù)操作而不是實(shí)數(shù)運(yùn)算,其過(guò)程和dct基本相似。這種方法的優(yōu)點(diǎn)在于:在編碼器中和解碼器中允許精度相同的變換和反變換,便于使用簡(jiǎn)單的定點(diǎn)運(yùn)算方式。也就是說(shuō),這里沒有"反變換誤差"。  變換的單位是4×4塊,而不是以往常用的8×8塊。由于用于變換塊的尺寸縮小,運(yùn)動(dòng)物體的劃分更,這樣,不但變換計(jì)算量比較小,而且在運(yùn)動(dòng)物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對(duì)圖像中較大面積的平滑區(qū)域不產(chǎn)生塊之間的灰度差異,可對(duì)幀內(nèi)宏塊亮度數(shù)據(jù)的16個(gè)4×4塊的dc系數(shù)(每個(gè)小塊一個(gè),共16個(gè))進(jìn)行第二次4×4塊的變換,對(duì)色度數(shù)據(jù)的4個(gè)4×4塊的dc系數(shù)(每個(gè)小塊一個(gè),共4個(gè))進(jìn)行2×2塊的變換。


        h.264為了提高碼率控制的能力,量化步長(zhǎng)的變化的幅度控制在12.5%左右,而不是以不變的增幅變化。變換系數(shù)幅度的歸一化被放在反量化過(guò)程中處理以減少計(jì)算的復(fù)雜性。為了強(qiáng)調(diào)彩色的逼真性,對(duì)色度系數(shù)采用了較小量化步長(zhǎng)。


4、統(tǒng)一的vlc


        h.264中熵編碼有兩種方法,一種是對(duì)所有的待編碼的符號(hào)采用統(tǒng)一的vlc(uvlc  :universal  vlc),另一種是采用內(nèi)容自適應(yīng)的二進(jìn)制算術(shù)編碼(cabac:context-adaptive  binary  arithmetic  coding)。cabac是可選項(xiàng),其編碼性能比uvlc稍好,但計(jì)算復(fù)雜度也高。uvlc使用一個(gè)長(zhǎng)度無(wú)限的碼字集,設(shè)計(jì)結(jié)構(gòu)非常有規(guī)則,用相同的碼表可以對(duì)不同的對(duì)象進(jìn)行編碼。這種方法很容易產(chǎn)生一個(gè)碼字,而解碼器也很容易地識(shí)別碼字的前綴,uvlc在發(fā)生比特錯(cuò)誤時(shí)能快速獲得重同步。


5、幀內(nèi)預(yù)測(cè)


        在先前的h.26x系列和mpeg-x系列標(biāo)準(zhǔn)中,都是采用的幀間預(yù)測(cè)的方式。在h.264中,當(dāng)編碼intra圖像時(shí)可用幀內(nèi)預(yù)測(cè)。對(duì)于每個(gè)4×4塊(除了邊緣塊特別處置以外),每個(gè)像素都可用17個(gè)zui接近的先前已編碼的像素的不同加權(quán)和(有的權(quán)值可為0)來(lái)預(yù)測(cè),即此像素所在塊的左上角的17個(gè)像素。顯然,這種幀內(nèi)預(yù)測(cè)不是在時(shí)間上,而是在空間域上進(jìn)行的預(yù)測(cè)編碼算法,可以除去相鄰塊之間的空間冗余度,取得更為有效的壓縮。


    如圖4所示,4×4方塊中a、b、...、p為16  個(gè)待預(yù)測(cè)的像素點(diǎn),而a、b、...、p是已編碼的像素。如m點(diǎn)的值可以由(j+2k+l+2)/  4  式來(lái)預(yù)測(cè),也可以由(a+b+c+d+i+j+k+l)/  8  式來(lái)預(yù)測(cè),等等。按照所選取的預(yù)測(cè)參考的點(diǎn)不同,亮度共有9類不同的模式,但色度的幀內(nèi)預(yù)測(cè)只有1類模式。


6、面向ip和無(wú)線環(huán)境


    h.264  草案中包含了用于差錯(cuò)消除的工具,便于壓縮視頻在誤碼、丟包多發(fā)環(huán)境中傳輸,如移動(dòng)信道或ip信道中傳輸?shù)慕研浴?br />

    為了抵御傳輸差錯(cuò),h.264視頻流中的時(shí)間同步可以通過(guò)采用幀內(nèi)圖像刷新來(lái)完成,空間同步由條結(jié)構(gòu)編碼(slice  structured  coding)來(lái)支持。同時(shí)為了便于誤碼以后的再同步,在一幅圖像的視頻數(shù)據(jù)中還提供了一定的重同步點(diǎn)。另外,幀內(nèi)宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時(shí)候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性。


    除了利用量化步長(zhǎng)的改變來(lái)適應(yīng)信道碼率外,在h.264中,還常利用數(shù)據(jù)分割的方法來(lái)應(yīng)對(duì)信道碼率的變化。從總體上說(shuō),數(shù)據(jù)分割的概念就是在編碼器中生成具有不同優(yōu)先級(jí)的視頻數(shù)據(jù)以支持網(wǎng)絡(luò)中的服務(wù)質(zhì)量qos。例如采用基于語(yǔ)法的數(shù)據(jù)分割(syntax-based  data  partitioning)方法,將每幀數(shù)據(jù)的按其重要性分為幾部分,這樣允許在緩沖區(qū)溢出時(shí)丟棄不太重要的信息。還可以采用類似的時(shí)間數(shù)據(jù)分割(temporal  data  partitioning)方法,通過(guò)在p幀和b幀中使用多個(gè)參考幀來(lái)完成。


    在無(wú)線通信的應(yīng)用中,我們可以通過(guò)改變每一幀的量化精度或空間/時(shí)間分辨率來(lái)支持無(wú)線信道的大比特率變化??墒?,在多播的情況下,要求編碼器對(duì)變化的各種比特率進(jìn)行響應(yīng)是不可能的。因此,不同于mpeg-4中采用的精細(xì)分級(jí)編碼fgs(fine  granular  scalability)的方法(效率比較低),h.264采用流切換的sp幀來(lái)代替分級(jí)編碼。

四、h.264的性能比較


        tml-8為h.264的測(cè)試模式,用它來(lái)對(duì)h.264的視頻編碼效率進(jìn)行比較和測(cè)試。測(cè)試結(jié)果所提供的psnr已清楚地表明,相對(duì)于mpeg-4(asp:advanced  simple  profile)和h.263++(hlp:high  latency  profile)的性能,h.264的結(jié)果具有明顯的*性。


        h.264的psnr比mpeg-4(asp)和h.263++(hlp)明顯要好,在6種速率的對(duì)比測(cè)試中,h.264的psnr比mpeg-4(asp)平均要高2db,比h.263(hlp)平均要高3db。6個(gè)測(cè)試速率及其相關(guān)的條件分別為:32  kbit/s速率、10f/s幀率和qcif格式;64  kbit/s速率、15f/s幀率和qcif格式;128kbit/s速率、15f/s幀率和cif格式;256kbit/s速率、15f/s幀率和qcif格式;512  kbit/s速率、30f/s幀率和cif格式;1024  kbit/s速率、30f/s幀率和cif格式。
版權(quán)與免責(zé)聲明: 凡本網(wǎng)注明“來(lái)源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來(lái)源:智慧城市網(wǎng)www.duty-free.cn”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它來(lái)源(非智慧城市網(wǎng)www.duty-free.cn)的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來(lái)源,并自負(fù)版權(quán)等法律責(zé)任。

編輯精選

更多

本站精選

更多

專題推薦

更多

名企推薦

更多

浙公網(wǎng)安備 33010602000006號(hào)