织梦CMS - 轻松建站从此开始!

罗索

h.263协议

罗索客 发布于 2003-09-25 10:55 点击:次 
作者:陆绍飞 发布时间:2001/08/28 br/br/文章摘要: br/ H.263是ITU-T提出的作为H.324终端使用的视频编解码建议,它是基于运动补偿的DPCM的混合编码,在运动搜索的基础上进行运动补偿,然后运用DCT变换和之字形扫描游程编码,从而得到输出码流。H.263在H.261建议的基础
TAG:

作者:陆绍飞  发布时间:2001/08/28 <br/><br/>文章摘要: <br/> H.263是ITU-T提出的作为H.324终端使用的视频编解码建议,它是基于运动补偿的DPCM的混合编码,在运动搜索的基础上进行运动补偿,然后运用DCT变换和"之"字形扫描游程编码,从而得到输出码流。H.263在H.261建议的基础上,将运动矢量的搜索增加为半象素点搜索;同时又增加了无限制运动矢量、基于语法的算术编码、高级预测技术和PB帧编码等四个高级选项;从而达到了进一步降低码速率和提高编码质量的目的。  <br/>         <br/> <br/>正文:    <br/> <br/><br/>h.263协议<br/><br/>1 h.263 简介<br/>  H.263是ITU-T提出的作为H.324终端使用的视频编解码建议,它是基于运动补偿的DPCM的混合编码,在运动搜索的基础上进行运动补偿,然后运用DCT变换和"之"字形扫描游程编码,从而得到输出码流。H.263在H.261建议的基础上,将运动矢量的搜索增加为半象素点搜索;同时又增加了无限制运动矢量、基于语法的算术编码、高级预测技术和PB帧编码等四个高级选项;从而达到了进一步降低码速率和提高编码质量的目的。<br/><br/>2 h.263的内容和特点<br/>  H.263 视频编码标准是专为中高质量运动图像压缩所设计的低码率图像压缩标准。与H.261 的p×64K 的传输码率相比,H.263的码率更低,单位码率可以小于 64K,且支持的原始图像格式更多,包括了在视频和电视信号中常见的QCIF,CIF,EDTV,ITU-R 601,ITU-R 709 等等。<br/>  H.263 采用运动视频编码中常见的编码方法,将编码过程分为帧内编码和帧间编码两个部分。埃帧内用改进的DCT 变换并量化,在帧间采用1/2 象素运动矢量预测补偿技术,使运动补偿更加精确,量化后适用改进的变长编码表(VLC)地量化数据进行熵编码,得到最终的编码系数。<br/>  H.263的编码速度快,其设计编码延时不超过150ms;码率低,在512 K 乃至 384K 带宽下仍可得到相当满意的图像效果,十分适用于需要双向编解码并传输的场合(如:可视电话)和网络条件不是很好的场合(如:远程监控)<br/>如下是H263的编解码图:<br/><br/><A HREF='/Files/UpFiles/dev2/vc/0010208000_2003925_105610_43172.gif' TARGET='_blank'><IMG SRC='/Files/UpFiles/dev2/vc/0010208000_2003925_105610_43172.gif' border='0' alt='新窗口浏览' onload="javascript:if(this.width>screen.width-333)this.width=screen.width-333"></A><br/><br/>为了达到这些目标,H.263采用如下方法:<br/>  1)信源编码器基于通用中间格式(CIF),使其可以同时应用于625线和525线两种电视标准。视频编码器对图象的取样次数为视频信号场线的整数倍,取样时钟和数字网之间的关系是异步关系,提供可以和其它各种设备信号相结合的独立的数字比特流。<br/>  2)采用可减少时间冗余的帧间预测和可减少空间冗余的残留信号编码方法。解码器具有运动补偿的能力,并允许可选择地在编码器中增加这种技术。H263运动补偿采用的是半象素精度,而不是H.261建议中的全象素精度和循环滤波器。而对待传送的符号采用了游程编码。<br/>  3)允许采用无限制运动矢量模式,在该模式中,运动矢量被允许指到图片的外部,可使用更大的运动矢量。允许采用基于句法的算术编码模式代替游程编码,可将最终的比特数显著降低。允许采用高级预测模式,对P帧的亮度部分采用了块重叠运动补偿。对图片中的某些宏块采用4个8x8矢量来代替原来的1个16x16矢量。编码器必须决定使用哪一种矢量。允许采用PB帧模式,一个PB帧包含一个由前面的解得的P帧图象预测得出的P帧和一个由前一个P帧和当前解码的P帧共同预测得出的B帧。使用这种模式可以在比特率增加幅度很小的情况下大幅度增加帧频。<br/>  4)信源编码器的主要原理是预测,块变换和量化。信源格式信源编码器对每秒发生30000/1001(大约29.97)次的图象进行操作。对图象频率的允许误差为±50 ppm。采用五种图象格式,图象被编码为一个亮度信号和两个色差成分(Y,CB和CR)。五种标准图象格式为: sub-QCIF, QCIF, CIF, 4CIF和16CIF。对每种图象格式而言,在正交排列时,亮度的取样结构都是dx个象素每行,dy行每幅图象。两个色差成分的取样都是dx/2个象素每行,dy/2行每幅图象。dx, dy, dx/2和dy/2的值在下表给出。<br/><br/>H.263各种图象格式的象素个数<br/>图象格式 亮度取样的象素个数(dx) 亮度取样的行数 (dy) 色度取样的象素个数(dx/2) 色度取样的行数(dy/2)<br/>sub-QCIF 128 96 64 48<br/>QCIF 176 144 88 72<br/>CIF 352 288 176 144<br/>4CIF 704 576 352 288<br/>16CIF 1408 1152 704 576<br/><br/>  对每种图象格式,色差取样被定位在和亮度块边界一致的块上。取样象素的纵横比和图象格式的纵横比一致,也和H.261建议中定义的QCIF和CIF一致:(4/3)*(288/352)。除了sub-QCIF格式的 纵横比为4:3。<br/>  译码器使用sub-QCIF以及QCIF格式等。编码器可对sub-QCIF和QCIF中的一种进行操作。译码器可支持达的格式将由外部手段来通知,例如H.245建议。如果希望得到所有可能的图象格式和视频编码算法也可求助于终端描述,例如H.324协议。这里的发送时钟是由外部提供的。视频信号的比特率是可变的。<br/>3 H263的主要技术<br/>  H.263采用句法和语义学的方法对多路视频来管理的。句法被划分为四层,四个层分别是图象、块组、宏块、块。图象层每帧图象的数据包含一个图象头,并紧跟着块组数据,最后是一个end-of-sequence码和填塞位。其中包括有图象开始码(PSC) (22 bits)、时域参照(TR)(8 bits)、类型信息 (PTYPE) (13 bits) 和量化器信息 (PQUANT) (5 bits)等十三个选项。<br/>  每个块组层(GOB)包含了一个块组层头,紧跟着宏块数据。每个GOB包含了一行或多行宏块。对于每帧图象的第一个GOB(0号),不需要传送GOB头。而对于其它的GOB,GOB头可以为空,这决定于编码策略。译码器可以通过外部手段发送信号给远程变码器要求只传送非空GOB头,例如建议H.245。<br/>  每个宏块中包含了一个宏块头和后续的块数据。COD只出现在用PTYPE指定为"INTER"的图象帧中,对于这些图象中的宏块,当COD指定或PTYPE指示为"INTRA"时会出现宏块类型 & 色度的编码块样式(MCPBC)。如果PTYPE指示了"PB帧",对于B块的宏块 (MODB)会出现。只有在MODB中指定时才会出现CBPB(指示将传送宏块的B系数)和B宏块的运动矢量数据 (MVDB) (变长)。当MCPBC和CBPY中指定时会出现"块数据"。<br/>  块层如果不在PB帧模式,一个宏块包含四个亮度块和两个色差块。在PB帧模式下,一个宏块包含12个块。在缺省H.263模式下,首先传送6个P块数据,然后是6个B块数据。<br/><br/>作者会员名:lsf   (陆绍飞)
本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://www.rosoo.net/a/200309/1044.html]
本文出处: 作者:陆绍飞
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
将本文分享到微信
织梦二维码生成器
推荐内容