路径: 主页 > GB/T > 第223页 > GB/T 20090.16-2016
| 标准编号 | GB/T 20090.16-2016 (GB/T20090.16-2016) | | 中文名称 | 信息技术 先进音视频编码 第16部分:广播电视视频 | | 英文名称 | Information technology -- Advanced coding of audio and video -- Part 16: Broadcasting video | | 行业 | 国家标准 (推荐) | | 中标分类 | L71 | | 国际标准分类 | 35.040 | | 字数估计 | 140,158 | | 发布日期 | 2016-04-25 | | 实施日期 | 2016-11-01 | | 标准依据 | 国家标准公告2016年第7号 | | 发布机构 | 中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会 |
GB/T 20090.16-2016
Information technology - Advanced coding of audio and video - Part 16: Broadcasting video
ICS 35.040
L71
中华人民共和国国家标准
信息技术 先进音视频编码
第16部分:广播电视视频
2016-04-25发布
2016-11-01实施
中华人民共和国国家质量监督检验检疫总局
中国国家标准化管理委员会发布
目次
前言 Ⅰ
引言 Ⅱ
1 范围 1
2 规范性引用文件 1
3 术语和定义 1
4 缩略语 9
5 约定 10
6 编码位流的结构 17
7 位流的语法和语义 21
8 解析过程 54
9 解码过程 73
附录A(规范性附录) 伪起始码 111
附录B(规范性附录) 档次和级别 112
附录C(规范性附录) 位流虚拟参考解码器 117
附录D(规范性附录) 基本熵编码码表 122
附录E(资料性附录) 高级熵编码解码器参考实现方法 132
前言
GB/T 20090在《信息技术 先进音视频编码》的总标题下,当前包括以下14个部分:
---第1部分:系统;
---第2部分:视频;
---第3部分:音频;
---第4部分:符合性测试;
---第5部分:参考软件;
---第6部分:面向数字版权管理的可信解码器与访问协议;
---第7部分:面向交互应用的视频编解码;
---第8部分:在IP网络上传输AVS;
---第9部分:AVS文件格式;
---第10部分:移动语音和音频;
---第11部分:同步文本;
---第12部分:综合场景;
---第13部分:视频工具集;
---第16部分:广播电视视频。
本部分为GB/T 20090的第16部分。
本部分按照GB/T 1.1-2009给出的规则起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。
本部分由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。
本部分起草单位:北京大学、中央电视台、浙江大学、华为技术有限公司、北京博雅华录视听技术研
究院有限公司、广州柯维新数码科技有限公司、深圳市海思半导体有限公司、上海国茂数字技术有限公
司、清华大学、国家广播电影电视总局广播科学研究院、国家广播电影电视总局广播电视规划院、中国科
学院计算技术研究所、北京大学深圳研究生院、中山大学。
本部分主要起草人:高文、丁文华、黄铁军、虞露、马思伟、郑萧桢、梁凡、何芸、张伟民、赵海武、张莉、
郑建铧、曾志华、王荣刚、郭晓强、邓向冬、潘晓菲、王强、董文辉、林永兵、张贤国、王振宇。
引 言
GB/T 20090的本部分遵循GB/T 20090.2-2013,增加了帧级加权量化、同极性场跳过模式编码、
增强场编码等技术。
本部分的发布机构提请注意如下事实,声明符合本部分时,可能涉及8.2、8.4、9.2、9.3、9.4.2、9.4.5、
9.4.6.2、9.4.6.3、9.4.9、9.4.9、9.5.1、9.5.2、9.6、9.7、9.9.2.2、9.9.2.3、9.11、附录A和附录D相关的专利的
使用。
本文件的发布机构提请注意,声明符合本文件,可能涉及65项与数字音频编解码技术相关的专利
的使用。
201210033977.4,使用非固定参考场前向预测跳过模式的编码解码方法;201110300629.4,选择参
考场及获取时域运动矢量的方法;ZL200680014013.8,一种实现算术编解码的方法及装置;
ZL200780000403.4,在编解码中的实现量化的方法和装置;ZL200710178532.4,图像编/解码方法、装置
和系统;ZL200810102353.7,运动矢量的缩放方法和装置、编解码方法和系统;ZL03148149.3,运用于图
像编码和视频编码的8×8整数变换方法和装置;ZL03115997.4,运用于图象编码和视频编码的整数变
换方法和装置;ZL03156124.1,图像和视频编码中兼容4×4变换的8×8变换方法和装置;ZL03150939.8,
视频编解码中运动矢量的预测方法和装置;ZL03150940.1,视频编解码中帧内预测的方法和装置;
ZL03143431.2,视频图像亚像素插值的方法和装置;ZL03143429.0,一种视频编解码中的运动矢量预测
方法和装置;ZL200310108470.1,视频编解码中变换系数块的扫描方法和装置;ZL200310109484.5,信
息熵保持编码方法与装置;ZL200310109499.1,信息熵保持解码方法与装置;ZL200310108468.4,1/4像
素精度插值的方法和装置;ZL200410017419.4,图像和视频编码中多尺度兼容处理装置及其方法;
ZL03146301.0,一种视频图象编码方法;ZL200410012658.0,一种环路滤波方法和环路滤波器;
ZL200410012857.1,视频编码的整数变换矩阵选择方法及相关的整数变换方法;ZL200410061094.X,一
种复杂度可分级的帧内预测方法;ZL200510104853.0,一种基于上下文的自适应熵编/解码方法;
ZL02125274.2,结合率失真优化的码率控制的方法及其装置;ZL02130833.0,用于视频编码的新型空间
预测方 法 及 其 装 置;ZL03157077.1,一 种 用 于 视 频 编 码 的 编 码 端/解 码 端 双 向 预 测 方 法;
ZL200310116085.1,一种参考图像缓冲区管理方法;ZL200310116087.0,最大宏块类型与编码块模式联
合编/解码的方法;ZL200310116088.5,一种视频图像跳过宏块的编码方法;ZL03148029.2,用于视频编
码的预测图像生成方法;ZL200410006340.1,一种帧内预测模式选取方法;ZL200410029452.9,一种
MPEG-2到AVS视频码流格式转换方法及其装置;ZL200310116089.X,固定参考帧数编码方式下获取
图像参考块的方法;ZL03157189.1,用于视频预测残差系数编码的熵编码方法;ZL03157078.X,一种快
速定位编码图像的方法;ZL03157076.3,一种定位编码图像标识的方法;ZL03149393.9,用于编码处理
的4输入/输出的整数变换/反变化方法;ZL03148033.0,一种用于编码处理的8输入/输出的整数变化/反
变换方法;ZL03148032.2,基于位平面的不等长的量化/反量化方法;ZL03148031.4,多视角视频编解码
预测补偿方法及装置;ZL03148030.6,用于视频编码运动矢量预测方法;ZL200310116090.2,直接编码
模式下确定参考图像块的方法;ZL200310100469.4,一种用剪辑标识码来辅助视频剪辑的方法;
ZL03151460.X,可随机访问数据流的封装方法及其对应的数据恢复方法;ZL200310107985.X,一种可随
机访问数据流的组织方法及其对应的解码方法;ZL03159169.8,一种视频编解码方法;ZL03120952.1,
一种视频图象编码方法,ZL03152502.4;一种基于多级流水线结构的实时1/4插值方法;ZL03156678.2,一
种分样本插值滤波方法;ZL200310101370.6,一种分样本插值滤波方法;ZL200310101445.0,基于流水
线的帧内预测模式块编码加速方法;ZL200410015637.4,图像和视频信号的变换装置及其方法;
200510061395.7,一种用于二进制化解码得到解码数据值的方法和装置;200480016912.2,一种视频宏
块模式解码方法;200680014019.5,一种二进制化方法及装置;201010135828.X,视频数据的打包、编解
码方法及装置及系统;200880001326.9,多参考图像压缩码流实现随机访问的解码方法及解码器;
200710126108.5,实现随机访问的方法及解码器(0989702CN同族);201310746046.3,表示视频图像显
示顺序的方法;201110240524.4,运用于图像编码和视频编码的六角变换方法和装置;201110335481.8,
视频编码合并模式双向补偿方法;201310049872.2,基于颜色空间变换进行编解码误差修正的方法和系
统;201310173139.1,利用YUV与RGB 空间联合修正视频编解码误差的方法;201310048281.3,一种图
像和视频编解码方法和系统;201210312587.0,一种快速防止出现伪起始码的方法及装置;
200410015637.4,图像和视频信号的变换装置及其方法。
本部分的发布机构对于该专利的真实性、有效性和范围无任何立场。
专利持有人已向本部分的发布机构保证,他愿意同任何申请人在合理且无歧视的条款和条件下,就
专利授权许可进行谈判。该专利持有人的声明已在本部分的发布机构备案。
联 系 人:黄铁军(数字音视频编解码技术标准工作组秘书长)
通讯地址:北京大学理科2号楼2641室
邮政编码:100871
电子邮件:tjhuang@pku.edu.cn
电 话:+10-62756172
传 真:+10-62751638
网 址:http://www.avs.org.cn
请注意除上述专利外,本部分的某些内容仍可能涉及专利。本部分的发布机构不承担识别这些专
利的责任。
信息技术 先进音视频编码
第16部分:广播电视视频
1 范围
GB/T 20090的本部分规定了多种比特率、分辨率和质量的视频压缩方法,并且规定了解码过程。
本部分适用于地面电视、有线电视、卫星电视、网络等应用。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 20090.2-2013 信息技术 先进音视频编码 第2部分:视频
3 术语和定义
GB/T 20090.2-2013界定的以及下列术语和定义适用于本文件。为了便于使用,以下重复列出了
GB/T 20090.2-2013中的某些术语和定义。
3.1
保留 reserved
定义了一些特定语法元素值,这些值用于将来对本部分的扩展。
注:这些值不出现在符合本部分的位流中。
[GB/T 20090.2-2013,定义2.1]
3.2
变长编码 variablelengthcoding
一个可逆的熵编码过程,它将短的码字分配给出现频率较高的符号,将长的码字分配给出现频率较
低的符号。
[GB/T 20090.2-2013,定义2.2]
3.3
变换系数 transformcoefficient
变换域上的一个标量。
[GB/T 20090.2-2013,定义2.3]
3.4
编码表示 encodingpresentation
数据编码后的形式。
[GB/T 20090.2-2013,定义2.4]
3.5
编码过程 encodingprocess
产生符合本部分位流的过程。
注:本部分不规定该过程。
[GB/T 20090.2-2013,定义2.5]
3.6
编码器 encoder
编码过程的实现。
[GB/T 20090.2-2013,定义2.6]
3.7
编码图像 codedpicture
一帧图像的编码表示。
[GB/T 20090.2-2013,定义2.7]
3.8
标志 flag
一个二值变量。
[GB/T 20090.2-2013,定义2.8]
3.9
补偿 compensation
求由语法元素解码得到的样本残差与其对应的预测值之和。
[GB/T 20090.2-2013,定义2.9]
3.10
残差 residual
样本或数据元素的重建值与其预测值之差。
[GB/T 20090.2-2013,定义2.10]
3.11
参考索引 referenceindex
解码图像缓冲区中参考图像或其中场的编号。
[GB/T 20090.2-2013,定义2.12]
3.12
参考图像 referencepicture
解码过程中用于后续图像帧间预测的图像。
[GB/T 20090.2-2013,定义2.13]
3.13
层 layer
位流中的分级结构,高层包含低层。编码层由高到低依次为:序列、图像、条带、宏块和块。
[GB/T 20090.2-2013,定义2.14]
3.14
场 field
由构成帧的3个样本矩阵中相间的行构成。
[GB/T 20090.2-2013,定义2.15]
3.15
档次 profile
本部分规定的语法、语义及算法的子集。
[GB/T 20090.2-2013,定义2.16]
3.16
二元符号 binarybin
组成二元符号串的符号,包括“0”和“1”。
[GB/T 20090.2-2013,定义2.17]
3.17
二元符号串 binarybinstring
有限位二元符号组成的有序序列,最左边符号是最高有效位(MSB),最右边符号是最低有效位
(LSB)。
[GB/T 20090.2-2013,定义2.18]
3.18
分量 component
图像的三个样值矩阵(亮度和两个色度)中的一个矩阵或矩阵中的单个样值。
[GB/T 20090.2-2013,定义2.19]
3.19
反变换 inversetransform
将变换系数矩阵转换成空域样值矩阵的过程。
[GB/T 20090.2-2013,定义2.20]
3.20
反量化 dequantization
对量化系数缩放后得到变换系数的过程。
[GB/T 20090.2-2013,定义2.21]
3.21
光栅扫描 rasterscan
将二维矩形光栅映射到一维光栅,一维光栅的入口从二维光栅的第一行开始,然后扫描第二行、第
三行,依次类推。光栅中的行从左到右扫描。
[GB/T 20090.2-2013,定义2.22]
3.22
宏块 macroblock
包括一个16×16的亮度样值块和对应的色度样值块。
[GB/T 20090.2-2013,定义2.24]
3.23
宏块地址 macroblockaddress
从图像左上角的宏块开始,沿光栅扫描的顺序编号,起始号为0。
[GB/T 20090.2-2013,定义2.25]
3.24
宏块行 macroblockline
在编码的图像相同的垂直位置,从左边界到右边界连续的宏块,其高度是16个样本。
[GB/T 20090.2-2013,定义2.26]
3.25
宏块位置 macroblockposition
图像中一个宏块的二维坐标,表示为(x,y)。
示例:如果当前图像的两场的编码数据合并成帧,图像左上角的宏块(x,y)=(0,0),对每个宏块列,从左到右x 依
次加1,对每个宏块行,从上到下y依次加1。如果当前图像的两场的编码数据依次出现,第一场左上角的宏块(x,y)=
(0,0),对第一场的每个宏块列,从左到右x依次加1,对第一场的每个宏块行,从上到下y依次加1;第二场左上角的宏块
(x,y)=(0,(H+31) > >5),H 是图像垂直方向扫描行数,对第二场的每个宏块列,从左到右x 依次加1,对第二场的
每个宏块行,从上到下y依次加1。
[GB/T 20090.2-2013,定义2.27]
3.26
后向预测 backwardprediction
用显示顺序上将来的参考图像对当前图像进行预测。
[GB/T 20090.2-2013,定义2.28]
3.27
划分 partitioning
将一个集合分为子集的过程。集合中的每个元素属于且只属于某一个子集。
[GB/T 20090.2-2013,定义2.29]
3.28
级别 level
在某一档次下对语法元素和语法元素参数值的限定集合。
[GB/T 20090.2-2013,定义2.30]
3.29
交流系数 ACcoefficient
AC系数
二维变换域上索引号不全为0的变换系数。
[GB/T 20090.2-2013,定义2.31]
3.30
解码处理 decodeprocessing
解析过程和解码过程。
[GB/T 20090.2-2013,定义2.32]
3.31
解码过程 decodingprocess
由语法元素产生解码图像的过程。
[GB/T 20090.2-2013,定义2.33]
3.32
解码器 decoder
完成解码处理的实体。
[GB/T 20090.2-2013,定义2.34]
3.33
解码顺序 decodingorder
解码过程根据图像之间的预测关系,对每帧图像解码的顺序。
[GB/T 20090.2-2013,定义2.35]
3.34
解码图像 decodedpicture
解码器根据位流重建的图像。
[GB/T 20090.2-2013,定义2.36]
3.35
解码图像缓冲区 decodedpicturebuffer
保存解码图像并用于预测、输出重排序和输出定时的缓冲区。
[GB/T 20090.2-2013,定义2.37]
3.36
解析过程 parse
由位流获得语法元素的过程。
[GB/T 20090.2-2013,定义2.38]
3.37
禁止 forbidden
定义了一些特定语法元素值,这些值不应出现在符合本部分的位流中。
注:禁止某些值的目的通常是为了避免在位流中出现伪起始码。
[GB/T 20090.2-2013,定义2.39]
3.38
块 block
一个M(列)×N(行)的样值矩阵或者变换系数矩阵。大小为8×8的块又称为子块。
注:改写GB/T 20090.2-2013,定义2.40。
3.39
块扫描 blockscan
量化系数的特定串行排序方式。
[GB/T 20090.2-2013,定义2.41]
3.40
亮度 luma
表示亮度信号的样值矩阵或单个样值。
[GB/T 20090.2-2013,定义2.42]
3.41
在解码过程对量化系数进行反量化的参数。
[GB/T 20090.2-2013,定义2.43]
3.42
反量化前变换系数的值。
[GB/T 20090.2-2013,定义2.44]
3.43
X档次解码器 x-profiledecoder
能够解码符合某档次规定的位流的解码器。
[GB/T 20090.2-2013,定义2.45]
3.44
起始码 startcode
长度为32位的二进制码字,其形式在整个位流中是唯一的。
注:起始码有多种用途,其中之一是用来标识位流语法结构的开始。
[GB/T 20090.2-2013,定义2.46]
3.45
前向预测 forwardprediction
用显示顺序上过去的参考图像对当前图像进行预测。
[GB/T 20090.2-2013,定义2.47]
3.46
P帧
帧间预测中只使用前向预测解码的图像。
[GB/T 200......
|