| 标准编号 | GB/T 20090.2-2013 (GB/T20090.2-2013) | | 中文名称 | 信息技术 先进音视频编码 第2部分:视频 | | 英文名称 | Information technology -- Advanced coding of audio and video -- Part 2: Video | | 行业 | 国家标准 (推荐) | | 中标分类 | L71 | | 国际标准分类 | 35.040 | | 字数估计 | 175,187 | | 旧标准 (被替代) | GB/T 20090.2-2006 | | 标准依据 | 国家标准公告2013年第27号 | | 发布机构 | 中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会 | | 范围 | GB/T 20090规定了数字音视频的压缩、解压缩、处理和表示的技术方案。GB/T 20090的本部分规定了多种比特率、分辨率和质量的视频压缩方法和解码过程。本部分适用于高分辨率和标准分辩率数字电视广播、激光数字存储媒体、互联网宽带交流媒体、多媒体通信等应用。本部分适于数字电视广播、交互式存储媒体、直播卫星视频业务、多媒体邮件、分组网络的多媒体业务、实时通信业务、远程视频监控等应用。 |
GB/T 20090.2-2013
Information technology.Advanced coding of audio and video.Part 2: Video
ICS 35.040
L71
中华人民共和国国家标准
代替GB/T 20090.2-2006
信息技术 先进音视频编码
第2部分:视频
2013-12-31发布
2014-07-15实施
中华人民共和国国家质量监督检验检疫总局
中国国家标准化管理委员会发布
目次
前言 Ⅰ
引言 Ⅲ
1 范围 1
2 术语和定义 1
3 缩略语 8
4 运算符和数学函数 8
5 位流语法、解析过程和解码过程的描述 11
6 编码位流的结构 15
7 位流的语法和语义 22
8 解析过程 65
9 解码过程 87
附录A(规范性附录) 伪起始码 140
附录B(规范性附录) 档次和级别 141
附录C(规范性附录) 位流虚拟参考解码器 148
附录D(规范性附录) 基本熵编码码表 153
前言
GB/T 20090《信息技术 先进音视频编码》分为以下13个部分:
---第1部分:系统;
---第2部分:视频;
---第3部分:音频;
---第4部分:符合性测试;
---第5部分:参考软件;
---第6部分:面向数字版权管理的可信解码器与访问协议;
---第7部分:面向交互应用的视频编解码;
---第8部分:在IP网络上传输AVS;
---第9部分:AVS文件格式;
---第10部分:移动语音和音频;
---第11部分:同步文本;
---第12部分:综合场景;
---第13部分:可重构视频编码工具集。
本部分为GB/T 20090的第2部分。
本部分按照GB/T 1.1-2009给出的规则起草。
本部分代替GB/T 20090.2-2006《信息技术 先进音视频编码 第2部分:视频》。
本部分与GB/T 20090.2-2006相比,除编辑性修改外主要技术变化如下:
---术语和定义中增加了参考背景前向帧间解码图像、二元符号、二元符号串、核心图像、条带集和
帧内解码背景图像等术语的定义,删除了非参考图像术语,同时为了标准术语的统一,将“比
特”统一为“位”,故本部分术语和定义中的填充位为GB/T 20090.2-2006中的填充比特、位
串为GB/T 20090.2-2006中的比特串、位流为GB/T 20090.2-2006中的比特流、位流缓冲
区为GB/T 20090.2-2006中的比特流缓冲区,位流顺序为GB/T 20090.2-2006中的比特流
顺序(见第2章);
---增加了帧内解码背景图像(G帧)、背景参考前向帧间解码图像(S帧)的定义(见6.2.3);
---增加了条带集的定义(见6.3);
---增加了4×4块的定义(见6.6);
---对视频序列的语法和语义做了修改(见7.1和7.2);
---解析过程增加了ce4(v)和ae(v)的解析过程(分别见8.3.2和8.4);
---图像头解码过程增加了确定加权量化矩阵的步骤(见9.2);
---宏块类型增加了G帧、S帧宏块类型的定义(见9.4.2);
---宏块解码过程增加了4×4帧内预测模式的解码过程(见9.4.4.3);
---宏块解码过程增加了加权量化矩阵的解码过程(见9.4.9);
---基本熵编码的解码过程增加了4×4块解码过程(见9.5.1.3);
---增加了高级熵编码的解码过程(见9.5.2);
---逆扫描增加了4×4块逆扫描的过程(见9.5.3);
---增加了量化系数预测过程的定义(见9.6);
---增加了4×4块反变换的过程(见9.8.3);
---增加了4×4块参考样本的获得(见9.9.5)及4×4亮度块帧内预测过程(见9.9.6);
---增加了亮度1/8样本插值过程(见9.10.2.2);
---增加了用于4×4块的基本熵编码码表(见附录D);
---增加了档次和级别的定义(见附录B)。
本部分由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。
本部分起草单位:中国科学院计算技术研究所、清华大学、浙江大学、华中科技大学、北京工业大学、
中山大学、华为技术有限公司、上海广电(集团)有限公司中央研究院、北京长信嘉信息技术有限公司、武
汉大学、北京大学、香港科技大学、法国电信北京代表处、中兴通讯股份有限公司、深圳市海思半导体有
限公司、联合信源数字音视频技术(北京)有限公司。
本部分主要起草人:高文、黄铁军、吴枫、何芸、虞露、梁凡、赵海武、马思伟、吕岩、李国平、张志明、
沈燕飞、周敏华、贾云卫、郭红星、楼剑、熊联欢、郑萧桢、张莉、郑建铧、孙莉、毛煦楠。
引 言
0.1 目标
GB/T 20090.2是为了适应数字电视广播、数字存储媒体、网络流媒体、多媒体通信等应用中对运动
图像压缩技术的需要而制定的。
0.2 应用
本部分适用的范围包括但不限于下述领域:
---有线电视(CATV,CableTV);
---交互存储媒体;
---宽带视频业务;
---多媒体邮件;
---实时通信业务(视频会议、可视电话等);
---远程视频监控。
0.3 档次和级别
本部分能支持多种比特率、分辨率和质量的视频压缩。考虑到应用本部分时的互操作性,定义档次
和级别:
---档次是本部分规定的语法、语义及算法的子集;
---级别是在某一档次下对语法元素和语法元素参数值的限定集合。
0.4 技术概述
本部分采用了一系列技术来达到高效率的视频编码,包括帧内预测、帧间预测、变换、量化和熵编码
等。帧间预测使用基于块的运动矢量来消除图像间的冗余;帧内预测使用空间预测模式来消除图像内
的冗余。再通过对预测残差进行变换和量化消除图像内的视觉冗余。最后,运动矢量、预测模式、量化
参数和变换系数用熵编码进行压缩。
0.4.1 预测技术
帧内预测不需要参考其他图像,采用帧内预测编码的图像可作为编码后序列的随机访问点。
帧间预测需要参考先前已解码的图像,解码的顺序可与编码器中源图像捕获处理的顺序或从解码
器输出用于显示的顺序不同。帧间预测中运动矢量的精度能达到1/4或1/8像素,运动矢量采用预测
编码。
0.4.2 图像分块
本部分中视频解码过程的基本处理单元是宏块。一个宏块包括一个16×16的亮度样值块和对应
的色度样值块。宏块可进一步划分到最小8×8或4×4的样本块来进行预测。
0.4.3 变换和量化
变换的单元是8×8或4×4的样本块。变换系数进行标量量化。
0.5 如何阅读本部分
建议读者从第1章(范围)开始,然后转到第2章(术语和定义)。第5章描述了位流语法、解析过程
和解码过程。第6章定义了编码位流结构。第7章(语法和语义)定义了位流的语法和语义:7.1是语法
描述,定义了位流中语法元素出现顺序;7.2是语义描述,也即语法元素的范围、限制和条件。第8章定
义了语法元素的解析过程。最后,第9章(解码过程)定义了语法元素如何映射到解码样值。在阅读本
部分的过程中,读者还需阅读第2章(术语和定义)、第3章(缩略语)、第4章(运算符和数学函数)及
附录。
0.6 相关专利情况说明
本部分的发布机构提请注意,声明符合本部分时,可能涉及到8.2、9.2、9.3、9.4.2、9.4.5、9.4.6.2、
9.4.9、9.5.1、9.5.2、9.7、9.8、9.10.2、9.10.2.2、9.12和附录A相关的专利的使用。
本部分的发布机构对于该专利的真实性、有效性和范围无任何立场。
该专利持有人已向本部分的发布机构保证,他愿意同任何申请人在合理且无歧视的条款和条件下,
就专利授权许可进行谈判。该专利持有人的声明已在本部分的发布机构备案。
在本部分起草过程中,起草组织者数字音视频编解码技术标准工作组根据会员签署同意的工作组
章程和有关知识产权规定以及会员在提案、审阅等期间提出的专利披露与许可声明等对标准可能涉及
的专利进行了识别。已经确知下表列出的专利权人持有本部分的专利:
专利持有人 地 址
中国科学院计算技术研究所 北京市海淀区中关村科学院南路6号(100080)
浙江大学 浙江省杭州市浙江大学信息与通信工程研究所(310027)
华中科技大学 湖北省武汉市洪山区珞瑜路1037号电子与信息工程系(430074)
清华大学 北京市海淀区清华大学电子工程系(100084)
北京工业大学 北京市朝阳区平乐园100号计算机学院(100022)
华为技术有限公司 广东省深圳市龙岗区坂田华为基地多媒体业务部(518057)
上海广电(集团)有限公司 上海市斜土路1646号上广电中央研究院(200233)
上述专利权人同意对所持有的本部分的必要专利在合理和非歧视的条款和条件基础上,通过AVS
专利池进行许可。由数字音视频编解码技术标准工作组推动成立的AVS专利池管理委员会是决定专
利池具体许可条款的独立机构。对于专利池中的所有专利,标准实施者可通过专利池管理委员会认可
的授权机构获得许可。有关资料可从数字音视频编解码技术标准工作组秘书处获得,联系方法如下:
联系人:黄铁军 (数字音视频编解码技术标准工作组秘书长)
通讯地址:北京2704信箱31分箱
邮政编码:100080
电子邮件:tjhuang@pku.edu.cn
电 话:+10-58858303,+10-58858300-303
传 真:+10-58858301
请注意除上述专利外,本部分的某些内容仍可能涉及专利。本部分的发布机构不承担识别这些专
利的责任。
信息技术 先进音视频编码
第2部分:视频
1 范围
GB/T 20090规定了数字音视频的压缩、解压缩、处理和表示的技术方案。GB/T 20090的本部分
规定了多种比特率、分辨率和质量的视频压缩方法和解码过程。
本部分适用于高分辨率和标准分辨率数字电视广播、激光数字存储媒体、互联网宽带流媒体、多媒
体通信等应用。本部分适用于数字电视广播、交互式存储媒体、直播卫星视频业务、多媒体邮件、分组网
络的多媒体业务、实时通信业务、......
|