首页 购物车 询价
www.GB-GBT.com 收录标准: 222397 (2026-05-14)

GB/T 33475.3-2018 相关标准英文版PDF

搜索结果: GB/T 33475.3-2018, GB/T33475.3-2018, GBT 33475.3-2018, GBT33475.3-2018
标准号码内文价格美元第2步(购买)交付天数标准名称详情状态
GB/T 33475.3-2018 英文版 7689 GB/T 33475.3-2018 [PDF]天数 <=21 信息技术 高效多媒体编码 第3部分:音频 GB/T 33475.3-2018 有效
基本信息
标准编号 GB/T 33475.3-2018 (GB/T33475.3-2018)
中文名称 信息技术 高效多媒体编码 第3部分:音频
英文名称 Information technology -- High efficiency media coding -- Part 3: Audio
行业 国家标准 (推荐)
中标分类 L71
国际标准分类 35.040
字数估计 508,526
发布日期 2018-06-07
实施日期 2019-01-01
标准依据 国家标准公告2018年第9号
发布机构 国家市场监督管理总局、中国国家标准化管理委员会

GB/T 33475.3-2018 Information technology--High efficiency media coding--Part 3: Audio ICS 35.040 L71 中华人民共和国国家标准 信息技术 高效多媒体编码 第3部分:音频 2018-06-07发布 2019-01-01实施 国 家 市 场 监 督 管 理 总 局 中国国家标准化管理委员会 发 布 目次 前言 Ⅲ 引言 Ⅳ 1 范围 1 2 规范性引用文件 1 3 术语和定义 1 4 符号和缩略语 3 5 位流语法规则 6 6 音频编码框架 8 7 通用音频编码 10 8 无损音频编码 84 9 对象元数据编码 112 10 AVS2-P3在传输流中的复用规范建议 119 附录A(规范性附录) AASF和AATF语法及语义 120 附录B(规范性附录) 通用音频编码表 131 附录C(规范性附录) AVS2-P3音频基本流在GB/T 17975.1-2010或 MPEG-2TS传输流中的 复用定义 500 前言 GB/T 33475《信息技术 高效多媒体编码》分为三个部分: ---第1部分:系统; ---第2部分:视频; ---第3部分:音频。 本部分为GB/T 33475的第3部分。 本部分按照GB/T 1.1-2009给出的规则起草。 本部分由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本部分起草单位:清华大学、南京青衿信息科技有限公司、中关村视听产业技术创新联盟、中科开元 信息技术(北京)有限公司、新加坡国家科研局资讯通信研究所、北京大学、武汉大学、北京天籁传音数字 技术有限公司、北京理工大学、天津大学。 本部分主要起草人:窦维蓓、潘兴德、李靓、舒海燕、卢敏、吴超刚、杨新辉、刘任化、黄海滨、俞容山、 黄益超、曲天书、王晓晨、姜林、王晶、张涛、高文、黄铁军。 引 言 GB/T 33475的本部分是高质量音频信号的编解码技术标准,是为了适应数字存储媒体、互联网宽 带音视频业务、数字音视频广播、无线宽带多媒体通信、数字电影、虚拟/增强现实和视频监控等应用中 对音频压缩技术的需要而制定的。 本部分描述了高质量音频信号的通用音频编码、无损编码和三维声音对象编码的表示方法,及通用 音频解码、无损解码和三维声音对象解码的方法。通用音频编码支持最多128声道、支持采样率 8kHz~192kHz,并支持8比特、16比特和24比特采样精度。支持编码输出比特流为每声道 16kbit/s~192kbit/s,单声道:16kbit/s、32kbit/s、44kbit/s、56kbit/s、64kbit/s、72kbit/s、 80kbit/s、96kbit/s、128kbit/s、144kbit/s、164kbit/s、192kbit/s;双声道立体声:24kbit/s、32kbit/s、 48kbit/s、64kbit/s、80kbit/s、96kbit/s、128kbit/s、144kbit/s、192kbit/s、256kbit/s、320kbit/s;5.1 环绕立体声:192kbit/s、256kbit/s、320kbit/s、384kbit/s、448kbit/s、512kbit/s、640kbit/s、 720kbit/s;以及7.1和10.1等多声道环绕立体声。无损音频编码支持最多128声道、任意采样频率,并 支持8比特、16比特和24比特采样精度。三维声音对象编码支持最多128个声音对象。 本文件的发布机构提请注意,声明符合本部分时,可能涉及到7.3、7.4.2、7.5、7.6、7.7、7.8、7.9、8.4、 8.7、9.3、9.4相关的专利的使用。 本文件的发布机构提请注意,声明符合本文件时,可能涉及到20项与通用音频编解码技术相关的 专利的使用。 PCT/CN2014/095012,一种用于音频信号的矢量量化编解码方法及装置;PCT/CN2014/095394, 多声道声音信号编码方法、解码方法及装置;PCT/CN2014/095396,多声道声音信号编码方法、解码方 法及装置;PCT/CN2014/095393,主成分分析PCA映射模型的编解码方法及装置;200610087094.6,频 带扩展编码方法及装置和解码方法及装置;201210085183.2,一种声音编解码装置及其方法; 201210085213.X,一种声音编解码装置及其方法;201210085257.2,一种声音编解码装置及其方法; 201310109081.4,一种声音解码装置及其方法;201310128173.7,一种声音编解码装置及其方法; 201310728959.2,一种用于音频信号的矢量量化编解码方法及装置;201410395806.5,多声道声音信号 编码方法、解码方法及装置;201410404895.5,多声道声音信号编码方法、解码方法及装置; 201410710991.2,主成分分析PCA映射模型的编解码方法及装置;201510226119.5,一种针对被舍弃的 子空间分量的补偿编解码装置及方法;200710175993.6,编码集成系统和方法与解码集成系统和方法; 200710135833.9,立体声音频编/解码方法及编/解码器;200710304486.8,音频信号的编码方法和装置 与解码方法和装置;200810106460.7,立体声信号编解码方法、装置及编解码系统;201410573759.9,一 种立体声编解码方法。 本文件的发布机构提请注意,声明符合本文件时,可能涉及到3项与无损音频音频编解码技术相关 的专利的使用。 ZL201010281033.X,一种基于整形小波变换的音频无损压缩编码、解码方法;201110263485.X,后 向块自适应Golomb-Rice编解码方法及装置;201410721299.X,多声道无损音频混合编解码方法及 装置。 本文件的发布机构提请注意,声明符合本文件时,可能涉及到4项与对象元数据编解码技术相关的 专利的使用。 201610157032.1,一种全景声处理方法;201610157663.3,一种声场空间的坐标定义方法; 201610158782.0,一种声音对象的编码方法;201610159117.3,一种全景声编码方法。 本文件的发布机构对于该专利的真实性、有效性和范围无任何立场。 该专利持有人已向本文件的发布机构保证,他愿意同任何申请人在合理且无歧视的条款和条件下, 就专利授权许可进行谈判。该专利持有人的声明已在本部分的发布机构备案。相关信息可以通过以下 联系方式获得: 联 系 人:黄铁军(数字音视频编解码技术标准工作组秘书长) 通讯地址:北京大学理科2号楼2641室 邮政编码:100871 电子邮件:tjhuang@pku.edu.cn 电 话:+10-62756172 传 真:+10-62751638 网 址:http://www.avs.org.cn 请注意除上述专利外,本部分的某些内容仍可能涉及专利。本部分的发布机构不承担识别这些专 利的责任。 信息技术 高效多媒体编码 第3部分:音频 1 范围 GB/T 33475的本部分描述了高质量音频信号的通用音频编码、无损音频编码和三维音频对象编 码的表示方法及通用音频解码、无损音频解码和三维音频对象解码的方法。 本部分适用于下述领域: ---数字存储媒体; ---互联网宽带音视频业务; ---数字音视频广播; ---无线宽带多媒体通信; ---数字电影; ---虚拟现实和增强现实; ---视频监控。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 4880.2-2000 语种名称代码 第2部分:3字母代码 GB/T 5271.1 信息技术 词汇 第1部分:基本术语 GB/T 5271.4 信息技术 词汇 第4部分:数据的组织 GB/T 5271.9 信息技术 词汇 第9部分:数据通信 GB/T 17975.1-2010 信息技术 运动图像及其伴音信息的通用编码 第1部分:系统 3 术语和定义 GB/T 5271.1、GB/T 5271.4和GB/T 5271.9界定的以及下列术语和定义适用于本文件。 3.1 保留 reserved 在定义编码位流中的暂时未被使用的字段,可能在将来的标准扩展中被用到。 3.2 比特率 bitrate 编码位流传输到解码器输入端的速率。 3.3 位流 bitstream 用作数据编码表示的有一定次序的一组比特。 3.4 编码 coding 读入音频采样流,并产生一个符合本部分的有效位流。 3.5 编码器 coder 编码处理的实体。 3.6 编码表示 codedrepresentation 以其编码形式表示的数据单元。 3.7 编码音频位流 codedaudiobitstream 音频信号的编码表示。 3.8 边信息 sideinformation 位流中控制解码的必要信息。 3.9 采样频率 samplingfrequency;fs 每秒从连续信号中提取离散信号的采样个数,可简称采样率。 注:单位为赫兹(Hz)。 3.10 辅助数据 ancilarydata 位流中用于协助声道编码的数据。 3.11 解码 decoding 在本部分中定义的一种数据处理,即读入编码位流并输出音频采样值的过程。 3.12 解码器 decoder 解码处理的实体。 3.13 谱系数 spectralcoefficient 分析滤波器组中输出的离散频谱域数据。 3.14 熵编码 entropycoding 信号数字表示中的一种变长无损编码,用以减少统计特性上的冗余。 3.15 声道 channel 声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。 3.16 数据单元 dataelement 编码前的和编码后的数据项的表示。 3.17 填充(位) stuffing(bits) 填充(字节) stuffing(byte) 可以插入到编码位流的特别位置中,而在解码过程中被去除的码字。另外,编码的附加数据也能使 用填充位或字节。 3.18 信号类型 signaltype 一种对编码音频信号进行分类的机制,用于选择不同的滤波方式和编码方式。 3.19 音频缓存器 audiobuffer 解码器中用于存储编码音频数据的缓存器。 3.20 字节 byte 8个比特的序列。 3.21 字节对齐 bytealignment 在编码位流中,使比特数为8的倍数的处理过程。 3.22 噪性编码 noiselevelcoding 信号统计特性类似噪声的程度参数编码。 3.23 加弦 addingindividualline 在特定频带内增加一个正弦成分。 3.24 线性预测编码 linearpredictcoding 对输入音频信号进行处理的一种算法,用于减少信号的冗余,提高编码效率。 3.25 提升小波 liftingwavelet 用提升策略来实现的小波变换。 3.26 去除声道间相关性以提高编码效率。 3.27 声道编码 channelcoding 基础声道的编码,即除声音对象外基础声音信号的编码。 3.28 声音对象 soundobject 被感知为一个整体的声音或由一个声源发出的独立于环境的声音。 3.29 声音对象编码 soundobjectcoding 读入声音对象音频采样流及其边信息,并产生一个包括对象元数据和音频内容的编码位流。 4 符号和缩略语 本部分中使用的数学运算符和优先级与C语言使用的类似。但对整型除法和算术移位操作进行 了特定的定义。除特别说明外,约定编号和计数从0开始。 4.1 算术运算符 下列算术运算符适用于本文件。 + 加 - 减(二元运算符)或取反(一元前缀运算符) × 乘 ab 幂,表示a的b次幂,也可表示上标。 ^ 幂 % 取模算符,仅对正整数定义。 /整数除法,结果向0取整。例如,7/4和-7/-4取整为1,-7/4和7/-4取整为-1。 除法运算,不做取整或四舍五入。 || 绝对值 |x|=x 当x >0 |x|=0 当x=0 |x|=-x 当x< 0 abs 绝对值 sign() 取符号 sign(x)=1 当x >0 sign(x)=0 当x=0 sign(x)=-1 当x< 0 x 平方根 i=a f(i)自变量i取由a到b(含b)的所有整数值时,函数f(i)的累 加和。 log10 以10为底的对数 log2 以2为底的对数 向下取整 exp 以自然常数e为底的指数函数 residual 残差,指实际观察值与估计值(拟合值)之间的差 4.2 逻辑运算符 下列逻辑运算符适合于本文件。 || 逻辑或 && 逻辑与 逻辑非 4.3 关系运算符 下列关系运算符适用于本文件。 > 大于 ≥ 大于或等于 < 小于 ≤ 小于或等于 = 等于 ≠ 不等于 max[,,] 参数表中的最大值 min[,,] 参数表中的最小值 4.4 位运算符 下列位运算符适用于本文件。 & 与 | 或 ~ 取反 a > >b 将a以2的补码整数表示的形式向右移b位。仅当b取正数时定义此运算。向右 移至最高有效位时,其值与a 移位运算前的最高有效位相等。 a < < b 将a以2的补码整数表示的形式向左移b位。仅当b取正数时定义此运算。向左 移至最低有效位时,其值等于0。 4.5 赋值 下列赋值运算适用于本文件。 == 赋值运算符 x =a.b x取从a至b(含b)的值,其中x、a和b是整数。 ++ 自加,x++相当于x=x+1。当用于数组下标时,在自加运算前先求变量值。 -- 自减,x--相当于x=x-1。当用于数组下标时,在自减运算前先求变量值。 += 自加指定值,例如,x+=3相当于x=x+3,x+=(-3)相当于x=x+(-3)。 -= 自减指定值,例如,x-=3相当于x=x+(-3),x-=(-3)相当于x=x-(-3)。 4.6 助记符 下列助记符适用于本文件。 rpchof 多项式余数,高阶在先。 bslbf 位串,左位在前,这里“左”是按GB/T 17191中写的位串的顺序。位串是带单引号的 1和0串。如‘10000001’。位串内的空格是便于阅读的,无特殊意义。(bitstreamleft bsmbf 位串是带引号的1和0串,右位在前,如先编码一个5比特的数值6,然后编码一个3比 特的数值2,那么编码位串为‘01000110’。 4.7 缩略语 下列缩略语适用于本文件。 BWE: 高频带宽扩展 (BandwidthExtension) 位流中的每一个数据项用黑体。通过名字、按位的长度及其类型和传输顺序的助记符来描述。 位流中被解码的数据元素所导致的操作依赖于该数据的值及以前解码的数据元素。下面的语法结 构表示数据元素以标准类型出现时的情形。 注1:如无特殊说明,本部分中的“位”指二进制位。 注2:本部分语法用“C”代码规定,变量或表达式为非零值时等价于条件为真,变量或表达式为零值时等价于条件为 非真。 while(condition){ 若条件为真,则数据元素组紧接着数据流产生,如此重复直到条件为非真。 do{ data_element }while(condition) 若条件为真,则数据元素组紧接着数据流产生,如此重复直到条件为非真。 if(condition){ data_element }else{ data_element 若条件为真,在数据流中产生第一组数据元素,若条件为非真,在数据流中产生第二组数据元素。 for(expr1;expr2;expr3){ data_element expr1是指定循环初始状态表达式,通常它指定了计数器的初始状态,expr2是指定的每次循环前 的测试条件。条件为非真时循环终止,expr3是每次循环结束时执行的表达式,一般是增加计数器。 注3:本结构的最通常用法为 for(i=0;i< n;i++){ data_element 数据元素组产生n次。数据元素组内的条件结构可能依赖循环控制变量i的值。第一次出现时被 置为‘0’,第二次增加到‘1’,如此往复。 switch(expr){ 根据表达式expr的值,产生对应的数据元素。expr的值为 caseconstcase1: constcase1时产生数据元素data_element1,expr的值为 data_element1 constcase2时产生数据元素data_element2,以此类推,expr的值 break 为constcasen时产生数据元素data_elementn。当expr的值不等于 caseconstcase2: constcase1,constcase2,,constcasen中的任何一个值时,产生 data_element2 数据元素data_elementdefault break data_elementn break default: break 本结构的一类变体是在case后不出现break,如 switch(expr){ expr的值constcasex时,从对应的caseconstcasex开始产生数 caseconstcase1: 据元素,直到break出现。 data_element1 expr的值constcase1时产生数据元素data_element1和 data_element2 data_elementn break data_elementn break default: break 注4:数据元素组中可能含有嵌套结构。为简便起见,当后面只有一个数据元素时“[]”省略。 data_element[] data_element是一数组数据,数据元素的个数由上下文而定; data_element[n] data_element[n]是数组数据的第n+1个元素; data_element[m][n] data_element[m][n]是二维数组的第m+1,n+1个元素; data_element[l][m][n] data_element[l][m][n]是三维数组的第l+1,m+1,n+1个元素; data_element[mn] data_element[mn]是位m 到位n之间包括的位。 虽然语法用过程项表示,但不能认为条款实现了可靠的解码过程。它只是定义了一个无错误的位 流输入。 byte_alignment函数的定义: 如当前位置在字节的边界,则byte_alignment()函数返回‘1’,即位流中的下一位是一个字节的起 始位,否则返回‘0’。 nextbits函数的定义: 函数nextbits()将位串与位流中将要解码的下一比特进行比较。 feof函数的定义: 函数feof()判断流或文件是否结束,feof()函数返回‘1’表示流或文件结束,否则返回‘0’。 位流语法表第二栏注明了每个数据元素的比特数。“XY”表示比特数的大小介于X和Y之间, 包括X和Y。“{X;Y}”表示比特数的大小为X或Y,取决于位流中其他数据元素的值。 6 音频编码框架 6.1 概述 视频、虚拟现实、网络和移动音频等应用环境提出了对三维音频数据的高效、高质量压缩编码需求。由 于3D视听系统的数据量远大于传统视听系统,增加了存储空间和传输带宽(或数据流量......

英文网页English: GB/T 33475.3-2018

相关标准: GB/T 38663 | GB/T 33475.5 | GB/T 33475.6 | GB/T 33475.4 |