标准搜索结果: 'GB/T 25724-2017'
标准编号 | GB/T 25724-2017 (GB/T25724-2017) | 中文名称 | 公共安全视频监控数字视音频编解码技术要求 | 英文名称 | Technical specifications for surveillance video and audio coding | 行业 | 国家标准 (推荐) | 中标分类 | A91 | 国际标准分类 | 13.310 | 字数估计 | 314,379 | 发布日期 | 2017-03-09 | 实施日期 | 2017-06-01 | 旧标准 (被替代) | GB/T 25724-2010 | 起草单位 | 公安部第一研究所、北京中星微电子有限公司、北京中盾安全技术开发公司、中星电子股份有限公司、杭州恒生数字设备科技有限公司、公安部安全与警用电子产品质量检测中心、山西中天信科技股份有限公司、千目聚云数码科技(上海)有限公司、北京欣博电子科技有限公司、杭州海康威视数字技术股份有限公司、湖南国科微电子股份有限公司、浙江大华技术股份有限公司、苏州科达科技股份有限公司、浙江宇视科技有限公司、天津天地伟业数码科技有限公司、北京联视神盾安防技术有限公司、北京智芯原动科技有限公司、上海熙菱信息技术有限公司 | 归口单位 | 全国安全防范报警系统标准化技术委员会(SAC/TC 100) | 标准依据 | National Standard Notice No. 5 of 2017 | 提出机构 | 中华人民共和国公安部 | 发布机构 | 中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会 |
GB/T 25724-2017
ICS 13.310
A91
中华人民共和国国家标准
代替GB/T 25724-2010
公共安全视频监控数字视音频
编解码技术要求
2017-03-09发布
2017-06-01实施
中华人民共和国国家质量监督检验检疫总局
中国国家标准化管理委员会发布
目次
前言 Ⅲ
引言 Ⅳ
1 范围 1
2 规范性引用文件 1
3 术语、定义和缩略语 1
3.1 术语和定义 1
3.2 缩略语 9
4 约定 10
4.1 算术运算符 10
4.2 逻辑运算符 11
4.3 关系运算符 11
4.4 位运算符 11
4.5 赋值运算符 12
4.6 数学函数 12
4.7 语法元素、变量和表 12
4.8 逻辑运算符的文字描述 13
4.9 过程 14
5 视频部分 14
5.1 编码比特流和输出数据的格式 14
5.2 语法和语义 19
5.3 解码过程 60
5.4 解析过程 114
6 音频部分 195
6.1 总体描述 195
6.2 编码器功能描述 198
6.3 解码器功能描述 244
6.4 比特分配描述 251
6.5 存储、传输接口格式 253
附录A(规范性附录) 假设参考解码器(HRD) 259
附录B(规范性附录) 字节流的格式 262
附录C(规范性附录) 视频档次与级别 264
附录D(规范性附录) 视频可用性信息(VUI) 267
附录E(规范性附录) 补充增强信息(SEI) 270
附录F(规范性附录) 智能分析数据描述 274
附录G(规范性附录) 音频档次和级别 290
附录H (规范性附录) 异常声音事件类型定义 292
附录I(资料性附录) VAD检测 293
附录J(资料性附录) 噪声消除 297
参考文献 306
前言
本标准按照GB/T 1.1-2009给出的规则起草。
本标准代替GB/T 25724-2010《安全防范监控数字视音频编解码技术要求》,与GB/T 25724-
2010相比主要技术变化如下:
---增加了术语(见3.1.93~3.1.95);
---修改了编码单位结构(见5.1.3,2010年版的5.1.3);
---修改了码流的语法和语义(见5.2.3、5.2.4,2010年版的5.2.3、5.2.4);
---修改了安全参数集的语法和语义(见5.2.3.2.5、5.2.4.4.4,2010年版的5.2.3.2.3、5.2.4.4.3);
---修改了参考图像的选择方法(见5.3.3.4,2010年版的5.3.3.4);
---修改了帧内预测过程的内容(见5.3.4,2010年版的5.3.4);
---修改了帧间预测过程的内容(见5.3.5,2010年版的5.3.5);
---修改了变换量化与重建的内容(见5.3.6,2010年版的5.3.6);
---修改了去块效应滤波过程的内容(见5.3.7,2010年版的5.3.7);
---增加了样点自适应补偿(SAO)(见5.3.8);
---增加了样点滤波补偿(见5.3.9);
---修改了解析过程的内容(见5.4,2010年版的5.4);
---修改了附录F,删除了变长码表,增加了智能分析数据描述(见附录F,2010年版的附录F)。
本标准由中华人民共和国公安部提出。
本标准由全国安全防范报警系统标准化技术委员会(SAC/TC100)归口。
本标准起草单位:公安部第一研究所、北京中星微电子有限公司、北京中盾安全技术开发公司、中星
电子股份有限公司、杭州恒生数字设备科技有限公司、公安部安全与警用电子产品质量检测中心、山西
中天信科技股份有限公司、千目聚云数码科技(上海)有限公司、北京欣博电子科技有限公司、杭州海康
威视数字技术股份有限公司、湖南国科微电子股份有限公司、浙江大华技术股份有限公司、苏州科达科
技股份有限公司、浙江宇视科技有限公司、天津天地伟业数码科技有限公司、北京联视神盾安防技术有
限公司、北京智芯原动科技有限公司、上海熙菱信息技术有限公司。
本标准主要起草人:陈朝武、邓中翰、郅晨、邱嵩、余子龙、张韵东、董骞、昝劲文、欧阳甸、卢京辉、
闫雪、林冬、施巨岭、查敏中、汪人瑞、梁敏学、黄麒麟、廖双龙、周文博、马莉、夏昌盛、曾娟鹃、李伟丽、
卢玉华、胡建华、王磊、孙大瑞、俞海、段争志、刘文尧、吕卓逸、姜黎、卢虹、倪昕、马伟、王秦镜、章勇、
邢培银、王大治、吴参毅。
本标准所代替标准的历次版本发布情况为:
---GB/T 25724-2010。
引 言
在GB/T 25724-2010《安全防范监控数字视音频编解码技术要求》(以下简称SVAC标准)发布
之前,国内、国际没有专门针对安全防范监控应用的视音频编解码标准,所有的视音频编解码标准,都是
针对广播电视和大众娱乐方面的应用,在安全防范领域直接采用具有很大的不适应性。
SVAC标准(2010年版)于2010年12月23日发布,2011年5月1日实施。该标准是具有我国自
主知识产权的、专门应用于安全防范视频监控技术领域的数字视音频编解码技术标准。该标准发布实
施以后,国家标准委、公安部、工信部等部门高度重视标准的推广应用,支持成立了北京安防视音频编解
码技术产业联盟(以下简称SVAC联盟),业内科研院所和广大企业围绕着SVAC产业链积极开展技术
研发和产品应用。
在标准实施过程中发现,SVAC标准在数据安全保护、提升压缩性能和编码效率、对智能化和大数
据的支持等方面还有待补充和完善之处。为此,全国安全防范报警系统标准化技术委员会(代号SAC/
TC100)组织公安部第一研究所和北京中星微电子有限公司等单位对SVAC标准进行了修订,使标准
更具有先进性和可操作性。
近年来,视频监控系统建设应用已经从安全防范行业扩展到公共安全各行业、领域,已经成为新形
势下维护国家安全和社会稳定的重要手段,在打击犯罪、治安防范、社会管理、服务民生等方面发挥着积
极作用。本次修订充分考虑了公共安全视频监控联网与应用建设的需要,标准内容普遍适用于公共安
全各行业、领域,因此标准名称变更为《公共安全视频监控数字视音频编解码技术要求》。
本标准主要技术特点有:
a) 支持高精度视频数据编码,适应宽动态范围,保留更多的图像细节,满足忠实于场景的要求。
视频支持8比特~12比特数据;
b) 支持多样化的帧内及帧间预测、变换量化、二进制算术编码等技术,获得更好的图像质量和更
高的编码效率;
c) 支持感兴趣区域(ROI)变质量编码,在传输网络带宽或数据存储空间有限的情况下,优先保证
ROI图像质量,节省非ROI的开销,提供更符合监控需要的高质量视频编码,提高监控系统整
体性能;
d) 支持可伸缩性视频编码(SVC),对视频数据分层次编码,满足不同传输网络带宽和数据存储环
境的需求;
e) 支持代数码书激励线性预测(ACELP)和变换音频编码(TAC)切换的双核音频编码,既保证对
语音信号具有较好的编码效果,也保证环境(背景)声音的编码效果;
f) 支持声音识别特征参数的编码,避免编码失真对语音识别和声纹识别的影响;
g) 支持绝对时间参考信息、智能分析信息等监控专用信息。监控专用信息通过专门语法与视音
频压缩编码数据一起传输和存储,规定了常用智能分析信息的携带方式,便于快速检索、分类
查询、视音频同步和监控数据的综合应用;
h) 支持数据安全保护,加强了对国密算法的支持,完善了安全参数集,增添了摘要、签名算法的标
识等内容,并对密钥及数字证书相关信息的携带做了规范定义,支持视频数据加密、认证功能。
相关专利情况说明
本文件的发布机构提请注意,声明符合本文件时,可能涉及到与5.2.3.1、5.2.3.2、5.2.4.2、5.2.4.4、
5.2.4.7、6.1.2、6.1.4、6.2.6.1.3、6.2.6.1.4.10、6.5.2.2中有关内容相关的专利的使用。
本文件的发布机构对于该专利的真实性、有效性和范围无任何立场。
该专利持有人已向本文件的发布机构保证,他愿意同任何申请人在合理且无歧视的条款和条件下,
就专利授权许可进行谈判。该专利持有人的声明已在本文件的发布机构备案。相关信息可以通过以下
联系方式获得:
专利持有人名称 联系地址
北京中星微电子有限公司 北京海淀学院路35号世宁大厦(100191)
北京中盾安全技术开发公司 北京海淀区首体南路1号(100048)
中星电子股份有限公司 天津经济技术开发区第四大街80号天大科技园A1座2层(300457)
武汉大学 湖北武汉市武汉大学(430079)
联系人:曾娟鹃
通讯地址:北京海淀区学院路35号世宁大厦16层
邮政编码:100191
电子邮件:zengjuanjuan@vimicro.com
电话:010-68948888-8950
传真:010-68944075
联系人:李伟丽
通讯地址:北京海淀区首体南路1号
邮政编码:100048
电子邮件:lwl@zhongdun.com.cn
电话:010-68773553-6387
传真:010-68773553-6215
请注意除上述专利外,本文件的某些内容仍可能涉及专利。本文件的发布机构不承担识别这些专
利的责任。
公共安全视频监控数字视音频
编解码技术要求
1 范围
本标准规定了公共安全视频监控应用的数字视音频压缩编码的解码过程。
本标准适用于公共安全领域的视音频实时压缩、传输、播放和存储等业务,其他需要视音频编解码
的领域也可参考采用。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
3 术语、定义和缩略语
3.1 术语和定义
下列术语和定义适用于本文件。
3.1.1
NAL单元 NALunit
一个语法结构,包含后续数据的类型指示和所包含的字节数,数据以RBSP形式出现,必要时其中
还包括散布的防伪字节。
3.1.2
NAL单元流 NALunitstream
由NAL单元组成的序列。
3.1.3
保留 reserved
某些语法元素的特定取值。
注:供中国安全防范监控数字视音频编解码技术标准工作组将来使用。符合本标准的比特流不应使用这些值,但
是这些值将来可能在本标准的扩展版本中用到。
3.1.4
闭环基音搜索 closed-looppitchsearch
用于从加权输入信号和长时预测滤波器状态估计基音延迟。也称为自适应码书搜索。
3.1.5
比特流 bitstream
由编码视音频及其相关数据构成的比特序列。比特流既可用来表示 NAL单元流,也可表示字
节流。
3.1.6
变换系数 transformcoefficient
频率域的标量,与解码过程的反变换部分中一个特定的一维或二维频率索引相关联的系数。
3.1.7
一个与特定二维频率索引相关联的整数量值,解码过程中用于计算变换系数的值。
3.1.8
编码过程 encodingprocess
产生符合本标准的比特流的过程,本标准对视频编码过程不做规定。
3.1.9
编码器 encoder
实现编码过程的实体,包括软件及硬件。
3.1.10
编码片 tile
一个矩形区域内部按照光栅扫描顺序排列的整数个树形编码单元。
3.1.11
编码视频序列 codedvideosequence
按照解码顺序排列的IDR图像和紧随其后的零个或多个非IDR图像组成的图像序列。
3.1.12
编码图像 codedpicture
一幅图像的编码表示。
注:符合本标准的一个编码图像为一个编码帧。
3.1.13
编码图像缓存区 codedpicturebuffer
一个先入先出缓存区,其存储方式按解码顺序排列。
3.1.14
编码帧 codedframe
一个帧的编码表示。
3.1.15
残差 residual
样点或数据元素预测值与解码值之间的差值。
3.1.16
参考索引 referenceindex
参考图像的索引。
3.1.17
参考图像 referencepicture
对解码顺序上后续图像的解码过程进行帧间预测的样点图像。
3.1.18
参考帧 referenceframe
一个标记为参考图像的帧,用于解码过程中的帧间预测。
3.1.19
参数 parameter
序列参数集、图像参数集或安全参数集中的一个语法元素。参数也用于量化参数一词中。
3.1.20
层 layer
没有分支等级关系中的一组句法结构。高层包含低层。编码层指编码图像序列层、图像层、编码片
层和编码单元层。对于可伸缩性视频编码图像,不同层的图像具有不同的可伸缩性(如不同的空间分辨
率)。
3.1.21
代数码书 algebraiccodebook
脉冲幅度和位置组成的一个集合。通过码字索引k按照一定的规则得到第k个激励码矢量的脉冲
幅度和位置。
3.1.22
档次 profile
本标准中的一个特定语法子集。
3.1.23
将逆滤波器传输函数A(z)分解为一个偶对称和一个奇对称多项式函数,指示该函数在单位圆上
的根。用于线性预测系数的变换。
3.1.24
二进制位 bin
二进制位串中的1比特。
3.1.25
二进制位串 binstring
一串二进制位。二进制位串为二值化的语法元素值的二进制表示。
3.1.26
二值化 binarization
语法元素所有可能值与一组二进制位串之间的唯一映射。
3.1.27
反变换 inversetransform
将变换系数矩阵转换为空域样点矩阵的过程。
3.1.28
一个字节,其值等于0x03,可能在NAL单元中出现。防伪字节的出现可以保证在NAL单元的后
续字节对齐的字节流中不会含有起始码前缀。
3.1.29
非参考图像 non-referencepicture
不用于对任何其他图像进行帧间编码的图像。
3.1.30
分量 component
图像的三个样点矩阵(一个亮度矩阵,两个色度矩阵)中的一个矩阵或矩阵中的单个样点。
在音频部分,也指矢量中的元素或信号中的某些频率成分。
3.1.31
利用共振峰处的噪声掩蔽特性,在共振峰区域分配比较大的失真,来减少峰谷主观感觉噪声的
滤波。
3.1.32
功率谱 powerspectrum
信号通过傅立叶变换后得到幅度谱的平方。
3.1.33
光栅扫描 rasterscan
矩形二维图像到一维图像的映射过程,一维图像的第一组值来自于二维图像最上边一行的从左到
右扫描,然后依次是第二行、第三行等等。对于图像每行(由上到下)都是从左到右扫描的。
3.1.34
后向预测 backwardprediction
使用显示顺序上在后的解码图像中的样点对当前图像中的样点进行预测。
3.1.35
划分 partitioning
将一个集合分为子集的过程。集合中的每个元素属于且只属于某一个子集。
3.1.36
基本层图像 baselayerpicture
不需要参考其他图像层信息即可以解码的图像。
3.1.37
级别 level
本标准中的一个特定档次中的参数取值的限定集合。一个档次可以包含一个或多个级别。对所有
档次定义了一组相同的级别,不同档次的每个级别大部分特性都是通用的。对于一个独立的实现,在一
定的约束条件下,可以支持多个级别。
3.1.38
一幅帧内解码图像。IDR图像解码之后,解码顺序上所有后续的编码图像都可以不用根据任何在
IDR图像之前解码的图像来进行帧间预测解码。每个编码视频序列的第一幅图像为IDR图像。
3.1.39
一个假设的解码器模型,规定了对于符合本标准的NAL单元流或字节流的可变性的约束。
3.1.40
解码过程 decodingprocess
读入编码的比特流后产生解码图像或者音频数据的过程。
3.1.41
解码器 decoder
实现解码过程的实体,包括软件及硬件。
3.1.42
解码顺序 decodingorder
解码过程中处理语法元素的顺序。
3.1.43
解码图像 decodedpicture
通过解码一幅编码图像得到的图像。符合本标准的一幅解码图像应是一个解码帧。
3.1.44
解码图像缓存区 decodedpicturebuffer
保存解码图像的存储空间,用于附录A中规定的预测参考、输出重排序或输出延时等。
3.1.45
开环基音搜索 open-looppitchsearch
直接从加权输入信号中估计最优基音延迟的过程。开环基音搜索简化了基音分析,并且将闭环基
音搜索限定在开环基音搜索的延迟值附近。
3.1.46
可伸缩性视频编码 scalablevideocoding
编码序列中的图像具有一定的可伸缩性。具有可伸缩性的图像通常包含基本层图像和增强层
图像。
3.1.47
块 block
视频信号空间中的一个M×N(M 列N 行)的样点矩阵,或者一个M×N 的变换系数矩阵。
音频信号空间的一个一维矢量。
3.1.48
亮度 luma
一个样点矩阵或单个样点,用于描述信号的单色表示。亮度所用符号为Y。
3.1.49
解码过程中对变换系数幅值进行反量化时使用的参数。
3.1.50
零输入响应 zeroinputresponse
滤波器当前输入为零时,由过去输入而产生的输出。
3.1.51
美尔 mel
一种非线性的频率刻度,根据主观音高进行划分。
3.1.52
用FFT将时域信号转化到频域,对其对数能量谱依照 Mel刻度分布的三角滤波器组进行卷积,对
各个滤波器的输出构成的向量进行DCT得到的系数,即美尔频率倒谱系数。
3.1.53
音频编码器的采样频率,范围为12800Hz~38400Hz,采用Fs 表示。
3.1.54
逆滤波器 inversefilter
去除信号短时相关性的滤波器。
3.1.55
频率索引 frequencyindex
与解码过程中反变换之前的变换系数相关的一维或二维索引。
3.1.56
起始码前缀 startcodeprefix
字节流中唯一等于0x000001的3个字节的序列,作为每个NAL单元的前缀。解码器可以利用起
始码前缀的位置来确定一个新的NAL单元的开始和前一个NAL单元的结束。NAL单元中通过加入
防伪字节来防止假冒的起始码前缀出现。
3.1.57
......
|