搜索结果: CYT168-2019
| 标准编号 | CY/T 168-2019 (CY/T168-2019) | | 中文名称 | 新闻出版内容资源加工规范 第11部分:音频加工 | | 英文名称 | Specifications for content resource processing in press and publication - Part 11: Audio processing | | 行业 | 印刷出版行业标准 (推荐) | | 中标分类 | L70 | | 国际标准分类 | | | 字数估计 | 23,273 | | 发布日期 | 2019-05-14 | | 实施日期 | 2019-06-01 | | 标准依据 | 行业标准备案公告2019年第6号(总第234号) | | 发布机构 | 国家新闻出版署 |
CY/T 168-2019
(Processing specifications for press and publication content resources-Part 11: Audio processing)
ICS 35.240.30
L70
CY
中 华 人 民 共 和 国 新 闻 出 版 行 业 标 准
2019 - 05 - 14 发布
2019 - 06 - 01 实施
国 家 新 闻 出 版 署 发 布
新闻出版内容资源加工规范
第 11 部分:音频加工
Specifications for content resource processing in press and publication-
Part 11: Audio processing
目次
前言...II
1 范围...1
2 规范性引用文件...1
3 术语和定义...1
4 加工对象...3
5 加工规格...3
5.1 格式选用原则...3
5.2 长期保存级...3
5.3 发布服务级...3
5.4 流通应用级...4
6 元数据...4
6.1 概述...4
6.2 音频资源基本元数据...4
6.3 子音频元数据...5
6.4 作者元数据...6
6.5 类型元数据...6
6.6 格式元数据...6
6.7 附件元数据...7
6.8 管理元数据...7
7 命名与存储...7
7.1 命名规则...7
7.2 存储...8
8 加工流程...8
8.1 音频资源加工环节...8
8.2 预处理环节...9
8.3 数字化采集...10
8.4 音频后期处理...11
9 元数据标引基本要求...11
10 质量要素与评测要求...12
10.1 内容质量...12
10.2 技术质量...12
附录 A(规范性附录) 音频资源元数据标引 XML Schema样例...14
附录 B(资料性附录) 音频资源元数据标引 XML样例...17
参考文献...20
II
前言
《新闻出版内容资源加工规范》系列标准包括以下12个标准:
──CY/T 101.1-2014 新闻出版内容资源加工规范 第1部分:加工专业术语;
──CY/T 101.2-2014 新闻出版内容资源加工规范 第2部分:数据加工及应用模式;
──CY/T 101.3-2014 新闻出版内容资源加工规范 第3部分:数据加工规格;
──CY/T 101.4-2014 新闻出版内容资源加工规范 第4部分:数据加工质量;
──CY/T 101.5-2014 新闻出版内容资源加工规范 第5部分:资料管理;
──CY/T 101.6-2014 新闻出版内容资源加工规范 第6部分:数据管理;
──CY/T 101.7-2014 新闻出版内容资源加工规范 第7部分:数据交付;
──CY/T 101.8-2014 新闻出版内容资源加工规范 第8部分:图书加工;
──CY/T 101.9-2014 新闻出版内容资源加工规范 第9部分:报纸加工;
──CY/T 101.10-2014 新闻出版内容资源加工规范 第10部分:期刊加工;
──CY/T 169-2019 新闻出版内容资源加工规范 第12部分:视频加工。
本标准按照GB/T 1.1-2009 给出的规则起草。
本标准由全国新闻出版信息标准化技术委员会(SAC/TC 553)提出并归口。
本标准起草单位:中新金桥数字科技(北京)有限公司、中宣部机关服务中心(中宣部信息中心)、
中科汇金数字科技(北京)有限公司、化学工业出版社、人民卫生出版社、人民音乐出版社。
本标准主要起草人:赵海涛、周长岭、刘成勇、熊志远、蒙昕晨、王文倩、石雄、温强、徐德、范
君宜、唐圣平、戚雪、刘勇、张沫、郭建伟、李福建、王泽祥、薛淼、刘京龙、朱鸿麟、蒙海光、骈骅。
新闻出版内容资源加工规范
第 11 部分:音频加工
1 范围
本标准规定了新闻出版行业音频类内容资源加工对象、加工规格、元数据、命名与存储、加工流程、
元数据标引基本要求、质量要素与评测要求等方面的内容。
本标准适用于新闻出版行业音频资源的数字化加工处理和质量检验。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB 18030 信息技术 中文编码字符集
CY/T 50-2008 出版术语
CY/T 101.1-2014 新闻出版内容资源加工规范 第1部分:加工专业术语
3 术语和定义
CY/T 50-2008和CY/T 101.1-2014界定的以及下列术语和定义适用于本文件。
3.1
数字音频 digital audio
用二进制编码数据表示音频信号的比特序列。
注:改写GB/T 22726-2008,定义3.1.1。
3.2
采样频率 Sampling Frequency;Fs
以赫兹定义其速率,每秒从连续信号中提取并组成离散信号的采样个数。
改写 GB/T 17975.7-2002,定义 3.70。
采样频率越高,声音波形表达的越精确,数字化声音失真越小。
3.3
量化精度 quantitative level
度量采样后离散信号幅度时的分级数,通常用“位(bit)”作单位。
16 位(bit)、24 位(bit)。
[GB/T 31219.4-2014,定义 3.2]
3.4
通道数 channels
传播音频信号的声道数。
单声道(mono);多声道(multi channel)。
[GB/T 31219.4-2014,定义 3.3]
3.5
信噪比 Signal to Noise Ratio;SNR
正常声音信号与噪声信号比值的简称。
注:信噪比SNR的计量单位是dB,其计算方法是10Lg(Ps/Pn),其中Ps和Pn分别代表信号和噪声的有效功率;也可以
换算成电压幅值的比率关系:20Lg(Vs/Vn),其中Vs和Vn分别代表信号和噪声电压的“有效值”。
3.6
比特率 bitrate
压缩比特流传输到解码器输入端的速率。
[GB/T 17975.7-2002,定义 3.7]
3.7
声道 channel
用来表示在一收听位置再现音频信号的数据序列。
[GB/T 17975.7-2002,定义 3.14]
3.8
长期保存级 long-term preservation level
以存档为目的,在确保数字音频数据的内容和物理完整性的前提下,保存音频数据的一种存储规格。
3.9
发布服务级 publishing service level
以获取和使用为目的,在服务器上发布供用户快速下载、浏览数字音频的一种存储规格。
注:这种级别的文件码率较低、体积小。
3.10
波形音频文件格式 Waveform Audio file format;WAV
一种符合RIFF文件规范的波形声音文件格式。
注:一般存放未经压缩处理的音频数据,体积较大,不适用于网络传播。
3.11
广播波形音频文件格式 Broadcast Wave Format;BWF
包含关于音频内容的基本元数据信息,并可用于数字音频与无线广播和电视交换的一种特殊WAVE
文件格式。
3.12
无损压缩音频文件格式 A fast and powerful lossless audio compressor;APE
以精炼的记录方式压缩并降低音频文件体积的一种压缩格式,压缩文件还原后与源文件一致。
注:该技术开放源码。
3.13
有损压缩音频文件格式 Moving Picture Experts Group Audio Layer III
不可逆转地删除(人耳听力不敏感的)数据以缩减源音频文件体积的一种压缩格式。
3.14
高级音频编码 Advanced Audio Coding;AAC
一种专为声音数据设计的小巧的文件有损压缩格式,支持最多48个全音域声道的音频编码格式。
3.15
动态范围 dynamic range
音响系统重放时最大不失真输出功率与静态时系统噪声输出功率之比的对数值,单位为分贝(dB)。
注:如一个正常人听阈为0dB SPL,不适阈为120dB SPL,则他的动态范围为120dB。
4 加工对象
新闻出版行业音频类内容资源包括盒式录音磁带(AT)、开盘式录音磁带(Reel-to-reel audio tape )、
数字录音带(DAT)、密纹唱片(LP)、粗纹唱片(SP)、迷你磁光盘(Mini Disc)、激光唱片(CD)
等模拟介质上所保留的原生资源、数字音频原生资源、数字音频文件格式资源。
5 加工规格
5.1 格式选用原则
各类音频资源所采用的文件存储格式应遵循具有普遍认可、成熟应用的原则,或符合国际标准、国
家标准或行业标准。常用的文件存储规格包括长期保存级、发布服务级和流通应用级。
5.2 长期保存级
音频资源长期保存级的加工规格见表 1。
音频资源长期保存级加工规格
资源内容质量 资源级别
主要参数
推荐格式
采样率 量化精度 通道数
极高质量标准
长期保存级
768/384 kHz
24 bit、32 bit 、
64 bit
多声道/双声道/
单声道(由原始资
料特性决定)
BWF
WAV
高质量标准 192 kHz 24 bit、32 bit
DVD 音频质量标准 96/48 kHz 24 bit、32 bit
CD 音频质量标准 44.1 kHz 16 bit
5.3 发布服务级
音频资源发布服务级的加工规格见表 2。
音频资源发布服务级加工规格
应用场景 资源级别
主要参数
推荐格式
采样率 量化精度 通道数
发布服务 发布服务级 44.1 kHz 16 bit
双声道/单声道
(由发布及服务方要求
决定)
BWF
WAV
APE
FLAC
5.4 流通应用级
音频资源流通应用级的加工规格见表3。
音频资源流通应用级加工规格
应用场景 资源级别
主要参数
推荐格式
采样率 量化精度 通道数
流通应用 流通应用级 44.1 kHz 320 kb/s 双声道/单声道
MP3
AAC
WMA
6 元数据
6.1 概述
元数据包含音频资源基本元数据、曲目元数据、作者元数据、类型元数据、格式元数据、附件元数
据及管理元数据。元数据以 XML1.0 及以上版本格式存储,其中字符应采用 GB 18030 字符集,编码方
式应采用 UTF-8。音频资源元数据标引 XML Schema 见附录 A,音频资源元数据标引 XML 样例参见附
录 B。
6.2 音频资源基本元数据
音频资源基本元数据应参照GB/T 25100-2010的有关规定,见表4。
音频资源基本元数据
序号 中文名称 英文标签 必备性 可重复性 备注(对应 DC)
1 音频资源唯一标识符 < Identifier > 必备 不可重复 标识符(Identifier)
2 中国标准音像制品编码 < ISRC > 有则必备 不可重复
表 4(续)
序号 中文名称 英文标签 必备性 可重复性 备注(对应 DC)
3 采用标准号 < UseStandardNO > 有则必备 可重复 如 GB/T 25100-2010
4 来源识别码 < SID > 有则必备 不可重复
5 ISBN < ISBN > 有则必备 不可重复
6 题名 < Title > 必备 可重复 题名(Title)
7 作者 < Creator > 必备 可重复 创建者(Creator)
8 其他责任者 < Contributor > 有则必备 可重复 其他责任者(Contributor)
9 主题 < Subject > 有则必备 可重复 主题(Subject)
10 描述 < Description > 有则必备 可重复 描述(Description)
11 出版日期 < Date > 有则必备 不可重复 日期(Date)
12 出版者 < Publisher > 有则必备 可重复 出版者(Publisher)
13 格式 < Format > 有则必备 可重复 格式(Format)
14 来源 < Source > 有则必备 可重复 来源(Source)
15 语种 < Language > 有则必备 可重复 语种(Language)
16 关联 < Relation > 有则必备 可重复 关联(Relation)
17 类型 < Type > 有则必备 可重复 资源类型(Type)
18 涉及范围 < Coverage > 有则必备 可重复 覆盖范围(Coverage)
19 权利 < Rights > 有则必备 可重复 权限(Rights)
20 单价 < Price > 有则必备 可重复
21 中图分类号 < CLC Code > 有则必备 可重复
22 系列题名 < Series Title > 有则必备 可重复
23 系列顺序号 < Series Number > 有则必备 可重复
24 版本 < Edition > 有则必备 不可重复
6.3 子音频元数据
子音频元数据包含音频文件子音频相关信息,见表5。
曲目元数据
序号 中文名称 英文标签 必备性 可重复性 备注(对应DC)
1 音频资源唯一标识符 < Identifier > 必备 不可重复
2 子音频唯一标识符 < SubIdentifier > 必备 不可重复 标识符(Identifier)
3 题名 < SubTitle > 必备 不可重复 题名(Title)
4 其他语种题名 < TitleOtherLanguage > 可选 可重复
5 作者 < SubCreator > 可选 可重复 创建者(Creator)
6 关键词 < SubKeyWords > 可选 可重复
7 主题词 < SubSubject > 可选 可重复 主题(Subject)
8 音频分类 < SubType > 可选 可重复 资源类型(Type)
9 打点标记项 < Mark > 可选 可重复
10 打点标记项顺序 < MarkNumber > 可选 可重复
6.4 作者元数据
作者元数据包含作者相关信息,见表6。
作者元数据
序号 中文名称 英文标签 必备性 可重复性 备注
1 子音频唯一标识符 < SubIdentifier > 必备 不可重复
2 作者顺序 < CreatorSN > 可选 不可重复
3 作者姓名 < CreatorName > 必备 可重复
4 其他形式姓名 < CreatorOtherName > 可选 可重复
5 所属机构 < CreatorOrganiztion > 可选 可重复
6 作者地址 < CreatorAddress > 可选 可重复
7 联系方式 < CreatorContact > 可选 可重复
8 作者简介 < CreatorBrief > 可选 可重复
9 作者照片 < CreatorPhoto > 可选 可重复
6.5 类型元数据
类型元数据包含音频类型相关信息,见表7。
类型元数据
序号 中文名称 英文标签 必备性 可重复性 备注
1 子音频唯一标识符 < SubIdentifier > 必备 不可重复
2 题材 < SubjectMatter > 可选 可重复
3 体裁 < Literaturetype > 可选 可重复
4 风格 < Style > 可选 可重复
5 剧种 < DramaType > 可选 可重复
6 曲种 < QuyiSort > 可选 可重复
6.6 格式元数据
格式元数据包含音频格式相关信息,见表8。
格式元数据
序号 中文名称 英文标签 必备性 可重复性 备注
1 音频资源唯一标识符 < Identifier > 必备 不可重复
2 时长 < Duration > 可选 不可重复
3 原始介质 < OriginalMedia > 可选 不可重复
4 采样频率 < SampFrequency > 可选 不可重复
5 量化精度 < QLevel > 可选 不可重复
6 声道数 < Channels > 可选 不可重复
7 比特率 < BitRate > 可选 不可重复
8 信噪比 < SNR > 可选 不可重复
9 文件大小 < Size > 可选 不可重复
6.7 附件元数据
附件元数据描述音频所属附件信息,见表9。
附件元数据
序号 中文名称 英文标签 必备性 可重复性 备注
1 音频资源唯一标识符 < Identifier > 必备 不可重复
2 顺序号 < SN > 可选 不可重复
3 附件类型 < AttachmentType > 可选 可重复
4 内容简述 < AttachmentBrief > 可选 可重复
6.8 管理元数据
管理元数据记录加工生产相关信息,见表10。
管理元数据
序号 中文名称 英文标签 必备性 可重复性 备注
1 音频资源唯一标识符 < Identifier > 必备 不可重复 资源的唯一标识
2 级别 < Level > 可选 不可重复 资源重要程度
3 加工者 < Processor > 必备 可重复
加工者类型可自定义,机构
/个人
4 加工日期 < ProcessDate > 必备 不可重复 资源加工时间
5 组成 < Files > 可选 可重复 构成资源的文件情况
6 存储位置 < FilesLoaction > 可选 可重复 资源保存的位置描述
7 命名与存储
7.1 命名规则
音频文件命名的编码宜包括项目代码、文献代码、结构代码和资源级别代码四部分,如图1所示。
文献代码
结构代码
资源级别
项目代码
音频资源命名编码
音频资源命名编码各部分的详细介绍如下:
a) 项目代码,项目代码宜采用“项目编号+项目年”的编码形式。
b) 文献代码,代表数字化项目当年加工的音频资源的编号(音频资源唯一标识符)。
c) 结构代码,结构代码由结构编码+流水号组成:
1) 结构编码为 1位字母,代表对象数据的结构信息,详见表 11;
2) 结构编码后以流水号表达对象数据的最小单位;
3) 结构编码与流水号之间不需要连接符号。
d) 资源级别代码,资源级别代码代表资源的应用级别,包括:
1) 长期保存级用字母 A表示;
2) 发布服务级用字母 D表示;
3) 流通应用级用字母 M标识。
结构代码表
序号 结构编码 说明
1 A 音频资料的光盘封面、网络资源的截图封面等。
2 B 音频资料的曲目目录等。
3 C 音频资料的各个曲目。
4 T 音频资料的印刷型附件、实物资源的相关说明考证资料等。
5 X 音频资料的光盘封底等。
7.2 存储
以项目为独立存储结构,所有文档存储于其中,存储体系见图 2。
项目代码
(文件夹)
音频资源
(文件夹)
加工成品文件
(文件夹)
对应结构对应级
别的音频文件
原始音频文件
(文件夹)
附件
(文件夹)
资源级别代码
(文件夹)
对应音频文件的
描述文档
存储体系
8 加工流程
8.1 音频资源加工环节
新闻出版行业音频类内容资源的加工环节包括音频预处理、数字化采集、音频后期处理、元数据标
引、资料归档五个环节。
8.2 预处理环节
8.2.1 预处理流程
音频预处理加工流程包括出库登记、资源检查、物理修复、清洁处理、模拟播放设备安装调试等过程,
见图3。
原生资源
出库登记
资源检查 清洁处理
物理修复
模拟播放设备
安装调试
是否合格
是否
可修复 是
归库
(待处理)
预处理流程
8.2.2 出库登记
将要加工的资源从库房中取出,核对唱片、封套编号。唱片、封套编号应一致,然后进行登记。
8.2.3 资源检查
检查待加工的音频资源,以判断资源保存完整性,是否需要进行物理修复并实现数字化加工。
8.2.4 物理修复
对损坏的音频资源进行修复,修复原则如下:
a) 采用目前成熟技术可以修复的资源,尽量修复;
b) 目前成熟技术无法修复,则保持原样,按照保存要求存放,直到未来技术成熟时再修复;
c) 修复过程中不得损坏原资源物件。
8.2.5 清洁处理
清洁处理过程包括磁带清洁、盘片清洁和黑胶清洁:
a) 磁带清洁,在清洁前要判断是否需要进行清洁处理,可使用医用棉进行清洁;
b) 盘片清洁,激光唱片表面有污迹时,可用柔软的绒布沾水湿润后轻轻擦拭,并从光碟中直接向
外擦;
注:不可顺纹擦拭;不能使用酒精或其他有机溶剂擦拭;清洁之后不能留残渣;不能损坏盘片。
c) 黑胶清洁,黑胶唱片清洗时,要进行种类区分:
盘面较为干净时,使用除静电软刷进行除尘;
盘面有尘土时,使用清水冲洗或使用黑胶专用除尘水清洗;
注:虫胶类唱片如片面龟裂时,酌情考虑水洗。
盘面有油性、胶性、霉菌类物质时,使用专用的黑胶清洗剂对其脏污进行软化分解并清洗;
盘面有结块硬物时,使用专业工具进行破碎处理,处理后使用专用黑胶清洗剂清洗。
8.2.6 模拟播放设备安装调试
针对不同音频材质,应完成对应音频器材调试,包括所有需要的采录设备、专业线材、特定仪器等
的调试。
8.3 数字化采集
8.3.1 采集流程
音频资源的数字化采集流程见图 4。
选取硬件
播放设备
音频资源 采集参数设定 实施监控 元数据编目
内容采集流程
8.3.2 数字化采集加工环境
数字化采集加工环境应选择照明适度、安静、温度及湿度常年一致的独立空间。
8.3.3 数字化采集设备
数字化采集设备的选取和连接,主要包括以下步骤:
a) 选取播放器,包括:
1) 针对不同存储介质的音频资源,选取对应播放设备进行播放;
2) 选取含有高标准 ADC、DAC的专业播放设备,以及经过精密车床所制造的重量大、水平度
高的唱机转盘与标准工业化唱臂所组成的唱机。
b) 选取音频卡,包括:
1) 应选取采样频率、量化精度、信噪比指标高且总谐波失真率较低的音频卡,保证音质还
原的真实性;
2) 应选取可选取频响范围在 44.1kHz,-0.1dB:3Hz~20.5Hz;96kHz,-0.5dB:3Hz~45.5kHz;
192kHz,-1dB:2Hz~92.7kHz;384kHz,-1dB:<1Hz~124kHz;768kHz,-3dB:<1Hz~
180kHz的音频卡;
3) 可选取拥有较低延时以及含有高质量 DSP 信号处理芯片的音频卡,辅助 CPU 处理音频信
号。
c) 连接设备,应根据不同的加工来源和加工需求,选择相应的连接设备方案。
8.3.4 采集参数设定
音频采集参数设定包括模拟采集和数字转置:
a) 模拟采集,包括:
1) 定义音频的采集源;
2) 具体参数的设置,采样率、响度量化、单声道/立体声等;
3) 定义音频采集格式,采用 BWF/WAV格式;
4) 定义音频信号来源电平。
b) 数字转置,包括:
1) 利用专业音频采集卡和音频工具软件从不同存储介质中采录音频信息;
2) 自动裁切成单个音频;
3) 保存成 BWF/WAV格式;
4) 保存到电脑硬盘指定文件夹中。
8.4 音频后期处理
8.4.1 音频处理
音频处理应经过消除直流偏移、降噪处理操作:
a) 直流偏移,移除声音偏移造成响度上的变化;
b) 降噪处理,应在最大限度保留原有有效声音信息的前提下,消除录音过程中的本底噪声,还原
声音的清晰度。
8.4.2 压缩转换
根据具体的应用需求,参照本标准第5章中规定的加工规格,用专门音频编辑软件或音频格式转换
软件,将数字化处理好的......
|