搜索结果: CYT101.6-2014
| 标准编号 | CY/T 101.6-2014 (CY/T101.6-2014) | | 中文名称 | 新闻出版内容资源加工规范 第6部分:数据管理 | | 英文名称 | Specification of content resource processing in press and publication. Part 6: Data management | | 行业 | 印刷出版行业标准 (推荐) | | 中标分类 | L70 | | 国际标准分类 | 35.240.30 | | 字数估计 | 12,157 | | 发布日期 | 1/29/2014 | | 实施日期 | 1/29/2014 | | 标准依据 | 新广出发2014[11]号 | | 发布机构 | 国家新闻出版署 | | 范围 | 本部分规定了新闻出版内容资源数字化加工中的数据交接、数据类型、数据命名、数据管理和数据安全管理等方面的要求。 |
CY/T 101.6-2014: 新闻出版内容资源加工规范 第6部分:数据管理
CY/T 101.6-2014 英文名称: Specification of content resource processing in press and publication. Part 6: Data management
新闻出版内容资源加工规范
第 6 部分:数据管理
11 范围
CY/T 101 的本部分规定了新闻出版内容资源数字化加工中的数据交接、数据类型、数据命名、数
据管理和数据安全管理等方面的要求。
本部分适用于新闻出版内容资源的数字化加工及电子资源的制作和应用。
2 术语和定义
CY/T 101.1-2014 中所界定的以及下列术语和定义适用于本文件。
2.1
新闻出版内容资源 press and publication content resource
新闻出版领域内任意形式、任何粒度的内容及其他有价值的资源。
2.2
委托方 distributor
委托数据加工处理的单位或个人。
2.3
加工方 processing vendor
承接数据加工处理的单位或个人。
2.4
在线存储 online storage
存储设备和所存储的数据保持“在线”状态,可以随时读取和修改。
2.5
离线存储 offline storage
备份级存储
用于对在线存储的数据进行备份,以防范可能发生的数据灾难。
2.6
成品数据 finished data
已经完成全部数据处理过程且符合预先设定的规格和质量要求,可实现交付的最终数据形态。
3.1 数据接收
加工方按照一定的流程从委托方接收待加工处理的原始数据并形成数据接收清单,内容如下:
a) 数据接收基本流程包括:
1) 接收物理存储介质;
新闻出版内容资源加工规范 第 6 部分:数据管理
2) 备份原始数据;
3) 验证备份数据有效性并形成资源清单;
4) 形成数据接收清单并经委托方确认;
5) 归还委托方原始数据。
b) 数据接收清单的内容包括:
1) 介质类型;
2) 数据名称;
3) 数据格式;
4) 数据容量及数量;
5) 数据日期信息;
6) 数据版本信息;
7) 接收日期;
8) 双方交接人员签章。
3.2 数据交付
加工方在完成数据的加工及转换后按一定的规格和形式将数据提交给委托方并
提交数据交付清单。内容如下:
a) 数据交付基本流程包括:
1) 加工方将交付数据存储在要求的介质中;
2) 加工方形成数据交付清单;
3) 委托方接收存储介质及交付清单;
4) 委托方验证数据存储有效性;
5) 委托方确认数据交付有效性。
b) 数据交付清单内容包括:
1) 数据交付介质;
2) 交付的数据清单;
3) 交付数据的存储空间及文件数;
4) 数据交付的日期;
5) 双方交接人签章。
4 数据类型
4.1 数据类型描述
4.1.1 纸质出版物
加工对象为纸质出版物时,通常采用扫描、图像处理、文字识别和校勘、内容结构化处理、版式
重构等数据加工流程。
4.1.2 电子数据
加工对象为电子数据时,通常采用数据有效性分析、数据转码处理、内容结构化处理、版式重构
等数据加工流程。不同数据加工流程其全生命周期中所产生的各种数据的类型可划分为基础数据、过
程数据和成品数据 3 类。
4.2 基础数据
4.2.1 纸质出版物加工生成的基础数据
通过扫描等方式将纸质出版物转化为计算机图像文件,并对图像文件进行一系列加工处理后的符
合一定质量规范和存储规范的图像数据集合,是展开后续加工的数据基础,也可作为出版单位长期保
存或按需印刷出版纸质出版物的数字化版本。
34.2.2 电子数据加工生成的基础数据
通过对电子数据的有效性分析和整理,确定其内容完整性、版本一致性和可复用性后,形成可转
码处理的符合一定质量规范和存储规范的计算机排版文件集合,是展开后续加工的数据基础,也可作
为出版单位长期保存或重新印刷出版纸质出版物的数字化版本。
4.3 过程数据
按照不同的加工流程、加工粒度进行数据加工处理时各加工环节所产生的各类中间数据,是最终
生成成品数据的必要过程数据,也是质量追溯、质量问题修改、数据再加工的重要基础。
4.3.1 纸质出版物加工生成的过程数据
一般包括:文字识别结果数据、文字校勘结果数据、内容结构化加工过程中的相关数据和版式重
构过程中的相关数据等。
4.3.2 电子数据加工生成的过程数据
一般包括:乱码处理相关数据和转曲字符处理相关数据等。
4.4 成品数据
成品数据应符合数据加工最终目标,并满足一定的质量规范和存储规范,可直接与相关的软件系
统构成数字内容产品。通常包含各类元数据成品数据、XML 等内容结构化成品数据、各类对象成品数
据、PDF 等版式成品数据以及 EPub 等流式成品数据。
5 数据命名
数据命名应清晰准确的反映数据的内容、状态及版本等信息,包括:
a) 唯一 ID 号码;
b) 处理数据的环节编号;
c) 处理数据的版本编号;
d) 本环节完成的日期及时间。
6 数据管理
6.1 基础数据管理
6.1.1 基础数据命名和存储
基础数据命名应遵守数据命名规则,其中环节编号和版本编号可省略或均设置为 0。基础数据在
线存储,供后续数据加工环节随时调用,使用权限均设置为只读。
6.1.2 基础数据备份
基础数据离线存储 1 ~ 2 份备份并长期保存,也可用于覆盖恢复出现问题的在线存储基础数据。
应确保离线存储备份数据的有效性和安全性。
6.2 过程数据管理
6.2.1 过程数据命名和存储
过程数据命名应遵守数据命名规则。过程数据按项目、环节和日期等信息进行区分并集中在线存储。
6.2.2 过程数据流转规范
应根据使用者角色严格控制过程数据的使用权限。过程数据流转应严格按照流程进行,禁止不同
环节间直接进行数据传递(返工数据应遵循同一流程),过程数据流转的管理流程为:
a) 从上一环节接收该环节成品数据;
b) 参照环节、日期、质量版本等进行存储;
c) 将数据按生产流程分发给后续环节。
6.2.3 过程数据备份
过程数据除集中在线存储,还应在相应的数据加工设备内保留备份。修改过程数据时,
应同时更新覆盖 2 份备份。
6.3 成品数据管理
6.3.1 成品数据命名和存储
成品数据命名应遵循数据命名规则并符合加工需求文档的要求。成品数据需在线存储,
以便随时检查、核对或修改。
6.3.2 成品数据备份
成品数据离线存储 1 ~ 2 份备份并长期保存。应确保离线存储备份数据的有效性和安全性。
6.4 数据长期保存
长期保存数据应达到以下要求:
a) 数据的存储应至少有 2 份独立的物理备份;
b) 数据的存储优先使用磁介质和光介质;
c) 存储刷新应在介质理论寿命的一半时进行;
d) 当出现先进成熟的存储介质和方法时宜及时迁移到新介质上。
6.5 数据核销
加工方对过程数据和成品数据的存储具有时间限制,成品数据验收合格后保留时间不超过 3个月,
如委托方有特殊要求,可按委托方要求的时间存储,一般不超过 1 年。
数据存储到期后应进行数据的核销。数据的核销应包括过程数据及成品数据在内的全部数据以及
各种数据备份。数据核销时委托方可到场监督,数据核销后委托方应向加工方出具数据核销证明文档。
7 数据安全管理
7.1 保障体系
应建立数据安全管理保障体系以确保数据安全。数据安全保障体系如图 1 所示。
7.2 制度管理
加工方应具备数据安全管理的制度体系,包括:
a) 规章制度;
b) 工作规范;
c) 作业流程和及作业指导书;
d) 工作报表模板等。
7.3 环境管理
加工方数据处理工作现场应遵循以下要求:
a) 无死角监控视频;
b) 作业区域应与其他非作业区域隔离,无关人员禁入;
c) 出入门禁控制;
7.4 设备管理
加工方使用的数据处理设备及网络应遵循以下要求:
a) 内外网物理隔离;
b) 作业用计算机 USB 接口禁用;
c) 数据服务器及存储设备专用;
d) 存储介质设专人保管;
e) 关键设备和存储设备配置不间断供电电源;
f) 采用高性能局域网络及 IDC 机房等。
7.5 人员管理
人员管理应遵循以下要求:
a) 有完善的人力资源管理制度,人力资源使用符合国家相关规定;
b) 人员无犯罪记录;
c) 人员上岗前应通过相关制度培训并符合岗位技能要求等。
7.6 技术管理
技术使用和管理应遵循以下内容:
a) 使用的系统和工具软件应设置认证登录功能;
b) 不同的岗位应设置不同的系统和工具软件的使用权限;
c) 作业用系统及工具软件应具备版......
|