| 标准编号 | CY/T 208-2020 (CY/T208-2020) | | 中文名称 | 文献片段标识符(DFI) | | 英文名称 | (Document Fragment Identifier (DFI)) | | 行业 | 印刷出版行业标准 (推荐) | | 中标分类 | A19 | | 国际标准分类 | 01.140.40 | | 字数估计 | 15,146 | | 发布日期 | 2020-11-16 | | 实施日期 | 2021-02-01 | | 标准依据 | 国新出发函(2020)249号 | | 发布机构 | 国家新闻出版署 |
CY/T 208-2020: 文献片段标识符(DFI)
CY/T 208-2020 英文名称: (Document Fragment Identifier (DFI))
文献片段标识符(DFI)
中华人民共和国新闻出版行业标准
中华人民共和国国家新闻出版署发 布
本标准按照 GB/T 1.1-2020 给出的规则起草。
本标准由国家新闻出版署提出。
本标准由全国新闻出版标准化技术委员会(SAC/TC 527)归口。
本标准起草单位:中国新闻出版研究院、人民教育电子音像出版社、北京师范大学音像出版社、
同方知网(北京)技术有限公司、中国版本图书馆。
本标准主要起草人:蔡逊、王青华、邱恋、熊海涛、王庚梅、刘颖丽、香江波。
前言
信息技术的发展,使信息文献资源的使用方式产生了深刻的变化,其中最显著的特征之一,就是
文献内容的碎片化应用。在各种应用终端设备上,对于文献应用的颗粒度已经明显地缩小,在诸多应
用场景下,文献的片段都需要通过对片段的标识或标引以实现识别、检索和定位。信息技术的发展还
给文献应用提供了共同呈现等复合应用的基础,这些应用往往需要在相关的内容片段之间建立对应关
系,而建立这样的对应关系也需要通过标识对文献的片段进行有效地识别和定位。
由此可见,在现代信息技术条件下,仅有对于一个信息资源的整体标识已经不能够满足数字化网
络化发展的使用需求。虽然一些机构和组织较早就注意到了这一问题,并且采取了相应的技术对策,
能够在特定的技术环境中有效地解决这个问题,但是迄今为止,这些手段和方法还难以做到在文献资
源脱离或转移原有的技术环境时,仍然能够实现相同的标引和定位。如果文献的发布者或文献应用的
开发者能够在原有的文献整体标识的基础上,遵循一种简便并且通用的规则,对文献片段进行(预先
或追加的)标识,将会给各种技术系统引用该标识,使该文献在不同的技术环境下实现各种使用功能
提供诸多的便利。
本标准提供了这样一种方法,在原有文献标识符的基础上,辅之一种片段标识的工具(文献片段
标识符),解决原有标识符不能标识文献片段的问题,即采用原有的整体标识 + 片段标识的二级标识
方法。这种方法既可以继续发挥原有标识符的作用,不改变现有的标识符体系框架,又可以满足文献
碎片化的各种使用需求,同时,这种二级标识架构还可以避免对片段的重新标识而产生大量标识符,
导致标识符泛滥而难于管理的问题。
引 言
1 范围
本标准规定了文献片段标识符(DFI)的构成、语法规则、显示、分配和管理。本标准适用于已被
整体标识的文献进行片段标识。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本
文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 4894-2009 信息与文献术语
GB/T 17710-2008 信息技术安全技术校验字符系统
GB/T 18238.3-2002(idt ISO/IEC 10118-3:1998)信息技术安全技术散列函数 第 3 部分:专
用散列函数
3 术语和定义
以下术语和定义适用于本标准。
4 文献片段标识符(DFI)
4.1 基本构成
文献片段标识符(DFI)由标识符标志和以下四部分组成:
a) 版本代码;b) 片段代码;c) 功能代码;d) 校验码。
4.3 语法规则
DFI 的语法规则定义为:
a) 版本代码
--版本代码由 3位数字组成,以区别同一文献的不同片段划分方案。
b) 片段代码
--片段代码每 3位数字为一组,由左至右每一组代表的片段颗粒度级别由大到小;
--由登记者决定采用的片段颗粒度级数,即采用多少组 3位数;
--当某一级别片段数量超过 103(3位数字)时,可按 3的整数倍增加该段的位数,即 6位数字、
9位数字,将该级别片段标识数量增加到 106、109;
--当登记者认为无须区分片段颗粒度级数时,可按照全部片段的数量确定片段代码应选择的字
长,片段代码的字长必须是 3的整数倍,此时须将全部片段代码不分段连续使用。
c) 功能代码
--功能代码由 2位数字组成,以 00~ 99 代表不同的功能,功能代码定义和使用规则见附录 A。
d) 校验码
--校验码由 1位数字组成,按 GB/T 17710-2008 规定的方法生成,具体计算步骤见附录 B。
4.4 DFI 的显示
当需要在屏幕上显示 DFI 编码或将其打印出来时,应在各字段间加上连字符“-”进行分隔,并在
数字编码前加上文献片段标识符标志“DFI”,“DFI”与编码之间空一个半角字符空格。
DFI 一般应与该文献的整体标识同时显示,该文献的整体标识在左,DFI 在右,中间空一个半角字
符空格,如示例 1所示。
4.5 DFI 的使用
DFI 的使用见附录 C。
5 DFI 的分配
5.1 版本代码
当登记者需要对一个文献进行片段分割并使用 DFI 标识时,可向 DFI 注册机构提出申请。
DFI 注册机构收到登记者的申请并确认符合本标准使用规范时,向登记者发放该文献标识符项下
的片段标识符版本代码,注册版本代码从 001 开始按流水顺序编排。
版本代码 000 作为特殊版本号码开放给未注册或不能注册的用户使用,DFI 注册机构不对 000 版
本号提供解析服务。
当文献尚未获得整体标识或其他原因不能进行版本注册时,可使用特殊版本号码按照本文件的规
则进行片段划分和标识,但仅限于组织内部使用,不可以开放给公众使用。未注册的片段标识版本可
在具备注册条件后进行注册。
当版本代码出现剩余可分配数量不足时,由注册机构决定是否增容和拟采取的增容规则。
5.2 片段代码和功能代码
由登记者根据需要决定片段代码使用几组和是否不分段连续使用,并为内容片段分配片段代码。
由登记者按照附录 A 的规则确定功能代码,其中未定义字段可由登记者自行定义,并可在应用解
析中实现其功能。
5.3 校验码
登记者使用 DFI 注册机构提供的工具计算出每一个文献片段标识符的校验码数值,并将该数值填
入校验位。
5.4 时限要求和变更
登记者应在领取版本代码后 90 天内完成片段代码和功能状态码的分配,并向注册机构上传 DFI 注
册和元数据表单。如遇特殊情况不能在 90 天内完成,可向注册机构说明并申请延期。
当登记者向注册机构提交 DFI 注册和元数据表单后,该 DFI 即不可更改。如需变更,登记者可申
领新的版本代码,并为该文献分配新的片段代码和功能代码。
6 DFI 元数据
每个 DFI 编码都应有附录 D 中规定的 DFI 元数据。DFI 编码和 DFI 元数据应录入到由登记者管理
的注册表中。应用技术系统可通过该......
|