搜索结果: HJ 722-2014, HJ722-2014
| 标准编号 | HJ 722-2014 (HJ722-2014) | | 中文名称 | 环境数据集说明文档格式(发布稿) | | 英文名称 | Documentation format of environmental dataset | | 行业 | 环保行业标准 | | 字数估计 | 29,218 | | 发布日期 | 12/25/2014 | | 实施日期 | 3/1/2015 | | 引用标准 | GB/T 2260-2007; GB/T 7408-2005; GB/T 17295-2008; HJ/T 417-2007; HJ 720-2014 | | 标准依据 | Ministry of Environmental Protection Notice 2014 No. 87 | | 发布机构 | 生态环境部 |
HJ 722-2014
Documentation format of environmental dataset
中华人民共和国国家环境保护标准
环境数据集说明文档格式
2014-12-25 发布
2015-03-01 实施
环 境 保 护 部 发布
目次
前言..II
1 适用范围.1
2 规范性引用文件.1
3 术语和定义.1
4 环境数据集说明文档内容要求.1
5 环境数据集说明文档格式要求.8
附录 A (规范性附录) 环境数据集说明文档模板9
附录 B (资料性附录) 环境数据集说明文档示例..14
前言
为贯彻《中华人民共和国环境保护法》,促进环境信息化工作,规范和指导环境数据集
说明文档的编写,制定本标准。
本标准规定了环境数据集说明文档的内容要求和格式要求。
本标准附录 A 为规范性附录,附录 B 为资料性附录。
本标准为首次发布。
本标准由环境保护部科技标准司组织制订。
本标准主要起草单位:环境保护部信息中心、北京市倍思电子数据库工程公司。
本标准环境保护部 2014 年 12 月 25 日批准。
本标准自 2015 年 3 月 1 日起实施。
本标准由环境保护部解释。
环境数据集说明文档格式
1 适用范围
本标准规定了环境数据集说明文档的内容要求、格式要求和环境数据集说明文档模板。
本标准适用于环境数据集加工、使用及汇交过程中对环境数据集的说明。
2 规范性引用文件
本标准内容引用了下列文件中的条款。凡是不注日期的引用文件,其有效版本适用于本
标准。
GB/T 2260-2007 中华人民共和国行政区划代码
GB/T 7408-2005 数据元和交换格式 信息交换 日期和时间表示法
GB/T 17295-2008 国际贸易计量单位代码
HJ/T 417-2007 环境信息分类与代码
HJ 720-2014 环境信息元数据规范
环办[2012]92 号 附件 3 污染源监督性监测数据元技术规定
环办[2012]92 号 附件 4 污染源自动监控数据元技术规定
环办[2012]92 号 附件 5 环境统计数据元技术规定
3 术语和定义
下列术语和定义适用于本标准。
3.1 数据集 dataset
可识别的数据集合。
3.2 环境数据集 environmental dataset
由环境保护业务相关的数据实例组成、遵循统一的数据模型、具有相对独立的业务语义
的数据集合。
3.3 数据元 data element
用一组属性描述定义、标识、表示和允许值的数据单元。
4 环境数据集说明文档内容要求
4.1 内容要求
环境数据集的创建单位应编写环境数据集说明文档,以准确描述环境数据集。环境数据
集说明文档应包含以下基本章节:
a) 概述;
b) 数据集标识;
c) 数据内容和结构;
d) 覆盖范围;
e) 数据质量;
f) 元数据。
可包括以下章节:
g) 数据分发;
h) 限制信息;
i) 数据维护;
j) 附加说明。
4.2 概述
概述应包括环境数据集说明文档的创建信息:
a) 数据集说明文档的名称;
b) 数据集说明文档的版本;
c) 数据集说明文档的发布日期;
d) 数据集说明文档的创建单位,包括单位名称、地址、电话、传真、电子邮件地址、
网址。
可包括以下可选项:
e) 术语和定义;
f) 缩略语。
4.3 数据集标识
数据集标识应包括以下项:
a) 数据集名称:缩略描述环境数据集内容的标题,应包含该数据集的空间覆盖范围、
时间覆盖范围、数据内容等;
b) 数据集摘要:对数据集内容概要说明的文字,应包含该数据集的主要内容、空间覆
盖范围、时间覆盖范围、形成过程、遵循的主要标准等信息;
c) 数据集分类:数据集所属的分类,遵循 HJ/T 417-2007 各种分类的取值规定;
d) 数据集提供方:包括数据集提供单位、提供单位电话、提供方电子邮件地址。
可包括以下可选项:
e) 目的:生成数据集的目的;
f) 补充信息:对该数据集的其他描述信息,如说明该数据集与历史版本间的关系。
4.4 数据内容和结构
4.4.1 数据结构
采用 UML 描述环境数据集的数据结构,即环境数据集数据模型,描述数据实体-属性
关系。用 UML 中类的概念表示数据实体,用 UML 类的属性概念表示实体的属性。
本标准采用 UML 定义的下列四种模型关系,并采用 UML 静态结构图表示数据实体间
的关系:
a) 关联
关联用于描述两个或更多类之间的一般关系。如图 1 所示。
关联的方向必须说明。如果不指明方向,则假定为双向关联。如果是单向关联,关联方
向在线段终点用箭头来标记。
图 1 关联示例图
b) 聚合
聚合用于创建两个类之间的部分与整体的关系。在该关系中,一个类担当容器角色,另
一个类担当容器的构件角色。如图 2 所示。
图 2 聚合示例图
c) 泛化
泛化表示一般化描述和具体化描述之间的关系,即超类与替代它的子类之间的关系。如
图 3 所示。
图 3 泛化示例图
d) 角色
模型中使用“角色名称”描述源对象与目标对象之间的关系。在双向关联中,提供两个
角色名称。如图 4 所示。
-单位
-设备
图 4 UML 角色示例图
4.4.2 数据内容
说明环境数据集所包含的数据元。若所包含的数据元在环办[2012]92 号文附件 3、环办
[2012]92 号文附件 4、环办[2012]92 号文附件 5 中已有定义,可直接引用;若为第一次定义,
则应对数据元的属性进行详细描述,数据元属性见表 1。
表 1 数据元属性表
序 号 属性名称 提交者填写
1 中文名称 是
2 别名 是
3 标识符 是
4 短名 是
5 定义 是
6 数据格式 是
7 值域 是
8 计量单位 是
9 版本 是
10 状态 是
11 备注 是
4.4.2.1 中文名称
数据元的中文名称是赋予数据元的单个或多个中文字词的指称,是唯一的,应尽量采用
环保业务已有名称或环保行业习惯用语,以方便数据元的使用。
数据元中文名称一般使用一个词语,要求用词精准,能够准确传达要表示的含义。
4.4.2.2 别名
数据元中文名称以外的名称。当同一数据元在不同业务中中文名称不同时,可采用别名
进行名称统一。别名也应尽量采用环保业务已有名称或行业习惯用语。
4.4.2.3 标识符
标识符是数据元的唯一标识,由前段码(四位阿拉伯数字)和后段码(六位阿拉伯数字)
两部分组成,前段码和后段码之间用“-”连接,如图 5 所示。
图 5 数据元标识符
4.4.2.4 短名
短名是该数据元中文名称的缩写名称。
数据元的短名遵循以下命名规则:
a) 采用该数据元中文名称的拼音首字母缩拼;
b) 当无法避免重复短名时,应采用数据元中文名称的首汉字全拼加剩余汉字首字母组
合的附加规则,以此类推,直至短名无重复;
例:姓名 短名:xingm
项目 短名:xiangm
c) 当数据元中文名称中有阿拉伯数字时,其短名命名中直接采用该阿拉伯数字;
d) 短名的最大长度为 30 个字符。
4.4.2.5 定义
定义为表达一个数据元的本质特性并使其区别于所有其他数据元的陈述。
数据元定义应遵循以下规则:
a) 每个定义必须区别于数据集说明文档中任何其它数据元定义,以保证唯一性;
b) 对数据元含义的阐述要准确,避免歧义性的定义;
c) 必须使用短语对数据元进行准确定义,应使用完整的、语法正确的句子;
d) 在定义中应使用全称,若需要,仅可使用人们普遍理解的缩略语,缩略语首次出现
时,必须予以说明;
e) 表述中不应加入不同的数据元定义或引用下层概念。
4.4.2.6 数据格式
数据格式是从业务的角度规定的数据元值的格式需求,包括所允许的最大和/或最小字
符长度,数据元值的表示格式等。
数据格式中使用的字符及含义见表 2。
表 2 字符含义表
字符 含义
a 字母字符
n 数字字符
an 字母数字字符
m(m 为自然数) 定长 m 个字符
..ul 长度不确定的文本
..p,q(p,q 均为自然数) 最长 p 个数字字符,小数点后 q 位
..
从最小长度到最大长度,前面附加最小长度,后面附
加最大长度
YYYYMMDDhhmmss
“YYYY”表示年份,“MM”表示月份,“DD”表示
日期,“hh”表示小时,“mm”表示分钟,“ss”表示
秒,视实际情况组合使用。
True/False 布尔型
例 1:an5(aannn) 表示定长 5 个字母数字字符,前 2 个为字母字符,后三个为数字字
符;
例 2:n..17,2 表示最长 17 个数字字符,小数点后两位;
例 3:an3..8 表示最大长度为 8,最小长度为 3 的不定长的字母数字字符;
例 4:True/False 表示该数值为布尔型。
如果“数据类型”是“二进制”,应标识出二进制的具体格式,如“JPEG”。
4.4.2.7 值域
数据元值域是根据相应属性中所规定的数据格式而决定的数据元的允许值的集合。
数据元值域有以下三种情况:
a) 通过名称给出:通过名称指出值域,如污水处理厂的名称最大长度不会超过 50 个字
母字符,所以数据元“污水处理厂名称”的值域是“最大长度为 50 的字母字符”;
b) 引用国家标准:当有国家标准时则引用国家标准,如引用 GB/T 7408-2005 中对于时
间表示法的规定;
c) 采用代码表:采用一个由所有允许值组成的列表,即代码表。用代码表表示数据元
的值域须遵照以下规则:
1) 已有国家、行业标准且完全满足需求的,直接采用国家、行业标准;已有国家、
行业标准且不能完全满足需求的,直接采用国家、行业标准,并在其基础上进
行修订;无国家、行业标准的,须按照国家分类编码的相关规范,制定相应的
代码表。
2) 自定义的代码表内容包括代码和名称。代码由若干位阿拉伯数字构成,所取位
数可根据内容调整,并按顺序排列。为满足未来业务扩充需要,可预留部分扩
充空间,如用代码“9”或“99”表示“其他”。代码表模版如表 3 所示。
表 3 代码表模版
代码 名称
1 XXX
2 XXX
3 XXX
4 XXX
9 其他
3) 代码表被多个数据元使用,即可被再利用。
4.4.2.8 计量单位
数值型数据元取值的计量单位。计量单位名称采用GB/T 17295-2008中的计量单位的名
称。
4.4.2.9 版本
版本指在一个注册机构内的一系列逐渐完善的数据元规范中,某个数据元规范发布的标
识。
版本的编写格式及版本控制须遵循以下原则:
a) 版本是由阿拉伯数字字符和小数点组成的字符串;
b) 版本至少包含两个阿拉伯数字字符和一个小数点字符;
c) 版本字符串应为“mm.nn”的形式,其中“m”、“n”表示阿拉伯数字字符,
小数点字符前面的子串“mm”和小数点字符后的子串“nn”应是正整数;
d) 版本字符串中,小数点字符前的子串“mm”表示数据元的主版本号,小数点字
符后的子串“nn”表示数据元的次版本号;
e) 当数据元的某些属性发生了改变时,其版本需要进行相应的改变。对数据元(当前
数据元)更新的时间,以及更新后的数据元(后续数据元)的版本等属性,应由数
据元注册机构以及评审小组决定,基本原则有:
1) 如果当前数据元和后续数据元之间进行有效的数据交换,则须改变后续数据元
版本字符串中小数点字符后面的子串“nn”(次版本号),当前数据元和后
续数据元的版本字符串之间的关系请参考原则 f。
2) 如果当前数据元和后续数据元之间无法进行有效的数据交换,则须改变后续数
据元版本字符串中小数点字符前的子串“mm”(主版本号),当前数据元和
后续数据元的版本字符串之间的关系请参考原则 f。
f) 当版本发生改变时,其改变后的版本(“后续版本”,表示为“pp.qq”)和当
前版本(表示为“mm.nn”)之间应遵循以下原则:
1) 若版本的次版本号发生变动,而版本的主版本号不发生变动,则从数学意义上
来看,应满足:qq=nn+1。
2) 若版本的主版本号发生变动,则应满足:pp=mm+1,qq=0。
g) 若版本的主版本号与此版本号均需发生变动,则数据元的版本字符串的变动情况参
考原则 f)中的第 2)条。
4.4.2.10 状态
数据元状态指在其注册的全生存期内所处状态的标示。
数据元在其注册的全生存期内包括四种状态:
a) 草案:数据元的内容处在草案阶段,只能内部使用,不能被正式推荐或发布使用;
b) 试用:数据元的内容处于试用阶段,可对外以通知、通告的形式发布试用数据元,
但不能以标准的形式发布,任何组织或机构都可对其提出异议或建议;
c) 标准:数据元的内容处于标准阶段,数据元将以标准的形式发布和使用,用此数据
元的组织或机构都应执行标准的规定;
d) 废止:当处在标准阶段的数据元因某种原因不能再继续被使用时,可将数据元标记
为“废止”,并以通知、通告或标准的形式向外发布信息。
4.4.2.11 备注
数据元的附加注释,描述在上述属性未能描述的其他内容。
4.5 覆盖范围
环境数据集的覆盖范围,包括空间覆盖范围和时间覆盖范围。
a) 空间覆盖范围:包括空间范围、经度和纬度。其中,空间范围用以说明数据内容覆
盖的空间区域范围,可多选。如流域名称、全国或省市名称,其中省市名称按 GB/T
2260-2007 中表 1 取值;经度、纬度为可选项;
b) 时间覆盖范围:包含起始时间、结束时间和时间频度。其中,起始时间、结束时间
用以表示数据内容跨越的时间段;时间频度用以说明该数据集的采集频度。
遵循 HJ720-2014 中 7.2.2 关于“覆盖范围信息”的描述要求。
4.6 数据质量
提供环境数据集的数据质量总体评价信息,包括数据志说明,用以说明数据集的产生背
景、处理方法、处理步骤等信息。
遵循 HJ720-2014 中 7.2.6.1 关于“数据志说明”的描述要求。
4.7 数据分发
提供环境信息数据集分发的格式信息和介质信息。
应包括以下部分:
a) 数据分发格式:数据分发时采用的格式名称,遵循 HJ720-2014 中 7.2.7.2 关于“数
据分发格式”的要求;
b) 数据分发介质:数据分发时采用的介质名称。
可包括:
c) 在线资源链接地址:可以获取环境信息数据集的网络地址,一般指向具体的数据资
源应用,遵循 HJ720-2014 中 7.2.7.1 关于“在线资源链接地址”的要求。
4.8 限制信息
包括安全限制分级,用以说明数据集访问和使用的限制信息等,内容遵循 HJ720-2014
中 7.3.2“安全限制分级代码表”的“名称”列。
4.9 数据维护
提供环境信息数据集维护的信息,描述对环境数据集进行数据维护的原则和标准。
应包括以下部分:
a) 更新频率:说明对数据集进行修改及添加的频率,内容遵循 HJ720-2014 中 7.3.1“数
据集更新/频率代码表”的名称列;
b) 更新机制:说明数据集的更新依据。
4.10 元数据
提供完整的元数据信息,必须包含 HJ720-2014 规定的核心元数据,也可包含该数据集
特需的元数据信息。
a) 污染源在线监控数据集,参照 HJ720-2014 附录 F;
b) 污染源监督性监测数据集,参照 HJ720-2014 附录 G;
c) 环境统计数据集,参照 HJ720-2014 附录 H。
元数据应采用 XML 语言对元数据进行描述,其 schema 参照 HJ720-2014 附录 A。
4.11 附加说明
提供环境数据集的其他信息,进一步说明环境数据集的其他方面的信息。
5 环境数据集说明文档格式要求
环境数据集说明文档应遵循下列格式要求:
a) 环境数据集说明文档电子文件名命名为“文档填写单位名称_顺序号_环境数据集说
明文档名称.文件后缀名”,如“中国环境监测总站_0010_2010 年 7 月 8 日重点城市
空气质量日报数据集说明文档.doc”。文件名中不能包含下列任何半角字符:斜杠(\、
/)、冒号(:)、星号(*)、问号(?)、引号(")、尖括号(< 、 >)和竖杠(|);
b) 环境数据集说明文档统一使用 A4 标准尺寸、简体汉字编写;
c) 环境数据集说明文档页边距设置:上边距:2.54cm,下边距:2.54cm;左边距:3.17cm,
右边距:2.5cm;装订线:0.8cm;页眉:1.5cm,页脚:1.75cm;
d) 环境数据集说明文档封面:标题写明“环境数据集名称+说明文档”,采用小一号
宋体加粗;封面应同时注明文档填写单位、文档填写人和文档填写日期;
e) 环境数据集说明文档主体:每章标题采用四号宋体加粗;正文部分汉字用小四号宋
体,英文和阿拉伯数字用小四号“Times New Roman”字体;正文行间距设置为 1.5
倍行距;
f) 环境数据集说明文档图表:图表标题采用五号黑体;表格中文字采用五号宋体,每
页续表均要加上表头;
g) 环境数据集说明文档内容编排见附录 A,文档示例参见附录 B。
附录 A
(规范性附录)
环境数据集说明文档模板
说明文档
文档填写单位:
文档填写人:
文档填写日期: 年 月 日
修订历史记录
日期 修改类型 版本 修订说明 作者
*修改类型分为 A – 增加 M – 修改 N – 第一次编写 D – 删除 (可使用 WORD 文档修订记录)
1、概述
名称:
版本:
发布日期:【CCYY-MM-DD】
创建单位:
单位名称:
地 址:
电 话:
传 真:
Email:
网 址:
1.2 术语和定义(可选)
1.3 缩略语(可选)
2、数据集标识
数据集名称:
数据集摘要:
数据集分类:
数据集提供方:
数据集提供单位:
数据集提供方电话:
数据集提供方电子邮件地址:
目的:(可选)
补充信息:(可选)
3、数据内容和结构
3.1 数据模型
【数据模型图】
3.2 数据元
序号 中文
名称
短名 定义 数据
格式
值域 计量
单位
版本 状态 备注
代码 名称
1 XXX
2 XXX
3 XXX
4 XXX
9 其他
4、覆盖范围
空间覆盖范围:
空间范围:【可多选】
经度(可选):
纬度(可选):
时间覆盖范围:
起始时间:【CCYY-MM-DD】
结束时间:【CCYY-MM-DD】
时间频度:
5、数据质量(可选)
数据志说明:
6、数据分发(可选)
数据分发格式:
数据分发介质:
在线资源链接地址:(可选)
7、限制信息(可选)
安全限制分级:
8、数据维护(可选)
更新频率:
9、元数据
【给出该环境数据集的元数据 XML 文档】
10、附加说明(可选)
附录 B
(资料性附录)
环境数据集说明文档示例
2010年7月8日重点城市空气质量
日报数据集说明文档
文档填写单位:中国环境监测总站
文档填写日期:2010 年 7 月 9 日
修订历史记录
日期 修改类型 版本 修订说明 作者
*修改类型分为 A – 增加 M – 修改 N – 第一次编写 D – 删除 (可使用 WORD 文档修订记录)
1、概述
1.1 2010 年 7 月 8 日重点城市空气质量日报数据集说明文档的创建信息
名称:2010 年 7 月 8 日重点城市空气质量日报数据集说明文档
版本:V1.0
发布日期:2010 年 7 月 9 日
创建单位:
单位名称:中国环境监测总站
地 址:北京市朝阳区安外大羊坊 8 号
电 话:010-84626......
|