路径: 主页 > HJ > 第8页 > HJ 720-2014
标准搜索结果: 'HJ 720-2014'
| 标准编号 | HJ 720-2014 (HJ720-2014) | | 中文名称 | 环境信息元数据规范 | | 英文名称 | Environment information metadata specification | | 行业 | 环保行业标准 | | 中标分类 | Z04 | | 字数估计 | 183,141 | | 发布日期 | 12/25/2014 | | 实施日期 | 3/1/2015 | | 标准依据 | 环境保护部公告公告2014年第87号 | | 发布机构 | 生态环境部 | | 范围 | 本标准规定了环境信息元数据框架, 定义了坏境信息核心元数据内容以及用以描述环境信息数据集的标识、内容、管理以及维护等信息。本标准适用于坏境信息元数据编目、建库、发布和查询。 |
HJ 720-2014
Environment information metadata specification
环境信息元数据规范
2014-12-25 发布
2015-03-01 实施
环 境 保 护 部 发布
中华人民共和国国家环境保护标准
目次
前言..II
1 适用范围1
2 规范性引用文件1
3 术语和定义1
4 一般规定1
5 符号与约定1
6 环境信息元数据框架5
7 环境信息核心元数据内容9
附录 A (规范性附录) 环境信息元数据 XML Schema..22
附录 B (规范性附录) 环境信息元数据扩展原则和方法..33
附录 C (资料性附录) 环境信息核心元数据示例..37
附录 D (资料性附录) 环境信息核心元数据应用的 XML 示例46
附录 E (规范性附录) 数据集标识符编码方案..51
附录 F (资料性附录) 应用方案 1:污染源自动监控元数据53
附录 G (资料性附录) 应用方案 2:污染源监督性监测元数据.100
附录 H (资料性附录) 应用方案 3:环境统计信息元数据.136
附录 I (资料性附录) 环境信息元数据扩展示例.178
前言
为贯彻《中华人民共和国环境保护法》促进环境信息化工作,规范环境信息资源元数据内容,制定
本标准。
本标准规定了环境信息元数据框架,定义了环境信息核心元数据内容以及用以描述环境信息数据集
的标识、内容、管理以及维护等信息。
本标准的附录 A、B、E 为规范性附录,附录 C、D、F、G、H、I 为资料性附录。
本标准为首次发布。
本标准由环境保护部科技标准司组织制订。
本标准起草单位:环境保护部信息中心、北京市倍思电子数据库工程公司、中国环境监测总站。
本标准环境保护部 2014 年 12 月 25 日批准。
本标准自 2015 年 3 月 1 日起实施。
本标准由环境保护部解释。
环境信息元数据规范
1 适用范围
本标准规定了环境信息元数据框架,定义了环境信息核心元数据内容以及用以描述环境信息数据集
的标识、内容、管理以及维护等信息。
本标准适用于环境信息元数据编目、建库、发布和查询。
2 规范性引用文件
本标准内容引用了下列文件中的条款。凡是不注日期的引用文件,其有效版本适用于本标准。
GB 11714 全国组织机构代码编制规则
GB/T 2260 中华人民共和国行政区划代码
GB/T 7408 数据元和交换格式 信息交换 日期和时间表示法
GB/T 22240-2008 信息安全技术 信息系统安全等级保护定级指南
HJ/T 417-2007 环境信息分类与代码
3 术语和定义
下列术语和定义适用于本标准。
3.1 数据集 dataset
可以识别的数据集合。
注: 本标准中数据集是指不可再细分的数据集,即能够用一个数据字典唯一描述的数据集合。
3.2 元数据 metadata
关于数据的数据。即数据的标识、覆盖范围、质量、空间和时间模式、空间参照系和分发等信息。
注: 本标准中元数据特指描述环境信息数据集的数据。
3.3 元数据元素 metadata element
元数据的基本单元。
注: 元数据元素在元数据实体中是唯一的。
3.4 元数据实体 metadata entity
一组说明数据相同特性的元数据元素。
注: 可以包含一个或一个以上元数据实体。
3.5 元数据子集 metadata section
元数据的子集合,由相关的元数据实体和元素组成。
3.6 环境信息核心元数据 environment information core metadata
描述环境信息数据集最基本属性的元数据实体和元数据元素。
注1: 是环境信息元数据的最小子集。
注2: 各业务应用时,必须包含环境信息核心元数据。
4 一般规定
按照本标准直接进行元数据应用时,其元数据内容应与第 7 章保持一致。
按照本标准进行元数据记录交换时,其编码应符合附录 A 规定的格式。
环境保护各专业可根据业务自身特点和应用需求在本标准基础上进行扩展,形成各专业数据的元数
据应用方案。扩展后的元数据应用方案必须符合第 6 章定义的环境信息元数据框架,原则上不可对元数
据框架进行扩展;其元数据内容必须包含第 7 章定义的环境信息核心元数据内容,其定义与描述方式必
须遵循第 5 章规定的符号与约定。具体的扩展原则方法应遵循附录 B 的要求,扩展示例参见附录 I。
5 符号与约定
5.1 摘要表示
5.1.1 概述
本标准采用摘要表示的方式定义和描述元数据。在以摘要表示的方式定义和描述元数据时,采用以
下属性,包括中文名称、英文名称、定义、数据类型、值域、短名、注解、子元素、扩展巴氏范式和示
例。
5.1.2 中文名称
各元数据子集、元数据元素或元数据实体的中文名称,用 7.2 中各小节的标题来表达。
例如:7.2.1.1 数据集名称
5.1.3 英文名称
对存在国际或行业领域惯用英文名称的元数据子集、元数据实体或元数据元素,则直接采用该英文
名称。
元数据子集、元数据实体或元数据元素的英文名称,一般用英文全称。
所有组成词汇为无缝连写。元数据元素的首词汇全部采用小写字母,其余每个词汇的首字母采用大
写;元数据子集和元数据实体的每个词汇的首字母大写。
例如:元数据子集“覆盖范围信息”英文名称为“Extent”;
元数据元素“东边经度”英文名称为“eastBoundLongitude”。
5.1.4 定义
描述元数据子集、元数据实体或元数据元素的基本内容和属性。
5.1.5 数据类型
说明元数据子集、元数据实体或元数据元素的数据类型,允许对其值域内的值进行操作的值域说明。
例如复合型、字符串、日期型等。
5.1.6 值域
说明元数据元素可以取值的范围。
5.1.7 短名
短名用于在本标准内唯一识别元数据子集、元数据实体或元数据元素,其确定规则如下:
a) 短名在本标准范围内必须唯一;
b) 对存在国际或行业领域惯用英文缩写的元数据实体或元数据元素,其短名直接采用该英文缩
写;
c) 对于根据英文名称形成的短名,在保持唯一性的前提下统一取每个单词前三个字母作为其短
名,当如此取词不能保证唯一性时应延展取词位数,通常仅增加一位,如此仍不能保证唯一性
时如前继续延长取词,直至保证唯一性为止;
d) 元数据子集和元数据实体的短名的写法是,所有组成词汇的缩写为无缝连写,并且每个词汇缩
写的首字母大写;
e) 元数据元素的短名的写法是,所有组成词汇的缩写为无缝连写,首词汇全部采用小写字母,其
余每个词汇的缩写的首字母大写。
例如:元数据元素“数据集提供方电子邮件”的英文名称为“electronicMail”,其短名为“eMail”。
5.1.8 注解
对元数据实体或元数据元素的含义的进一步解释,包括该元数据实体或元数据元素的约束/条件(必
选、可选或条件必选)和最大出现次数。当该元数据元素为条件必选时,应注明其约束条件。
5.1.8.1 约束/条件
说明元数据实体或元数据元素是否必须选取的属性。包括必选(M)、可选(O)和条件必选(C)。
--必选 M
表明该元数据实体或元数据元素必须选择。
--可选 O
根据实际应用可以选择也可以不选的元数据实体或元数据元素。已经定义的可选元数据实体和可选
元数据元素,可指导各业务数据元数据规范制定人员充分说明其业务信息资源。
如果一个可选元数据实体未被使用,则该实体所包含的元素(包括必选元素)也不选用。可选元数
据实体可以有必选元素,但只当可选实体被选用时才成为必选。
--条件必选 C
当满足约束条件中所定义的条件时必须选择。条件必选用于以下三种可能性之一:
a) 当在多个选项中进行选择时,至少一个选项必选,且必须使用;
b) 当另一个元数据元素已经使用时,选用一个元数据实体或元数据元素;
c) 当另一个元数据元素已经选择了一个特定值时,选用一个元数据元素。
5.1.8.2 最大出现次数
元数据实体或元数据元素可以具有的最大实例数目。只出现一次的用“1”表示,重复出现的用
“N”表示。不为 1 的固定出现次数可用相应的数字表示,如“2”、“3”、“4”等。
5.1.9 子元素
子元素是通过一定的表示规则以确定一个元数据子集或元数据实体中包含的下一级的元数据实体
或元数据元素。表示规则为:“标识符 = 表达式”。表达式中各符号的含义见表 1。
表 1 表达式的符号含义
符 号 含 义
= 由替换、生成,由组成
+ 与
| 或(选择)--在由“|”分开的两项之中选择其一
0{a}1
表示{}中的元数据元素 a 为可选项或条件必选项,且最大出现次数为 1;若为条件
必选项,约束/条件具体见其注解
0{a}n
表示{}中的元数据元素 a 为可选项或条件必选项,且最大出现次数为 N;若为条件
必选项,约束/条件具体见其注解
a 表示元数据元素 a 为必选项,且最大出现次数为 1
1{a}n 表示{}中的元数据元素 a 为必选项,且最大出现次数为 N
在子元素表示中,{}中均使用元数据元素或实体的中文名称。
例如:
子 元 素:数据集提供方 =
数据集提供单位+
0{数据集提供方电话}n+
0{数据集提供方地址}1+
0{数据集提供方电子邮件}n
5.1.10 扩展巴氏范式
扩展巴氏范式可以更加规范化的表示一个元数据子集或元数据实体与其下一级的元数据实体或元
数据元素之间的关系,便于系统实现。与子元素的表示法不同,扩展巴氏范式用“,”代替子元素中的
“+”表示“与”关系,{}中均使用该元数据元素的短名,并以“;”作为表达式的结尾。
例如:
扩展巴氏范式:IdPoC = rpOrgName, 0{cntPhone}n,0{cntAdd}1,0{eMail}n;
5.2 UML 图
5.2.1 概述
本标准采用统一建模语言(UML)描述元数据子集、元数据实体和元数据元素之间的关系。
在本标准中,用 UML 中包的概念表示元数据子集,用 UML 中类的概念表示元数据实体,用 UML
类的属性的概念表示元数据元素。
5.2.2 统一建模语言模型关系及符号说明
本标准涉及 UML 定义的下列几种模型关系,并采用 UML 静态结构图表示元数据实体间的关系。
(1) 关联
关联用于描述两个或更多类之间的一般关系,见图 1。
关联的方向必须说明。如果不指明方向,则假定为双向关联。如果是单向关联,关联方向可以在线
段终点用箭头来标记。
图 1 关联
(2) 聚合
聚合用于创建两个类之间的部分与整体的关系。在聚合关系中,一个类担当容器角色,另一个类
担当容器的构件角色,见图 2。
图 2 聚合
(3) 泛化
泛化表示超类与可以替代它的子类之间的关系,见图 3。超类是泛化类,而子类则定义为特化类。
图 3 泛化
(4) 依赖
依赖关系表示对一个元数据子集的理解、使用等依赖其他元数据子集,见图 4。
图 4 依赖
(5) 角色
模型中可以使用“角色名称”描述源对象与目标对象之间的关系。在双向关联中,提供两个角色名
称。
图 5 说明在 UML 模型中如何表示角色名称和基数。
图 5 UML 角色名称和基数
6 环境信息元数据框架
6.1 概述
环境信息元数据框架包括 8 个元数据子集:标识信息、覆盖范围信息、内容信息、维护信息、限制
信息、数据质量信息、分发信息和元数据描述信息。环境信息元数据框架如图 6 所示。
图 6 环境信息元数据框架
各元数据子集的内容见表 2。
表 2 环境信息元数据子集
序号 子集名称 子集内容
1 标识信息
标识信息包含唯一标识数据集的信息,内容包括环境信息的数据集名称、数据集发布
日期、数据集摘要、数据集提供方、关键字、数据集分类和数据量等信息。标识信息
实体是必选的。
2 覆盖范围信息
覆盖范围信息提供数据覆盖范围的描述信息,内容包括环境信息资源的空间范围和时
间范围。覆盖范围信息实体是必选的。
3 内容信息
内容信息提供数据内容特征的描述信息。内容信息实体是必选的。
环境信息各业务应用可根据需要重点扩展内容信息中的元数据。
4 维护信息 维护信息包含有关数据集的更新频率的信息。维护信息实体是可选的。
5 限制信息
限制信息包含访问和使用数据集的限制信息、数据集的信息公开属性。限制信息实体
是可选的。
6 数据质量信息 数据质量信息包含数据集的数据志说明信息。数据质量信息实体是可选的。
7 分发信息
分发信息包含获取数据集的途径分发格式信息,如在线资源链接地址。分发信息实体
是可选的。
8 元数据描述信息
元数据描述信息是对本标准制定的环境信息元数据的描述信息。元数据描述信息实体
是可选的。
6.2 环境信息元数据 UML 模型
6.2.1 标识信息
标识信息UML模型,见图7。
-数据集名称: string
-数据集发布日期: Date
-数据集摘要: string
-关键字: short
-数据量: string
-数据集标识符: string
-数据集保管期限: string
-数据集提供单位: string
-数据集提供方电话: string
-数据集提供方地址: string
-数据集提供方电子邮件: string
-类目名称: string
-类目编码: string
-分类标准: string
1..*
1..*
图 7 标识信息 UML 模型
6.2.2 覆盖范围信息
覆盖范围UML模型,见图8。
图 8 覆盖范围信息 UML 模型
6.2.3 内容信息
内容信息 UML 模型,见图 9。
图 9 内容信息 UML 模型
6.2.4 维护信息
维护信息 UML 模型,见图 10。
图 10 维护信息 UML 模型
6.2.5 限制信息
限制信息 UML 模型,见图 11。
图 11 限制信息 UML 模型
6.2.6 数据质量信息
数据质量信息 UML 模型,见图 12。
-数据志说明: string
-数据源说明: string
-处理步骤: string
-度量说明: string
-数据质量评价: string
图 12 数据质量信息 UML 模型
6.2.7 分发信息
分发信息 UML 模型,见图 13。
图 13 分发信息 UML 模型
6.2.8 元数据描述信息
元数据描述信息UML模型,见图14。
-元数据标识符: string
-元数据更新日期: Date
-元数据维护单位: string
-元数据维护方电话: string
-元数据维护方地址: string
-元数据维护方电子邮件: string
0..*
图 14 元数据描述信息 UML 模型
7 环境信息核心元数据内容
7.1 概述
环境信息核心元数据由 8 个元数据子集、23 个元数据实体和元数据元素组成,可用于环境信息数
据集的编目、数据交换活动和对数据集的描述。
环境信息核心元数据包含 10 个必选的元数据实体和元数据元素,分别是:
a) 数据集名称(7.2.1.1)
b) 数据集发布日期(7.2.1.2)
c) 数据集摘要(7.2.1.3)
d) 数据集提供方(7.2.1.4)
e) 关键字(7.2.1.5)
f) 数据集分类(7.2.1.6)
g) 数据集标识符(7.2.1.8)
h) 资源域(7.2.3.1)
i) 数据分发格式(7.2.7.2)
j) 元数据标识符(7.2.8.1)
环境信息核心元数据还包括 13 个可选和条件必选的元数据实体和元数据元素。
附录 C 提供了环境信息核心元数据示例。
用户进行元数据著录时,可参考附录 D 的核心元数据应用 XML 示例。
7.2 核心元数据定义
7.2.1 标识信息
定 义:唯一标识环境信息数据集所需的基本信息
英文名称:IdentificationInfo
数据类型:复合型
短 名:DataIdInfo
注 解:必选项;最大出现次数为 N
子 元 素:标识信息 =
数据集名称+
数据集发布日期+
数据集摘要+
1{数据集提供方}n+
1{关键字}n+
1{数据集分类}n+
0{数据量}1+
数据集标识符+
0{数据集保管期限}1
扩展巴氏范式:DataIdInfo=resTitle,0{pubDate}1,abstract,1{IdPoC}n,rpOrgName,1{keyword}n,1{TpCa
t}n,0{dataQuan}1,dataId,0{dataRet}1;
7.2.1.1 数据集名称
英文名称:title
定 义:环境信息数据集内容的标题
数据类型:字符串
值 域:自由文本
短 名:resTitle
注 解:必选项;最大出现次数为 1
7.2.1.2 数据集发布日期
英文名称:dateOfPublication
定 义:环境信息数据集提供方发布数据集的日期
数据类型:日期型
值 域:按 GB/T 7408 执行,格式为 CCYY-MM-DD
短 名:pubDate
注 解:必选项;最大出现次数为 1
7.2.1.3 数据集摘要
英文名称:abstract
定 义:对数据集内容进行概要说明的文字,可包含环境空间数据详细描述信息
数据类型:字符串
值 域:自由文本
短 名:abstract
注 解:必选项;最大出现次数为 1
7.2.1.4 数据集提供方
英文名称:PointOfContact
定 义:提供并对环境信息数据集负责的人或单位的名称和地址信息
数据类型:复合型
短 名:IdPoC
注 解:必选项;最大出现次数为 N
子 元 素:数据集提供方 =
数据集提供单位+
0{数据集提供方电话}n+
0{数据集提供方地址}1+
0{数据集提供方电子邮件}n
扩展巴氏范式:IdPoC=rpOrgName,0{cntPhone}n,0{cntAdd}1,0{eMail}n;
7.2.1.4.1 数据集提供单位
英文名称:organisationName
定 义:提供环境信息数据集的单位名称
数据类型:字符串
值 域:自由文本
短 名:rpOrgName
注 解:必选项;最大出现次数为 1
7.2.1.4.2 数据集提供方电话
英文名称:phone
定 义:数据集提供单位的联系电话号码
数据类型:字符串
值 域:自由文本
短 名:cntPhone
注 解:可选项;最大出现次数为 N
7.2.1.4.3 数据集提供方地址
英文名称:address
定 义:数据集提供单位的物理联系地址
数据类型:字符串
值 域:自由文本
短 名:cntAdd
注 解:可选项;最大出现次数为 1
7.2.1.4.4 数据集提供方电子邮件
英文名称:electronicMail
定 义:数据集提供单位的电子邮件地址
数据类型:字符串
值 域:自由文本
短 名:eMail
注 解:可选项;最大出现次数为 N
7.2.1.5 关键字
英文名称:keyword
定 义:概括环境信息数据集主要内容的通用词、形式化词或短语
数据类型:字符串
值 域:自由文本
短 名:keyword
注 解:必选项;最大出现次数为 N;可从特定的主题词典中选用或由各业务部门自定义填写
7.2.1.6 数据集分类
英文名称:TopicCategory
定 义:说明环境信息数据集分类方式及其相应的分类信息
数据类型:复合型
短 名:TpCat
注 解:必选项;......
|