路径: 主页 > MISC > 第41页 > CYT160-2017
标准搜索结果: 'CYT160-2017'
| 标准编号 | CY/T 160-2017 (CY/T160-2017) | | 中文名称 | 主题分类词表描述规范 | | 英文名称 | (Topic classification vocabulary description specification) | | 行业 | 印刷出版行业标准 (推荐) | | 中标分类 | A19 | | 发布日期 | 2017-11-03 | | 实施日期 | 2018-02-01 | | 标准依据 | 行业标准备案公告2018年第1号(总第217号) | | 发布机构 | 国家新闻出版署 |
CY/T 160-2017: 主题分类词表描述规范
CY/T 160-2017 英文名称: (Topic classification vocabulary description specification)
主题分类词表描述规范
中华人民共和国新闻出版行业标准
1 范围
本标准规定了新闻出版领域主题分类词表的组成结构、编制、描述及更新与维护。
本标准适用于新闻出版领域主题分类词表的建设与维护。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 4894-2009 信息与文献 术语GB/T 25514-2010 健康信息学 健康受控词表 结构和高层指标
3 术语和定义下列术语和定义仅适用于本文件。
3.1主题分类词表 subject classification thesaurus由词汇表、分类表和特征表构成的规范词的集合。
3.2词汇表 terminology list在一个特定的领域表示系统性概念的词汇集合特征表 attribute list
表示人物、地理、机构或事件名称等属性的专用概念的集合。
3.4词条 terms用于特定目的的词或词组。
3.5类目 class至少具有一个共同特征的单元的
4 主题分类词表的组成
4.1 词表结构一个完整的主题分类词表由词汇表、分类表和特征表构成。主题分类词表结构
如图 1 所示,描述主题分类词表描述规范如下:
a) 词汇表,主题分类词表的核心表,对词条代码、词条名称、词条信息等进行描述;
b) 分类表,主题分类词表的辅助表,对词汇表中的词条进行分类,又称范畴表;
c) 特征表,主题分类词表的辅助表,对词汇表中的词条进行补充描述。
4.2 词汇表结构词汇表由词条代码、词条名称、词条释义和词条属性组成。词汇表的组成结构如图 2所示,描述如下:
a) 词条代码,描述词条名称的唯一代码,词条编码原则与方法见附录 A;
b) 词条名称,描述词条的中文名称、英文名称、汉语拼音名称和拉丁名称等一组信息;
c) 词条释义,描述词条的内涵和外延定,说明或解释性等文字;
d) 词条属性,描述词条的性质,包括词间关系、所属分类和所属特征等。
4.3 分类表结构
分类表由类号、类目和类目注释组成。分类表的组成结构如图 3 所示,描述如下:
a) 类号,标识类目的代码;b) 类目,通常由大类、中类和小类构成;
c) 类目注释,类目的说明性文字。
4.4 特征表结构
特征表由特征词类型、特征词代码、特征词和特征词注释组成。特征表组成结构如图 4 所示。特
征词编码方法与代码见附录 B。特征表结构描述如下:
a) 特征词类型,表示特征词所属关系;
b) 特征词代码,描述特征词的标识;
c) 特征词,描述事实、数值、概念、原理、技能和规则等知识类型的词;
d) 特征词注释,描述特征词的说明性文字。
5 主题分类词表的编制
5.1 词汇表编制
5.1.1 词源选词来源主要包括:
a) 工具型资源,包括辞/词典、主题词表、相关标准、年鉴、百科全书和手册等;
b) 法律法规资源,包括政策、法律和法规等;
c) 出版物资源,包括学术图书、学术期刊和报纸等;
d) 相关文献资源,包括学位论文、专利、会议和档案文献等;
e) 其他资源,包括网络词库和在线百科等。
5.1.2 选词选词的范围及基本原则包括:
a) 应符合所确定的专用词表的学科范围;
b) 应具有单一性,词形简洁、概念明确;
c) 应以名词或名词性词组为主,避免使用单字型动词,慎用形容词、副词和数量词;
d) 同一事物具有多个名称时均应入选;
e) 选用全称作为主题词。
5.1.3 确词确词的基本规则包括:
a) 依据词汇表所覆盖的学科范围,确定具有标引需求的词或词组;
b) 确定通用名词和术语以及专指性强、使用频率高的名词和词组;
c) 不采用由 2 个或 2 个以上概念所构成的复合词,不采用由整体和部分所构成的复合词。复合词
应避免使用标点符号。
5.1.4 释义词的释义基本规则包括:
a) 同一词条在不同场景下具有不同含义时,应注明其使用场景;
b) 词条定义易引起歧义时,须加词条注释;
c) 应使用自然词序,不应使用倒序形式。
5.1.5 词间关系
5.1.5.1 词间关系类型基本词间关系类型主要包括:
a) 等同关系。表示概念相同或相近的词间关系,包括全称与缩略同义、本名与别名同义等。词表
中通常采用“用”、“代”词间关系标识符;
示例:科学技术(正式主题词)D 科技(非正式主题词)
b) 层级关系。表示主题词概念中上位概念与下位概念的隶属关系;示例:联合国S 国际组织
c) 相关关系。某一主题词虽不具有同义和准同义关系,也不具有上位和下位关系,但使用中具有密切联系。
示例:技术评价C 可行性评价
5.1.5.2 词间关系符号词间关系符号使用 1 位汉语拼音字母表示,包括:
a)Y = 用,主题词指引符;b)D = 代,非正式主题词指引符;
c)S = 属,上位主题词指引符;d)F = 分,下位主题词指引符;
e)C = 参,参照词指引符;f)Z = 族,族首词指引符。
5.1.5.3 词间关系表达词间关系类型与符号的关系见表 1。
5.2 分类表编制5.2.1 选用分类表
根据学科范围和业务需求可选用成熟的分类体系,可参考各专业领域编制的分类表(法)或主题
词表中的分类表。
5.2.2 编制分类表当一个词汇表没有适用的分类法,可在现有分类法的基础上进行类目细化,或参考现有分类法进行编制。
5.3 特征表编制特征表作为分类表的扩展信息,由事实、数值、概念、原理、技能、规则和其他等知识类型的特
征词组成。各专业领域主题分类词表可根据需求编制特征表。
5.4 词表信息描述主题分类词表信息由中文名称、英文标签、说明、类型、可选性和取值组成。
主题分类词表信息要素参见附录 C。
6 主题分类词表的更新与维护
6.1 原则主题分类词表应定期修订并发布,增补、删除、修改的基本原则如下:
a) 随时记录原则,发现问题应随时记录并填写记录卡;
b) 及时修改原则,发现错误应立即修改并填写记录卡备案;
c) 定期更新原则,对于发现的问题统一协调,定期更新;
d) 逐步完善原则,新编主题分类词表需要在实践中逐步完善,发现问题及时记录,定期更新。
6.2 方法6.2.1 增补主题分类词表应根据应用情况的统计进行增补,增补新词应符合如下条件:
a) 反映新学科和新理论等概念和事件等,作为新词;b) 词表中无对应的词,作为新词;
c) 使用率、检索率高的热词,作为新词。
6.2.2 删除在使用中应及时删除错误的、重复的、过时的、标引率和检索率低下的词,
删除的词和代码不应重复使用。
6.2.3 修改在使用中发现词在类目、概念、词形、参照关系上存在矛盾或错误时应及时修改。
A.1 词条编码原则词条编码的基本原则包括:
a) 计算机可处理;b) 具有层级性;c) 具有唯一性;
d) 具有可扩展性;e) 具有冗余性。
A.2 词条编码方法词条编码的基本方法及要求包括:
a) 按照主题词的层级编码,每一层级编码数位尽量保持一致;
b) 可选择字母和数字组合方式编码;
c) 每个主题词应有一个唯一的编码。
附录 A(规范性附录)词条编码原则与方法
B.1 特征词编码方法用以标引词汇表中词条的属性特征,其编码方法由 1 位大写英
文字母和 1 位数字组成并可根据需求扩展。
B.2 特征词代码表由特征词类型、特征词代码、特征词和特征词注释构成。特征词代码表见表 B.1。
附录 B(规范性附录)特征词编码方法与代码
特征词类型 特征词代码 特征词 特征词注释
E9 其他技能 描述其他技能规则型 (F)
F1 法律 描述有关法律、法规的条文
F2 标准 描述针对某些问题制定的共同和重复使用的规则
F3 规章制度 描述规则和制度,约束相关人员行为和事务处理方法等
F9 其他规则 描述其他规则其他类型 (Z) Z 其他类型 描述其他类型
C.1 主题分类词表信息要素主题分类词表的信息要素见表 C.1。
附录 C(资料性附录)主题分类词表信息要素
中文名称 英文标签 说明 类型 可选性 取值
类目注释 < ClassNote > 对类目的说明 字符 有则必选
特征词表 < FeatureTable > 描述词表特征词表的一组信息 字符 有则必选
特征词类型 < FeatureTermType > 表示特征词所属类型 字符 有则必选
A=事实型B=数值型C=概念型D=原......
|