首页 购物车 询价
www.GB-GBT.com

[PDF] GB/T 36337-2018 - 英文版

标准搜索结果: 'GB/T 36337-2018'
标准号码内文价格美元第2步(购买)交付天数标准名称状态
GB/T 36337-2018 英文版 519 GB/T 36337-2018 [PDF]天数 <=5 信息处理用藏语词类标记集 有效

基本信息
标准编号 GB/T 36337-2018 (GB/T36337-2018)
中文名称 信息处理用藏语词类标记集
英文名称 The parts-of-speech tagging set for Tibetan information processing
行业 国家标准 (推荐)
中标分类 L70
国际标准分类 35.240.01
字数估计 26,249
发布日期 2018-06-07
实施日期 2019-01-01
发布机构 国家市场监督管理总局、中国国家标准化管理委员会

GB/T 36337-2018 The parts-of-speech tagging set for Tibetan information processing ICS 35.240.01 L70 中华人民共和国国家标准 信息处理用藏语词类标记集 2018-06-07发布 2019-01-01实施 国 家 市 场 监 督 管 理 总 局 中国国家标准化管理委员会 发 布 目次 前言 Ⅲ 引言 1 1 范围 1 2 术语和定义 1 3 标记符号 1 4 词类标记集 1 5 词类标记集中主要词类的特征 11 6 词类及标记代码的说明 14 参考文献 20 前言 本标准按照GB/T 1.1-2009给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本标准起草单位:中国电子技术标准化研究院、西藏大学、西藏自治区藏语文工作委员会办公室、西 北民族大学、青海师范大学、青海民族大学、中国科学院软件研究所、西藏自治区工业和信息化厅。 本标准主要起草人:扎西加、欧珠、尼玛扎西、熊涛、格桑多吉、多拉、拉巴泽仁、大罗桑朗杰、高定国、 拉琼、仁青诺布、索南尖措、旺堆、小尼玛扎西、普次仁、顿珠次仁、赵栋材、边巴嘉措。 引 言 本标准以现代藏语的词类和分词研究成果为基础,根据藏文自身的词汇特点与构词规律,并参考汉 语分词及词类标记相关标准(见参考文献)的内容,规定了信息处理中藏语词类标记集。 信息处理用藏语词类标记集 1 范围 本标准规定了信息处理中藏语词类标记集。 本标准适用于藏文信息处理各领域,其他行业和有关学科可参照使用。 2 术语和定义 下列术语和定义适用于本文件。 2.1 词类 partsofspeech;POS 依据词的句法功能原则所划分的类。 2.2 分词单位 segmentunit 在分词过程中出现的词。 注:分词单位不仅限于语法词,其中也包含了信息处理所需的一部分结合紧密、使用稳定的词组。 2.3 词类标注 POStagging 对分词文本中的每个分词单位标注上词类的过程。 2.4 用计算机对藏文的音、形、义等信息进行处理。 3 标记符号 本标准中标记符号采用英文字母、汉语拼音字母及藏文拉丁转写字母。 4 词类标记集 4.1 名词 (n) 表示......

相关标准: GB/T 37344  GB/T 36333  GB/T 36332  GB/T 37344