标准搜索结果: 'GB 13000-2010'
| 标准编号 | GB 13000-2010 (GB13000-2010) | | 中文名称 | 信息技术 通用多八位编码字符集(UCS) | | 英文名称 | [GB/T 13000-2010] Information technology -- Universal multiple-octet coded character set (UCS) | | 行业 | 国家标准 | | 中标分类 | L71 | | 国际标准分类 | 35.040 | | 字数估计 | 1476,116 | | 发布日期 | 2011-01-10 | | 实施日期 | 2011-11-01 | | 旧标准 (被替代) | GB 13000.1-1993 | | 引用标准 | GB/T 2311-2000; GB/T 5261-1994; UNICODE STANDARD ANNEX UAX#9 THE UNICODE BIDIRECTIONAL ALGORITHM VERSION 4.0 2003; UNICODE STANDARD ANNEX UAX#15 UNICODE NORMALIZATION FORMS VERSION 4.0 2003 | | 采用标准 | ISO/IEC 10646-2003, IDT | | 标准依据 | 国家标准批准发布公告2011年第1号(总第166号) | | 发布机构 | 中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会 | | 范围 | 本标准规定了通用多八位编码字符集。本标准适用于世界上各种语言的书面形式以及附加符号的表示、传输、交换、处理、存储、输入及显现。 |
GB 13000-2010
ICS 35.040
L71
中华人民共和国国家标准
代替GB 13000.1-1993
信息技术 通用多八位编码字符集(UCS)
(ISO/IEC 10646:2003,IDT)
2011-01-10发布
2011-11-01实施
中华人民共和国国家质量监督检验检疫总局
中国国家标准化管理委员会发布
目次
前言 Ⅲ
引言 Ⅳ
1 范围 1
2 符合性 1
3 规范性引用文件 2
4 术语和定义 2
5 UCS的总体结构 6
6 基本结构及术语 7
7 UCS的总体要求 10
8 基本多文种平面 10
9 辅助平面 11
10 专用平面和专用区 11
11 UCS的修订与更新 11
12 子集 12
13 UCS的编码表示形式 12
14 实现的级别 12
15 控制功能与UCS的联合使用 13
16 标识特征的声明 13
17 代码表与字符名称清单的结构 14
18 块名称 15
19 双向语境中的字符 15
20 特殊字符 16
21 字符的显现形式 22
22 兼容字符 22
23 字符的顺序 22
24 规范化形式 22
25 组合用字符 23
26 个别文字的特性 24
27 CJK汉字的字源参考 25
28 字符名称及注释 28
29 基本多文种平面的结构 30
30 用于文字和符号编码的辅助多文种平面结构 32
31 辅助表意文字平面的结构 33
32 辅助特殊用途平面的结构 34
33 代码表和字符名称清单 34
附录A(规范性附录) 用于子集的图形字符的汇集 1353
附录B(规范性附录) 组合字符清单 1373
附录C(规范性附录) 00组16个平面的转换格式(UTF-16) 1388
附录D(规范性附录) UCS转换格式8(UTF-8) 1392
附录E(资料性附录) 双向语境中的镜像字符 1397
附录F(资料性附录) 替代格式字符 1403
附录G(资料性附录) 按字母排序的字符名称清单 1410
附录H (资料性附录) 使用“标记”标识UCS 1411
附录J(资料性附录) 对具有内部存储器的接收/始发组合设备的建议 1412
附录K(资料性附录) 八位值表示的标记法 1413
附录L(资料性附录) 字符命名导则 1414
附录 M (资料性附录) 字符来源 1417
附录N(资料性附录) 对字符字汇的外部参考 1422
附录P(资料性附录) 字符的附加信息 1424
附录Q(资料性附录) 朝鲜文代码映射表 1428
附录R(资料性附录) 朝鲜文名称 1429
附录S(资料性附录) CJK汉字的认同和排序规则 1454
附录T(资料性附录) 使用标签字符的语言标记法 1467
附录U(资料性附录) 音乐符号的使用 1469
前言
本标准的体系结构与基本多文种平面部分是强制性的,其余为推荐性的。
本标准等同采用国际标准ISO/IEC 10646:2003《信息技术 通用多八位编码字符集(UCS)》(英文
版)。为便于读者理解,本标准在第1章增加了脚注,在附录S(资料性附录)的最后增加了“S.4对‘CJK
汉字认同和排序规则’的补充说明”。
本标准代替GB 13000.1-1993《信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构
与基本多文种平面》。
本次修订对1993年版的主要变动如下:
a) 朝鲜文及其补充从基本多文种平面的3400~4DFF移至基本多文种平面的AC00~D7FF(原
O区,即第一版的保留区),空出的代码位置分配给新增的CJK统一汉字扩充A;
b) 增加收录多种我国少数民族文字及其他文字、字符,如藏文、蒙古文、彝文等;
c) 新增用于UTF-16的S区(代理区),代码位置是基本多文种平面的D800~DFFF(原O区,即
第一版的保留区),并有专门的附录对其进行说明;
d) 增加了辅助平面,包括00组01平面(文字和符号辅助多文种平面)、00组02平面(辅助表意
文字平面,用于CJK统一汉字扩充B和CJK兼容汉字补充)和00组0E平面(辅助特殊用途
平面)。
本标准的附录A、附录B、附录C和附录D是规范性附录,附录E、附录F、附录G、附录 H、附录J、
附录K、附录L、附录 M、附录N、附录P、附录Q、附录R、附录S、附录T和附录U是资料性附录。
本标准由中华人民共和国工业和信息化部提出。
本标准由全国信息技术标准化技术委员会(SAC/TC28)归口。
本标准起草单位:中国电子信息产业发展研究院、中国电子技术标准化研究所、教育部语言文字应
用研究所、中国科学院软件研究所、北京北大方正电子有限公司。
本标准主要起草人:张轴材、陈壮、王晓明、吴健、尹江红、何正安。
本标准于1993年首次发布,本次为第一次修订。
引 言
本标准规定了通用多八位编码字符集(UCS)。它适用于世界上各种语言(文字)的书面形式以及
附加符号的表示、传输、交换、处理、存储、输入及显现。
通过对多文种文本的编码的一致性的定义,本标准使得数据的国际交换成为可能。信息技术产业
获得了数据的稳定性,更强的全球可互操作性和数据可交换性。转化为本国家标准的国际标准ISO/
IEC 10646已经在新的互联网协议中广泛采用,并被当今的操作系统和计算机语言所实现。本标准收
纳了95000多个世界上多种文字的字符。
本标准包含了一些电子化资料,它们适用于使用机读格式数据的用户。这些资料由下列可打印文
件组成:
---CJKU_SR.txt
---CJKC_SR.txt
---Alnames.txt
---HangulX.txt
---HangulSy.txt
用户可向本标准归口单位(中国电子技术标准化研究所)索取上述电子化资料。
地址:北京市东城区安定门东大街1号(北京市1101信箱)
邮编:100007
电话:84043004
信息技术 通用多八位编码字符集(UCS)
1 范围
本标准规定了通用多八位编码字符集(UCS)。
本标准适用于世界上各种语言(文字)的书面形式以及附加符号的表示、传输、交换、处理、存储、输
入及显现。
本标准:
---规定了GB 13000的体系结构;
---定义了GB 13000中使用的术语;
---描述了本编码字符集的总体结构;
---规定了UCS的基本多文种平面(BMP);
---规定了UCS的若干个辅助平面:辅助多文种平面(SMP)、辅助表意文字平面(SIP),以及辅助
特殊用途平面(SSP);
---定义了一个图形字符集,用于世界各种语言的手写和书面形式;
---规定了BMP、SMP、SIP、SSP的图形字符的名称及编码表示;
---规定了UCS的肆八位(32位)正则形式:UCS-4;
---规定了UCS的双八位(16位)BMP形式:UCS-2;
---规定了控制功能的编码表示;
---规定了未来对编码字符集进行增补的管理办法。
UCS是一种与GB/T 2311规定的编码体系不同的编码体系。本标准16.2规定了从GB/T 2311
中指明UCS的方法。
本标准中任意一个图形字符,无论是在BMP平面还是在辅助平面,只分配唯一的一个码位1)。
1) 实际上,上述“一字一码”的原则在本标准的下列情形中,作了特别处理:
a) 不同文种的同形字符是分别编码的,比如拉丁A,希里尔文A和希腊文A,就是分别编码的;
b) CJK同一源字集中的同形字符,可能在CJK统一汉字编码区和CJK兼容汉字编码区中分别编码;
注:UnicodeStandard的4.0版包括了与本标准等同的字符集、名称和编码表示。为了便于实现,它还提供了字符
属性、处理算法以及定义的细节。
2 符合性
2.1 总则
专用字符一旦按本标准规定的方法使用,这些专用字符本身就不再受下列符合性要求的约束。
2.2 信息交换的符合性
如在编码信息内用于交换的编码字符数据元素符合以下条件,则符合本标准:
a) 在该编码字符数据元素内的全部图形字符的编......
|