标准搜索结果: 'GB 18030-2022'
标准编号 | GB 18030-2022 (GB18030-2022) | 中文名称 | 信息技术 中文编码字符集 | 英文名称 | Information technology - Chinese coded character set | 行业 | 国家标准 | 中标分类 | L71 | 国际标准分类 | 35.040 | 字数估计 | 748,738 | 发布日期 | 2022-07-19 | 实施日期 | 2023-08-01 | 旧标准 (被替代) | GB 18030-2005 |
GB 18030-2022: 信息技术 中文编码字符集
GB 18030-2022 英文名称: Information technology - Chinese coded character set
ICS 35.040
CCSL71
中华人民共和国国家标准
代替GB 18030-2005
信息技术 中文编码字符集
国 家 市 场 监 督 管 理 总 局
国 家 标 准 化 管 理 委 员 会 发 布
1 范围
本文件规定了信息技术用的中文图形字符及其二进制编码的十六进制表示。
本文件适用于中文和其他文字图形字符信息的处理、交换、存储、传输、显现、输入和输出。
本文件适用于为具备中文和其他文字图形字符信息化处理及交换功能的技术类产品,包括但不限
于以输入法、光学字符识别(OCR)、编辑校对、机器翻译、语音合成、文字转写、智能写作等为代表的软
件产品,以及以计算机、通信终端设备、电子书阅读器、学习机等为代表的硬件产品。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文
件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于
本文件。
GB/T 2312-1980 信息交换用汉字编码字符集 基本集
GB/T 11383-1989 信息处理 信息交换用八位代码结构和编码规则
GB/T 13000 信息技术 通用多八位编码字符集(UCS)
3 术语和定义
下列术语和定义适用于本文件。
4.1 概述
本文件收录的字符以单字节、双字节或四字节编码。
4.2 单字节部分
单字节部分收录了GB/T 11383-1989的0x00~0x7F全部128个字符。
4.3 双字节部分
双字节部分收录了GB/T 2312-1980中的全部图形字符、GB/T 13000中的CJK统一汉字以及部
分图形字符。双字节部分的字符按照附录A的规定。其中,表意文字描述符的图形、代码位置和功能
应符合附录B的规定。
注:GB/T 13000对中国、日本、韩国、越南等国家和地区使用的汉字统一编码。具备独有抽象字形的汉字,赋予单
独的代码位置;来源不同而抽象字形相同的汉字,则赋予共用的代码位置。经过编码的汉字称为CJK统一汉字
4.4 四字节部分
四字节部分收录了上述双字节字符之外的GB/T 13000中的66个CJK统一汉字(9FA6~9FEF,
不包括9FB4~9FBB的8个字符)、CJK统一汉字扩充A、CJK统一汉字扩充B、CJK统一汉字扩充C、
CJK统一汉字扩充D、CJK统一汉字扩充E、CJK统一汉字扩充F和已经在GB/T 13000中编码的少数
民族文字的字符。四字节部分的字符按照附录C的规定。
5 总体结构
正文中凡数字前标有0x的表示采用十六进制,未标有0x的表示采用十进制。附录中凡编码的表
示均采用十六进制,其他数字的表示均采用十进制。
单字节部分采用GB/T 11383-1989的......
|