路径: 主页 > GB/T > 第225页 > GB/T 46350-2025

[PDF] GB/T 46350-2025 - 英文版

标准搜索结果: 'GB/T 46350-2025'

标准号码	美元	购买PDF	工期	标准名称(英文版)
GB/T 46350-2025	439	GB/T 46350-2025	<=4	信息技术云计算智能云服务通用要求

基本信息
标准编号	GB/T 46350-2025 (GB/T46350-2025)
中文名称	信息技术云计算智能云服务通用要求
英文名称	Information technology - Cloud computing - General requirements of AI cloud service
行业	国家标准 (推荐)
中标分类	L70
国际标准分类	35.240.01
字数估计	22,229
发布日期	2025-10-05
实施日期	2026-02-01
发布机构	国家市场监督管理总局、国家标准化管理委员会

GB/T 46350-2025: 信息技术云计算智能云服务通用要求 ICS 35.240.01 CCSL70 中华人民共和国国家标准信息技术云计算智能云服务通用要求 AIcloudservice 2025-10-05发布 2026-02-01实施国家市场监督管理总局国家标准化管理委员会发布目次前言 Ⅲ 1 范围 1 2 规范性引用文件 1 3 术语和定义 1 4 缩略语 1 5 能力框架 2 6 基础设施要求 3 6.1 资源 3 6.2 资源管理 4 6.3 加速 5 6.4 任务管理和调度 6 7 模型开发要求 6 7.1 数据处理 6 7.2 模型构建 8 7.3 模型管理 9 7.4 模型部署 11 7.5 模型推理 11 7.6 数据闭环 12 7.7 大模型提示工程 12 7.8 大模型指令调优 12 7.9 MLOps工作流 12 7.10 LMOps工作流 13 8 模型服务要求 13 8.1 计算机视觉类 13 8.2 语音类 13 8.3 自然语言处理类 14 8.4 多模态类 14 9 人工智能应用开发要求 14 9.1 开发环境 14 9.2 应用开发框架 14 9.3 应用组件 14 9.4 应用模板 14 9.5 知识管理 15 9.6 应用管理 15 参考文献 16 前言本文件按照GB/T 1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。本文件起草单位:北京百度网讯科技有限公司、中国电子技术标准化研究院、华为云计算技术有限公司、浪潮云信息技术股份公司、天翼云科技有限公司、中移(苏州)软件技术有限公司、广州市品高软件股份有限公司、中国人民解放军国防科技大学、阿里云计算有限公司、深信服科技股份有限公司、北京华胜天成科技股份有限公司、中兴通讯股份有限公司、济南浪潮数据技术有限公司、中移雄安信息通信科技有限公司、中移(杭州)信息技术有限公司、北京天融信网络安全技术有限公司、湖南麒麟信安科技股份有限公司、京东科技信息技术有限公司、上海商汤智能科技有限公司、浪潮电子信息产业股份有限公司、中国移动通信有限公司研究院、北京银信长远科技股份有限公司、安超云软件有限公司、中国烟草总公司湖南省公司、电子科技大学、中国科学院信息工程研究所、杭州谐云科技有限公司、荣联科技集团股份有限公司、哈尔滨工业大学、清华大学、北京国信网联科技有限公司、甘肃同兴智能科技发展有限责任公司、中航材导航技术(北京)有限公司、广东粤电信息科技有限有限公司、深圳聚瑞云控科技有限公司、广东车卫士信息科技有限公司、深圳市易连汇通科技有限公司、宝德计算机系统股份有限公司、北京大道云行科技有限公司、北京厚普医药科技有限公司、广州赋安数字科技有限公司、深圳市五兴科技有限公司、海天地数码科技(北京)有限公司、桂林理工大学、江西云眼视界科技股份有限公司、北京金智达管理顾问有限公司、澳克多普有限公司、广脉科技股份有限公司、北京智慧易科技有限公司、四川汉唐云分布式存储技术有限公司、苏州明逸智库信息科技有限公司、广东博今信息技术集团有限公司。本文件主要起草人:宋飞、陈行、贾超、王志鹏、杨丽蕴、玄凌博、谢永康、刘增志、查丽、赵华、张敏、郑佳佳、杨明、苗子聪、郭旸、徐军、林冬艺、黄继承、包涵、王意洁、吴涛、朱松、刘晨、魏胜平、梁钢、李响、亓开元、张坤、姚飞、宁溯、张风雷、喻涵、张朝潞、雷晓锋、杨鹏举、邓旺波、刘辰、韩冬、吴庚、代文斌、鲁璐、叶丰华、范亚梅、毛浣渠、季寒德、鞠万里、郭晓、许刚、邹暾、李益文、罗光春、陈爱国、边鹏旭、王翱宇、王向东、王静、刘奇旭、吴晓清、谭儒、李伟泽、徐冠群、乔霖、陈志峰、王程安、王瑞敏、李幸、闫纪红、黄双喜、杨思维、高宇、曹建农、詹越、孙沛、王林军、胡周达、林禧桐、郭文艺、曾俭、张云霞、刘爱贵、张芳、梁华、赵亚云、董广明、刘刚、罗军、王文迪、谢晓兰、唐涛、赵本金、王巍、赵淑飞、关涛、聂琨林、王亮、彭黎。信息技术云计算智能云服务通用要求 1 范围本文件确立了智能云服务能力框架,规定了智能云服务基础设施、模型开发、模型服务、人工智能应用开发等方面的要求。本文件适用于指导智能云服务的设计、开发、部署、使用和测评。 2 规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 32400-2015 信息技术云计算概览与词汇 3 术语和定义 GB/T 32400-2015界定的以及下列术语和定义适用于本文件。 3.1 云计算 cloudcomputing 通过网络将可伸缩、弹性的共享物理和虚拟资源池以按需自服务的方式供应和管理的模式。注:资源包括服务器、操作系统、网络、软件、应用和存储设备等。 [来源:GB/T 32400-2015,3.2.5,有修改] 3.2 云服务 cloudservice 通过云计算(3.1)已定义的接口提供的一种或多种能力。 [来源:GB/T 32400-2015,3.2.8] 3.3 智能云服务 AIcloudservice 支撑或提供人工智能能力的云服务。注:人工智能能力指模型开发、模型服务、人工智能应用开发等。 4 缩略语下列缩略语适用于本文件。 P2P:点对点(peer-to-peer) 5 能力框架智能云服务通过云服务方式为用户提供AI算力资源和人工智能能力,支持人工智能应用,帮助用户高效、便捷、低成本获取和使用人工智能云服务。智能云服务能力框架见图1,包括基础设施、模型开发、模型服务、人工智能应用开发等能力,智能云服务提供其中一种或多种组合能力,各层功能如下: a) 基础设施:提供面向人工智能的基础设施功能,进行创建和管理人工智能算力集群,提交和调度任务,基于加速库使用异构计算资源(包括裸金属、虚拟机、容器等),支撑人工智能负载运行; b) 模型开发:提供模型开发工具链,包括数据处理、模型构建、模型管理、模型部署、模型推理、数据闭环等模型开发通用功能,和提示工程、指令调优等大模型开发功能,以及 MLOps、LMOps 工作流,支撑人工智能模型在云端的训练、优化、管理和部署; c) 模型服务:提供多种模型的云服务功能,包括计算机视觉类、语音类、自然语言处理类、多模态类等,满足用户在云端使用预训练好的模型; d) 人工智能应用开发:提供AI应用开发工具链,包括开发环境、应用开发框架、应用组件、应用模板、知识管理、应用管理等,降低人工智能应用开发门槛,提升人工智能应用开发效率,支撑用户在具体业务场景中应用人工智能技术。图1 智能云服务能力框架 6 基础设施要求 6.1 资源 6.1.1 计算资源 6.1.1.1 裸金属裸金属要求包括: 注:裸金属指未预装操作系统和虚拟化软件,提供物理服务器资源的云服务。 a) 应支持不同类型的人工智能加速处理器,包括GPU、ASIC、FPGA等; b) 应支持不同数量的人工智能加速处理器; c) 应支持神经网络计算,如卷积计算、向量计算、标量计算等; d) 应支持人工智能加速处理器的多卡P2P通信; e) 应支持人工智能加速处理器间互联,如CCIX、PCIe等互联方式。 6.1.1.2 虚拟机虚拟机要求包括: a) 应支持不同类型的人工智能加速处理器,包括GPU、ASIC、FPGA等; b) 应支持不同数量的人工智能加速处理器; c) 应支持神经网络计算,如卷积计算、向量计算、标量计算等; d) 应支持人工智能加速处理器在单卡分片模式下多实例间计算单元、显存单元的隔离; e) 宜支持人工智能加速处理器在单卡分片模式下多实例间编解码的隔离; f) 应支持人工智能加速处理器的多卡P2P通信; g) 应支持人工智能加速处理器间互联,如CCIX、PCIe等互联方式。 6.1.1.3 容器容器要求包括: a) 应支持不同类型的人工智能加速处理器,包括GPU、ASIC、FPGA等; b) 应支持不同数量的人工智能加速处理器,如1卡、2卡、4卡、8卡等; c) 应支持神经网络计算,如卷积计算、向量计算、标量计算等; d) 应支持人工智能加速处理器的多卡P2P通信; e) 应支持单卡和多卡人工智能加速处理器共享和隔离。 6.1.2 存储资源存储资源要求包括: a) 应支持块存储服务; b) 应支持并行文件存储服务; c) 应支持对象存储服务; d) 宜支持对象存储数据挂载到并行文件存储。 6.1.3 网络资源网络资源要求包括: a) 计算节点间和容器间应支持 RDMA 网络,如采用InfiniBand、基于融合以太网的 RDMA (RoCE)等网络协议; 注:计算节点包括裸金属和虚拟机。 b) 应支持多租户间RDMA网络隔离; c) 应支持多租户间性能隔离,如带宽隔离、包速率隔离等。 6.2 资源管理 6.2.1 计算资源管理 6.2.1.1 裸金属管理裸金属管理要求包括: a) 应支持对裸金属的生命周期管理,如创建、关机、启动、重启、释放等; b) 应提供包含多种人工智能加速处理器驱动程序的操作系统镜像。 6.2.1.2 虚拟机管理虚拟机管理要求包括: a) 应支持对虚拟机的生命周期管理,如创建、关机、启动、重启、释放等; b) 应提供包含多种人工智能加速处理器驱动程序的虚拟机镜像; c) 应支持虚拟机配置变更,如调整挂载的显卡数量。 6.2.1.3 容器管理容器管理要求包括: a) 应支持容器的生命周期管理,如创建、删除等; b) 应提供包含多种人工智能加速处理器驱动程序的容器镜像; c) 应支持容器配置变更,如调整挂载的显卡数量。 6.2.2 存储资源管理存储资源管理要求包括: a) 应支持块存储的创建、删除、权限管理、访问和查询; b) 应支持并行文件存储的挂载、卸载、权限管理、访问和查询; c) 应支持对象存储的创建、删除、权限管理、访问和查询; d) 宜支持对象存储的挂载管理。 6.2.3 网络资源管理网络资源管理应支持配置RDMA网络隔离。 6.2.4 集群资源管理集群资源管理要求包括: a) 应支持集群生命周期管理,如集群创建、删除等; b) 应支持集群节点手动、自动扩缩容; c) 应支持多种计算资源集群类型,如裸金属集群、虚拟机集群、容器集群等。 6.3 加速 6.3.1 计算加速计算加速要求包括: a) 应支持基础算子加速,如ElementWise类算子、Tensor与矩阵计算类算子、Tensor变换类算子、池化类算子等; b) 应支持融合算子加速,如ConvolutionBiasRelu等; c) 宜支持多种开源模型的训练和推理加速; d) 宜支持采用多种异构计算芯片进行训练和推理加速; e) 可提供根据环境配置自动匹配并行策略的工具; f) 可提供模型权重格式转换与切分工具,在不同训练框架中对模型权重进行格式转换与切分。 6.3.2 存储加速存储加速要求包括: a) 应支持对接不同类型的数据源,如对象存储、文件存储、块存储等; b) 应支持多种缓存结构,如内存缓存、磁盘缓存等; c) 应支持配置数据缓存策略,如动态加载、预加载、缓存准入、缓存替换等; d) 宜支持以层级命名空间访问数据源; e) 宜支持人工智能加速处理器读写数据; f) 可提供检查点异步加速工具,减少检查点存储写入时间。 6.3.3 通信加速通信加速要求包括: a) 应支持集合通信的语义,如Send、recv、al-gather等; b) 应支持节点内的拓扑感知; c) 应支持节点间的拓扑感知; d) 应支持感知网络慢速的节点; e) 宜支持通信算子卸载到硬件(如交换机、智能网卡等)。 6.4 任务管理和调度 6.4.1 任务管理任务管理要求包括: a) 应支持任务生命周期管理,如创建、删除、启动、暂停、恢复等; b) 应支持多种任务提交方式,如命令行、控制台、API等; c) 应支持多种类型的任务,包括训练任务、推理任务等; d) 应支持多种场景的任务资源配额配置; e) 应支持查看任务信息,如运行状态信息、监控和日志信息等; f) 应支持任务使用计算资源的弹性扩缩容; g) 可支持多层级资源配额设置。 6.4.2 任务调度任务调度要求包括: a) 应支持拓扑感知调度,如人工智能加速处理器间拓扑感知调度、节点间网络拓扑感知调度等; b) 应支持同一任务中多个实例的资源批量调度; c) 应支持按人工智能加速处理器的类型调度; d) 应支持共享与独占任务调度; e) 应支持任务优先级调度; f) 应支持抢占式调度,如队列内抢占、队列间抢占等; g) 应支持任务调度时,本队列在资源不足时向其他队列借用资源; h) 应支持多种调度策略,如Binpack、Spread等; i) 宜支持训练与推理任务混合调度; j) 宜支持单一任务同时调度多种人工智能加速处理器进行混合训练。 6.4.3 任务容错任务容错要求包括: a) 应支持多种故障判断,如任务异常退出、假死等; b) 应支持多种任务恢复方式,如本地重启恢复、自动重调度恢复等。 7 模型开发要求 7.1 数据处理 7.1.1 数据接入数据接入要求包括: a) 应支持接入多种来源的数据,如块存储、文件存储和对象存储等; b) 应支持接入结构化和半结构化数据,如csv、tsv、txt、parquet等数据类型; c) 应支持接入非结构化数据,包括图片、语音、文本等数据类型; d) 应支持接入压缩包文件; e) 宜支持周期性接入数据,如按照设置的时间间隔定期接入数据等; f) 宜支持接入加密数据。 7.1.2 数据预处理数据预处理要求包括: a) 应支持结构化数据的清洗,如数据拆分、异常值检测、缺失值填充等; b) 应支持非结构化数据的清洗,根据特定规则剔除不符合要求的非结构化数据,如内容去重等; c) 应支持自定义数据预处理功能,如用户自定义预处理算法等; d) 宜支持自动预处理。 7.1.3 数据标注数据标注要求包括: a) 应支持多种数据类型的标注工具或模板,如文本类、表格类、图片类、音视频类等; b) 应支持对标注标签、标注属性等标注信息的管理,如编辑、删除和查询等; c) 应支持可视化标注,标注信息在原始数据直观呈现; d) 应支持团队标注的管理,如任务管理、人员管理等; e) 应支持对标注的评估,如准确性、有效性等; f) 应支持对标注数据、标签等标注结果导出; g) 宜支持智能标注,如调用算法或外部服务自动标注数据、通过训练算法自动标注等。 7.1.4 数据管理数据管理要求包括: a) 应支持数据集的生命周期管理,如创建、删除、导入、导出、发布等; b) 应支持统一管理图片、文本、音频、视频、表格等类型数据; c) 应支持有标注数据和无标注数据的导入、导出、查看; d) 应支持数据集信息的展示和查询,如原始数据、数据标注信息、标签信息等; e) 应支持数据集的管理,如权限管理、版本管理等; f) 应支持数据集的共享。 7.1.5 数据分析数据分析要求包括: a) 应支持结构化数据的预览; b) 应支持非结构化数据的预览,如文本、图片、视频、音频等类型数据; c) 应支持数据集的分析,如数据集的统计特征分析、质量特征分析等; d) 应支持数据分析的可视化,如数据分布可视化、标签分布可视化等; e) 宜支持数据集重构,如通过清洗、集合、填充、过滤等操作形成新的数据集; f) 宜支持多种维度的数据质检,如样本的数量、完整度、分布等。 7.1.6 数据增强数据增强要求包括: a) 应支持文本类数据的多种数据增强策略,如回译、同义词替换、非核心词替换等; b) 应支持图片类数据的多种数据增强策略,如几何变换、扭曲图像、加噪声、色彩抖动等; c) 宜支持音频类数据的多种数据增强策略,如加噪声、调整音量、调整混响等时域增强策略,或调整音高、调整播放速度、频谱交换等频域增强策略; d) 可支持多种类型数据的自动增强,如文本类数据、图片类数据、音频类等; e) 可支持对指令数据集和多轮会话数据集的数据扩充和增强; f) 可支持对提示词数据集的转换和增强。 7.2 模型构建 7.2.1 算法仓库算法仓库要求包括: a) 应支持多种机器学习算法的存储和查询,如分类、回归、聚类等; b) 应支持多种深度学习算法的存储和查询,如卷积神经网络、循环神经网络等; c) 应支持多种计算机视觉类算法的存储和查询,如目标检测、图像分类、文字识别等; d) 应支持多种语音类算法的存储和查询,如声音分类等; e) 应支持多种自然语言处理类算法的存储和查询,如文本分类、文本实体抽取、情感分析等; f) 应支持自定义算法的存储和查询,如自定义名称、唯一标识、算法组件等; g) 宜支持迁移学习和强化学习等算法的存储和查询; h) 宜支持时序状态数据处理算法的存储和查询,如时序预测等。 7.2.2 算法管理算法管理要求包括: a) 应支持算法的生命周期管理,如设计、开发、测试、部署等; b) 应支持算法的版本管理,如版本号管理、版本发布等; c) 应提供算法相关信息的说明,如算法效果、性能等; d) 宜支持管理同一算法的多种语言版本或运行环境; e) 宜提供算法适用场景的使用示例和说明。 7.2.3 特征工程特征工程要求包括: a) 应提供特征提取,如按照给定的定义提取特征; b) 应支持多种特征选择方式,如Gini增益、信息增益、信息值等; c) 应支持特征组合,如将多个特征组织组合或衍生为新的特征等; d) 应支持特征转换,如数据归一化、标准化、分箱、数值替换等; e) 应支持数据降维,如主成分分析、线性判别分析等; f) 宜支持自定义特征工程方法; g) 宜支持特征分析可视化,如特征指标的图表可视化等; h) 宜支持特征异常评估,如基于统计方法、距离方法或谱方法等方法进行异常点检测; i) 宜支持特征库的管理,如特征存储、分享、特征库接入等; j) 宜支持多种自动特征工程,如自动特征选择、自动特征衍生等。 7.2.4 开发环境开发环境要求包括: a) 应支持交互式编码环境; b) 应支持对代码的增加、删除、修改和查看; c) 应支持线上IDE环境; d) 应支持多种机器学习框架,如Scikit-learn、XGB oost等; e) 应支持多种深度学习框架,如TensorFlow、PyTorch; f) 应支持开发环境的管理,如增加、删除、查看、修改等; g) 宜支持自定义开发环境,如以镜像方式提供自定义的开发环境。 7.2.5 模型训练模型训练要求包括: a) 应支持单机多卡、多机多卡和跨地域多节点等分布式训练; b) 应支持配置训练资源,如CPU核数、GPU个数、内存、GPU显存等; c) 应支持自定义训练参数,如算法参数、运行参数、训练数据、验证数据等; d) 应支持训练任务的生命周期管理,如创建、删除、重启等; e) 应支持对训练任务的状态进行定时检查点保存; f) 应支持查看训练任务的信息,如训练状态、训练进度、训练结果、训练失败原因等; g) 应支持多种模型再训练方式,如基于预训练模型微调、算法选择和参数调优等; h) 应支持模型训练过程的可视化,如训练参数、训练指标、模型图的可视化; i) 宜支持自定义代码的模型训练; j) 宜提供自动调参工具,根据模型及数据量自动设定参数; k) 宜支持人工智能加速处理器单卡虚拟化后多模型训练方式; l) 宜支持对大规模无监督数据的预训练任务,如千亿规模语言模型的预训练。 7.2.6 模型调优模型调优要求包括: a) 应支持机器学习类模型的效果和性能调优,如分类模型、聚类模型、回归模型、序列预测模型等; b) 应支持生成类模型调优评估,对模型效果进行对比; c) 应支持增加、删除或修正训练数据集样本,实现模型调优和效果对比; d) 应支持设置多种模型超参数实现模型调优和效果对比,如全量数据迭代数、批量样本数量等; e) 应支持多种自动模型调优和效果对比的策略,如EarlyStopping方法、超参网格搜索等; f) 宜支持异常样本检测,如通过修正数据标签、挖掘潜在噪声样本等优化模型进行检测; g) 宜支持设置模型权重,实现模型调优和效果对比,如boosting模式等; h) 宜支持通过编辑神经网络层结构实现模型调优和效果对比,如隐藏层节点数、数据块大小、优化方法等; i) 宜支持生成式模型的有监督精调、DPO对齐等优化方法。 7.3 模型管理 7.3.1 模型仓库 ......

英文网页English: GB/T 46350-2025

相关标准: GB/T 43195|GB/T 46346|GB/T 46345|GB/T 43195|