路径: 主页 > GB/T > 第672页 > GB/T 43584.2-2023
标准搜索结果: 'GB/T 43584.2-2023'
| 标准编号 | GB/T 43584.2-2023 (GB/T43584.2-2023) | | 中文名称 | 生物技术 大规模并行测序 第2部分:测序数据的质量评估 | | 英文名称 | Biotechnology - Massively parallel sequencing - Part 2: Quality evaluation of sequencing data | | 行业 | 国家标准 (推荐) | | 中标分类 | A40 | | 国际标准分类 | 07.080 | | 字数估计 | 22,287 | | 发布日期 | 2023-12-28 | | 实施日期 | 2023-12-28 | | 发布机构 | 国家市场监督管理总局、中国国家标准化管理委员会 |
GB/T 43584.2-2023: 生物技术 大规模并行测序 第2部分:测序数据的质量评估
ICS 07.080
CCSA40
中华人民共和国国家标准
生物技术 大规模并行测序
第2部分:测序数据的质量评估
(ISO 20397-2:2021,IDT)
2023-12-28发布
2023-12-28实施
国 家 市 场 监 督 管 理 总 局
国 家 标 准 化 管 理 委 员 会 发 布
目次
前言 Ⅲ
引言 Ⅳ
1 范围 1
2 规范性引用文件 1
3 术语和定义 1
4 原始数据 5
4.1 通则 5
4.2 原始数据文件 5
4.3 原始数据的质量评估 5
4.4 原始数据预处理 7
5 序列比对与定位 7
5.1 通则 7
5.2 序列比对与定位文件格式 7
5.3 序列比对和定位的质量控制 8
5.4 比对后处理 9
6 变异识别 9
6.1 通则 9
6.2 变异识别的数据文件 9
6.3 变异识别的质量指标 10
6.4 假阳性变异处理 10
6.5 序列注释 10
7 验证 10
7.1 通则 10
7.2 质量指标验证 10
8 文件 11
附录A(资料性) 特定 MPS平台示例的质量指标 12
附录B(资料性) 按应用划分的覆盖范围和推荐读序 13
附录C(资料性) 序列比对和定位软件 14
参考文献 15
前言
本文件按照GB/T 1.1-2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定
起草。
本文件是GB/T 43584《生物技术 大规模并行测序》的第2部分。
GB/T 43584已经发布了以下部分:
---第2部分:测序数据的质量评估。
本文件等同采用ISO 20397-2:2021《生物技术 大规模并行测序 第2部分:测序数据的质量评
估》。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由全国生化检测标准化技术委员会(SAC/TC387)提出并归口。
本文件起草单位:中国测试技术研究院生物研究所、江汉大学、中国测试技术研究院、深圳华大生命
科学研究院、河北省食品检验研究院、成都医学院、深圳华汉基因生命科技有限公司、浙江贝兰伯生物技
术有限公司、深检集团(深圳)医学检验实验室。
本文件主要起草人:周李华、李怀平、叶善蓉、易艳、王丹、姜展樾、魏晓锋、林华、樊东生、陈佳平、
叶德萍、彭海、冯双、王奇、马丽侠、张岩、张勇、杨俊、张才敏、蒋慧、杨国武。
引 言
大规模并行测序(MPS)是一种利用大规模并行处理进行核酸测序的高通量分析方法,该方法可在
相对较短时间内对不同生物体的全基因组、转录组和特定靶核酸进行研究。
MPS已用于许多生命科学领域,可对数百万乃至数千万个核苷酸碱基进行测定和高通量分析。生
物体内脱氧核糖核酸和核糖核酸聚合物的生物变异为准确测定序列带来了挑战。通过 MPS测定,序
列质量取决于许多因素,包括但不限于样品质量、文库制备、平台选择及测序数据质量。
GB/T 43584拟由以下部分构成:
---第1部分:核酸和文库制备。第1部分主要提供基础研究,目的在于规定了测序和数据生成前
文库制备和文库质量评估的一般准则和注意事项。
---第2部分:测序数据的质量评估。第2部分基于第1部分开展具体操作和数据质量控制并为
第3部分提供研究基础。
---第3部分:宏基因组学的总体要求和指南。第3部分包含第1部分、第2部分,规定了宏基因
组学从样品制备、生成和分析测序数据的准则。
测序数据分析在数据存储、计算时间和变异检测准确性等多个领域均对生物信息学提出较大的挑
战。与测序数据相关的主要挑战之一是监测数据处理流程各个阶段的质量控制指标,此点易被忽视。
了解数据质量对下游序列分析至关重要。核酸测序数据处理与分析的质量控制可分为三个阶段:原始
数据、比对和变异识别。本文件提供了 MPS测序数据质量评估的注意事项,以及针对不同的 MPS平
台提供具体建议。
生物技术 大规模并行测序
第2部分:测序数据的质量评估
1 范围
本文件明确了对大规模并行测序数据进行质量评估的整体要求和建议。涵盖了原始数据生成后的
程序、序列比对和变异识别。
本文件提供了大规模并行测序(MPS)数据验证和存档的一般指南。
本文件不适用于与从头组装相关的任何处理。
2 规范性引用文件
本文件没有规范性引用文件。
3 术语和定义
下列术语和定义适用于本文件。
3.1
接头序列 adaptersequence
接头 adapter
一种已知序列的人工寡核苷酸,可连接到核酸片段的3'端或5'端。
注:它提供引物位点以及对测序插入序列片段所需的其他必要序列。
3.2
算法 algorithm
完全确定的有限序列指令,通过它可以从输入变量的值计算输出变量的值。
[来源:IEC 60050-351:2013,351-42-27,有修改]
3.3
碱基识别 basecaling
将大规模并行测序原始电信号转化为核苷酸序列的计算过程。
注:碱基识别的应用和算法的性能由读序和共有序列准确性来确定。
3.4
对程序、脚本或软件的整......
|