| 标准编号 | GB/T 35890-2018 (GB/T35890-2018) | | 中文名称 | 高通量测序数据序列格式规范 | | 英文名称 | Technical specification of high throughput sequencing data format | | 行业 | 国家标准 (推荐) | | 中标分类 | A40 | | 国际标准分类 | 07.080 | | 字数估计 | 14,112 | | 发布日期 | 2018-02-06 | | 实施日期 | 2018-09-01 | | 发布机构 | 国家市场监督管理总局、中国国家标准化管理委员会 |
GB/T 35890-2018
Technical specification of high throughput sequencing data format
ICS 07.080
A40
中华人民共和国国家标准
高通量测序数据序列格式规范
2018-02-06发布
2018-09-01实施
中华人民共和国国家质量监督检验检疫总局
中国国家标准化管理委员会发布
前言
本标准按照GB/T 1.1-2009给出的规则起草。
本标准由全国生化检测标准化技术委员会(SAC/TC387)提出并归口。
本标准起草单位.深圳华大基因研究院、中国计量科学研究院。
本标准主要起草人.梁鑫明、刘心、蒋慧、杜佳婷、谢强、李倩一、李岱怡、王晶。
高通量测序数据序列格式规范
1 范围
本标准规定了高通量测序数据的序列格式,包括序列描述格式规范和高通量测序数据整体格式
规范。
本标准适用于规范生物体DNA高通量测序数据序列格式。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 30989 高通量基因测序技术规程
3 术语和定义
下列术语和定义适用于本文件。
3.1
高通量测序 high-throughputsequencing
以一次并行几十万到几百万条核酸分子序列测定和一般读长较短等为标志,适用于DNA的测序
技术。
注.改写GB/T 30989-2014,定义3.1.9。
3.2
测序片段 reads
高通量测序平台产生的含有碱基序列和质量值的序列片段。
3.3
双末端测序 paired-endsequencing
对DNA模板链和互补链分别测序,并得到两条链成对测序片段的测序技术。
3.4
插入片段长度 insertsize
双末端测序中,从模板链测序的测序片段左端到互补链测序的测序片段右端的距离。
3.5
测序片段识别码 readsidentifier
用以识别一段测序片段的具有唯一性的字符串。
3.6
碱基序列 basesequence
测序片段中记......
|