| 标准编号 | GB/T 46019.2-2025 (GB/T46019.2-2025) | | 中文名称 | 塑料 再生塑料成分鉴别 第2部分:聚丙烯(PP)材料 | | 英文名称 | Plastics - Identification of recycled plastics - Part 2: Polypropylene(PP) materials | | 行业 | 国家标准 (推荐) | | 中标分类 | G31 | | 国际标准分类 | 83.080.01, 13.030.50 | | 字数估计 | 26,250 | | 发布日期 | 2025-08-01 | | 实施日期 | 2026-02-01 | | 发布机构 | 国家市场监督管理总局、国家标准化管理委员会 |
GB/T 46019.2-2025: 塑料 再生塑料成分鉴别 第2部分:聚丙烯(PP)材料
ICS 83.080.01;13.030.50
CCSG31
中华人民共和国国家标准
塑料 再生塑料成分鉴别
第2部分:聚丙烯(PP)材料
2025-08-01发布
2026-02-01实施
国 家 市 场 监 督 管 理 总 局
国 家 标 准 化 管 理 委 员 会 发 布
目次
前言 Ⅲ
引言 Ⅳ
1 范围 1
2 规范性引用文件 1
3 术语和定义 1
4 原理 2
5 模型构建与评估 2
6 待测样品鉴别 6
附录A(资料性) 原生PP和再生PP鉴别流程 8
附录B(资料性) 原生PP和再生PP典型的总离子流色谱图 11
附录C(资料性) 原生PP和再生PP鉴别的典型标志性挥发性组分 14
附录D(资料性) 随机森林模型超参数组合设置示例 15
附录E(资料性) 原生PP和再生PP鉴别示例 16
参考文献 19
前言
本文件按照GB/T 1.1-2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定
起草。
本文件是GB/T 46019《塑料 再生塑料成分鉴别》的第2部分。GB/T 46019已发布以下部分:
---第1部分:聚对苯二甲酸乙二醇酯(PET)材料;
---第2部分:聚丙烯(PP)材料。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中国石油和化学工业联合会提出。
本文件由全国塑料标准化技术委员会(SAC/TC15)归口。
本文件起草单位:广州海关技术中心、循环新材(邯郸)有限公司、北京市科学技术研究院分析测试
研究所(北京市理化分析测试中心)、东芝家用电器制造(南海)有限公司、福建华盛铭兔环保科技有限公
司、知里科技(广东)有限公司、广州仕天材料科技有限公司、北京华塑晨光科技有限责任公司、江苏赛维
尔新材料科技有限公司、中石化(北京)化工研究院有限公司、中蓝晨光成都检测技术有限公司、宁波海
关技术中心、山东道恩高分子材料股份有限公司、广州质量监督检测研究院、同轨科技成都有限公司、
浙江宝绿特环保技术工程有限公司、天津大学、贵州大学、珠海格力新材料有限公司、暨南大学、广东丙
辛新材料有限公司、金发科技股份有限公司、上海化工研究院有限公司、广东顺威赛特工程塑料开发有
限公司、福建省纤维检验中心、万容日丽新材料(湖南)有限公司、烟台正海合泰科技股份有限公司、青岛
海关技术中心、浙江金彩新材料有限公司、湖南众科新材料有限公司、深圳日高胶带新材料有限公司、
湖北博韬合纤股份有限公司、深圳市海兴隆塑胶五金制品有限公司、上海前石科技有限公司、中质标研
(北京)标准化服务中心、上海睿聚环保科技有限公司。
本文件主要起草人:苏启枝、钟怀宁、李卓英、高峡、霍耀楠、魏育南、杨青华、文江河、郑慧琴、李丹、
张朔、薛燕波、谢鹏、罗川、王泽方、叶元坚、陈宏愿、欧晢文、李忠磊、张珍明、杨伟业、林勤保、张梅、周景楠、
郑雯、沈贤婷、具嘉峻、杨化浩、陈敏剑、朱峰、宋镇、韦明、刘杰、王仑、孙侠、孙利明、李崀、赵磊、张世博、
丁海波、吴卫均、卢宁、张长安、熊维、么虹任、李洲、罗晓霞、史迎杰。
引 言
构建废弃物循环利用体系是我国实施全面节约战略、保障国家资源安全、积极稳妥推进碳达峰碳中
和目标、加快绿色转型步伐的重要举措。消费后塑料的回收与再利用作为废弃物循环利用的重要组成
部分,不仅能够减少资源浪费和环境污染,还能有效降低碳排放,是推动塑料行业绿色高效发展的重要
方向。聚丙烯(PP)作为一种广泛应用于包装、汽车、家电等领域的热塑性塑料,其消费后废弃物的高效
回收与再利用,对于促进资源循环、推动塑料产业绿色高效发展具有重要意义。
塑料材料在使用、废弃和回收过程中可能会引入各种杂质。然而,与化学回收不同,机械回收难以
完全去除消费后塑料中的杂质。因此,机械回收再生PP[也称为PP(REC)]在挥发性组分特征上与原
生PP存在一定差异。通过对PP材料中挥发性组分进行分析,可以筛选出典型的标志性挥发性组
分,为原生与再生PP的鉴别提供基础依据。
本文件基于顶空气相色谱-质谱联用(HS-GC-MS)技术对原生PP和再生PP样品中挥发性组分进
行分析,筛选出典型的挥发性组分,并结合随机森林分类模型,给出再生PP概率预测值,实现对样品是
否为消费后机械回收再生PP的鉴别。
为确保检测方法的科学性和可靠性,本文件结合现行相关标准,明确了样品制备方法、仪器参考条
件、数据处理的规范流程,以及模型构建与评估的具体步骤,旨在为塑料再生行业提供系统化、可重复、
可溯源的技术指导,助力塑料废弃物的高效循环利用。
GB/T 46019《塑料 再生塑料成分鉴别》拟由三个部分构成。
---第1部分:聚对苯二甲酸乙二醇酯(PET)材料。目的在于确立再生PET材料鉴别的方法。
---第2部分:聚丙烯(PP)材料。目的在于确立再生PP材料鉴别的方法。
---第3部分:聚乙烯(PE)材料。目的在于确立再生PE材料鉴别的方法。
塑料 再生塑料成分鉴别
第2部分:聚丙烯(PP)材料
1 范围
本文件描述了采用顶空气相色谱-质谱法测定聚丙烯(PP)材料的挥发性组分,使用随机森林算法
构建预测模型,鉴别消费后机械回收再生PP塑料材料与原生PP塑料材料的方法。
本文件适用于以消费后PP为原料,通过粉碎、筛选、分类、清洗、熔融挤出造粒等工艺制成的颗粒
状PP再生塑料材料的鉴别。
本文件不适用于通过化学回收得到的再生PP塑料材料的鉴别。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文
件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于
本文件。
GB/T 2035 塑料 术语
GB/T 30102 塑料废弃物的回收和再利用指南
GB/T 40006.1 塑料 再生塑料 第1部分:通则
GB/T 41867 信息技术 人工智能 术语
GB/T 45090 塑料 再生塑料的标识和标志
3 术语和定义
GB/T 2035、GB/T 30102、GB/T 40006.1、GB/T 45090和GB/T 41867界定的以及下列术语和定
义适用于本文件。
3.1
消费后塑料 post-consumerplastic
已经实现了其预期用途或不能再使用(包括从流通环节中返回的塑料)的、由终端用户产生的塑料。
[来源:GB/T 30102-2024,3.3,有修改]
3.2
随机森林模型 randomforestmodel
通过构建多个决策树并汇总其预测结果来进行分类或回归的机器学习方法。
3.3
基尼不纯度 giniimpurity
衡量数据集纯度的指标,即随机从数据集中选取两个样本,它们属于不同类别的概率。
注:基尼不纯度越小,则数据集的纯度越高。
3.4
网格搜索 gridsearch
在预设的超参数组合范围内逐一训练模型并评估性能,确定最优的超参数组合的系统化超参数优
化方法。
3.5
在不同分类阈值下,通过计算假阳性率与真阳性率并汇制其关系曲线,用于评估分类模型区分正负
样本的能力。
注:受试者工作特征曲线下面积(ROC-AUC)作为模型整体判别能力的量化指标,值越接近1表示性能越好。
3.6
精确率 precision
模型预测为正类的样本中,实际为正类的比例。
3.7
召回率 recal
所有实际为正类的样本中,被模型正确识别为正类的比例。
4 原理
PP材料在其整个生命周期(包括使用、废弃和机械回收阶段)中,可能会引入或失去多种挥发性组
分,导致再生PP与原生PP的挥发性组分有所不同。因此,可基于顶空气相色谱-质谱联用(HS-GC-
MS)技术,通过分析足够数量来源明确的原生PP和再生PP中挥发性组分的组成特征,筛选出标志性
挥发性组分,并基于其定量离子峰面积构建和验证随机森林模型。对待测样品,采用相同的分析方法测
定其标志性挥发性组分,并将其定量离子峰面积数据输入上述模型中,给出再生PP概率预测值,用于
再生PP鉴别。
注:原生PP和再生PP鉴别的流程见附录A。
5 模型构建与评估
5.1 样品收集
为确保模型的稳定性和适用性,收集足够数量且具备代表性的原生PP和再生PP样品用于模型构
建。原生PP与再生PP样品各不应少于75批次,并涵盖不同来源、生产工艺和生产厂家。为避免样本
类别分布失衡,任一类别(原生PP或再生PP)在全部样本中的比例不应超过60%。
5.2 样品分析
5.2.1 试剂和材料
5.2.1.1 标准品
5.2.1.1.1 正构烷烃(C7~C23,共17种)混合标准溶液,溶剂为正己烷,每种物质质量浓度均为
1000μg/mL。
5.2.1.1.2 D8-萘(CAS号:1146-65-2),纯度≥99.5%(质量分数)。
5.2.1.2 试剂
无水乙醇:色谱纯。
5.2.2 仪器和设备
5.2.2.1 顶空气相色谱-质谱联用仪:配有EI源,顶空进样器的使用温度不低于150℃。
5.2.2.2 顶空瓶:20mL,带铝质盖及四氟乙烯硅橡胶垫。
5.2.2.3 分析天平:感量0.01mg。
5.2.2.4 分析天平:感量0.1mg。
5.2.3 溶液配制
5.2.3.1 D8-萘储备液(1000μg/mL)
称量10mg(精确至0.01mg)的D8-萘(5.2.1.1.2)于10mL容量瓶,使用无水乙醇(5.2.1.2)溶解定
容至刻度,混匀后备用。
5.2.3.2 D8-萘工作液(10μg/mL)
移取1.00mLD8-萘储备液(5.2.3.1)于100mL容量瓶,加入无水乙醇稀释定容至刻度,混匀后
备用。
5.2.3.3 D8-萘工作液(0.3μg/mL)
移取3.00mLD8-萘工作液(5.2.3.2)于100mL容量瓶,加入无水乙醇稀释定容至刻度,混匀后
备用。
5.2.4 仪器设置
5.2.4.1 顶空参考条件
顶空参考条件如下:
a) 平衡温度:150℃;
b) 平衡时间:30min;
c) 进样体积:1mL。
注:等效采用手动顶空进样方式是可行的。
5.2.4.2 气相色谱-质谱参考条件
由于测试结果取决于所使用仪器,因此不可能给出气相色谱-质谱分析的通用参数。设定的参数应
保证色谱测定时各组分能够得到有效的分离,下列给出的参数证明是可行的:
a) 色谱柱:(5%-苯基)-甲基聚硅氧烷气相色谱柱,长30m,内径250m,膜厚0.25m,或等效柱;
b) 升温程序:起始40℃,以5℃/min的速率升至200℃,再以30℃/min升至300℃;
c) 载气:氦气,流速1.0mL/min;
d) 进样方式:不分流;
e) 气相色谱-质谱接口温度:250℃;
f) 进样口温度:250℃;
g) 离子源温度:230℃;
h) 质谱四极杆温度:150℃;
i) 数据采集模式:全扫描,扫描范围45m/z~200m/z。
5.2.5 样品分析
5.2.5.1 向干净的顶空瓶中加入20μLD8-萘工作液(5.2.3.3),按照5.2.4仪器参考条件进行分析。
注:D8-萘定量离子(136m/z)的信噪比(S/N)大于3有利于提高鉴别准确性。
5.2.5.2 按照5.2.4仪器参考条件对干净的顶空瓶进行分析,作为空白样品。
5.2.5.3 向干净的顶空瓶中加入2μL正构烷烃混合标准溶液(5.2.1.1.1),按照5.2.4仪器参考条件进
行分析。
5.2.5.4 向干净的顶空瓶中加入20μLD8-萘工作液(5.2.3.2),按照5.2.4仪器参考条件进行分析。应
进行不少于2次独立测试。
5.2.5.5 向干净的顶空瓶中称取1.5g样品(精确至0.1mg),按照5.2.4仪器参考条件进行分析。应进
行不少于2次独立测试。
5.3 色谱数据处理
5.3.1 正构烷烃保留时间提取
对正构烷烃混合标准样品(见5.2.5.3)谱图进行处理,得到每个正构烷烃物质的保留时间。
5.3.2 D8-萘定量离子峰面积提取
对D8-萘样品(见5.2.5.4)谱图进行处理,提取136m/z离子,积分峰面积。
5.3.3 样品挥发性组分色谱峰信息提取
对每个样品的挥发性组分数据进行峰检测,提取定量离子(以质谱图中最大丰度离子计)、进行平滑
处理和峰面积积分(基于定量离子)。同时,提取定性离子,并计算其相对于定量离子的相对丰度,最后
提取保留时间信息。附录B给出了原生和再生PP典型的总离子流色谱图。
5.3.4 保留指数计算
基于标准正构烷烃的保留时间,按照公式(1),计算各挥发性组分的保留指数(I)
Ii= n+
log
ti
tn
log
tn+1
tn
êê
úú
×100 (1)
式中:
Ii ---当前挥发性组分的保留指数;
i ---当前挥发性组分;
n ---位于当前挥发性组分保留时间前且与其保留时间最接近的一个正构烷烃的碳原子数;
ti ---当前挥发性组分的保留时间,单位为分(min);
tn ---位于当前挥发性组分保留时间前且与其最接近的一个正构烷烃的保留时间,单位为分
(min);
tn+1---位于当前挥发性组分保留时间后且与其最接近的一个正构烷烃的保留时间,单位为分
(min);
100 ---缩放因子,用于标准化保留指数的数值范围。
5.3.5 挥发性组分峰面积数据汇总
不同样品中某单一挥发性组分的保留指数偏差不超过20,且定量离子一致、定性离子相对丰度符
合表1规定的最大允许相对误差范围,即判定为相同挥发性组分,将这些组分在各样品中的峰面积进行
汇总,构建样品挥发性组分峰面积数据矩阵。
表1 定性离子丰度比的最大允许相对偏差
定性离子丰度相对于定量离子的比例 最大允许相对误差
>50% ±15%
>20%~50% ±20%
>10%~20% ±30%
≤10% ±50%
注:若样品中某一挥发性组分的峰面积小于5倍空白样品,则认为该组分没有检出,其峰面积记为0。
5.3.6 相对峰面积计算
按照公式(2),计算各挥发性组分的相对峰面积。
Ai_rel=
Ai
Aint
(2)
式中:
Ai_rel---当前挥发性组分的定量离子相对峰面积;
i ---当前挥发性组分;
Ai ---当前挥发性组分的定量离子峰面积;
Aint ---同一批次样品中D8-萘(136m/z)的平均峰面积。
5.4 模型构建
5.4.1 软件要求
所使用的软件应支持随机森林算法实现,并提供分层随机抽样、交叉验证及超参数优化功能;能够
输出模型评估指标,包括分类准确率和ROC-AUC;支持结果可视化功能,如绘制受试者工作特征曲线
(ROC)和特征重要性排序图等。
注:模型构建有多种软件实现方式,包括但不限于R语言的tidymodels、Python的scikit-learn。本文件研制过程中
所使用的模型是基于R语言的tidymodels构建的。
5.4.2 训练集与测试集划分
对5.3处理后的数据按样品类别(原生PP和再生PP)进行分层随机抽样,选取80%作为模型训练
集A1,其余20%作为测试集B1。在划分过程中,应确保训练集和测试集中样品类别的比例一致,且同
一样品的平行数据不应同时出现在训练集和测试集中。
5.4.3 数据预处理
对于相对峰面积为0的数据,统一赋值为对应组分在训练集A1中所有非零相对峰面积的最小值
的1/10。
5.4.4 标志性挥发性组分筛选与确定
基于数据预处理后的训练集A1,以样品类别为目标变量,所有挥发性组分为特征变量,构建随机森
林辅助模型,用于评估变量重要性。通过计算各挥发性组分在该模型中导致的基尼不纯度平均减少
量,量化其对再生PP鉴别的重要性,并按重要性从高到低排序,筛选出若干典型的标志性挥发性组分。
筛选后的标志性组分数量不应少于20个。附录C列出了25个用于原生PP和再生PP鉴别的典型标
志性挥发性组分,包括其保留指数、定性离子和定量离子信息。可直接采用附录C中列出的标志性挥
发性组分,也可结合当前训练集重新进行筛选。
筛选完成后,应在预处理后训练集A1和测试集B1中统一保留筛选后的标志性挥发性组分,形成
筛选后的训练集A2和测试集B2,确保模型的训练和评估基于相同的挥发性组分。
注:筛选过程中排除不适合作为判别依据的组分是必要的,例如柱流失物质(如硅氧烷),以及在空白中频繁出现且
在实际样品中的丰度与空白无显著差异的组分(如烷烃)。
5.4.5 超参数调优
使用保留了筛选后挥发性组分的训练集A2,以样品类别为目标变量,筛选出的标志性挥发性组分
为特征变量,结合10倍交叉验证和网格搜索的方法,对随机森林模型的3个关键超参数进行联合优化。
需要优化的关键超参数包括:决策树的数量,每次节点分裂时随机选择的特征数量,以及每个叶子节点
的最小样本数。
训练集A2内部按照样品类别进行分层随机抽样,将数据划分为10个互斥子集,用于10倍交叉验
证。在划分过程中,应确保各子集中样品类别的比例一致,且同一样品的平行数据不应同时出现在不同
子集中。该划分在超参数调优过程中保持固定。
为每个超参数预设候选取值范围,每个超参数应设置不少于3个水平,构建超参数组合的网格(示
例见附录D)。遍历所有预设的超参数组合,对于每一组超参数,均基于上述10个互斥子集进行模型训
练与验证。每轮交叉验证中,依次选取一个子集作为验证子集,其余子集作为训练子集,在训练子集上
拟合模型后,在对应的验证子集上进行预测,并计算该轮验证的受试者工作特征曲线下面积(ROC-
AUC)。完成10轮交叉验证后,汇总各轮验证的ROC-AUC值,并计算其平均值。
以每组超参数组合对应的平均 ROC-AUC值作为模型性能的评估指标。平均 ROC-AUC值越
高,表明该超参数组合在训练集上具有更优的鉴别能力。
注:在R语言的tidymodels中,这些参数对应为trees、mtry和 min_n。
5.4.6 超参数选择与最终模型训练
根据超参数调优的结果,选择平均ROC-AUC值最高的超参数组合作为最优超参数组合。使用训
练集A2,结合最优超参数组合,重新训练随机森林模型,构建最终的鉴别模型。
5.5 模型评估
将保留了筛选后挥发性组分的测试集B2数据输入最终鉴别模型中进行预测,评估其鉴别准确率、
ROC-AUC、精确率和召回率(以再生PP为正类)。模型应满足以下要求:
a) 鉴别准确率不低于95%;
b) ROC-AUC不低于0.95;
c) 再生PP(正类)的精确率和召回率均不低于0.90;
d) 测试集准确率与训练集准确率的差异应小于3%。
注:若使用第三方提供的鉴别模型,但在使用前,对其性能进行验证是必要的。验证时,分析不少于10个原生PP
和10个再生PP样品是必要的,并对其标志性挥发性组分进行汇总后输入模型进行预测。模型在验证样品中
的鉴别准确率不低于95%是可接受的。
6 待测样品鉴别
6.1 在进行待测样品鉴别前,应确保仪器没有标志性挥发性组分的残留。
6.2 按照5.2.3的方法配制D8-萘工作液。
6.3 按照5.2.4的条件设置顶空-气相色谱色谱仪。
6.4 按照5.2.5的方法分别按顺序对空白样品、正构烷烃混合标准溶液、D8-萘工作液和待测样品进行
分析。待测样品应进行3次独立测试。
6.5 根据5.4.4筛选出的标志性挥发组分,对待测样品的独立测试结果进行处理,对标志性挥发组分的
定量离子峰面积进行积分和汇总,并计算其相对D8-萘的相对峰面积。对于相对峰面积为0的数据,统
一赋值为对应组分在训练集A1中所有非零相对峰面积的最小值的1/10。
6.6 将待测样品每次独立测试的数据输入到最终的随机森林模型(见5.4.5)中进行预测,按照以下原
则进行判定:
a) 若模型预测测试结果的再生概率≥0.5,鉴别样品为再生PP;
b) 若模型预测测试结果的再生概率< 0.5,则鉴别为原生PP;
c) 依据三次独立测试结果中鉴别类型占多数的结果为最终鉴别结果。
附录E给出了原生PP和再生PP鉴别的具体示例。
附 录 A
(资料性)
原生PP和再生PP鉴别流程
A.1 鉴别待测PP材料是否为再生PP的流程图
鉴别待测PP材料是否为再生PP的流程图见图A.1。
图A.1 鉴别待测PP材料是否为再生PP的流程图
A.2 原生PP与再生PP鉴别模型构建流程图
原生PP与再生PP鉴别模型构建流程图见图A.2。
图A.2 原生PP与再生PP鉴别模型构建流程图
A.3 原生PP与再生PP鉴别标志性挥发性组分筛选和确定流程图
原生PP与再生PP鉴别标志性挥发性组分筛选和确定流程图见图A.3。
图A.3 原生PP与再生PP鉴别标志性挥发性组分筛选和确定流程图
附 录 B
(资料性)
原生PP和再生PP典型的总离子流色谱图
B.1 原生PP典型总离子流色谱图
原生PP典型总离子流色谱图见图B.1~图B.3。
图B.1 原生PP典型总离子流色谱图1
图B.2 原生PP典型总离子流色谱图2
图B.3 原生PP典型总离子流色谱图3
B.2 再生PP典型总离子流色谱图
再生PP典型总离子流色谱图见图B.4~图B.6。
图B.4 再生PP典型总离子流色谱图1
图B.5 再生PP典型总离子流色谱图2
图B.6 再生PP典型总离子流色谱图3
附 录 C
(资料性)
原生PP和再生PP鉴别的典型标志性挥发性组分
原生PP和再生PP鉴别的25种典型标志性挥发性组分见表C.1。表C.1中列出的典型标志性挥
发性组分来源于对170个原生PP样品和119个再生PP样品的分析结果。基于这些标志性挥发性组
分,随后构建并优化了随机森林模型。需要注意的是,随着再工艺的不断进步,再生PP的挥发性组分
特征可能发生变化,部分标志性组分的适用性可能受到影响。因此,在实际应用时,结合最新数据,定期
评估并更新模型及标志性组分是必要的,以确保方法的长期有效性。
表C.1 原生PP和再生PP鉴别25种典型标志性挥发性组分
序号 保留指数(I) 定量离子 定性离子(相对丰度)
1 1014 111 125(43%)、154(30%)
2 1028 68 93(72%)、136(15%)
3 1031 81 108(75%)、154(57%)
4 1042 84 99(60%)、67(23%)
5 1083 118 117(85%)、103(53%)
6 1143 142 58(70%)、86(16%)
7 1180 119 91(27%)、134(25%)
8 1213 133 134(85%)、105(40%)
9 1333 147 91(75%)、75(15%)
10 1342 138 95(48%)、193(43%)
11 1399 170 141(50%)、77(32%)
12 1411 161 91(85%)、189(52%)
13 1460 177 135(40%)、149(34%)
14 1502 161 175(38%)、189(24%)
15 1597 105 106(14%)、91(10%)
16 1629 91 147(20%)、175(11%)
17 1640 91 133(16%)、105(7%)
18 1659 173 174(14%)、128(10%)
19 1662 91 119(45%)、105(15%)
20 1724 91 161(18%)、175(17%)
21 1822 91 105(18%)、161(14%)
22 1829 91 147(64%)、105(15%)
23 1855 149 150(9%)、104(5%)
24 1899 175 177(75%)、189(75%)
25 1959 149 150(9%)、104(4%)
附 录 D
(资料性)
随机森林模型超参数组合设置示例
随机森林模型调优过程中使用的超参数组合设置示例见表D.1。
表D.1 随机森林模型超参数组合设置示例
决策树的数量 每次节点分裂时随机选择的特征数量 每个叶子节点的最小样本数
500 4 2
500 4 4
500 4 6
500 5 2
500 5 4
500 5 6
500 6 2
500 6 4
500 6 6
750 4 2
750 4 4
750 4 6
750 5 2
750 5 4
750 5 6
750 6 2
750 6 4
750 6 6
1000 4 2
1000 4 4
1000 4 6
1000 5 2
1000 5 4
1000 5 6
1000 6 2
1000 6 4
1000 6 6
附 录 E
(资料性)
原生PP和再生PP鉴别示例
E.1 模型
E.1.1 收集来自不同来源的170批次原生PP和119批次再生PP样品。
E.1.2 按照5.2的方法进行挥发性组分分析。
E.1.3 按照5.3的方法进行数据处理和汇总,所得数据作为模型构建的输入数据。汇总示例见表E.1。
表E.1 模型构建所用输入数据汇总示例
样品 类别 组分1 组分2 组分3 组分4 组分5 组分6 组分7
原生PP1-1 原生PP
原生PP1-2 原生PP
再生PP1-1 再生PP
再生PP1-2 再生PP
注:组分1、组分2、组分3等对应的是所有检测到的挥发性组分,相应数值为该组分的相对峰面积。
E.1.4 按照5.4的方法划分数据集,进行数据处理,并基于基尼不纯度平均减少量筛选出25个典型标
志性挥发性组分(见表C.1),使用网格搜索和10倍交叉验证进行随机森林模型超参数调优,并基于
ROC-AUC选择最优的超参数组合,并构建最终鉴别模型。20个典型标志性挥发性组分在训练集中的
最小相对峰面积的1/10见表E.2。
表E.2 数据处理后25个标志性挥发性组分的最小相对峰面积
组分
标志性
组分1
标志性
组分2
标志性
组分3
标志性
组分4
标志性
组分5
标志性
组分6
标志性
组分7
标志性
组分8
标志性
组分9
标志性
组分10
相对峰
面积
2.3×10-42.4×10-52.4×10-41.8×10-41.9×10-42.7×10-42.1×10-42.0×10-41.9×10-41.6×10-4
组分
标志性
组分11
标志性
组分12
标志性
组分13
标志性
组分14
标志性
组分15
标志性
组分16
标志性
组分17
标志性
组分18
标志性
组分19
标志性
组分20
相对峰
面积
1.4×10-41.4×10-41.6×10-43.0×10-41.6×10-42.3×10-41.2×10-41.0×10-41.3×10-42.1×10-4
组分
标志性
组分21
标志性
组分22
标志性
组分23
标志性
组分24
标志性
组分25
- - - - -
相对峰
面积
1.6×10-41.6×10-41.4×10-45.1×10-42.4×10-4 - - - - -
E.1.5 按照5.5的方法评估模型,确保其性能满足5.5的要求,用于待测样品鉴别。
E.2 待测样品
待测样品为透明微黄色PP粒子。
E.3 样品前处理及分析
E.3.1 按照5.2.3的方法配制D8-萘工作液。
E.3.2 按照5.2.4的条件设置顶空-气相色谱色谱仪。
E.3.3 按照5.2.5的方法分别分析1个空白样品、1个正构烷烃混合标准溶液、2个D8-萘工作液及待测
样品的3个独立测试样本。
E.4 数据处理
E.4.1 在待测样品数据中,依次检索表C.1中的标志性挥发性组分(共检出6个标志性挥发性组
分),并对其定量离子进行峰面积积分。
E.4.2 按照5.3.2的方法对D8-萘标准样品的定量离子(136m/z)进行峰面积积分。
E.4.3 计算每一个标志性挥发性组分相对于D8-萘(平均值)的相对峰面积。
E.4.4 对于未检出的标志性挥发性组分,其相对峰面积记为数据库中相应组分的最小相对峰面积(表
E.1)。表E.3展示了待测样品数据的处理过程,包括D8-萘的原始峰面积、每个标志性挥发性组分的保
留指数、参考保留指数、原始峰面积以及基于D8-萘归一化后的相对峰面积。
表E.3 待测样品汇总数据表
组分 I 参考I 峰面积1 峰面积2 峰面积3 相对峰面积1 相对峰面积2 相对峰面积3
D8-萘 - - 713220 721648 - - - -
组分1 1015 1014 - - - 2.3×10-4 2.3×10-4 2.3×10-4
组分2 1028 1028 5993 5400 5696.5 0.00768 0.00692 0.00730
组分3 - 1031 - - - 2.4×10-4 2.4×10-4 2.4×10-4
组分4 - 1042 - - - 1.8×10-4 1.8×10-4 1.8×10-4
组分5 - 1083 - - - 1.9×10-4 1.9×10-4 1.9×10-4
组分6 - 1143 - - - 2.7×10-4 2.7×10-4 2.7×10-4
组分7 - 1180 - - - 2.1×10-4 2.1×10-4 2.1×10-4
组分8 1214 1213 69340 54600 61970 0.08881 0.06993 0.07937
组分9 1334 1333 15904 24278 20091 0.02037 0.03110 0.02573
组分10 1343 1342 4711 4197 4454 0.00603 0.00538 0.00570
组分11 1403 1399 4064 3406 3735 0.00521 0.00436 0.00478
组分12 - 1411 - - ......
|