搜索结果: GB/T 45431-2025, GB/T45431-2025, GBT 45431-2025, GBT45431-2025
| 标准编号 | GB/T 45431-2025 (GB/T45431-2025) | | 中文名称 | 法庭科学 伪造人像 检验系统评测 | | 英文名称 | Forensic sciences - Forged video and image of a person - Evaluation for examination system | | 行业 | 国家标准 (推荐) | | 中标分类 | A92 | | 国际标准分类 | 07.140 | | 字数估计 | 14,127 | | 发布日期 | 2025-02-28 | | 实施日期 | 2025-06-01 | | 发布机构 | 国家市场监督管理总局、中国国家标准化管理委员会 |
GB/T 45431-2025: 法庭科学 伪造人像 检验系统评测
ICS 07.140
CCSA92
中华人民共和国国家标准
法庭科学 伪造人像 检验系统评测
2025-02-28发布
2025-06-01实施
国 家 市 场 监 督 管 理 总 局
国 家 标 准 化 管 理 委 员 会 发 布
目次
前言 Ⅲ
1 范围 1
2 规范性引用文件 1
3 术语和定义 1
4 评测数据集和环境要求 1
5 功能指标 3
6 性能指标 3
7 评测结果形成 4
8 评测文档集 5
附录A(资料性) 评测数据集说明 6
参考文献 9
前言
本文件按照GB/T 1.1-2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中华人民共和国公安部提出。
本文件由全国刑事技术标准化技术委员会(SAC/TC179)归口。
本文件起草单位:中国信息通信研究院、中国科学院信息工程研究所、公安部鉴定中心、南开大学、
最高人民检察院检察技术信息研究中心、北京市国家安全局司法鉴定中心、司法鉴定科学研究院、
公安部第三研究所、南京理工大学、北京多维视通技术有限公司、中国科学院自动化研究所、中国科学院
计算技术研究所。
本文件主要起草人:石霖、颜媚、喻民、姜建国、张宁、谢兰迟、王欢、李博权、杜富强、柳溢文、梁亚超、
王嘉文、黄杨奕、李敏、黄伟庆、翟晚枫、刘浩田、邹皓、刘硕、田心宁、江澜、王魁、杜文玉、周颂东、钞锋、
林建成、施少培、曾锦华、陈小娟、王海涛、陈鹏、成云飞、王武、练智超、查瑞麒、李千目、李军宏、万军、
曹娟。
法庭科学 伪造人像 检验系统评测
1 范围
本文件规定了法庭科学领域伪造人像检验系统评测的数据集和环境要求,确立了功能指标和性能
指标,规定了评测结果形成及评测文档集要求。
本文件适用于法庭科学领域伪造人像检验系统的评测,产品自测和产品选型参照使用。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文
件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于
本文件。
GB/T 45429 法庭科学 伪造人像 检验通则
3 术语和定义
GB/T 45429界定的以及下列术语和定义适用于本文件。
3.1
评测数据集 evaluationdataset
评估伪造人像检验系统功能、性能的一组数据所组成的集合。
3.2
检验系统从输入评测数据集的数据到输出检验结果所花费时间的平均值。
4 评测数据集和环境要求
4.1 评测数据集
4.1.1 开源数据采集和筛选
通过开源数据采集和筛选的人脸图像/视频要求如下:
a) 图像格式至少应包括BMP、JPEG、JPEG2000、PNG、HEIF;
b) 视频文件格式至少应包括 MP4、AVI、MKV、FLV、MOV;
c) 视频编码格式至少应包括 MPEG、H.264、H.265、AV1;
d) 视频分辨率不低于360P;
e) 人脸分辨率不低于100×100像素;
f) 人脸帧数占比不低于80%;
g) 视频时长不少于10s且不超过1min。
4.1.2 真实人物数据集
面向指定真实人物进行多维度组合式视频拍摄要求如下:
a) 拍摄场景至少应包括室内、室外、影视剧制作场景(如绿幕、蓝幕等);
b) 镜头采集模式至少应包括横向移动、前向移动、访谈场景侧视角固定、新闻主播场景主视角
固定;
c) 采集条件至少应包括俯视、平视等不同角度,以及阳光、灯光等不同光照条件;
d) 人物姿态至少应包括站姿、走姿等;
e) 人脸属性至少应包括微笑、大笑、惊讶、愤怒、悲伤、无表情;
f) 拍摄视频分辨率不小于360P、人脸画面占比不小于10%、人脸帧数占比不小于80%、人脸数
量不少于1个且不多于3个,视频时长不小于10s且不超过1min。
4.1.3 评测数据集处理
评测数据集要求如下。
a) 评测数据集包含伪造数据和真实数据的比例为1∶1,总体数量不少于5000个;其中,伪造人
像的方法包括人脸替换、人脸编辑、人脸操控、人脸生成等,具体说明见附录A。
b) 评测数据集包含典型干扰,干扰类型为噪声、模糊、锐化、压缩、几何变换等,每种干扰类型数据
量不少于100个,具体说明见附录A。
c) 添加干扰后的样本数据较原数据信噪比不小于20dB,信噪比按公式(1)~公式(3)计算。
SNR=10lg
f(x,y)
g(x,y)
êê
úú (1)
f(x,y)= ∑x
,yI(x,y)
êê
úú
(2)
g(x,y)=
∑x,y[I(x,y)-Idenoised(x,y)]2
(3)
式中:
SNR ---信噪比,单位为分贝(dB);
I(x,y) ---加扰后图片像素点值;
Idenoised(x,y)---加扰前图片像素点值;
N ---图像像素点总数;
f(x,y) ---图像信号能量值;
g(x,y) ---干扰信号能量值。
以上计算公式适用于灰度图。对于RGB 图像,分别计算每个通道上的SNR,再计算SNR平均值。
4.1.4 评测数据集标注
评测数据集至少应标注以下内容:
a) 数据标签(真样本/假样本);
b) 伪造数据的类型;
c) 伪造数据使用的伪造方法;
d) 伪造人脸出现的帧数定位;
e) 伪造的区域(全脸/嘴巴/头发等);
f) 是否为指定人物样本;
g) 是否为加干扰数据以及干扰类型。
4.2 评测环境
根据被测系统的功能要求、性能要求和应用场景配置相应的软硬件环境。
5 功能指标
5.1 采集功能
系统应具备人工/自动采集视频图像信息的功能。
5.2 检测功能
系统应具备检测不同格式、视频编码格式、清晰度、分辨率、人脸帧数占比、视频时长等视频图像的
能力,相应的要求同4.1.1。
5.3 分析功能
系统应具备伪造人像鉴别的能力,宜具备对评测数据的干扰类型分析的能力。
5.4 统计功能
系统应具备对检验结果进行统计分析的功能。
5.5 管理功能
5.5.1 系统参数管理功能
系统宜具备参数管理模块功能,包括但不限于:
a) 仪器设备信息管理;
b) 检验日期参数设置。
5.5.2 系统日志管理功能
系统应具备日志管理模块功能,包括但不限于:
a) 日志类型;
b) 日志记录内容。
5.5.3 系统安全管理功能
系统应具备安全管理模块功能,包括但不限于:
a) 数据传输加密;
b) 系统备份。
6 性能指标
6.1 检验能力指标
6.1.1 准确度
准确度指标是衡量系统性能和准确性的关键指标。其中,评测内容主要包括:
a) 准确率:所有正确检测的样本占所有检测样本的比例,按公式(4)计算;
b) 精确率:所有检测命中的伪造数据占所有命中结果数据的比例,按公式(5)计算;
c) 召回率:所有检测的样本占所有应检测的样本的比例,按公式(6)计算;
d) F1:模型精确率和召回率的一种调和平均,按公式(7)计算。
A=
TP+TN
TP+FP+FN+TN
(4)
P=
TP
TP+FP
(5)
R=
TP
TP+FN
(6)
F1=2×
(P×R)
(P+R)
(7)
式中:
A ---准确率;
P ---精准率;
R ---召回率;
F1---深度学习模型评估指标,衡量模型的精确率和召回率的平衡;
TP---识别为伪造数据信息并且实际为伪造数据信息的内容数量;
FP---识别为伪造数据信息并且实际为真实数据信息的内容数量;
TN---识别为真实数据信息并且实际为真实数据信息的内容数量;
FN---识别为真实数据信息并且实际为伪造数据信息的内容数量。
6.1.2 鲁棒性
鲁棒性通过添加干扰前后精确率指标的偏差绝对值来衡量,按公式(8)计算:
ΔPi= Pi-PA (8)
式中:
ΔPi ---添加第i种干扰操作后的精确率指标偏差值;
Pi ---添加第i种干扰操作后的精确率值;
PA ---添加干扰前的精确率基准值。
其中,i取值为1~5时,对应的干扰类型依次为噪声、模糊、锐化、压缩、几何变换。
6.2 系统运行性能指标
以平均检验时间作为系统运行性能评测指标。平均检验时间是评测数据集上所有检验时间与评测
总次数的比值,按公式(9)计算:
T=
i=1
(TSi-Tei)
(9)
式中:
i ---第i轮推断;
TSi---服务开始推断的时间点,单位为秒(s);
Tei---服务结束推断的时间点,单位为秒(s);
N ---评测总次数;
T ---平均检验时间,单位为秒(s)。
7 评测结果形成
7.1 评测执行
将评测数据集输入到被测系统中,检查被测系统的采集、检测、分析、统计、管理功能,并获取性能指
标的评测结果。
7.2 结果判定
7.2.1 功能指标
给出功能指标是否符合第5章要求的判定结果。
7.2.2 性能指标
按照第6章的要求给出性能指标的评测结果,并宜对结果含义进行说明:
a) 被测系统评测的F1值越大,表明系统正确检测伪造人像的能力越强;
b) 被测系统的鲁棒性越高,表明检验伪造人像系统模型的检验能力更稳定;
c) 在系统运行性能方面,针对某一特定F1值(如F1=0.9),被测系统的平均检验时间越小,表明
伪造人像检验系统的运行能力越强。
8 评测文档集
8.1 评测计划
描述所要完成的评测,至少应包括评测背景、评测目的、评测内容、所需资源、任务安排和进度。
8.2 评测用例
构造评测用例的记录至少应包括下列内容:
a) 评测目标;
b) 被测功能;
c) 评测数据;
d) 系统的预期行为。
8.3 评测记录
根据评测用例执行评测情况,做好评测记录。每个评测记录均应包含详细的信息,以方便进行重复
评测。评测记录至少应包括下列内容:
a) 评测用例与评测计划或评测需求的追踪关系;
b) 与评测用例相关的所有结果,包括评测期间出现的所有失败;
c) 评测中所涉及的人员身份及评测时间。
8.4 评测报告
在评测报告中汇总评测对象和结果。评测报告至少应包括下列内容:
a) 产品标识;
b) 用于评测的计算机系统(硬件、软件及配置);
c) 产品描述、用户文档;
d) 功能检验和性能评测结果;
e) 要求的清单;
f) 评测开始和结束日期。
附 录 A
(资料性)
评测数据集说明
伪造人像检验系统评测数据集的干扰类型、伪造方法及对应图例见表A.1。
表A.1 评测数据集说明
处理方式 类型 图例
干扰
噪声干扰
......
|