路径: 主页 > GB/T > 第233页 > GB/T 45348-2025

[PDF] GB/T 45348-2025 - 英文版

标准号码	内文	价格美元	第2步(购买)	交付天数	标准名称	状态
GB/T 45348-2025	英文版	359	GB/T 45348-2025	[PDF]天数 >=4	信息技术实时定位声源定位成像系统技术规范	有效

基本信息
标准编号	GB/T 45348-2025 (GB/T45348-2025)
中文名称	信息技术实时定位声源定位成像系统技术规范
英文名称	Information technology - Real time locating - Technical specification for sound source locating and imaging system
行业	国家标准 (推荐)
中标分类	L66
国际标准分类	35.240.50
字数估计	18,150
发布日期	2025-02-28
实施日期	2025-09-01
发布机构	国家市场监督管理总局、中国国家标准化管理委员会

GB/T 45348-2025: 信息技术实时定位声源定位成像系统技术规范 ICS 35.240.50 CCSL66 中华人民共和国国家标准信息技术实时定位声源定位成像系统技术规范 2025-02-28发布 2025-09-01实施国家市场监督管理总局国家标准化管理委员会发布目次前言 Ⅲ 1 范围 1 2 规范性引用文件 1 3 术语和定义 1 4 系统参考架构 2 4.1 总体描述 2 4.2 数据采集层 3 4.3 数据处理层 3 4.4 交互层 4 5 技术要求 4 5.1 功能要求 4 5.2 性能要求 5 6 测试方法 6 6.1 测试条件 6 6.2 功能测试 6 6.3 性能测试 7 附录A(资料性) 声源定位成像原理 10 附录B(资料性) 麦克风阵列坐标系设置示例 11 附录C(资料性) 系统流程图 12 参考文献 13 前言本文件按照GB/T 1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。本文件起草单位:科大讯飞股份有限公司、中国电子技术标准化研究院、国网安徽省电力有限公司电力科学研究院、中国科学院计算技术研究所、合肥智能语音创新发展有限公司、杭州微影软件有限公司、中国电力科学研究院有限公司、浙江潮汐力科技有限公司、杭州品铂科技有限公司、国能数智科技开发(北京)有限公司、北京科技大学、合肥四相至新科技有限公司、北京麦钉艾特科技有限公司、苏州寻息科技股份有限公司、羚羊工业互联网股份有限公司、北京交通大学、安徽听见科技有限公司、重庆邮电大学、清研讯科(北京)科技有限公司、武汉大学、浙江讯飞智能科技有限公司、中国科学院自动化研究所、北京市燃气集团研究院、北京华控智加科技有限公司、深圳市燃气集团股份有限公司、中国电子科技集团公司第五十四研究所、深圳市博思高科技有限公司、广东中创智家科学研究有限公司、南方电网数字电网科技(广东)有限公司、龙源电力集团股份有限公司、中国联合网络通信有限公司智能城市研究院、深圳云里物里科技股份有限公司、郑州联睿电子科技有限公司、杭州兆华电子股份有限公司、北京电信规划设计院有限公司、电子科技大学长三角研究院(衢州)、北京新锐科创科技有限公司、深圳市铨顺宏科技有限公司、上海热像科技股份有限公司、北京声智科技有限公司、西安联丰迅声信息科技有限责任公司、北京谛声科技有限责任公司、长沙中联重科环境产业有限公司、温州市研创物联网科技有限公司、宜宾市天珑通讯有限公司、深圳市爱特姆科技有限公司、合肥君信电子科技有限公司、咸亨电气技术(杭州)有限公司、深圳市视联卓创科技有限公司、深圳时空数字科技有限公司、上海格鲁布科技有限公司、杭州爱华仪器有限公司、环鸿电子(昆山)有限公司、上海赛铭特科技有限公司、江苏赛西科技发展有限公司。本文件主要起草人:胡国平、张璋、宋继伟、王文峰、蔡明琦、张晖、杨海涛、刘颖、杨杰、胡啸宇、罗海勇、吴江照、宋若淼、耿力、梁启晨、赵方、韩帅、李俊、黄佳佳、王晓燕、王曲、徐明璐、李素敏、刘晓伟、周维、高睿鹏、王玮、聂文迪、裘有斌、邓跃进、宫韬、高伟、车明、刘加、张浩、李爽、李启家、黄伟彬、曾乔迪、张国珍、刘琪、张敏、肖岩、柴宇佳、曹祖杨、郭丙峰、陈祝明、王正生、石春磊、许毅、陈孝良、李晓强、黄毅伟、虞小跃、林凌鹏、周波、孙振培、李朋辉、李文国、席旭刚、张涛、孙文化、沈道义、毛志德、刘上、陈明、赵峻莉。信息技术实时定位声源定位成像系统技术规范 1 范围本文件确立了声源定位成像系统的系统参考架构,规定了技术要求,描述了相应的测试方法。本文件适用于声源定位成像系统的设计、开发和测试。 2 规范性引用文件本文件没有规范性引用文件。 3 术语和定义下列术语和定义适用于本文件。 3.1 用来确定声源位置并展现声场空间分布的软硬件系统。注:声源定位成像原理见附录A。 3.2 声压级 soundpressurelevel 被测声压与基准声压的比值。注:声压级Lp 计算公式见公式(1)。 Lp =20lg p0 (1) 式中: p ---被测声压,单位为微帕(μPa); p0 ---取值声压,取值为20μPa; Lp ---声压级,单位为分贝(dB)。 3.3 麦克风阵列 microphonearray 由具有确定空间拓扑结构的多个麦克风组成的,对声学信号的空间特性进行采样的装置。 [来源:GB/T 36464.1-2020,3.23,有修改] 3.4 以麦克风阵列(3.3)的中心为原点,在麦克风阵列(3.3)接收平面及其法向方向所建立的空间三维直角坐标系。注:附录B给出了麦克风阵列坐标系的一种建立方式。 3.5 方位角 azimuthangle 被观测点相对于麦克风阵列坐标系(3.4)x轴正方向的水平旋转角度。 3.6 俯仰角 pitchangle 被观测点相对于麦克风阵列坐标系(3.4)xoz平面上下旋转的角度。 3.7 通过数据可视化技术来显示空间中声场分布情况的示意图。 3.8 时频图 time-frequencyfigure 描述信号的频率随时间的变化关系的图像。 3.9 通过空间中的声场分布热力图(3.7),确定声源位置信息。注:附录A给出了一种基于延时求和算法进行声源定位的介绍。 3.10 声源成像 soundsourceimaging 将空间中的声场分布热力图(3.7)与对应视场的视频图像叠加,以可视化的形式展现声源的空间分布。 3.11 定位准确度 positioningaccuracy 声源定位成像系统对被观测点的定位结果与参考结果间的一致程度。 3.12 定位精确度 positioningprecision 在规定条件下,声源定位成像系统对被观测点多次定位结果间的一致程度。 4 系统参考架构 4.1 总体描述声源定位成像系统(以下简称“系统”)通过空间中的声场分布热力图来确定声源的位置信息,再将空间声场分布热力图与视频图像叠加,用可视化的形式展现声源的空间分布。系统参考架构可分为数据采集层、数据处理层和交互层三个部分,系统参考架构见图1,系统流程图见附录C。注:虚框为可选内容。图1 系统参考架构 4.2 数据采集层数据采集层包括摄像装置、麦克风阵列、温湿度气压传感装置和测距传感装置。 a) 摄像装置用于获取俯仰角和方位角范围内的实时图像画面。 b) 麦克风阵列用于实时采集声音数据。 c) 温湿度气压传感装置用于获取表征环境湿度、温度、压力等参量的原始信号。 d) 测距传感装置用于获取表征观测点与系统之间距离的原始信号。其中,观测点可通过辅助瞄准器确定。 4.3 数据处理层数据处理层包括图像处理模块、声音处理模块、环境感知处理模块、距离测量处理模块、声源定位模块、分析图谱生成模块和声视叠加模块: a) 图像处理模块根据俯仰角和方位角范围进行实时画面裁剪; b) 声音处理模块读取采集到的声音数据并将其进行格式转换; c) 环境感知处理模块读取温湿度气压传感装置采集的数据并将其转化为实际的测量值,并基于测量值计算当前环境参数下的实际声速值; d) 距离测量处理模块读取测距传感装置采集的数据并将其转化为观测点与系统之间的实际距离测量值; e) 声源定位模块对采集的声音信号进行处理,计算在系统的视场范围内,不同方位角、俯仰角处声压级的大小; f) 分析图谱生成模块基于声源定位模块的分析数据,生成可用于分析的图谱,例如时频图等; g) 声视叠加模块通过空间坐标转换,将视频图像和声音定位信息融合,形成带声源定位成像信息的视频流。 4.4 交互层交互层包括声源定位成像显示模块、分析图谱显示模块、声源参数配置模块和基础交互模块。 a) 声源定位成像显示模块是一种实时动态显示界面,将声视叠加模块输出视频流和声源定位渲染的热力图实时进行可视化展示。 b) 分析图谱显示模块是一种实时展示声源图谱频率和能量分布的图表,可用于声源特征的辅助分析。 c) 声源参数配置模块包括声源成像频率调整子模块和声源特性调整子模块: 1) 声源成像频率调整子模块用于提供不同定位频率的选择功能; 2) 声源特性调整子模块用于提供单声源/多声源显示模式选择和声源阈值选择等。 d) 基础交互模块包括声源成像拍照/录制子模块、历史记录与详情子模块: 1) 声源成像拍照/录制子模块具有声场分布热力图保存能力,提供拍照和录制选项; 2) 历史记录与详情子模块用于提供系统相关记录查询功能,如日期、地点、传感器状态等。 5 技术要求 5.1 功能要求 5.1.1 声源定位通过声源定位功能,系统可得到声源的位置、方位角和俯仰角及距离等信息。声源定位的具体要求如下: a) 应在声场分布热力图上标注出声源中心所处的位置; b) 宜根据空间中声场分布情况,获得声源的具体方位角和俯仰角信息; c) 宜给出声源相对于系统选定观测点的距离。 5.1.2 声源成像系统应具备将声场分布热力图进行成像显示的功能。 5.1.3 频率调整系统应具备实时调整成像频率范围或预设多个成像频段的功能,满足声源成像对不同频率范围的需求。 5.1.4 时频图显示系统宜具备显示时频图的功能。 5.1.5 声源选择通过声源选择功能,系统可实现单声源和多声源定位模式的选择,声源选择的具体要求如下: a) 应具备单声源定位的功能; b) 宜具备多声源定位的功能; c) 若具备多声源定位的功能,则应具备单/多声源定位模式选择的功能。 5.1.6 拍照和录制系统应具备声场分布热力图的拍照和录制功能。 5.1.7 记录和回放通过记录和回放功能,系统可实现对声源定位成像结果的记录和调取回看,记录和回放的具体要求如下: a) 应能记录并输出声源定位成像结果; b) 宜具备视频、音频的记录及输出功能,并可随时调取查看已记录的测试结果。 5.2 性能要求 5.2.1 实时性自采集到声音信号至声源成像显示的时间间隔应在500ms以内。 5.2.2 成像声压级在环境底噪不高于30dB时,应能对声压级在30dB~90dB之间的信号进行声源成像。 5.2.3 成像范围声音信号采集及成像的角度范围应以麦克风阵列中轴为基准,俯仰角宜不小于35°,方位角宜不小于48°。 5.2.4 成像距离在满足5.2.2中的成像声压级要求下,应能对距离麦克风阵列坐标系原点40m范围内的声音信号进行声源成像。 5.2.5 定位准确度在满足5.2.4中的成像距离要求下,对单声源定位准确度应在3°以内。 5.2.6 定位精确度在满足5.2.4中的成像距离要求下,对固定目标的单声源定位结果,其在角度上分布的标准差应在 0.2°以内。 5.2.7 双声源分辨率在满足5.2.2中的成像声压级以及5.2.4中的成像距离要求下,系统能分辨的两个声源与麦克风阵列坐标系原点形成的夹角之间的最小角度应在10°以内。 5.2.8 录像帧率在进行视频记录时,视频的传输帧率应不低于25f/s。 6 测试方法 6.1 测试条件 6.1.1 测试环境除非另有规定,测试在下述环境条件下进行。 a) 环境温度:15℃~35℃。 b) 相对湿度:25%~75%。 c) 大气压:86kPa~106kPa。 d) 如在室内测试,应选择安静无扰的环境进行测试,如半消室或全消室;环境底噪不高于30dB。 e) 如在室外测试,应选择晴好天气在开阔场地进行测试,避免遮挡物,环境中无其他明显干扰信号影响测试,且风速在5m/s以下。 6.1.2 测试声源用于测试的声源宜为20kHz~60kHz频率范围内的单频正弦信号或宽频信号。 6.1.3 频段设置系统的成像频段设置应覆盖测试声源的频率。 6.1.4 录像帧率用于测试的摄像设备的录像帧率应不低于60f/s。 6.2 功能测试 6.2.1 声源定位改变测试声源与麦克风阵列的相对角度,若观察亮斑能追随成像画面中声源的位置而变化,记录具备声源定位功能,其他情况则记录不具备。 6.2.2 声源成像打开(持续至少30s)和关闭测试声源信号发射系统,观察被测系统显示设备,目测显示中心在打开信号发射系统时,是否出现单一、局域的亮斑,并且随着测试声源信号终止而消失,记录是否具备声源成像功能。 6.2.3 频率调整进入频率调整模块,调整频率范围观察声源成像变化,记录是否具备频率调整功能。 6.2.4 时频图显示进入时频图显示模块,观察系统显示设备里时频图是否正常显示,记录是否具备时频图显示功能。 6.2.5 声源选择进入声源切换功能,可选择单声源模式和多声源模式;放置两个或两个以上声源发出相同信号,观察系统显示设备,在单声源模式下是否可对一个声源成像;在多声源模式下是否可对多个声源成像。 6.2.6 拍照和录像分别选择拍照和录像模式,通过文件系统确认是否对声源成像进行对应的图片和视频保存。 6.2.7 记录和回放使用系统的记录功能,查看是否能记录成像效果图,并可随时调取查看已记录的测试结果。 6.3 性能测试 6.3.1 实时性实时性的测试方法如下。 a) 摄像设备置于被测系统与测试声源同一水平线上,使摄像设备能清晰捕捉被测系统的成像画面。 b) 开启摄像设备、被测系统和测试声源,测试声源宜使用单频正弦信号,频率宜取20kHz~ 60kHz范围内的某一频率;被测系统与测试声源参考点的距离设置为2m。 c) 分析摄像设备采集的音频和视频,被测系统的实时性计算见公式(2)。 t=t0+t1 (2) 式中: t0---摄像设备接收到测试声源和对应视频中声源位置处出现成像画面的时间差; t1---摄像设备与被测系统之间的声音传播时间。 6.3.2 成像声压级成像声压级的测试方法如下: a) 测试声源宜使用单频正弦信号,频率宜取20kHz~60kHz范围内某一频率,被测系统与声源参考点距离设置为2m; b) 使用标准测量设备记录系统所在位置的声压级,连续调整声源强度,使该声压级从90dB逐渐降至30dB以下,目测被测系统是否能在30dB以下稳定成像; c) 调整声源发出信号强度,使被测系统坐标原点处声压级从30dB逐渐提升至90dB以上,目测被测系统是否能在90dB以上稳定成像。 6.3.3 成像范围成像范围的测试方法如下: a) 测试声源宜使用单频正弦信号,频率宜取20kHz~60kHz范围内某一频率,被测系统与声源参考点距离设置为2m; b) 以被测系统麦克风阵列中轴为基准,将测试声源分别置于与中轴线垂直面的待测点P1、P2、 P3、P4 处,空间几何结构如图2所示; c) 目测观察被测系统是否能清晰稳定成像。其中,夹角θ为俯仰角的角度范围,夹角ϕ为方位角的角度范围,俯仰角与方位角应满足5.2.3的要求。图2 声源成像范围检测点示意图 6.3.4 成像距离极限成像距离的测试方法如下: a) 固定测试声源的信号强度和频率范围,频率宜取20kHz~60kHz范围内的某一段频率,1m 距离声源信号强度宜为70dB; b) 在声源正对且距离系统1m可稳定成像时,按0.5m步长远离声源进行移动,直至被测系统成像效果消失,记录声源距离系统的距离; c) 在测试结果或报告中记录测试声源信号的频率和幅值。 6.3.5 定位准确度定位准确度的测试方法如下。 a) 被测系统正对声源2m,利用声源产生一组固定幅值的单频正弦信号,频率宜取20kHz~ 60kHz范围内某一频率。 b) 使用被测系统录像功能,连续采集时间不少于30s,逐帧分析成像画面,每帧画面映射到目标声源所处的成像映射面,如图3所示,夹角θ即为定位准确度。计算公式见公式(3)。 θ=(B'C'/r)×180/π (3) 式中: B'---声源成像映射中心; C'---声源中心; r ---被测系统A 到成像映射面的距离。图3 定位准确度检测示意图 6.3.6 定位精确度定位精确度的测试方法如下。 a) 被测系统正对声源2m,利用声源产生一组固定幅值的单频正弦信号,频率宜取20kHz~ 60kHz范围内某一频率。 b) 使用被测系统录像功能,连续采集时间不少于30s,测量每一帧成像画面的定位角度,计算定位角度的标准差值。标准差计算公式如式(4)。 σ= ∑ i=1 (Xi-X)2/(N-1) (4) 式中: σ ---测量样本数据标准差; Xi ---第i次测量的样本值; 􀭿X ---样本数据的平均值; N ---测量次数。 6.3.7 双声源分辨精度双声源分辨精度的测试方法如下: a) 被测系统正对声源2m,利用声源产生一组固定幅值的单频正弦信号,频率宜取20kHz~ 60kHz范围内某一频率,且幅值差异应在5dB以内; b) 按图4所示分别进行四组双声源测试,每组测试声源A 和B 分别置于(P1,P5)、(P2,P6)、 (P3,P7)、(P4,P8); c) 记录系统显示设备能否同时显示声源A 和B 的成像。注:双声源定位分辨率2θ0=10°;被测系统与声源的距离为r0;P1:(r0,θ0);P2:(r0, 2θ0 );P3:(r0,0);P4: (r0,- 2θ0 );P5:(r0,-θ0);P6:(r0,- 2θ0 );P7:(r0,0);P8:(r0, 2θ0 )。图4 多声源分辨精度检测示意图 6.3.8 录像帧率进入系统选择录像功能,对声源信号进行录像,导出录像分析录像帧率。附录 A (资料性) 声源定位成像原理声源定位成像技术基于传声器阵列测量理论,利用阵列充分捕获空间信息,借助阵列的空间选择特性以实现非期望声源的信号抑制,获得采集区域的声场分布,并将声场分布图与视频图像进行叠加形成声成像图,声成像图中可直观显示声源位置、强度等信息。如图A.1、图A.2所示,以延时求和波束形成算法为例。假设在聚焦面B 上存在一个声源,传感装置阵列位于测量面A 上。由于各个传感装置与声源之间存在距离上的差异,因此信号在到达每个阵元上都会有一定的时间差,时间差与实际的声速大小直接相关,可基于环境的温湿度和大气压获得更为准确的声速进行计算。通过对不同阵元接收的信号进行延时处理后进行叠加,实现对指定方向的波束ra 拾音。通过扫描空间指定区域内的方向,即可获得相应的声场分布云图。以对应的视频图像为背景,与声场分布云图相互叠加融合,从而形成声源定位成像系统的输出结果。图A.1 延时求和示意图图A.2 波束形成扫描示意图附录 B (资料性) 麦克风阵列坐标系设置示例方位角和俯仰角分别衡量声源相对于麦克风阵列平面正对方向在水平面上的转角和竖直面上的转角。麦克风阵列坐标系设置可参考图B.1。以麦克风阵列平面中心点O 为原点建立右手坐标系,A 为麦克风阵列平面,以麦克风阵列向前法向方向为z轴,P 为声源位置,P'为声源在xoz平面上的投影。方位角可以用OP'与x轴正方向的夹角ϕ表示,取值范围为±180°,其中P'落在z轴正半区域为正;俯仰角可用OP 与xoz平面的夹角,即POP'的锐角夹角θ来表示,取值范围为±90°,其中P 在y轴正半区域为正。图B.1 麦克风阵列坐标系设置示意图附录 C (资料性) 系统流程图系统流程图见图C.1,具体流程如下。 a) 摄像装置将实时采集的图像数据输入给图像处理模块,由图像处理模块进行裁剪、增强等图像处理后输入给声视叠加模块。 b) 麦克风阵列将实时采集的声音信号输入给声音处理模块,由声音处理模块进行格式转......

英文网页English: GB/T 45348-2025

相关标准: CNCA C09-02 | GB/T 46383.301 | GB/T 46366 | CNCA C09-02 |