多任务学习残差卷积网络的声源定位和深度估计方法

A multi-task learning residual convolutional network approach for sound source localization and depth estimation

在线阅读下载PDF

导出

摘要针对基于平面麦克风阵列的声源定位方法难以估计声源深度的问题,文章提出了多任务学习残差卷积网络的声源定位和深度估计方法。提出的网络模型具有两个输出分支,分别用于实现声源定位和深度估计。该网络使用函数波束形成的成像结果作为输入特征。通过设计一种高分辨率并且无旁瓣的目标图作为网络的标签来提高函数波束形成声源识别性能,同时将声源面与测量阵列之间的距离均匀离散成不同的深度类别,根据网络输出的深度类别的概率来估计声源深度。仿真结果表明,所提方法在五种频率的测试集中定位准确率都不低于96.95%,平均距离误差小于0.003 4 m,分类准确率大于99.05%,能够准确定位声源并估计声源深度。此外,该方法在低信噪比情况下也能有效识别声源,具有良好的泛化性。 A multi-task learning residual convolutional network(MTL-ResCNN)method for sound source localization and depth estimation is proposed to address the problem that it is difficult to estimate the sound source depth by the planar microphone array-based sound source localization methods.The proposed network model has two output branches to achieve sound source localization and depth estimation,respectively.The network uses functional beamforming(FBF)imaging results as input features.A high-resolution and side-lobes-free target map is designed as the label of the network to improve the source identification performance of functional beamforming,while the distance between the source plane and the measurement array is uniformly discretized into different depth classes,and the source depth is estimated based on the probability of the depth classes output by the network.The simulation results show that in the test set of five frequencies the proposed method has a localization accuracy of no less than 96.95%,an average distance error of less than 0.0034 m,and a classification accuracy of more than 99.05%,which can accurately locate the sound source and estimate the source depth.In addition,the method can effectively identify the sound source with good generalization even under a low signal to noise ratio.

作者耿林张鸽王书海夏晨骏谢峰斯嘉禾 GENG Lin;ZHANG Ge;WANG Shuhai;XIA Chenjun;XIE Feng;SI Jiahe(School of Electrical Engineering and Automation,Anhui University,Hefei 230601,Anhui,China)

机构地区安徽大学电气工程与自动化学院

出处《声学技术》 CSCD 北大核心 2024年第6期887-895,共9页 Technical Acoustics

基金国家自然科学基金项目(51975003) 安徽省自然科学基金项目(2108085ME175) 安徽高校协同创新项目(GXXT-2021-010)。

关键词声源定位深度估计多任务学习残差卷积网络函数波束形成 sound source localization depth estimation multi-task learning residual convolutional network(MTLResCNN) functional beamforming

分类号 TB532 [理学—声学]

引文网络
相关文献

参考文献3

1杨洋,褚志刚.高性能波束形成声源识别方法研究综述[J].机械工程学报,2021,57(24):166-183. 被引量：14
2丁晋晋,胡定玉,余亮.三维空间非同步测量高分辨率声成像方法[J].声学学报,2022,47(2):220-228. 被引量：1
3张钰,刘建伟,左信.多任务学习[J].计算机学报,2020,43(7):1340-1378. 被引量：37

二级参考文献32

1梅继丹,石文佩,马超,孙大军.近场反卷积聚焦波束形成声图测量[J].声学学报,2020,45(1):15-28. 被引量：16
2褚志刚,杨洋,倪计民,江洪.波束形成声源识别技术研究进展[J].声学技术,2013,32(5):430-435. 被引量：19
3褚志刚,杨洋.基于非负最小二乘反卷积波束形成的发动机噪声源识别[J].振动与冲击,2013,32(23):75-81. 被引量：18
4杨洋,褚志刚,倪计民,王卫东.除自谱的互谱矩阵波束形成的噪声源识别技术[J].噪声与振动控制,2011,31(4):145-148. 被引量：33
5王子腾,杨殿阁,李兵,连小珉.运动汽车噪声的可视化测量方法比较研究[J].振动工程学报,2011,24(5):578-584. 被引量：7
6褚志刚,杨洋,王卫东,肖新标,蒋忠翰,贺岩松.基于波束形成方法的货车车外加速噪声声源识别[J].振动与冲击,2012,31(7):66-70. 被引量：29
7杨洋,倪计民,褚志刚,石秀勇.基于互谱成像函数波束形成的发动机噪声源识别[J].内燃机工程,2012,33(3):82-87. 被引量：31
8褚志刚,杨洋.球形传声器阵列三维波束形成性能[J].农业工程学报,2012,28(11):80-85. 被引量：6
9褚志刚,杨洋.基于波束形成缩放声强的声源局部声功率计算[J].声学学报,2013,38(3):265-271. 被引量：19
10刘月婵,何元安,商德江,尚大晶,孙超.高精度球面阵聚焦声源定位方法研究[J].声学学报,2013,38(5):533-540. 被引量：9

共引文献49

1赵海英,周伟,侯小刚,张小利.基于多任务学习的传统服饰图像双层标注[J].吉林大学学报（工学版）,2021,51(1):293-302. 被引量：7
2杨佳明,姜静.基于联合训练的强化学习方法[J].信息技术与信息化,2021(3):126-127.
3陈亮,褚燕华,王丽颖,张晓琳,刘海佳.基于CoBERT-BiGRU的对话式机器阅读理解[J].计算机应用研究,2021,38(7):1983-1987.
4颜志鹏.基于多任务协同的粒子群聚类优化算法[J].现代计算机,2021,27(19):32-40. 被引量：1
5郭辉,郭静纯,张甜.基于梯度优化的多任务混合学习方法[J].计算机技术与发展,2021,31(10):7-12. 被引量：2
6吴锴,王晓放,边超,刘海涛.面向变精度仿真数据建模分析的多任务学习方法比较研究[J].风机技术,2021,63(5):71-80.
7马雨,解庆,唐伶俐,刘永坚.一种基于多任务学习的方面级情感分析方法[J].计算机应用与软件,2022,39(2):245-252. 被引量：1
8李红光,王菲,丁文锐.面向目标分类识别的多任务学习算法综述[J].航空学报,2022,43(1):197-212. 被引量：9
9谭慧欣,赖杰伟,王祚,季磊,张一行,王进亮,宋育章,阳维.可穿戴式心电信号R峰检测的心拍感知卷积网络[J].南方医科大学学报,2022,42(3):375-383. 被引量：3
10王鑫,赵清杰,于重重,张长春,陈涌泉.多节点探测器软着陆的路径规划方法[J].宇航学报,2022,43(3):366-373. 被引量：4

1谢自勤,罗赟,康信勇.心电图对急性ST段抬高型心肌梗死罪犯血管定位及合并缺血性心肌病的诊断价值[J].医学信息,2024,37(23):155-158.

声学技术

2024年第6期

浏览历史

内容加载中请稍等...

多任务学习残差卷积网络的声源定位和深度估计方法

参考文献3

二级参考文献32

共引文献49

相关作者

相关机构

相关主题

浏览历史