期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于通道和帧级特征注意力模型的环境声音识别 被引量:8
1
作者 苏瑞轩 葛动元 姚锡凡 《科学技术与工程》 北大核心 2024年第16期6792-6798,共7页
为了对环境声音进行更好的识别,提出基于通道和帧级特征注意力的环境声音识别卷积神经网络模型。该模型针对声音特征特点选取一维卷积以提高模型对声音特征信息的提取能力,并引入SE-Res2Net模块实现对声音特征细粒度上的全局感受并帮助... 为了对环境声音进行更好的识别,提出基于通道和帧级特征注意力的环境声音识别卷积神经网络模型。该模型针对声音特征特点选取一维卷积以提高模型对声音特征信息的提取能力,并引入SE-Res2Net模块实现对声音特征细粒度上的全局感受并帮助模型关注特征通道间的信息,在全连接层前加入注意力统计池化模块,增强模型对表征不同声音类别的关键帧级特征的学习以提高模型识别性能。采用Urbansound8K数据集,实验结果表明:所提模型在测试集上的训练准确率达到94.5%,即模型可以有效学习声音特征中表征不同环境声音的关键信息并进行正确预测。对消融实验结果分析可得,所提模型的设计可使其分类错误率的下降率达到43.8%,表明模型对一维卷积的应用和各个模块的引入是有效的,可见所提环境声音识别模型性能优越。 展开更多
关键词 声音识别 细粒度 通道加权 帧级特征 注意力统计池化
在线阅读 下载PDF
融合Swin Transformer和CNN的环境声音分类模型
2
作者 朱振飞 葛动元 +1 位作者 姚锡凡 苏瑞轩 《科学技术与工程》 北大核心 2024年第28期12259-12267,共9页
环境声音分类已经成为计算机听觉领域的一项重要任务,可以作为计算机视觉的补充,帮助设备更好地理解环境和用户需求,具有广泛的应用前景,将对人类生活产生积极影响。近年来,环境声音分类领域采用了具有自注意力机制的Transformer模型,... 环境声音分类已经成为计算机听觉领域的一项重要任务,可以作为计算机视觉的补充,帮助设备更好地理解环境和用户需求,具有广泛的应用前景,将对人类生活产生积极影响。近年来,环境声音分类领域采用了具有自注意力机制的Transformer模型,然而现有模型需要较大的内存,同时依赖于预训练的视觉模型,无法较好提取音频特征。为了解决这些问题并提高环境声音分类准确度,提出了一种新的具有双分支结构的Swin Conformer环境声音分类模型。通过融合卷积神经网络和具有窗口自注意力机制的Swin Transformer模型,以交互方式融合双分支特征并引入令牌语义模块。结果表明:Swin Conformer模型在ESC-50和UrbanSound8K公共数据集上分别通过验证实现了98.1%和96.8%的分类准确度。与现有模型相比,具有更高的分类准确度,证明了该模型在环境声音分类任务中的可行性和优越性。 展开更多
关键词 环境声音分类 数据增强 TRANSFORMER 自注意力
在线阅读 下载PDF
鲸生鲸语
3
作者 苏瑞轩 董明 陈雪(指导) 《中学科技》 2022年第10期24-25,共2页
我们曾在大连自然博物馆研学。在巨鲸厅参观时,我们为鲸面临的悲惨现状所震动:由于鲸能给人类带来巨大的经济利益,它们被大量捕杀。有的鲸被解剖之后,胃里仅有一张15米长的渔网,它生前已经十几天没有进食了。有的鲸被捕杀时,肚子里还有... 我们曾在大连自然博物馆研学。在巨鲸厅参观时,我们为鲸面临的悲惨现状所震动:由于鲸能给人类带来巨大的经济利益,它们被大量捕杀。有的鲸被解剖之后,胃里仅有一张15米长的渔网,它生前已经十几天没有进食了。有的鲸被捕杀时,肚子里还有未出生的小宝宝。博物馆展出的捕鲸枪虽然已经生锈,但是依然让我们感受到杀气看着这些,我们心里感到十分难过。 展开更多
关键词 博物馆 研学
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部