期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于通道和帧级特征注意力模型的环境声音识别
被引量:
8
1
作者
苏瑞轩
葛动元
姚锡凡
《科学技术与工程》
北大核心
2024年第16期6792-6798,共7页
为了对环境声音进行更好的识别,提出基于通道和帧级特征注意力的环境声音识别卷积神经网络模型。该模型针对声音特征特点选取一维卷积以提高模型对声音特征信息的提取能力,并引入SE-Res2Net模块实现对声音特征细粒度上的全局感受并帮助...
为了对环境声音进行更好的识别,提出基于通道和帧级特征注意力的环境声音识别卷积神经网络模型。该模型针对声音特征特点选取一维卷积以提高模型对声音特征信息的提取能力,并引入SE-Res2Net模块实现对声音特征细粒度上的全局感受并帮助模型关注特征通道间的信息,在全连接层前加入注意力统计池化模块,增强模型对表征不同声音类别的关键帧级特征的学习以提高模型识别性能。采用Urbansound8K数据集,实验结果表明:所提模型在测试集上的训练准确率达到94.5%,即模型可以有效学习声音特征中表征不同环境声音的关键信息并进行正确预测。对消融实验结果分析可得,所提模型的设计可使其分类错误率的下降率达到43.8%,表明模型对一维卷积的应用和各个模块的引入是有效的,可见所提环境声音识别模型性能优越。
展开更多
关键词
声音识别
细粒度
通道加权
帧级特征
注意力统计池化
在线阅读
下载PDF
职称材料
融合Swin Transformer和CNN的环境声音分类模型
2
作者
朱振飞
葛动元
+1 位作者
姚锡凡
苏瑞轩
《科学技术与工程》
北大核心
2024年第28期12259-12267,共9页
环境声音分类已经成为计算机听觉领域的一项重要任务,可以作为计算机视觉的补充,帮助设备更好地理解环境和用户需求,具有广泛的应用前景,将对人类生活产生积极影响。近年来,环境声音分类领域采用了具有自注意力机制的Transformer模型,...
环境声音分类已经成为计算机听觉领域的一项重要任务,可以作为计算机视觉的补充,帮助设备更好地理解环境和用户需求,具有广泛的应用前景,将对人类生活产生积极影响。近年来,环境声音分类领域采用了具有自注意力机制的Transformer模型,然而现有模型需要较大的内存,同时依赖于预训练的视觉模型,无法较好提取音频特征。为了解决这些问题并提高环境声音分类准确度,提出了一种新的具有双分支结构的Swin Conformer环境声音分类模型。通过融合卷积神经网络和具有窗口自注意力机制的Swin Transformer模型,以交互方式融合双分支特征并引入令牌语义模块。结果表明:Swin Conformer模型在ESC-50和UrbanSound8K公共数据集上分别通过验证实现了98.1%和96.8%的分类准确度。与现有模型相比,具有更高的分类准确度,证明了该模型在环境声音分类任务中的可行性和优越性。
展开更多
关键词
环境声音分类
数据增强
TRANSFORMER
自注意力
在线阅读
下载PDF
职称材料
鲸生鲸语
3
作者
苏瑞轩
董明
轩
陈雪(指导)
《中学科技》
2022年第10期24-25,共2页
我们曾在大连自然博物馆研学。在巨鲸厅参观时,我们为鲸面临的悲惨现状所震动:由于鲸能给人类带来巨大的经济利益,它们被大量捕杀。有的鲸被解剖之后,胃里仅有一张15米长的渔网,它生前已经十几天没有进食了。有的鲸被捕杀时,肚子里还有...
我们曾在大连自然博物馆研学。在巨鲸厅参观时,我们为鲸面临的悲惨现状所震动:由于鲸能给人类带来巨大的经济利益,它们被大量捕杀。有的鲸被解剖之后,胃里仅有一张15米长的渔网,它生前已经十几天没有进食了。有的鲸被捕杀时,肚子里还有未出生的小宝宝。博物馆展出的捕鲸枪虽然已经生锈,但是依然让我们感受到杀气看着这些,我们心里感到十分难过。
展开更多
关键词
博物馆
鲸
研学
原文传递
题名
基于通道和帧级特征注意力模型的环境声音识别
被引量:
8
1
作者
苏瑞轩
葛动元
姚锡凡
机构
广西科技大学机械与汽车工程学院
华南理工大学机械与汽车工程学院
出处
《科学技术与工程》
北大核心
2024年第16期6792-6798,共7页
基金
国家自然科学基金(51765007)。
文摘
为了对环境声音进行更好的识别,提出基于通道和帧级特征注意力的环境声音识别卷积神经网络模型。该模型针对声音特征特点选取一维卷积以提高模型对声音特征信息的提取能力,并引入SE-Res2Net模块实现对声音特征细粒度上的全局感受并帮助模型关注特征通道间的信息,在全连接层前加入注意力统计池化模块,增强模型对表征不同声音类别的关键帧级特征的学习以提高模型识别性能。采用Urbansound8K数据集,实验结果表明:所提模型在测试集上的训练准确率达到94.5%,即模型可以有效学习声音特征中表征不同环境声音的关键信息并进行正确预测。对消融实验结果分析可得,所提模型的设计可使其分类错误率的下降率达到43.8%,表明模型对一维卷积的应用和各个模块的引入是有效的,可见所提环境声音识别模型性能优越。
关键词
声音识别
细粒度
通道加权
帧级特征
注意力统计池化
Keywords
sound recognition
fine-grained
channel weighting
frame-level features
attention statistics pooling
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合Swin Transformer和CNN的环境声音分类模型
2
作者
朱振飞
葛动元
姚锡凡
苏瑞轩
机构
广西科技大学机械与汽车工程学院
华南理工大学机械与汽车工程学院
出处
《科学技术与工程》
北大核心
2024年第28期12259-12267,共9页
基金
国家自然科学基金(51765007)
广西科技大学研究生教育创新计划项目(GKYC202307)。
文摘
环境声音分类已经成为计算机听觉领域的一项重要任务,可以作为计算机视觉的补充,帮助设备更好地理解环境和用户需求,具有广泛的应用前景,将对人类生活产生积极影响。近年来,环境声音分类领域采用了具有自注意力机制的Transformer模型,然而现有模型需要较大的内存,同时依赖于预训练的视觉模型,无法较好提取音频特征。为了解决这些问题并提高环境声音分类准确度,提出了一种新的具有双分支结构的Swin Conformer环境声音分类模型。通过融合卷积神经网络和具有窗口自注意力机制的Swin Transformer模型,以交互方式融合双分支特征并引入令牌语义模块。结果表明:Swin Conformer模型在ESC-50和UrbanSound8K公共数据集上分别通过验证实现了98.1%和96.8%的分类准确度。与现有模型相比,具有更高的分类准确度,证明了该模型在环境声音分类任务中的可行性和优越性。
关键词
环境声音分类
数据增强
TRANSFORMER
自注意力
Keywords
environmental sound classification
data augmentation
Transformer
self-attention
分类号
TP391.7 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
鲸生鲸语
3
作者
苏瑞轩
董明
轩
陈雪(指导)
机构
大连理工大学附属学校
不详
出处
《中学科技》
2022年第10期24-25,共2页
文摘
我们曾在大连自然博物馆研学。在巨鲸厅参观时,我们为鲸面临的悲惨现状所震动:由于鲸能给人类带来巨大的经济利益,它们被大量捕杀。有的鲸被解剖之后,胃里仅有一张15米长的渔网,它生前已经十几天没有进食了。有的鲸被捕杀时,肚子里还有未出生的小宝宝。博物馆展出的捕鲸枪虽然已经生锈,但是依然让我们感受到杀气看着这些,我们心里感到十分难过。
关键词
博物馆
鲸
研学
分类号
G26 [历史地理—考古学及博物馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于通道和帧级特征注意力模型的环境声音识别
苏瑞轩
葛动元
姚锡凡
《科学技术与工程》
北大核心
2024
8
在线阅读
下载PDF
职称材料
2
融合Swin Transformer和CNN的环境声音分类模型
朱振飞
葛动元
姚锡凡
苏瑞轩
《科学技术与工程》
北大核心
2024
0
在线阅读
下载PDF
职称材料
3
鲸生鲸语
苏瑞轩
董明
轩
陈雪(指导)
《中学科技》
2022
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部