期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多流卷积和数据增强的声场景分类方法 被引量:5
1
作者 曹毅 费鸿博 +1 位作者 李平 张小勇 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第4期40-46,共7页
针对单特征输入时,现有声场景分类方法分类准确率不高且泛化能力不强的问题,提出了一种基于多流卷积和数据增强的声场景分类方法.首先,介绍了卷积神经网络和混合数据增强的基本原理;其次,基于网络并行输入理论,设计了一种多流卷积神经... 针对单特征输入时,现有声场景分类方法分类准确率不高且泛化能力不强的问题,提出了一种基于多流卷积和数据增强的声场景分类方法.首先,介绍了卷积神经网络和混合数据增强的基本原理;其次,基于网络并行输入理论,设计了一种多流卷积神经网络模型以期实现多流特征融合,其由特征提取模块和特征融合模块组成;然后,为进一步提升模型的准确率并降低模型过拟合的概率,提出了一种多维混合数据增强方法以实现特征数据的平滑处理;最后,采用9种特征组合方案,基于Urbansound8K,ESC50和ESC10数据集分别开展了声场景分类实验.实验结果表明:模型的准确率分别为88.29%,77.75%和96.25%,验证了当使用该方法进行声场景分类研究时,模型具有较高的准确率和较强的泛化能力. 展开更多
关键词 声场景分类 多流特征融合 多流卷积神经网络 过拟合 多维混合数据增强
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部