深度学习算法的激活函数研究被引量：28

Research on Activation Function of Deep Learnimg Algorithm

在线阅读下载PDF

导出

摘要作为深度学习算法中重要的环节,激活函数可以为神经网络引入非线性因素。大量学者通过提出或改进激活函数的方法在一定程度上提高了算法的优化及泛化能力。研究了现阶段的激活函数,将激活函数大致分为S系激活函数和ReLU系激活函数,从不同激活函数的功能特点和存在的饱和性、零点对称和梯度消失及梯度爆炸的现象进行研究分析,针对Sigmoid,Tanh,ReL,P-ReLU,L-ReLU等典型激活函数分别应用在卷积神经网络(Covolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)中测试。在CNN中使用MNIST,CIFAR-10经典数据集测试不同激活函数,并在RNN中使用大豆粮油数据集对大豆的产值进行预警,通过结果得到S系激活函数比ReLU系激活函数收敛更快,而ReLU系激活函数则在精度上优于S系激活函数,其中P-ReLU在大豆产值预测中达到93%的最高精度。 Since Deep Learning algorithm has attracted widespread attention,academia has made great efforts to improve algorithm’s optimization performance.As an important part of deep learning algorithm,activation function introduces non-linear factors to neural networks.A lot of authors have,to some extent,improved optimization and generalization of the algorithm by proposing or updating activation function methods.This article roughly divides activation functions into S-system activation function and ReLU-system activation function after a thorough research.Starting with researching and analyzing functional characteristics of different activation functions,such as the existence of saturation,zero symmetry,gradient disappearance and gradient explosion,the article focuses on the typical activation functions such as Sigmoid,Tanh,ReLU and P-ReLU,and their respective test results in Convolutional Neural Network(CNN)and Recurrent Neural Network(RNN).Classic data sets like MNIST and CIFAR-10 in CNN are used to test different activation functions.Soybean data set are used in RNN to give an early warning to the output value,which shows that the S-system activation function converges faster than the ReLU-system activation function while ReLU-system has an edge in accuracy,P-ReLU achieved the highest accuracy of 93%in soybean yield prediction.

作者张有健陈晨王再见 ZHANG Youjian;CHEN Chen;WANG Zaijian(The School of Physics and Electronic Information,Anhui Normal University,Wuhu 241000,China;Anhui Provincial Engineering Laboratory on Information Fusion and Control for Intelligent Robot,Wuhu 241000,China)

机构地区安徽师范大学物理与电子信息学院安徽省智能机器人信息融合与控制工程实验室

出处《无线电通信技术》 2021年第1期115-120,共6页 Radio Communications Technology

基金粮食信息处理与控制教育部重点实验室开放基金(KFJJ-2018-205)。

关键词激活函数卷积神经网络循环神经网络深度学习 activation function CNN RNN deep learning

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1杨丽,吴雨茜,王俊丽,刘义理.循环神经网络研究综述[J].计算机应用,2018,38(A02):1-6. 被引量：444
2蒋昂波,王维维.ReLU激活函数优化研究[J].传感器与微系统,2018,37(2):50-52. 被引量：111

二级参考文献4

1李宏伟,吴庆祥.智能传感器中神经网络激活函数的实现方案[J].传感器与微系统,2014,33(1):46-48. 被引量：8
2张剑,屈丹,李真.基于词向量特征的循环神经网络语言模型[J].模式识别与人工智能,2015,28(4):299-305. 被引量：41
3李超,柴玉梅,南晓斐,高明磊.基于深度学习的问题分类方法研究[J].计算机科学,2016,43(12):115-119. 被引量：25
4任智慧,徐浩煜,封松林,周晗,施俊.基于LSTM网络的序列标注中文分词法[J].计算机应用研究,2017,34(5):1321-1324. 被引量：69

共引文献552

1吴煌,杨智成,李梦华.基于长短期记忆神经网络的矿井涌水量预测[J].中国水运（下半月）,2023,23(3):25-27. 被引量：4
2姚晨明,姚磊.基于智能感知与数据决策的疏浚与通航预警系统研发[J].中国水运（下半月）,2022,22(9):35-36. 被引量：1
3孙铭,魏守科,王莹洁,赵金东,袁梅雪.基于小波分解的LSTM水质预测模型[J].计算机系统应用,2020,29(12):55-63. 被引量：11
4许昱旻,郭春.基于移动平均和神经网络的公路隧道运营通风折减率修正研究[J].现代隧道技术,2022,59(S01):121-127. 被引量：3
5秦帅波.中医知识智能诊断系统的研究[J].计算机产品与流通,2020,9(1):142-142.
6董建宁,张淇钧,陈衡,冯福媛,潘佩媛,徐钢,王修彦,刘彤.基于GRU门控循环单元的火电AGC数据建模及应用[J].洁净煤技术,2024,30(S01):406-413. 被引量：1
7柴晋,乔加飞,孙灏,梁占伟,张千.神经网络算法在脱硫系统优化中的应用进展[J].洁净煤技术,2021,27(S02):27-32. 被引量：3
8李治甫,康帅,尹俊红,王楷诚.基于深度学习的框架结构损伤识别研究[J].河南大学学报（自然科学版）,2024,54(1):100-109. 被引量：1
9李昌明.经验模态分解融合深度学习的时间序列预测模型[J].辽宁工程技术大学学报（自然科学版）,2022,41(2):175-183. 被引量：1
10郭小萍,钟道金,李元.基于AMSDAE-BLSTM的工业过程质量预测[J].电子测量技术,2023,46(4):19-24.

同被引文献292

1曹富奎,白天,许晓珑.基于公路监控视频的车辆检测和分类[J].计算机系统应用,2020,29(10):267-273. 被引量：5
2邱锡鹏.《神经网络与深度学习》[J].中文信息学报,2020(7):4-4. 被引量：18
3张磊,王洪涛,刘卫,刘明红.基于高维数据和深度学习的短期电力负荷预测[J].科技通报,2021,37(3):55-59. 被引量：6
4白铂,刘玉婷,马驰骋,王光辉,闫桂英,闫凯,张明,周志恒.图神经网络[J].中国科学：数学,2020,50(3):367-384. 被引量：29
5邓建国,张素兰,张继福,荀亚玲,刘爱琴.监督学习中的损失函数及应用研究[J].大数据,2020,6(1):60-80. 被引量：46
6万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：63
7刘永明.岩屑录井技术发展之前瞻[J].中国石油和化工标准与质量,2012,32(11):117-117. 被引量：2
8田苗苗.数据挖掘之决策树方法概述[J].长春大学学报,2004,14(6):48-51. 被引量：45
9柳金钟,张海翠,王秀荣,王明荣,王召英.文72块沙三中地层特征分析及岩性特征识别[J].内蒙古石油化工,2005,31(8):156-159. 被引量：2
10潘和平,樊政军,马勇.低阻油气层识别方法研究[J].天然气工业,2006,26(2):66-68. 被引量：23

引证文献28

1高如新,常嘉浩,杜亚博,刘群坡.基于改进YOLOv5s的煤矸石目标检测算法[J].电子测量技术,2023,46(13):95-101. 被引量：1
2高明宇,倪海明,张博洋,陈剑峰,戚大伟,牟洪波.一种基于GoogLeNet卷积神经网络的木节缺陷识别方法[J].森林工程,2021,37(4):66-70. 被引量：21
3许玉蕊,刘银华,高鑫.基于特征融合卷积神经网络的垃圾分类[J].自动化与仪表,2021,36(9):11-16. 被引量：3
4苏静,许天琪,张贤坤,史艳翠,顾淑婷.基于图卷积与外积的协同过滤推荐模型[J].计算机应用研究,2021,38(10):3044-3048. 被引量：10
5吴风浪.应用无限深度神经网络的大数据分析方法[J].信息技术,2021,45(10):110-116. 被引量：2
6曹展家,师本慧.基于堆叠双向LSTM的雷达目标识别方法[J].计算机测量与控制,2021,29(12):126-130. 被引量：3
7王沐晨,李立州,张珺,黄钰棋,张林,石玥.基于卷积神经网络气动力降阶模型的翼型优化方法[J].应用数学和力学,2022,43(1):77-83. 被引量：9
8任志玲,南忠明.基于改进CNN的串联型故障电弧识别方法研究[J].控制工程,2022,29(2):263-270. 被引量：8
9李鑫,任德均,任秋霖,曹林杰,闫宗一.基于Retinanet的轮毂焊缝检测定位方法[J].计算机与现代化,2022(9):60-67.
10马俊文,严京海,孙瑞雯,刘保献.基于LSTM-GCN的PM_(2.5)浓度预测模型[J].中国环境监测,2022,38(5):153-160. 被引量：11

二级引证文献89

1杨松,王宝金,沈锦桃.单板缺陷自动化修补技术研究进展[J].世界林业研究,2023,36(3):63-68.
2高飞,林凯杰.基于图卷积网络的双向协同过滤推荐算法[J].软件,2021,42(7):32-38. 被引量：1
3孙炜,陆一枝,商庆清.基于神经网络的杨树苗木注射针头阻力预测模型研究[J].林业机械与木工设备,2021,49(10):32-35. 被引量：1
4冯兴杰,生晓宇.基于图神经网络与深度学习的商品推荐算法[J].计算机应用研究,2021,38(12):3617-3622. 被引量：13
5严飞,章继鸿,姚宇晨,刘军.改进的Unet型木材缺陷图像分割方法[J].林业机械与木工设备,2022,50(1):41-45. 被引量：1
6王蒙,黄俐,殷鸿鑫.基于振动与图像检测的车轮踏面擦伤检测系统设计[J].自动化技术与应用,2022,41(4):127-131. 被引量：1
7秦瑞霞,徐华东,陈能志,甄宗霖,魏解东.基于介电谱的介电常数与木材含水率的相关性[J].中南林业科技大学学报,2022,42(3):162-169. 被引量：7
8韦昱伶,王关平,王成江,于莹.基于介电特性的花椒湿基含水率预测研究[J].林业机械与木工设备,2022,50(4):59-63. 被引量：1
9李应果,杨洁.基于阈值分割的单板穿孔缺陷识别算法研究[J].西北林学院学报,2022,37(3):199-204. 被引量：5
10吕旭昕,窦洛文,落昊飞,白骅.绿视率与NDVI值相结合的道路空间绿量可视性研究——以沣东新区为例[J].西北林学院学报,2022,37(3):239-245. 被引量：7

1李继勇,张娇扬,陈媛.基于灰色模型的河北省战略性新兴产业产值预测研究[J].数学的实践与认识,2020,50(14):303-311. 被引量：1
2吴雪莲,李兆伟,刘福锁,朱玲,段方维,范维.大功率扰动下计及系统频率分布特性的紧急控制策略研究[J].电力系统保护与控制,2021,49(3):104-114. 被引量：15
3窦柯宁,孙小淇.自适应遗传算子优化BP神经网络的气温预测[J].应用数学进展,2021,10(1):258-267. 被引量：1
4王康,霍朝宾,李青旭.一种基于鸽群优化算法的入侵检测技术[J].电子技术应用,2021,47(2):11-15. 被引量：1
5曹建荣,吕俊杰,武欣莹,张旭,杨红娟.融合运动特征和深度学习的跌倒检测算法[J].计算机应用,2021,41(2):583-589. 被引量：23
6曹桂涛,朱贺,叶雪香.反应堆结构三维非线性抗冲击分析[J].核动力工程,2021,42(1):70-74.
7何伟,李磊民,黄玉清.嵌入式平台上运动目标的稳定实时跟踪算法[J].传感器与微系统,2021,40(2):139-141.
8秦钟,杨建国,王海默,杨佳睿,崔春晖.基于Retinex理论的低照度下输电线路图像增强方法及应用[J].电力系统保护与控制,2021,49(3):150-157. 被引量：22

无线电通信技术

2021年第1期

浏览历史

内容加载中请稍等...

深度学习算法的激活函数研究被引量：28

参考文献2

二级参考文献4

共引文献552

同被引文献292

引证文献28

二级引证文献89

相关作者

相关机构

相关主题

浏览历史

深度学习算法的激活函数研究 被引量：28

参考文献2

二级参考文献4

共引文献552

同被引文献292

引证文献28

二级引证文献89

相关作者

相关机构

相关主题

浏览历史

深度学习算法的激活函数研究被引量：28