基于注意力模型的混合学习算法被引量：5

A Hybrid Algorithm Based on Attention Model

在线阅读下载PDF

导出

摘要为了解决传统BP(back-propagation)算法收敛速度慢,训练得到的网络性能较差的问题,在借鉴生理学中“选择性注意力模型”的基础上,将遗传算法与误差放大的BP学习算法进行了有机的融合,提出了基于注意力模型的快速混合学习算法.该算法的核心在于将单独的BP训练过程划分为许多小的切片,并对每个切片进行误差放大的训练和竞争淘汰机制的选择.通过发现收敛速率较快的个体和过滤陷入局部极值的个体,来保证网络训练的成功率和实现快速向全局最优区域逼近的目的.仿真结果表明,该算法有效地解决了传统BP算法中由于初始权值的随机性造成的训练失败问题,并能有效解决饱和区域引起的后期训练缓慢问题,在不增加网络隐层节点数的情况下,显著地提高了网络的收敛精度和泛化能力.这将使神经网络在众多实际的分类问题上具有更广泛的应用前景. A hybrid algorithm based on attention model (HAAM) is proposed to speed up the training of back-propagation neural networks and improve the performances. The algorithm combines the genetic algorithm with the BP algorithm based on magnified error signal. The key to this algorithm lies in the partition of the BP training process into many chips with each chip trained by the BP algorithm. The chips in the same iteration are optimized by the GA operators, and those in different iterations constitute the whole training. Therefore, the HAAM obtains the ability of searching the global optimum solution relying on these operations, and it is easy to be parallelly processed. The simulation experiments show that this algorithm can effectively avoid failure training caused by randomizing the initial weights and thresholds, and solve the slow convergence problem resulted from the Flat-Spots when the error signal becomes too small. Moreover, this algorithm improves the generalization of BP network by improving the training precision instead of adding hidden neurons.

作者杨博苏小红王亚东

机构地区哈尔滨工业大学计算机科学与技术学院

出处《软件学报》 EI CSCD 北大核心 2005年第6期1073-1080,共8页 Journal of Software

基金国家自然科学基金~~

关键词 BP算法人工神经网络注意力模型遗传算法饱和区域局部极值 back-propagation algorithm artificial neural network attention model genetic algorithm Flat-Spots local optimum

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1殷峻暹,陈守煜,邱菊.基于遗传与BP混合算法神经网络预测模型及应用[J].大连理工大学学报,2002,42(5):594-598. 被引量：21
2陶卿,曹进德,孙德敏,方廷健.基于约束区域神经网络的动态遗传算法[J].软件学报,2001,12(3):462-467. 被引量：10
3Li Yan, Kang ZhuoComputation Center, Wuhan University, Wuhan 430072, Hubei, China.A Two-Level Subspace Evolutionary Algorithm for Solving Multi-Modal Function Optimization Problems[J].Wuhan University Journal of Natural Sciences,2003,8(S1):249-252. 被引量：3
4郑志军,郑守淇.进化神经网络中的变异算子研究[J].软件学报,2002,13(4):726-731. 被引量：8
5张军,刘克胜,王煦法.一种基于免疫调节和共生进化的神经网络优化设计方法[J].计算机研究与发展,2000,37(8):924-930. 被引量：32
6杨国军,崔平远,李琳琳.遗传算法在神经网络控制中的应用与实现[J].系统仿真学报,2001,13(5):567-570. 被引量：48

二级参考文献15

1梁化楼,戴贵亮.人工神经网络与遗传算法的结合：进展及展望[J].电子学报,1995,23(10):194-200. 被引量：71
2胡铁松,袁鹏,丁晶.人工神经网络在水文水资源中的应用[J].水科学进展,1995,6(1):76-82. 被引量：98
3杨若黎,吴沧浦.一种新的非线性规划神经网络模型[J].自动化学报,1996,22(3):293-300. 被引量：4
4陈守煜.模糊模式识别神经网络预测理论[J].中国学术期刊文摘,1996,(11):46-46.
5刘勇康立山等.非数值并行算法：第二册，遗传算法[M].北京:科学出版社,2000.135-137.
6刘俊斌.MATLAB5．0语言与程序设计[M].武汉:华中理工大学,1998.1-25.
7楼顺天施阳.基于MATLAB的系统分析与设计－－神经网络[M].西安:西安电子科技大学出版社,2000..
8吴敏毓，医学免疫学，1995年
9云庆夏,黄光球.遗传算法和遗传规划及其在矿业中的应用[J].中国矿业,1997,6(2):62-66. 被引量：23
10马钧水,刘贵忠,贾玉兰.改进遗传算法搜索性能的大变异操作[J].控制理论与应用,1998,15(3):404-408. 被引量：84

共引文献114

1桑保华,薛晓中.基于方案弹道的简易制导炸弹在线神经网络控制设计[J].弹箭与制导学报,2006,26(S1):217-220.
2刘汉丽,周成虎,朱阿兴,李霖.多子群遗传神经网络模型用于路口短时交通流量预测[J].测绘学报,2009,38(4):363-368. 被引量：16
3刘芳,李人厚.基于模糊进化规划和分层方法的神经网络设计方法[J].信息与控制,2004,33(4):385-388. 被引量：3
4高志刚,李克鹏,李琦.基于遗传算法和神经网络的倒立摆控制系统[J].江西电力职业技术学院学报,2004,17(3):39-41. 被引量：5
5李茂军,罗安,童调生.人工免疫算法及其应用研究[J].控制理论与应用,2004,21(2):153-157. 被引量：43
6李敏远,都延丽.基于遗传算法学习的复合神经网络自适应温度控制系统[J].控制理论与应用,2004,21(2):242-246. 被引量：11
7刘志刚,王建华,耿英三,欧阳森.一种改进的遗传模拟退火算法及其应用[J].系统仿真学报,2004,16(5):1099-1101. 被引量：31
8汤放奇,李茂军,罗安.人工免疫算法的全局收敛性分析[J].长沙电力学院学报（自然科学版）,2004,19(3):1-4. 被引量：5
9章兢,周泉.基于免疫克隆算法的物流配送车辆路径优化研究[J].湖南大学学报（自然科学版）,2004,31(5):54-58. 被引量：10
10陈曦,林涛,唐贤瑛.遗传算法的参数设计与性能研究[J].计算机工程与设计,2004,25(8):1309-1310. 被引量：18

同被引文献64

1付振宪,邓正隆,魏宗康.惯导平台漂移误差参数估计的方案设计与仿真研究[J].中国惯性技术学报,1999,7(2):71-74. 被引量：5
2常晓宇,周春光,管恩政,梁艳春,徐秀娟,王喆.用育种算子改进遗传算法[J].吉林大学学报（信息科学版）,2005,23(2):157-161. 被引量：11
3杨国为,王守觉,闫庆旭.分式线性神经网络及其非线性逼近能力研究[J].计算机学报,2007,30(2):189-199. 被引量：19
4Becerikli Y,Oysal Y.Modeling and prediction with a class of time delay dynamic neural network[J].Applied Soft Computing,2007,7(4):1164-1169.
5Jakubek S,Keuth N.A local neuro-fuzzy network for high dimensional models and optimization engineering[J].Applications of Artificial Intelligence,2006,9(6):705-717.
6Pepijn W J,Johansen T A,Srensen J A,et al.Neural network augmented identification of underwater vehicle models[J].Control Engineering Practice,2007,15(6):715-725.
7Ra(s)it K(o)ker.Design and performance of an intelligent predictive controller for a six-degree-of-freedom robot using the Elman network[J].Information Sciences,2006,176(22):1781-1799.
8Chiang K W,Huang Y W.An intelligent navigator for seamless INS/GPS integrated land vehicle navigation[J].Applied Soft Computing,2008,8(1):722-733.
9Seo I H,Leeghim H,Bang H.Nonlinear momentum transfer control of a gyrostat with a discrete damper using neural network[J].ActaAstronautica,2008,62(6-7):357-373.
10Li Zhijun,Chen Weidong.Adaptive neural-fuzzy control of uncertain constrained multiple coordinated nonholonomic mobile manipulators[J].Engineering Applications of Artificial Intelligence,2008,21(1):985-1000.

引证文献5

1张长胜,欧阳丹彤,岳娜,张永刚.一种基于遗传算法和LM算法的混合学习算法[J].吉林大学学报（理学版）,2008,46(4):675-680. 被引量：24
2许江涛,崔乃刚,穆荣军.基于Elman网络结构的惯导平台漂移模型辨识方法[J].系统工程与电子技术,2010,32(7):1497-1500.
3陈悦,张少白.LM算法在神经网络脑电信号分类中的研究[J].计算机技术与发展,2013,23(2):119-122. 被引量：6
4武高博,王黎明,柴玉梅,刘箴.基于层次模型和注意力机制的文本分类算法[J].中文信息学报,2020,34(11):84-95. 被引量：2
5张怡文,袁宏武,孙鑫,吴海龙,董云春.基于Adam注意力机制的PM_(2.5)浓度预测方法[J].大气与环境光学学报,2021,16(2):117-126. 被引量：5

二级引证文献37

1董正琪,姜杰,赵雪成,杨增汪.Adam优化的BP神经网络地铁空调环境模式检测[J].电子测量技术,2022,45(24):111-117. 被引量：11
2岳娜,欧阳丹彤,张长胜,刘玉玺.噪声环境下函数优化问题的混合优化算法[J].吉林大学学报（理学版）,2008,46(5):891-896.
3翟千钧,孙钟皓,谷波.滚动转子式压缩机性能参数通用计算模型[J].低温工程,2009(6):46-51. 被引量：3
4王新颖,隽志才,吴庆妍,孙元.KNN算法的数据优化策略[J].吉林大学学报（信息科学版）,2010,28(3):309-313. 被引量：7
5于连江,吴春国,郭立强,梁艳春,杨锌朔.易物模型及其求解算法[J].吉林大学学报（理学版）,2010,48(4):653-657. 被引量：1
6武菊,任鹏.基于LM和SA的混合优化算法[J].内江师范学院学报,2010,25(8):32-34. 被引量：3
7崔玉洁,熊海灵,朱明强.BP神经网络在心理障碍诊断中的应用研究[J].计算机应用与软件,2012,29(3):35-38. 被引量：2
8窦甜华,张强.基于多传感器信息融合的火灾探测[J].智能建筑电气技术,2012,6(4):41-45. 被引量：5
9梁毅,刘世洪.基于遗传算法优化的BP神经网络的组合预测模型方法研究[J].中国农业科学,2012,45(23):4924-4930. 被引量：6
10怀丽波.最优化理论与方法在人工神经网络中的应用[J].科技创新导报,2013,10(3):55-55. 被引量：1

1杨博,王亚东,苏小红.基于切片模型的快速混合学习算法[J].哈尔滨工业大学学报,2006,38(5):685-688. 被引量：1
2张春合,李会方,贾鹏.基于误差放大的BP算法改进[J].火力与指挥控制,2009,34(7):86-88.
3陈梦泽.基于视觉注意力的视频水印算法[J].长春师范大学学报（人文社会科学版）,2012,31(12):15-19.
4Kerstin Sophie Haring,Katsumi Watanabe,Marco Ragni,Lars Konieczny.The Use of ACT-R to Develop an Attention Model for Simple Driving Tasks[J].Psychology Research,2013,3(4):189-198.
5高静静,张菁,沈兰荪.视觉注意力模型的改进算法[J].电子测量技术,2008,31(3):1-3. 被引量：7
6贺昱曜,方忠,徐德民.前向神经网络学习算法进展[J].电气自动化,1999,21(6):4-6. 被引量：1
7刘振凯,蔡青.基于人工神经网络的电机设计知识表示方法研究[J].电工技术学报,1998,13(2):6-9. 被引量：2
8胡明霞.基于BP神经网络的入侵检测算法[J].计算机工程,2012,38(6):148-150. 被引量：37
9李永浩,张西红,彭涛,徐旭.基于视觉注意力模型的红外人体图像兴趣区域提取[J].计算机应用研究,2011,28(12):4794-4796. 被引量：2
10刘佳璐,刘琼荪,胡上尉.基于放大误差信号的BP算法[J].计算机工程与应用,2007,43(21):90-92. 被引量：3

软件学报

2005年第6期

浏览历史

内容加载中请稍等...

基于注意力模型的混合学习算法被引量：5

参考文献6

二级参考文献15

共引文献114

同被引文献64

引证文献5

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

基于注意力模型的混合学习算法 被引量：5

参考文献6

二级参考文献15

共引文献114

同被引文献64

引证文献5

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

基于注意力模型的混合学习算法被引量：5