改进DBNet的电商图像文字检测算法研究被引量：3

iSFF-DBNet:An improved text detection algorithm in e-commerce images

在线阅读下载PDF

导出

摘要电商图像背景较为复杂、文字区域形状多变,现有的文字检测模型无法精确检测文字位置这一问题。提出一种改进的文字检测模型——迭代自选择特征融合DBNet(iSFF-DBNet)。首先在主干网络提取特征后,在构建特征金字塔网络FPN的过程中引入注意力机制;然后提出了迭代自选择特征融合模块iSFF来提升模型的特征提取能力;最后引入双边上采样模块提升可微分二值化模块的自适应性能。实验结果表明,在ICPR MTWI 2018网络图像数据集文本检测任务中,对比标准的DBNet模型,所提改进模型的召回率和F-score分别提升了6.0%和2.4%。与其他文字检测模型相比,该模型在精确率和召回率上取得了平衡,能够更准确地检测文字。 Aiming at the problem that existing text detection models cannot accurately detect text locations due to complex backgrounds and variable text region shapes in e-commerce images,an improved text detection model,named Iterative Self-selective Feature Fusion DBNet(iSFF-DBNet),is proposed.Firstly,after extracting features from the backbone network,an attention mechanism is introduced in the process of building a Feature Pyramid Network(FPN),and an Iterative Self-selective Feature Fusion(iSFF)module is proposed to enhance the feature extraction ability of the model.Finally,a bilinear upsampling module is introduced to improve the adaptive performance of the differentiable binaryization module.Experimental results show that compared to the standard DBNet model,the recall and F-score of the improved model are increased by 6.0%and 2.4%,respectively,in the text detection task of the ICPR MTWI 2018 web-scale image dataset.Compared with other text detection models,this model achieves a balance between accuracy and recall,and can detect text more accurately.

作者李卓璇周亚同 LI Zhuo-xuan;ZHOU Ya-tong(School of Electronic and Information Engineering,Hebei University of Technology,Tianjin 300401,China)

机构地区河北工业大学电子信息工程学院

出处《计算机工程与科学》 CSCD 北大核心 2023年第11期2008-2017,共10页 Computer Engineering & Science

基金京津冀基础研究合作专项(H2021202008,J210008) 内蒙古自治区纪检监察大数据实验室开放课题(IMDBD202105)。

关键词文字检测多尺度特征特征融合深度学习 character detection multi-scale feature feature fusion deep learning

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1喻君洁.我国直播电商发展存在的问题及解决策略[J].商展经济,2021(24):32-34. 被引量：5

二级参考文献7

1赵子忠,陈连子.直播电商的传播理论、发展现状、产业结构及反思[J].中国广播,2020(9):11-18. 被引量：24
2胡珊珊,段彩璇,蒋禧妙,陈昱澄,张陈旺.移动直播联动带货电商模式优化策略研究[J].商展经济,2021(8):13-15. 被引量：3
3俞华,刘甜甜.我国直播电商发展现状[J].中国国情国力,2021(6):33-40. 被引量：12
4李心如,张翠英.电商直播中消费者的消费心理分析[J].商展经济,2021(13):52-54. 被引量：7
5余法河.直播电商中存在的问题及规制[J].中国商论,2021(14):9-11. 被引量：10
6高涵,陈子威,陈颖,李雪.直播电商可持续性发展的路径研究[J].新经济,2021(8):89-93. 被引量：2
7臧程程,赵婷婷.我国电商直播的发展现状、问题与规制路径[J].新媒体研究,2021,7(10):49-53. 被引量：5

共引文献4

1黄荣晟.数字化背景下电商直播带货的营销模式创新[J].中国商论,2022(17):34-36. 被引量：9
2刘乃铭.电商直播带货存在的问题及对策——以农产品为例[J].辽宁经济职业技术学院学报.辽宁经济管理干部学院,2022(6):21-23. 被引量：6
3陈华,白卫星.产教融合背景下新型电商人才培养路径研究[J].中州大学学报,2023,40(4):105-110. 被引量：6
4曾国威,罗震东.城市直播电商空间集聚与扩散趋势研究——以杭州市主城区为例[J].地域研究与开发,2024,43(2):91-97. 被引量：1

同被引文献13

1胡龙灿,杨帆,樊爱军.手写数学公式的识别研究及在Android上的应用[J].计算机应用与软件,2014,31(8):28-31. 被引量：2
2付鹏斌,彭荆旋,杨惠荣,李建君.基于多重几何特征和CNN的脱机手写算式识别[J].计算机系统应用,2020,29(8):271-279. 被引量：2
3甘晓英,白阳,何晓栋,刘斌.一种并行二值图像连通域标记算法[J].计算机与数字工程,2021,49(5):993-997. 被引量：10
4沈佳伟,周宇昂,赵天宇,周渊,周志豪,张娟.手写数学表达式识别方法研究[J].福建电脑,2021,37(7):59-61. 被引量：1
5王栋.人工智能OCR技术的应用研究[J].电子技术与软件工程,2022(1):122-125. 被引量：30
6雷嘉兴,王伟.二维傅里叶图像预处理对DNN网络的影响研究[J].科学技术创新,2022(11):61-64. 被引量：2
7王巍,周庆华.基于改进Faster R-CNN的算式检测与定位[J].智能计算机与应用,2022,12(12):164-168. 被引量：2
8徐劲力,李征瑞,黄丰云,许建宁.基于改进多尺度形态学的裂缝图像去噪算法[J].计算机应用与软件,2023,40(3):255-259. 被引量：3
9李佳慧,李秀云,李超,李晓磊.基于改进DBNet的复杂自然场景文本检测技术[J].长江信息通信,2023,36(7):10-13. 被引量：1
10孙隽姝,王树徽,杨晨雪,黄庆明,郑振刚.附加特征图增强的图卷积神经网络[J].计算机学报,2023,46(9):1900-1918. 被引量：2

引证文献3

1刘兴豪,陈芷妍,何滨,童保鑫,李文全.基于手机拍照的手写算式识别研究[J].信息技术与信息化,2024(6):68-71.
2郭改文,吴笛鸣,王楠.基于深度学习的冠状动脉CT图像分割算法研究[J].河南财政金融学院学报（自然科学版）,2024,33(3):9-13.
3邓伟超,俞鑫春,朱建宝,马青山,陈宇,叶超,张才智,葛春燕.基于DBNet-CST的文本检测模型[J].通信与信息技术,2025(1):100-103.

1满莎.高职院校“云约式”教学模式的构建[J].无线互联科技,2023,20(17):150-152.
2寿绍安,罗海荣,王晓康,张洁,虎俊,周剑桥.基于VMD-ISODATA-DBN的配电台区短期负荷预测方法[J].智慧电力,2023,51(11):53-60. 被引量：9
3王赛楠,杨诚.基于人脸关键点检测的社区门禁系统设计与实现[J].常州信息职业技术学院学报,2023,22(5):20-23.
4陈银燕,王超,赵冉冉.《气动控制技术》课程思政评价体系的构建与实践[J].学周刊,2023(36):49-51.
5刘译善,孙涵.基于特征增强的RGB-D显著性目标检测[J].计算机技术与发展,2023,33(11):28-34. 被引量：1
6李维刚,陈婷,田志强.基于孪生自适应图卷积算法的点云分类与分割[J].计算机应用,2023,43(11):3396-3402. 被引量：3
7陈世炳,潘晶晶,王斌,林金山,罗雁.基于改进梯度提升决策树的10 kV及以下配电网线损率预测[J].系统仿真技术,2023,19(2):120-123. 被引量：3
8Abdelwahed Motwakel,Hala J.Alshahrani,Jaber S.Alzahrani,Ayman Yafoz,Heba Mohsen,Ishfaq Yaseen,Amgad Atta Abdelmageed,Mohamed I.Eldesouki.Deer Hunting Optimization with Deep Learning Enabled Emotion Classification on English Twitter Data[J].Computer Systems Science & Engineering,2023,47(12):2741-2757.

计算机工程与科学

2023年第11期

浏览历史

内容加载中请稍等...

改进DBNet的电商图像文字检测算法研究被引量：3

参考文献1

二级参考文献7

共引文献4

同被引文献13

引证文献3

相关作者

相关机构

相关主题

浏览历史

改进DBNet的电商图像文字检测算法研究 被引量：3

参考文献1

二级参考文献7

共引文献4

同被引文献13

引证文献3

相关作者

相关机构

相关主题

浏览历史

改进DBNet的电商图像文字检测算法研究被引量：3