目的零样本汉字识别(zero-shot Chinese character recognition,ZSCCR)因其能在零或少训练样本下识别未见汉字而受到广泛关注。现有的零样本汉字识别方法大多采用基于部首序列匹配框架,即首先预测部首序列,然后根据表意描述序列(ideogra...目的零样本汉字识别(zero-shot Chinese character recognition,ZSCCR)因其能在零或少训练样本下识别未见汉字而受到广泛关注。现有的零样本汉字识别方法大多采用基于部首序列匹配框架,即首先预测部首序列,然后根据表意描述序列(ideographic description sequence,IDS)字典进行最小编辑距离(minimum edit distance,MED)匹配。然而,现有的MED算法默认不同部首的替换代价、插入代价和删除代价相同,导致在匹配时候选字符类别存在距离代价模糊和冗余的问题。为此,提出了一种字符敏感编辑距离(character-aware edit distance,CAED)以正确匹配目标字符类别。方法通过设计多种部首信息提取方法,获得了更为精细化的部首描述,从而得到更精确的部首替换代价,提高了MED的鲁棒性和有效性;此外,提出部首计数模块预测样本的部首数量,从而形成代价门控以约束和调整插入和删除代价,克服了IDS序列长度预测不准确产生的影响。结果在手写汉字、场景汉字和古籍汉字等数据集上进行实验验证,与以往的方法相比,本文提出的CAED在识别未见汉字类别的准确率上分别提高了4.64%、1.1%和5.08%,同时对已见汉字类别保持相当的性能,实验结果充分表明了本方法的有效性。结论本文所提出的字符敏感编辑距离,使得替换、插入和删除3种编辑代价根据字符进行自适应调整,有效提升了对未见汉字的识别性能。展开更多
目的针对合成孔径雷达(synthetic aperture radar,SAR)图像舰船检测中因背景复杂、目标尺寸各异等因素导致的漏检、误检结果,提出一种基于YOLOv8(you only look once v8)的改进算法。方法首先,轻量化处理YOLOv8的原有网络结构,大幅降低...目的针对合成孔径雷达(synthetic aperture radar,SAR)图像舰船检测中因背景复杂、目标尺寸各异等因素导致的漏检、误检结果,提出一种基于YOLOv8(you only look once v8)的改进算法。方法首先,轻量化处理YOLOv8的原有网络结构,大幅降低网络的冗余度,使轻量化的网络更适合SAR图像舰船检测任务。其次,在主干网络中融入可变形卷积,增强模型对目标的感知能力,能更好地适应目标形变和复杂背景;同时,在颈部网络融入卷积注意力模块,减弱背景信息的干扰,使网络更专注舰船目标的特征。最后,采用EIoU(efficient intersection over union)损失函数,最小化预测框与真实框间的差值(包括宽度和高度),实现更快的收敛速度。结果分别在SSDD(SAR ship detection dataset)和HRSID(high-resolution SAR images dataset)上进行测试,结果表明,改进算法的检测性能优于当前几种流行的目标检测算法。其中,与YOLOv8相比,在两个公开数据集上,改进算法的精度评估指标mAP(mean average precision)@0.5分别提升0.68%和1.29%,mAP@0.75分别提升3.32%和3.10%,其处理速度FPS(frames per second)分别提升22帧/s和18帧/s。结论本文在轻量化处理YOLOv8基础上融合可变形卷积与注意力机制构建的改进算法,能实现SAR舰船检测精度和速度的双重提升。展开更多
针对忽视局部关系中的二阶标记关系问题,本文提出了一种基于全局和局部关系的类属特征多标记分类(global and lo⁃cal relationships based on multi⁃label classification algorithm with label⁃specific features,LFGML)算法。通过全...针对忽视局部关系中的二阶标记关系问题,本文提出了一种基于全局和局部关系的类属特征多标记分类(global and lo⁃cal relationships based on multi⁃label classification algorithm with label⁃specific features,LFGML)算法。通过全局关系的角度来获取类属特征,使用加权平均法计算每个实例的邻域信息,利用杰卡德相似度提取局部关系中的二阶标记关系。LFGML算法在10个多标记数据集Genbase、Medical、Arts、Health、Flags、Cal500、Yeast、Image、Education和Emotions进行了实验。结果表明,所提出的算法相对于其他对比算法在多标记分类中具有明显的的性能优势。展开更多
文摘目的零样本汉字识别(zero-shot Chinese character recognition,ZSCCR)因其能在零或少训练样本下识别未见汉字而受到广泛关注。现有的零样本汉字识别方法大多采用基于部首序列匹配框架,即首先预测部首序列,然后根据表意描述序列(ideographic description sequence,IDS)字典进行最小编辑距离(minimum edit distance,MED)匹配。然而,现有的MED算法默认不同部首的替换代价、插入代价和删除代价相同,导致在匹配时候选字符类别存在距离代价模糊和冗余的问题。为此,提出了一种字符敏感编辑距离(character-aware edit distance,CAED)以正确匹配目标字符类别。方法通过设计多种部首信息提取方法,获得了更为精细化的部首描述,从而得到更精确的部首替换代价,提高了MED的鲁棒性和有效性;此外,提出部首计数模块预测样本的部首数量,从而形成代价门控以约束和调整插入和删除代价,克服了IDS序列长度预测不准确产生的影响。结果在手写汉字、场景汉字和古籍汉字等数据集上进行实验验证,与以往的方法相比,本文提出的CAED在识别未见汉字类别的准确率上分别提高了4.64%、1.1%和5.08%,同时对已见汉字类别保持相当的性能,实验结果充分表明了本方法的有效性。结论本文所提出的字符敏感编辑距离,使得替换、插入和删除3种编辑代价根据字符进行自适应调整,有效提升了对未见汉字的识别性能。
文摘目的针对合成孔径雷达(synthetic aperture radar,SAR)图像舰船检测中因背景复杂、目标尺寸各异等因素导致的漏检、误检结果,提出一种基于YOLOv8(you only look once v8)的改进算法。方法首先,轻量化处理YOLOv8的原有网络结构,大幅降低网络的冗余度,使轻量化的网络更适合SAR图像舰船检测任务。其次,在主干网络中融入可变形卷积,增强模型对目标的感知能力,能更好地适应目标形变和复杂背景;同时,在颈部网络融入卷积注意力模块,减弱背景信息的干扰,使网络更专注舰船目标的特征。最后,采用EIoU(efficient intersection over union)损失函数,最小化预测框与真实框间的差值(包括宽度和高度),实现更快的收敛速度。结果分别在SSDD(SAR ship detection dataset)和HRSID(high-resolution SAR images dataset)上进行测试,结果表明,改进算法的检测性能优于当前几种流行的目标检测算法。其中,与YOLOv8相比,在两个公开数据集上,改进算法的精度评估指标mAP(mean average precision)@0.5分别提升0.68%和1.29%,mAP@0.75分别提升3.32%和3.10%,其处理速度FPS(frames per second)分别提升22帧/s和18帧/s。结论本文在轻量化处理YOLOv8基础上融合可变形卷积与注意力机制构建的改进算法,能实现SAR舰船检测精度和速度的双重提升。
文摘针对忽视局部关系中的二阶标记关系问题,本文提出了一种基于全局和局部关系的类属特征多标记分类(global and lo⁃cal relationships based on multi⁃label classification algorithm with label⁃specific features,LFGML)算法。通过全局关系的角度来获取类属特征,使用加权平均法计算每个实例的邻域信息,利用杰卡德相似度提取局部关系中的二阶标记关系。LFGML算法在10个多标记数据集Genbase、Medical、Arts、Health、Flags、Cal500、Yeast、Image、Education和Emotions进行了实验。结果表明,所提出的算法相对于其他对比算法在多标记分类中具有明显的的性能优势。