在医学图像分割领域U-Net已经成为了被应用最广泛的医学图像分割模型,许多有关医学图像分割的研究都用U-Net作为基线标准。以U-Net为基础的一系列变体分割模型也相继问世,其中包括CoTr,其为Convolutional neural network and a Transfor...在医学图像分割领域U-Net已经成为了被应用最广泛的医学图像分割模型,许多有关医学图像分割的研究都用U-Net作为基线标准。以U-Net为基础的一系列变体分割模型也相继问世,其中包括CoTr,其为Convolutional neural network and a Transformer的简称。就如其名,CoTr是一个结合了卷积神经网络和Transformer,具有类似U-Net的U形结构的分割网络。CoTr构造卷积层以提取特征表示,并且构造有效的可变形Transformer (DeTrans)以对提取的特征图的长程依赖性进行建模。与平等对待所有关键位置的vanilla Transformer不同,DeTrans通过引入可变形的自注意机制,只关注一小部分关键位置。因此,DeTrans的计算和空间复杂性大大降低,使得处理多尺度和高分辨率特征图成为可能,而这些特征图通常对图像分割至关重要。CoTr模型在多模态腹部分割数据集(Amos数据集)上进行了广泛评估。结果表明,在3D多器官分割任务上,与其他基于CNN、基于Transformer和混合方法相比,CoTr带来了持续的性能改进。展开更多
近年来场景文本检测技术飞速发展,提出一种可适用于任意形状文本检测的新颖算法Mask Text Detector.该算法在Mask R-CNN的基础上,用anchor-free的方法替代了原本的RPN层生成建议框,减少了超参、模型参数和计算量.还提出LQCS(Localizatio...近年来场景文本检测技术飞速发展,提出一种可适用于任意形状文本检测的新颖算法Mask Text Detector.该算法在Mask R-CNN的基础上,用anchor-free的方法替代了原本的RPN层生成建议框,减少了超参、模型参数和计算量.还提出LQCS(Localization Quality and Classification Score)joint regression,能够将坐标质量和类别分数关联到一起,消除预测阶段不一致的问题.为了让网络区分复杂样本,结合传统的边缘检测算法提出Socle-Mask分支生成分割掩码.该模块在水平和垂直方向上分区别提取纹理特征,并加入通道自注意力机制,让网络自主选择通道特征.我们在三个具有挑战性的数据集(Total-Text、CTW1500和ICDAR2015)中进行了广泛的实验,验证了该算法具有很好的文本检测性能.展开更多
文摘在医学图像分割领域U-Net已经成为了被应用最广泛的医学图像分割模型,许多有关医学图像分割的研究都用U-Net作为基线标准。以U-Net为基础的一系列变体分割模型也相继问世,其中包括CoTr,其为Convolutional neural network and a Transformer的简称。就如其名,CoTr是一个结合了卷积神经网络和Transformer,具有类似U-Net的U形结构的分割网络。CoTr构造卷积层以提取特征表示,并且构造有效的可变形Transformer (DeTrans)以对提取的特征图的长程依赖性进行建模。与平等对待所有关键位置的vanilla Transformer不同,DeTrans通过引入可变形的自注意机制,只关注一小部分关键位置。因此,DeTrans的计算和空间复杂性大大降低,使得处理多尺度和高分辨率特征图成为可能,而这些特征图通常对图像分割至关重要。CoTr模型在多模态腹部分割数据集(Amos数据集)上进行了广泛评估。结果表明,在3D多器官分割任务上,与其他基于CNN、基于Transformer和混合方法相比,CoTr带来了持续的性能改进。
文摘近年来场景文本检测技术飞速发展,提出一种可适用于任意形状文本检测的新颖算法Mask Text Detector.该算法在Mask R-CNN的基础上,用anchor-free的方法替代了原本的RPN层生成建议框,减少了超参、模型参数和计算量.还提出LQCS(Localization Quality and Classification Score)joint regression,能够将坐标质量和类别分数关联到一起,消除预测阶段不一致的问题.为了让网络区分复杂样本,结合传统的边缘检测算法提出Socle-Mask分支生成分割掩码.该模块在水平和垂直方向上分区别提取纹理特征,并加入通道自注意力机制,让网络自主选择通道特征.我们在三个具有挑战性的数据集(Total-Text、CTW1500和ICDAR2015)中进行了广泛的实验,验证了该算法具有很好的文本检测性能.