【ELGC-Net】用于遥感变化检测的高效局部-全局上下文聚合(IEEE TGRS收录)

摘要

  • 现有的CNN和基于Transformer的框架往往难以准确的分割语义变化区域。且,基于标准自注意力的Transformer方法对图像分辨率存在二次计算复杂度,使得在训练数据有限的CD任务种不太实用。
  • 为此,提出孪生的高效变化检测框架ELGC-Net,利用丰富的上下文信息来精确分割变化区域,同时减少模型的大小。ELGC-Net包含一个孪生编码器、融合模块和一个解码器。
    • 编码器:引入一个Efficient Local-Global Con-text Aggregator(ELGCA)模块,增强全局上下文和局部空间信息,同时解决标准自注意力的局限性。
      • PT捕获全局上下文信息。
        • 采用池化操作进行特征提取,并通过transpose注意力最小化计算成本。
      • 深度卷积对局部上下文进行编码。
  • 大量实验表明,ELGC-Net优于现有方法,在提高精度的同时显著减少了训练参数。
  • 还介绍了ELGC-Net-LW,是一种更轻量化的变体,显著降低了计算复杂度,在不影响CD精度的情况下,满足计算资源有限的场景。
  • 论文链接:https://arxiv.org/abs/2403.17909
  • 代码链接:GitHub - techmn/elgcnet: ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection

动机

以往的一些方法依赖于标准的自注意力,与编码器中tokens的数量呈二次复杂度。大量的参数、高内存占用和高FLOPs使得这些方法不太适合用于实际的遥感变化检测应用。因此,希望同时捕获局部-全局上下文信息,有效地检测图像对之间的细微和显著的结构变化。

方法

总体架构如图3所示:

你可能感兴趣的:(change,detection,论文阅读,计算机视觉,深度学习)