DenoDet:SAR 图像目标检测

一、什么是 SAR 图像

SAR 图像是一种独特的遥感成像技术,能够穿透云、雨、雪和雾等大气障碍物,因此在多个领域都有广泛应用,如地质勘探、环境监测、军事侦察等

二、SAR 图像上目标检测的挑战

  1. 散斑噪声干扰(speckle noise):SAR 是一个相干成像系统,其图像本质上包含不可避免的散斑噪声,会叠加在目标上
    针对散斑噪声的传统解决办法:多尺度特征表示、合并上下文信息、软阈值

  2. 小目标的挑战(small targets):空间范围通常有限,并且目标物体很容易与杂波混淆
    解决办法:浅层特征增强网络、多内核大小的特征融合

以上两个问题的现有的解决方法(在目标检测的过程中同时去噪)在几个关键领域存在局限性:

  1. 抑制噪声不足:CNN 本身会在检测目标特征的同时尝试空间去噪,但是 SAR 图像中的散斑噪声和目标混在一起,难以在原始光谱中分离
  2. 深度学习中的光谱偏差:深度网络对低频分量表现出频谱偏向,这些分量主要代表背景或更大的物体。不利于检测小目标。
    即:深度网络更容易学习到图像的整体结构和背景信息,而忽略一些细节特征
  3. 静态网络权重:训练后网络权重是静态的,无法自适应地适应 SAR 图像中不断变化的地形或噪点条件。

那么,我们能否在目标检测之前对图像去噪呢?

不可以,因为在图像域中,将相干散斑噪声与目标特征完全分离本质上是一个病态问题。噪声的去除不可避免地会导致关键目标细节的丢失

与其试图在图像层面抑制散斑噪声,不如将去噪的重点转移到目标检测框架内的特征层面

即:设计一个可以无缝集成到目标检测框架中的即插即用特征降噪模块

因此,本文提出了:DenoDet,一种从频域多子空间特征去噪的角度提高 SAR 目标检测性能,DenoDet 将注意力机制解释为动态软阈值收缩操作,即转到频域去噪

三、DenoDet 网络的动机

源于希望通过 显式频域转换 使网络能够优先保留与小目标特征相关的高频信息,同时校准卷积网络对低频分量的固有偏见

因为:不同的频率会对应于不同尺度的结构,自然而然地形成多尺度的子空间表示

大的思想就是:引入频域之后,目标和噪声就可以分布在不同的频域内,就可以很好的分离,所以也就比较方便抑制噪声

四、整体架构

(1)TransDeno

动态软阈值去噪过程,选择性地保留有效的目标信号,同时过滤掉多余的噪声成分。

使用 2D DCT 将特征表示映射到频域中,并将其分解为多个子空间,每个子空间代表特定频率范围内的信息。

(2)Deformable Group Fully Connected (DeGroFC) layer

自适应地确定每个图像的最佳子空间数量。

五、具体模块

A. Revisiting Attention as Dynamic Soft Thresholding

软阈值是用于降噪的一项基本技术,常规的软阈值函数为:

为了更有效地抑制噪声,信号通常被转换为特定的变换域,如小波或傅里叶域,这样可以更清楚地区分信号特征和噪声。 

创新点是为软阈值加入注意力机制,注意力机制会为数据组件分配不同的权重,会强调与预测任务最相关的权重。

其中函数 g 会聚合相关的特征上下文,生成注意力权重(所以现在的阈值是一个取决于输入的动态值)

你可能感兴趣的:(目标检测,人工智能,计算机视觉)