论文地址:https://arxiv.org/pdf/2408.12879
代码地址:https://github.com/Linwei-Chen/FreqFusion
关注UP CV缝合怪,分享最计算机视觉新即插即用模块,并提供配套的论文资料与代码。
https://space.bilibili.com/473764881
密集图像预测任务需要在高分辨率下具有强大的类别信息和精确空间边界细节的特征。为了实现这一点,现代分层模型通常利用特征融合,直接将来自深层的粗略特征和来自较低层的、分辨率较高的特征相加。本研究观察到融合特征值在对象内部快速变化,由于高频特征的干扰导致类别内部不一致。此外,融合特征中模糊的边界缺乏准确的高频信息,导致边界位移。基于这些观察,本研究提出了频率感知特征融合(FreqFusion),它集成了自适应低通滤波器(ALPF)生成器、偏移生成器和自适应高通滤波器(AHPF)生成器。ALPF生成器预测空间变化的低通滤波器,以衰减对象内部的高频分量,减少上采样过程中的类内不一致性。偏移生成器通过重采样,用更一致的特征替换不一致的特征来细化大的不一致特征和细边界,而AHPF生成器增强了下采样过程中丢失的高频边界细节信息。全面的可视化和定量分析表明,FreqFusion有效地提高了特征一致性并锐化了对象边界。跨各种密集预测任务的大量实验证实了其有效性。
密集图像预测任务要求特征在高分辨率下具备强大的类别信息和精确的空间边界细节。为了实现这一目标,现代分层模型通常利用特征融合,直接将来自深层的粗粒度特征上采样后与来自较低层的高分辨率特征相加。本研究观察到,融合特征值在对象内部变化迅速,由于高频特征的扰动导致类别内不一致。此外,融合特征中模糊的边界缺乏准确的高频信息,导致边界位移。基于这些观察,本研究提出了频率感知特征融合(FreqFusion),它集成了自适应低通滤波器(ALPF)生成器、偏移生成器和自适应高通滤波器(AHPF)生成器。ALPF 生成器预测空间变化的低通滤波器,以衰减对象内部的高频分量,从而减少上采样过程中的类内不一致性。偏移生成器通过重采样,用更一致的特征替换不一致的特征,从而细化大面积不一致特征和细边界,而 AHPF 生成器增强了下采样过程中丢失的高频边界细节信息。全面的可视化和定量分析表明,FreqFusion 有效地提高了特征一致性并锐化了对象边界。跨各种密集预测任务的广泛实验证实了它的有效性。
本博客介绍一篇关于密集图像预测任务中特征融合的新方法——FreqFusion。FreqFusion模块旨在解决两个关键问题:类别内不一致性和边界位移。让我们深入了解FreqFusion的五个核心创新点:
**类别内高频分量自适应平滑:**
基于局部相似性的特征重采样:
➕ 低层特征高频细节增强: ➕
✨ 增强型初始融合: ✨
特征相似性分析: