YOLO13:基于超图增强自适应视觉感知的实时目标检测

YOLO13:基于超图增强自适应视觉感知的实时目标检测

论文:YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception

代码:https://github.com/iMoonLab/yolov13

YOLOv13主要技术

YOLOv13 新一代实时检测器,集卓越性能与效率于一身。

YOLOv13 系列包含四种变体:Nano、Small、Large 和 X-Large,其核心技术包括:

超图自适应相关增强(HyperACE)

  • 将多尺度特征图中的像素视为超图顶点。
  • 采用可学习的超边构建模块,自适应探索顶点间的高阶相关性。
  • 利用具有线性复杂度的消息传递模块,在高阶相关性的引导下有效聚合多尺度特征,实现对复杂场景的高效视觉感知。

全流程聚合-分发范式(FullPAD)

  • 使用 HyperACE 聚合主干网络的多尺度特征,并在超图空间中提取高阶相关性。

  • FullPAD 范式进一步通过三条独立通道,将这些增强相关性的特征分别传递至主干与颈部的连接层、颈部内部层以及颈部与头部的连接层,实现全流程的细粒度信息流和表征协同。

  • FullPAD 显著改善梯度传播,提升检测性能。

基于深度可分离结构的模型轻量化

  • 用基于深度可分离卷积(DSConv、DS-Bottleneck、DS-C3k、DS-C3k2)的模块替代大核卷积,在保持感受野的同时大幅减少参数和计算量。

  • 在不牺牲精度的前提下实现更快的推理速度。

主要架构

主要测试结果

MS COCO Benchmark

与其他先进的实时目标检测器在 MS COCO 数据集上的定量对比

Method FLOPs (G) Parameters(M) AP50:95val AP50val AP75val Latency (ms)
YOLOv6-3.0-N 11.4 4.7 37.0 52.7 2.74
Gold-YOLO-N 12.1 5.6 39.6 55.7 2.97
YOLOv8-N 8.7 3.2 37.4 52.6 40.5 1.77
YOLOv10-N 6.7 2.3 38.5 53.8 41.7 1.84
YOLO11-N 6.5 2.6 38.6 54.2 41.6 1.53
YOLOv12-N 6.5 2.6 40.1 56.0 43.4

你可能感兴趣的:(YOLO计算机视觉应用,目标检测,人工智能,计算机视觉,YOLO13)