Mask R-CNN 论文译读笔记

Mask R-CNN

摘要

  本文提出了一种概念简单、灵活且通用的目标实例分割框架。本文的方法能够高效检测图像中的目标,同时为每个实例生成高质量的分割掩码。该方法被称为 Mask R-CNN,它对现有的 Faster R-CNN 进行扩展并行增加一个对象掩膜预测分支同时包含原有的边界框识别分支。Mask R-CNN 训练简单,相比 Faster R-CNN 仅增加少量开销,推断速度可达5fps。此外,MaskRCNN易于推广到其他任务,例如在同一框架内进行人体姿态估计。本文在COCO挑战赛的三个赛道(实例分割、边界框目标检测和人体关键点检测)中均取得了顶尖结果。在不使用任何花哨技巧的情况下,MaskRCNN作为单模型在每个任务上都超越了所有existing方法,包括COCO2016挑战赛的获胜者。本文希望这一简单而有效的方法能成为solid的基线,推动未来的实例级识别研究。代码开源于:https://github.com/facebookresearch/Detectron。

1. 引言

  计算机视觉社区在短时间内快速提高了目标检测和语义分割的结果。这一进步在很大程度上得益于强大的 baseline systems,例如分别用于目标检测的 Fast/Faster R-CNN [12_FastRCNN, 36_FasterRCNN] 和用于语义分割的 Fully Convolutional Network (FCN) [30_FCN] 框架。这些方法在概念上直观易懂,兼具灵活性和鲁棒性,同时具有快速的训练和推理时间。本文的目标是为实例分割开发一个具有相当能力的框架。
  实例分割颇具挑战性,因为它既要求正确检测图像中的所有目标,又必须对每个目标实例进行精确分割。

你可能感兴趣的:(cnn,笔记,人工智能)