MMDet实例分割loss_rpn_bbox为nan但其它loss正常的解决

文章首发见博客:https://mwhls.top/4901.html。
无图/格式错误/后续更新请见首发页。
更多更新请到mwhls.top查看
欢迎留言提问或批评建议,私信不回。

昨天还以为这个月无活可整,没想到第二天就来事了,下个月还好久,留到下月发也不大好( º﹃º )。

问题描述
  • 使用MMDetection训练实例分割,训练可执行,测试可执行,但loss_rpn_bboxnanloss_bbox却有值。
  • 评估时,少数模型能获得0.1的精度,但无法随训练次数上升而提高。
  • 使用faster rcnn或mask2former,四个backbone,都出现上述问题。
故障原因
  • 标签尺寸与图像尺寸不匹配。
    • 例如,图像为700x700的大小,而annotations/trainval.json里的大小却为3840x2160,且所有segmentation, bbox的标签,都是以3840x2160为参考(即取值为[0, 3840])
解决方法

你可能感兴趣的:(python,python,pytorch,深度学习,人工智能)