YOLO 中的三大框类型全解析:Ground Truth、Anchor、Bounding Box 有何区别?

1. Ground Truth Box(真值框)

数据集中人工标注的真实目标位置。

•	 是“答案”,模型训练的目标。
•	标注格式通常是 [x, y, w, h, class_id]
•	比如一张猫的图,它的真实框就是 ground truth box。

2. Anchor Box(锚框)

预设的一些模板框,模型学习时的“参考基准”。

•	是一些固定的宽高组合(比如[10×13]、[16×30]等),
•	每个 grid cell 会分配若干 anchor,用来“捕捉”可能存在的目标。
•	训练时,模型会尝试让某个 anchor 去拟合最接近的 ground truth box。

3. Bounding Box(预测框)

模型预测出来的目标框,最终输出结果。

•	是你跑推理时看到的结果。
•	每个 anchor 最终预测一个 bounding box(包含位置 + 置信度 + 类别)。
名称 中文 角色 是否固定 举例
Ground Truth Box 真值框 训练目标 ❌ 否 [80, 120, 60, 90]
Anchor Box 锚框 初始模板 / 参考框 ✅ 是 [10, 13], [116, 90] 等
Bounding Box 预测框 模型的最终输出 ❌ 否 [78, 118, 65, 85]

你可能感兴趣的:(YOLO 中的三大框类型全解析:Ground Truth、Anchor、Bounding Box 有何区别?)