RT-DETR实时端到端目标检测器

RT-DETR(Real-Time DEtection TRansformer)是一种新型的实时端到端目标检测器,由百度公司的研究者提出。这项工作首次实现了在实时目标检测任务中不依赖于后处理(如非极大值抑制NMS)的端到端检测器。

RT-DETR的主要特点包括:
实时性能:RT-DETR能够在保持高准确性的同时,实现实时的检测速度。例如,RT-DETR-L在COCO val2017数据集上达到了53.0%的平均精度(AP)和114 FPS(每秒帧数)的性能,而RT-DETR-X则达到了54.8%的AP和74 FPS。
无需后处理:与现有的实时目标检测器相比,RT-DETR不需要依赖于NMS等后处理步骤,这减少了推理延迟并提高了检测速度。
高效的混合编码器:为了处理多尺度特征并提高计算效率,RT-DETR设计了一个高效的混合编码器,它通过解耦内部尺度交互和跨尺度融合来处理不同尺度的特征。
IoU感知的查询选择:RT-DETR提出了一种IoU感知的查询选择机制,通过在训练过程中引入IoU约束,为解码器提供更高质量的初始对象查询,从而提高检测性能。
灵活的推理速度调整:RT-DETR支持通过使用不同数量的解码器层来灵活调整推理速度,而无需重新训练,这使得模型能够适应不同的实时场景。

 

你可能感兴趣的:(人工智能,目标跟踪)