万里鹏程转瞬至

论文解读：DETRs Beat YOLOs on Real-time Object Detection

发表时间：2023
论文地址：https://arxiv.org/abs/2304.08069
项目地址：https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/rtdetr 【官方】或 https://github.com/ultralytics/ultralytics/tree/main/ultralytics/vit/rtdetr 【ultralytics团队复现】

基本总结

RT-DETR-L在COCO val2017上实现了53.0%的AP，在T4 GPU上实现了114FPS，RT-DETR-X实现了54.8%的AP和74FPS，在速度和精度方面都优于相同规模的所有YOLO检测器。RT-DETR-R50实现了53.1%的AP和108FPS，RT-DETR-R101实现了54.3%的AP和74FPS

背景知识

1、transformer-based detectors（DETRs）取得了显著的性能,其移除了NMS,但是计算成本较高的问题一直没有解决
2、在transformer-based detectors引入多尺度特征可加速收敛提高性能，但是导致编码器序列显著变长，使得计算效率更低

re-detr先进性

1、实时的transformer-based detectors（过解耦尺度内交互和跨尺度融合来有效地处理多尺度特征降低gflop，通过iou感知的query来加速收敛）
2、re-detr设计了一种高效的混合编码器来代替原来的transformer编码器。通过解耦多尺度特征的尺度内交互（使用AIFI实现）和跨尺度融合（使用CCFM使用），该编码器可以有效地处理不同尺度的特征，大幅度的降低了编码器的gflop
3、在解码器中提出IoU感知的查询选择，通过在训练过程中提供IoU约束，为解码器提供更高质量的初始对象查询
4、解码器支持通过使用不同的解码器层来灵活地调整推理速度，而不需要再训练

re-detr的设计

1、其网络结构设计如下所示，其可以使用传统的conv backbone，使用CCFM模块对多尺度特征进行融合，然后使用带iou感知的head进行query操作

2、其与尺度融合的关键模块为AIFI和CCFM，基于注意的尺度内特征交互（AIFI）模块和基于cnn的跨尺度特征融合模块（CCFM）。AIFI进一步减少了基于变体D的计算冗余，它只在S5上执行尺度内交互。
3、re-detr在设计上再次提到了bboxes准确率与conf得分不一致的情况，其强制使用IoU-aware Query Selection使二者一致（将iou考虑进cls_GT中）。通过设计，使得iou与conf得分尽可能保持一致
4、其backbone有HGNetv2和ResNet两种版本

re-detr的训练超参

使用AdamW优化器
base learning rate= 0.0001，
weight decay = 0.0001，
global gradient clip norm = 0.0001，
linear warmup steps= 2000

近年来，基于端到端transformer-based detectors（DETRs）取得了显著的性能。然而，DETRs的高计算成本的问题还没有得到有效的解决，这限制了它们的实际应用，并阻止了它们充分利用没有非最大抑制（NMS）后处理的好处。本文首先分析了现代实时目标检测器中NMS对推理速度的影响，并建立了一个端到端速度基准。为了避免NMS造成的推理延迟，我们提出了一种实时检测转换器（RT-DETR），这是我们所知的第一个实时端到端目标检测器。具体来说，我们设计了一种高效的混合编码器，通过解耦尺度内交互和跨尺度融合来有效地处理多尺度特征，并提出了iou感知的查询选择来提高对象查询的初始化。此外，我们提出的检测器支持通过使用不同的解码器层来灵活地调整推理速度，而不需要再训练，这方便了实时目标检测器的实际应用。我们的RTDETR-L在COCO val2017上达到53.0%的AP，在T4 GPU上达到114 FPS，而RT-DETR-X达到54.8%的AP和74 FPS，在速度和精度上都优于所有相同规模的YOLO探测器。此外，我们的RTDETR-R50达到了53.1%的AP和108 FPS，在精度上比dino-Deformable-detr-R50高2.2%的AP，在FPS中约21倍。源代码和预训练过的模型将在github: PaddleDetection项目中提供。

1. Introduction

目标检测是一项基本的视觉任务，它包括识别和定位图像中的目标。现代目标探测器有两种典型的架构：基于cnn的和基于transformer的。在过去的几年里，人们对基于CNN的目标检测方法进行了广泛的研究。这些探测器的体系结构已经从最初的两阶段[9,26,3]发展到一阶段[19,31,1,10,22,13,36,14,7,33,11]，并且出现了两种检测范式，基于锚框的[19,22,13,10,33]和无锚框的[31,7,36,14,11]。这些研究在检测速度和准确性方面都取得了重大进展。基于transformer的目标探测器（DETRs）[4,29,34,43,23,35,20,16,40]由于消除了各种手工制作的组件，如非最大抑制（NMS）。因此其受到了学术界的广泛关注。该架构大大简化了目标检测的pipeline（流程），实现了端到端目标检测。

实时目标检测是一个重要的研究领域，具有目标跟踪[39,42]、视频监控[24]、自动驾驶[2,38]等广泛的应用前景。现有的实时探测器一般为基于cnn的架构，在检测速度和准确性上实现了合理的权衡。然而，这些实时检测器通常需要NMS来进行后处理，这通常很难进行优化，而且不够健壮，从而导致检测器的推理速度出现延迟。近年来，由于研究人员努力加速训练收敛和降低优化难度，基于transformer的检测器取得了显著的性能。然而，DETRs的高计算成本问题尚未得到有效的解决，这限制了DETRs的实际应用，导致无法充分利用其好处。这意味着虽然简化了目标检测流程（pipeline）的过程，但由于模型本身的计算成本高，很难实现实时目标检测。以上问题自然启发我们思考是否可以将DETR扩展到实时场景，充分利用端到端检测器，以避免NMS在实时检测器上造成的延迟。

为了实现上述目标，我们重新考虑了DETR，并对其关键组件进行了详细的分析和实验，以减少不必要的计算冗余。具体来说，我们发现，虽然引入多尺度特征有利于加速训练收敛和提高性能[43]，但它也导致了编码器序列长度的显著增加。因此，transformer编码器由于计算成本高而成为模型的计算瓶颈。为了实现实时目标检测，我们设计了一种高效的混合编码器来代替原来的transformer编码器。通过解耦多尺度特征的尺度内交互和跨尺度融合，该编码器可以有效地处理不同尺度的特征。此外，之前的工作[35,20]表明，解码器的对象查询初始化方案对检测性能至关重要。为了进一步提高性能，我们提出了IoU感知的查询选择，通过在训练过程中提供IoU约束，为解码器提供更高质量的初始对象查询。此外，我们提出的检测器支持通过使用不同的解码器层来灵活地调整推理速度，而不需要再训练，这得益于DETR架构中解码器的设计，方便了实时检测器的实际应用。

在本文中，我们提出了一种实时检测转换器（RT-DETR），这是我们所知的第一个实时端到端transformer检测器。RT-DETR不仅在精度和速度方面优于目前最先进的实时检测器，而且不需要后处理，因此检测器的推理速度没有延迟，而且保持稳定，充分利用了端到端检测流程（pipeline）的优势。我们提出的RT-DETR-L在COCO val2017上达到53.0%的AP，在NVIDIA Tesla T4 GPU上达到114 FPS，而RT-DETR-X达到54.8%的AP和74 FPS，在速度和精度上都优于所有相同规模的YOLO探测器。因此，我们的RT-DETR成为了一个新的实时目标检测的SOTA，如图1所示。此外，我们提出的RT-DETR-R50达到53.1%的AP和108 FPS，而RT-DETR-R101达到54.3%的AP和74 FPS。其中，RT-DETRR50在准确性上比dino-Deformable-DETR-R50高出2.2%（53.1%APvs50.9%AP），在FPS上高出约21倍（108 FPS vs 5 FPS）。

本文的主要贡献总结如下：
(i) 我们提出了第一个实时端到端目标检测器，它不仅在精度和速度方面优于目前最先进的实时检测器，而且不需要后处理，因此其推理速度不延迟，保持稳定；
（ii）详细分析了实时检测器上NMS的影响，并从后处理的角度得出了基于cnn的实时检测器的结论；
（iii）我们提出的iou感知查询选择在模型中表现出良好的性能改进，为改进对象查询的初始化方案提供了新的思路；
（iv）我们的工作为端端检测器的实时实现提供了一个可行的解决方案，提出的检测器可以使用不同的解码器层灵活调整模型大小和推理速度，而不需要再训练。

2. Related work

2.1. Real-time Object Detectors

经过多年的不断开发，YOLO系列[25,1,32,22,13,10,7,36,14,33,11]已经成为实时对象探测器的同义词，大致可以分为两类：基于锚框的[25,1,32,10,33]和无锚框的[7,36,14,11]。从这些探测器的性能来看，锚（anchor）已不再是限制YOLO发展的主要因素。然而，上述检测器产生了大量冗余的边界框，需要在后处理阶段使用NMS来过滤掉它们。不幸的是，这导致了性能瓶颈，而NMS的超参数对检测器的准确性和速度有重大影响。我们认为这与实时物体探测器的设计理念不兼容的。

1、yolo系列模型现在引领着各类实时目标检测器

2、NMS操作制约了模型的性能

2.2. End-to-end Object Detectors.

端到端对象检测器[4,29,34,43,23,35,20,16,40]以其精简的流程（pipeline）而闻名。Carion等人[4]首先提出了基于transformer的端到端目标探测器，命名为DETR（Detect Transformer）。它因其独特的特点而引起了广泛的关注。特别是，DETR在传统的检测中消除了手工设计的锚框|锚点和NMS组件。相反，它采用了双向（bipartite）匹配，并直接预测一对一的对象集。通过采用该策略，DETR简化了检测流程（pipeline），缓解了NMS造成的性能瓶颈。尽管DETR有明显的优势，但它仍然存在两个主要问题：训练收敛速度慢和难以优化的查询。许多DETR的变体已经被提出来解决这些问题。例如，Deformable-detr[43]通过提高注意机制的效率，加速了具有多尺度特征的训练收敛。. Conditional(条件)-DETR [23]和Anchor DETR [35]降低了查询的优化难度。DAB-DETR [20]引入了4D参考点，并逐层迭代优化预测盒。DN-DETR [16]通过引入查询去噪来加速训练的收敛性。DINO [40]建立在以前的工作之上，并取得了最先进的结果。虽然我们正在不断改进DETR的组件，但我们的目标不仅是进一步提高模型的性能，而且还要创建一个实时的、端到端对象检测器。

1、基于transformer的端到端目标探测器，采用了双向（bipartite）匹配，并直接预测一对一的对象集，移除了目标检测中的nms

2、DETR存在收敛满、query效率低下的问题

3、现在有不少DETR的变体已经被提出来解决这些问题，但离实时监测还差了一些

2.3. Multi-scale Features for Object Detection.

现代目标探测器已经证明了利用多尺度特征来提高性能的意义，特别是对于小物体。FPN [18]引入了一个特征金字塔网络，它融合了来自相邻尺度的特征。后续的工作[21,8,30,10,14,33,11]对这种结构进行了扩展和增强，并被广泛应用于实时对象探测器中。Zhu等人[43]首先在DETR中引入了多尺度特征，提高了性能和收敛速度，但这也显著提高了DETR的计算成本。虽然可Deformable的注意机制在一定程度上降低了计算成本，但多尺度特征的合并仍然导致了较高的计算负担。为了解决这个问题，一些工作试图设计计算效率高的DETR。高效的DETR [37]通过初始化具有密集先验的对象查询，减少了编码器层和解码器层的数量。稀疏的DETR [27]有选择地更新了期望被解码器引用的编码器token，从而减少了计算开销。Lite DETR [15]通过以交错的方式降低了低级别特性的更新频率，从而提高了编码器的效率。虽然这些研究降低了DETR的计算成本，但这些工作的目标并不是为了推广DETR作为一种实时检测器。

1、可以用多尺度特征来提高目标检测的性能

2、在DETR中使用多尺度能提升收敛效率和精度，但是增加了计算负担

3、现在有不少DETR的变体已经被提出来解决这些问题，但离实时监测还差了一些

3. End-to-end Speed of Detectors

3.1. Analysis of NMS

NMS是目标检测中广泛采用的一种后处理算法，用于消除检测器输出的重叠预测盒。在NMS中两个超参数分别是： score阈值和IoU阈值。其运算过程为：分数低于分数阈值的预测框被直接过滤掉，当两个预测框的IoU超过IoU阈值时，分数较低的框将被丢弃。这个过程被迭代地执行，直到每个类别的所有盒子都被处理完毕。因此，NMS的执行时间主要取决于输入预测框的数量和两个超参数。

为了验证这一观点，我们利用YOLOv5（基于锚框的）[10]和YOLOv8（无锚框的）[11]进行实验。我们首先计算在输出框被具有相同的输入图像的不同评分阈值过滤后剩余的预测框的数量。我们对0.001到0.25的分数进行采样作为阈值，以计数两个检测器的剩余预测盒，并将其绘制成直方图，直观地反映了NMS易受其超参数的影响，如图2所示。

此外，我们以YOLOv8为例，评估了COCO val2017上的模型精度，以及在不同NMS超参数下的NMS操作的执行时间。注意，我们在实验中采用的NMS后处理操作是拉伸效率TensorRT NMS插件:efficientNMSPlugin，其中包括多个高效的内核，包括高效nms过滤器、radix排序、高效CUDA等，我们只报告高效CUDA内核的执行时间。我们在T4 GPU上测试了速度，在上述实验中的输入图像和预处理是一致的。我们使用的超参数和相应的结果如表1所示。

1、无锚框模型所预测出的框在各个conf阈值下明显要少很多，其nms时间会显著降低

2、现行的nms操作中参数conf_threshold,iou_threshod影响执行时间与精度效果

3.2. End-to-end Speed Benchmark

为了能够公平地比较各种实时检测器的端到端推理速度，我们建立了一个端到端速度测试基准。考虑到NMS的执行时间会受到输入图像的影响，需要选择一个基准数据集，并计算多个图像的平均执行时间。该基准测试采用COCO val2017作为默认数据集，将TensorRT的NMS后处理插件用于需要后处理的实时检测器。具体来说，我们根据在基准数据集上获取的相应精度的超参数来测试检测器的平均推理时间，并排除了IO和Memory-Copy操作。我们利用这个基准测试测试了基于锚的探测器YOLOv5 [10]和YOLOv7 [33]的端到端速度，以及T4 GPU上的无锚探测器PP-YOLOE [36]、YOLOv6 [14]和YOLOv8 [11]的端到端速度。测试结果见表2。

根据结果，我们得出结论，实时检测器都需要NMS后处理的，无锚检测器的性能优于基于锚的检测器，因为前者占用的后处理时间明显少于后者。这在以往的工作中被忽略了。造成这种现象的原因是，基于锚的探测器比无锚的探测器产生更多的预测bboxes（这是我们测试的探测器的三倍）。
1、在先行阶段，无锚检测器精度性能优于基于锚的

2、无锚检测器产生更少的框，nms时间更短

4. The Real-time DETR

4.1. Model Overview

所提出的RT-DETR由一个主干网、一个混合编码器和一个带有辅助预测头的transformer解码器组成。模型架构的概述如图3所示。

具体来说，我们利用主干{ $S_3, S_4, S_5$ }的最后三个阶段的输出特性作为编码器的输入。该混合编码器通过尺度内交互和跨尺度融合，将多尺度特征转换为一系列图像特征(见章节4.2)。随后，使用iou感知的查询选择从编码器输出序列中选择固定数量的图像特征，作为解码器的初始对象查询(见章节4.3)。最后，利用具有辅助预测头的解码器迭代优化对象查询生产bboxes和相应的scores。

4.2. Efficient Hybrid Encoder

计算瓶颈分析 为了加速训练的收敛性和提高性能，Zhu等人[43]建议引入多尺度特征，并提出了可Deformable的注意机制来减少计算量。然而，尽管注意机制的改进降低了计算开销，但输入序列长度的急剧增加仍然导致编码器成为计算的瓶颈，阻碍了DETR的实时实现。据[17]报道，该编码器占gflop的49%，但在Deformable-detr[43]中只占AP的11%。为了克服这一障碍，我们分析了多尺度transformer编码器中存在的计算冗余，并设计了一组变体来证明尺度内和跨尺度特征的同时交互作用是计算效率低的。

高级特征是从包含关于图像中对象的丰富语义信息的低级特征中提取出来的。直观地说，在级联的多尺度特征上执行特征交互是冗余的。为了验证这一观点，我们重新考虑了编码器的结构，并设计了一系列具有不同编码器的变体，如图5所示。这将变量集通过将多尺度特征交互解耦为尺度内交互和跨尺度融合的两步操作，逐步提高模型精度，同时显著降低计算成本(详细指标见Tab。 3).我们首先删除DINO-R50 [40]中的多尺度transformer编码器作为基线a。接下来，插入不同形式的编码器，基于基线A产生一系列变体，阐述如下：

•A→B：变体B插入一个单比例的transformer编码器，它使用一层transformer块。每个尺度的特征共享尺度内特征交互的编码器，然后将输出的多尺度特征连接起来。
•B→C：变体C引入了基于B的跨尺度特征融合，并将连接的多尺度特征输入编码器，以执行特征交互。
•C→D：变体D解耦了多尺度特征的尺度内相互作用和跨尺度融合。首先，利用单尺度transformer编码器进行尺度内交互，然后利用类似panet的[21]结构进行跨尺度融合。
•D→E：VaritantE进一步优化了基于D的多尺度特征的尺度内交互和跨尺度融合，采用了我们设计的高效混合编码器（详见下文）。

混合设计
在此基础上，我们重新考虑了该编码器的结构，并提出了一种新的高效混合编码器。如图3所示，所提出的编码器由两个模块组成，即基于注意的尺度内特征交互（AIFI）模块和基于cnn的跨尺度特征融合模块（CCFM）。AIFI进一步减少了基于变体D的计算冗余，它只在S5上执行尺度内交互。我们认为，将自注意操作应用于具有更丰富语义概念的高级特征，可以捕获图像中概念实体之间的联系，便于后续模块对图像中对象的检测和识别。同时，由于缺乏语义概念，存在与高级特征交互的重复和混淆的风险，低级特征的尺度内交互是不必要的。为了验证这一观点，我们只对变体D中的S5进行了尺度内交互作用，实验结果报告在Tab3中 $D_{S_5}$ 行。与普通的D相比， $D_{S_5}$ 显著降低了延迟（快了35%），但提高了准确性（AP提高了0.4%）。这一结论对于实时探测器的设计至关重要。CCFM也基于变体D进行了优化，插入了几个由卷积层组成的融合块进入融合路径。融合块的作用是将相邻的特征融合成一个新的特征，其结构如图4所示。

融合块包含N个重新块，双路输出通过元素添加融合。我们可以将这个过程表述如下：

4.3. IoU-aware Query Selection

DETR中的对象查询是一组可学习的嵌入，它们由解码器进行优化，并由预测头映射到分类分数和边界框。然而，这些对象查询很难进行解释和优化，因为它们没有明确的物理意义。后续工作[35,20,43,37,40]改进了对象查询的初始化，并将其扩展到内容查询和位置查询（锚地）。其中，[43,37,40]都提出了查询选择方案，其共同点是利用分类分数从编码器中选择前K个特征来初始化对象查询（或仅选择位置查询[40]）。然而，由于分类分数的不一致分布和位置信心，一些预测盒子高分类分数但不接近GT盒子，导致高iou低conf的bbox被选中，而低iou高conf的bbox被丢弃。这就损害了探测器的性能。为了解决这个问题，我们提出了IoU感知查询选择，通过约束模型在训练期间对IoU分数高的特征产生高分类分数，对IoU分数低的特征产生低分类分数。因此，模型根据分类评分选择的前K个编码器特征对应的预测框具有较高的分类评分和较高的IoU评分。我们重新制定了探测器的优化目标如下：

其中c表示类别，b表示bbox，在计算类别loss时考虑iou的大小（将IoU评分引入到分类分支的目标函数中（类似于VFL [41]），以实现对正样本的分类和定位的一致性约束。）

有效性分析
为了分析所提出的IoU感知查询选择的有效性，我们将val2017上查询选择所选择的编码器特征的分类得分和IoU得分进行了可视化，如图6所示。具体来说，我们首先根据分类分数选择前K（我们实验中的K=300）编码器特征，然后将分类分数大于0.5的散点图可视化。红点和蓝点分别通过应用普通查询选择和iou感知查询选择训练的模型中计算出来。点越靠近图的右上角，对应特征即分类标签和边界框的质量越有可能描述图像中的真实对象。根据可视化结果，我们发现最显著的特征是大量的蓝色点集中在图的右上角，而红色的点集中在右下角。这表明，使用iou感知的查询选择训练的模型可以产生更多高质量的编码器特征。

此外，我们还定量地分析了这两种类型的点的分布特征。图中蓝点比红点多138%，即分类得分小于或等于0.5的红点更多，可以认为是低质量的特征。然后，我们用分类分数来分析特征的IoU，我们发现IoU分数大于0.5的蓝点比红点多120%。定量结果进一步表明，基于IoU感知的查询选择可以为对象查询提供更多的编码器特征，具有准确的分类（高分类分数）和精确的位置（高IoU分数），从而提高了检测器的准确性。详细的定量结果见第5.4节.

4.4. Scaled RT-DETR

为了提供一个可扩展的RT-DETR版本，我们用HGNetv2替换了ResNet [12]主干。我们使用深度乘法器和宽度乘法器来扩展主干器和混合编码器在一起。因此，我们得到了两个具有不同数量的参数和FPS的RT-DETR版本。对于我们的混合编码器，我们分别通过调整CCFM中的回复块数和编码器的嵌入维数来控制深度乘法器和宽度乘法器。值得注意的是，我们提出的不同尺度的RT-DETR保持了一个均匀的解码器，这便于使用高精度的大型DETR模型对光探测器进行蒸馏。这将是一个可探索的未来方向。

5. Experiments

5.1. Setups

Dataset 我们在微软提出的COCO数据集上进行了广泛的实验，以验证所提出的探测器。对于消融研究，我们在COCO2017 train上进行训练，并在COCO 2017 val数据集上进行验证。我们使用标准的COCO AP度量与单尺度图像作为输入。

Implementation Details 我们使用ResNet [12]和预先训练的图像[28]上的HGNetv2系列作为我们的骨干。AIFI由1个transformer层组成，CCMF中的融合块默认由3个基本模型的回复块组成。在iou感知的查询选择中，我们选择前300个编码器特性来初始化解码器的对象查询。解码器的训练策略和超参数几乎遵循DINO [40]。我们使用AdamW优化器，base learning rate= 0.0001，weight decay = 0.0001，global gradient clip norm = 0.0001，和linear warmup steps= 2000。主干设置的学习率遵循[4]。我们也使用指数移动平均线（EMA）与ema衰减=0.9999。1×的配置意味着总epoch为12，如果没有指定，所有的消融实验都使用1×。报告的最终结果使用了一个6×的配置。数据增强包括随机的{颜色扭曲，扩展，裁剪，翻转，调整大小}操作，遵循[36]。

5.2. Comparison with SOTA

表2将所提出的RT-DETR与其他实时和端到端对象检测器进行了比较。我们提出的RT-DETR-L达到了53.0%的AP和114 FPS，而RTDETR-X达到了54.8%的AP和74 FPS，在速度和精度上都优于所有相同规模的YOLO探测器。此外，我们提出的RT-DETR-R50达到了53.1%的AP和108 FPS，而RT-DETR-R101达到了54.3%的AP和74 FPS，在速度和精度上都优于现有的端到端检测器。

Compared to real-time detectors. 为了进行公平的比较，我们比较了比例RTDETR与当前实时探测器的速度和准确性(速度测试方法指章节3.2)。我们将按比例排列的RT-DETR与YOLOv5 [10]、PP-YOLOE [36]、YOLOv6v3.0（以下简称YOLOv6）[14]、YOLOv7 [33]和YOLOv8 [11]进行了比较，在表2中。 .与YOLOv5-L / PP-YOLOE-L / YOLOv7-L相比，RT-DETR-L显著提高了4.0% / 1.6% / 1.8% AP，FPS提高了111.1% / 21.3% / 107.3%，参数数量减少了30.4% / 38.5% / 11.1%。与YOLOv5-X / PP-YOLOE-X / YOLOv7-X相比，RTDETR-X将精度提高了4.1% / 2.5% / 1.9% AP，将FPS提高了72.1% / 23.3% / 64.4%，参数数量减少了22.1% / 31.6% / 5.6%。与YOLOv6-L / YOLOv8-L相比，RT-DETR-L的精度提高了0.2% / 0.1%的AP，速度提高了15.2% / 60.6%，参数数量减少了45.8% / 25.6%。与YOLOv8-X相比，RT-DETR-X在精度上提高了0.9%的AP，在速度上提高了48.0%的FPS，在参数数量上减少了1.5%。

Compared to end-to-end detectors. 表2表明，RT-DETR在所有具有相同主干的端到端检测器中都达到了最先进的性能。与DINO-Deformable-DETR-R50[40]相比，RT-DETR-R50显著提高了2.2% AP（53.1% AP vs. 50.9% AP）和速度提高了21倍（108FPSvs.5FPS），并减少了10.6%的参数数量。与SMCA-DETR-R101 [6]相比，RT-DETR-R101显著提高了8.0% AP的准确性。

5.3. Ablation Study on Hybrid Encoder

为了验证我们对编码器的分析的正确性和所提出的混合编码器的有效性，我们评估了在Sec4.2中设计的变体集的指标。包括AP、参数数和T4 GPU上的延迟。实验结果见表3。变体B比a提供了1.9%的AP改进，同时增加了3%的参数数量和54%的延迟。这证明了尺度内特性交互是重要的，但普通transformer编码器是昂贵的。变体C比B提供了0.7%的AP改进，并保持参数的数量不变，而延迟增加了20%。这说明跨尺度的特征融合也是必要的。

变体D比C提供了0.8%的AP改进，同时增加了9%的参数数量，但减少了8%的延迟。这表明，解耦尺度内交互和跨尺度融合可以在降低精度的同时降低计算量。与D相比， $D_{S_5}$ 减少了35%的延迟，但提供了0.4%的AP改进。这证明了较低层次特征的尺度内交互作用是不必要的。最后，配备了我们提出的混合编码器的变体E比d提供了1.5%的AP改进。尽管参数的数量增加了20%，但延迟减少了24%，使编码器的计算效率更高。

5.4. Ablation Study on IoU-aware Query Selection

我们对iou感知的查询选择进行了消融研究，定量实验结果如表4所示。我们采用的查询选择根据分类得分选择顶部K（K = 300）编码器特征作为内容查询，并使用这些所选特征对应的边界框作为初始位置查询。我们比较val2017上两个查询选择选择的编码器特征，计算分类得分大于0.5和大于0.5的比例，分别对应“ $Prop_{cls}$ ”和“ $Prop_{both}$ ”列。

结果表明：通过IoU感知查询选择选择的编码器特征不仅增加了高分类分数的比例（0.82% vs 0.35%），而且提供了更多具有高分类分数和高IoU分数的特征（0.67% vs 0.30%）。我们还在val2017年，我们评估了两种查询选择训练的检测器的准确性，其中iou感知的查询选择提高了0.8%的AP（48.7% AP vs 47.9% AP）。

5.5. Ablation Study on Decoder

表5显示了不同解码器层的RT-DETR各解码器层的精度和速度。当解码器层数为6层时，检测器的最佳精度为53.1% AP。我们还分析了每个解码器层对推理速度的影响，并得出了每个解码器层消耗约0.5 ms的结论。此外，我们还发现，随着解码器层指数的增加，解码器相邻层之间的精度差异逐渐减小。以6层解码器为例，使用5层推理只损失0.1%的AP（53.1% AP vs 53.0% AP），同时减少了0.5 ms（9.3 ms vs 8.8 ms）。因此，RT-DETR支持通过使用不同的解码器层来灵活地调整推理速度，而不需要再训练来进行推理，这方便了实时检测器的实际应用。

6. Conclusion

在本文中，我们提出了RT-DETR，据我们所知的第一个实时端到端检测器。我们首先对NMS进行了详细的分析，并建立了一个端到端速度基准，以验证当前实时检测器的推断速度被NMS延迟的事实。我们还从NMS的分析中得出结论，无锚点检测器以同样的精度优于基于锚点的检测器。为了避免NMS造成的延迟，我们设计了一个实时的端到端检测器，其中包括两个关键的改进组件：一个可以有效地处理多尺度特征的混合编码器，以及一个基于iou感知的查询选择，以改进对象查询的初始化。大量的实验表明，与其他实时探测器和类似大小的端到端探测器相比，RT-DETR在速度和精度上都达到了最先进的性能。此外，我们提出的检测器支持通过使用不同的解码器层来灵活地调整推理速度，而不需要再训练，这方便了实时目标检测器的实际应用。我们希望这项工作能够付诸实践，为研究人员提供启示。

你可能感兴趣的:(#,目标检测,目标检测,深度学习,人工智能)

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
yolo 目标检测600类目标大霸王龙行业+领域+业务场景=定制 YOLO 目标检测人工智能
1.模型架构调整类别适配：将YOLO输出层的类别节点数调整为600（如YOLOv5的detect.yaml中修改nc=600），并更新类别名称映射表（classes.txt）。骨干网络优化：若使用YOLOv5/v8，可升级骨干网络（如C3模块深度）或替换为更高性能的主干（如EfficientNet、ResNet-101），以增强复杂场景的特征提取能力。多尺度检测头：保留或扩展YOLO的多尺度输出（
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
H800核心技术突破与行业应用实战智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
学苑教育杂志《学苑教育》杂志社学苑教育编辑部2025年第21期目录 QQ296078736 人工智能
专题研究推进“教-学-评”一体化，打造小学语文高效课堂刘月兰;4-6教育管理新高考制度下普通高中生涯教育课程设计的研究霍亚贞;马玲;7-9课堂教学核心素养下小学数学深度学习课堂的构建策略康贵景;10-12“双减”背景下初中英语教学的课堂模式高燕;13-15小学低年级数学说理课堂构建策略玉洁;16-18基于法治观念培育的道法课项目式教学策略许静;19-21“双师课堂”在初中语文写作教学中的实践孙巧玲
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
智慧工地系统：建筑行业数字化变革的引领者青云智慧园区 java
在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR