【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》

今天给大家带来的论文是2019年的《Point RCNN: An Angle-Free Framework for Rotated Object Detection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。Point RCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理解3D边界框的表示和优化问题具有深刻的启发意义，可以帮助我们在更高层次上反思3D检测的核心难点。

论文链接：Point RCNN: An Angle-Free Framework for Rotated Object Detection

首先需要特别指出，这篇论文的应用领域是二维（2D）遥感影像（aerial images）中的旋转目标检测，而不是前面几篇论文所关注的自动驾驶场景中的三维（3D）点云检测。这里的“Point”指的是“代表点”（Representative Points），是一种2D特征点表示，注意不要与3D点云（Point Cloud）中的“PointRCNN”混淆。

1. 论文概述 (Overview)

这篇论文旨在解决遥感影像中旋转目标检测的核心难题。由于航拍视角，物体具有任意方向、巨大的尺度和长宽比变化，且常常密集排列。现有的SOTA方法大多是基于角度（angle-based）的，即通过回归 (x, y, w, h, θ) 五个参数来定义旋转框。然而，这种方法长期受到一个“边界不连续性问题”（boundary discontinuity problem）的困扰。

为解决此问题，论文提出了一个纯粹的无角度（angle-free）框架，名为Point RCNN 。它是一个两阶段检测器，由无角度的PointRPN（用于生成候选框）和PointReg（用于精细优化）组成。其核心思想是，不直接回归角度，而是通过学习物体的“代表点”和“角点”来间接定义和优化旋转框，从而规避角度回归带来的问题。

此外，论文还针对遥感数据集中常见的类别不均衡问题，提出了一个均衡数据集策略，通过对稀有类别图像进行重采样来稳定训练过程并提升性能。最终，该方法在DOTA、HRSC2016等多个大型遥感影像数据集上取得了SOTA的性能。

2. 背景与动机：旋转目标检测中的“角度”难题

在旋转目标检测中，如何表示一个旋转框是核心问题。

基于角度的表示法：通常使用 (x, y, w, h, θ) 五个参数，其中 θ 表示旋转角。这种方法虽然直观，但存在一个致命缺陷——

边界不连续性。如下图所示，对于一个近乎正方形的物体，当其w和h的定义因为微小的变化而互换时，θ 的值会发生90度的跳变。这种突变会“迷惑”网络的学习过程，导致训练不稳定，限制了模型的精度上限。

【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》_第1张图片

图4: 角度预测的边界不连续问题。黄色和红色的框非常相似，但角度 `θ` 的定义却相差了90度

无角度的表示法：为了规避上述问题，另一条技术路线是直接回归旋转框的四个角点坐标 (x1, y1, ..., x4, y4) 。这种方式更直接，且参数单位统一，但当时已有的无角度方法性能相对有限。

核心动机：设计一个更有效、更直接的纯无角度框架，以彻底解决角度回归带来的边界问题，并提升旋转目标的检测性能。

3. Point RCNN 模型详解

Point RCNN是一个两阶段的检测器，其整体流程如下图所示。

【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》_第2张图片

图3: Point RCNN 整体流程图

3.1. 第一阶段：PointRPN (生成旋转候选框)

PointRPN是一个无锚框（anchor-free）且无角度的区域提案网络，其目标是生成高质量的旋转候选框（Rotated Region of Interests, RRoI）。

代表点学习 (Representative Points Prediction)：受到RepPoints的启发，PointRPN的核心任务是学习一组（默认为9个）能够有效描述物体形状和姿态的代表点 。它采用了一个从粗到精（coarse-to-fine）的过程：
1. 初始阶段：网络首先预测一组初步的代表点偏移量。
2. 优化阶段：利用初始阶段预测的偏移量，通过**可变形卷积（Deformable Convolution）**对特征图进行对齐和优化，然后再预测一组更精确的代表点偏移量，得到最终的代表点集。
从代表点到RRoI：在得到一组代表点后，PointRPN并不直接回归框的参数。而是通过调用OpenCV中的 MinAreaRect 函数，计算出能够包围这组代表点的最小面积矩形 。这个矩形就被用作一个高质量的、无角度生成的RRoI。这一步非常巧妙，将点的表示转换为了框的表示。

3.2. 第二阶段：PointReg (优化旋转边界框)

PointReg是RCNN的检测头，负责对PointRPN生成的RRoI进行分类和精细优化。

角点回归 (Corner Points Refine)：PointReg同样采用无角度设计。对于输入的RRoI，它首先通过RRoIAlign提取特征，然后通过两个全连接层（FC）进行编码。最后，网络直接回归该RRoI 四个角点的偏移量，从而得到一个更精确的旋转框。
级联结构：这种“优化角点”的过程可以级联进行。即将第一级优化后的框作为第二级的输入，进行再次优化，以达到更高的精度。

3.3. 均衡数据集策略 (Balanced Dataset Strategy)

遥感影像数据集经常存在严重的长尾分布问题，即某些类别（如舰船）的实例数量远多于其他类别（如田径场）。这会导致模型在训练时偏向于常见类别。为解决此问题，论文提出了一种重采样（re-sampling）策略：

首先，计算数据集中每个类别 c 在多少比例的图像中出现过，记为Fc 。
然后，根据一个阈值 β_thr 计算每个类别的重复采样因子 rc。Fc 越小的稀有类别，其 rc 值越大。
对于每张图像，其最终的重复采样因子 rI 取决于它所包含的所有类别中最大的那个 rc 。
在训练时，根据 rI 对图像进行重采样，使得包含稀有类别的图像有更高的概率被选中。

实验证明，这一策略能有效稳定训练过程，并将在DOTA-v1.0上的mAP从80.37%提升至80.71% 。

4. 关键创新点

纯无角度框架 (Angle-Free): PointRPN 和 PointReg 都完全不涉及角度预测，从根本上规避了边界不连续问题。
代表点学习 (PointRPN): 通过预测一组代表点来隐式地表示旋转目标，比直接回归旋转框或使用锚框更灵活。MinAreaRect 转换提供了一种无锚框（Anchor-Free）且无角度的RRoI生成方式。
角点精炼 (PointReg): 直接在RCNN阶段精炼四个角点，参数单位一致，且采用由粗到精的策略。
平衡数据集策略 (Balanced Dataset Strategy): 针对遥感图像中常见的长尾分布问题（某些类别实例极少，如DOTA中“Ground track field” vs “Ship”）做出优化。

5. 实验结果 (SOTA Performance)

数据集: DOTA-v1.0, DOTA-v1.5 (更小目标、更多实例), HRSC2016 (船舶), UCAS-AOD (小目标：车、飞机)。
主干网络: 主要使用 ReResNet-50-ReFPN (ReDet提出的旋转等变主干)，也验证了 Swin-Tiny-FPN (Transformer主干) 的通用性。
主要结果 (mAP):
- DOTA-v1.0: 80.71% (ReR50-ReFPN + 平衡策略)，81.32% (Swin-T-FPN)，显著优于 ReDet (80.10%) 和 Oriented RCNN (80.32%)。平衡策略带来 +0.34% 提升。
- DOTA-v1.5: 79.31% (ReR50-ReFPN + 平衡策略)，80.14% (Swin-T-FPN + 平衡策略)，显著提升 SOTA 约 2.5-2.86% (vs ReDet 76.80%, Oriented RCNN 76.45%)。平衡策略带来 +0.57% 提升。
- HRSC2016 (VOC2012 metric): 98.53%，优于 ReDet (97.63%) 和 Oriented RCNN (97.60%)。
- UCAS-AOD: 90.04%，优于 S²A-Net (89.99%) 等。
消融实验 (Ablation Studies on DOTA-v1.5):
- PointReg 有效性: 角点回归 (8参数) 优于带角度的5参数回归 (77.60% vs 77.25%)。
- 平衡策略有效性: 找到最佳阈值 β_thr=0.3 (77.60%)。
- 各模块贡献: PointRPN (+2.81%), 平衡策略 (+0.05%, 但与其他结合效果显著), PointRPN+平衡策略 (+5.89%), 完整PointRCNN (+6.24%) 均有效提升基线 (71.36%)。
- PointRPN 召回率 (Recall): Top-2000 proposals 可达 90.00% 召回率，证明其生成高质量RRoI的能力。
可视化: 图8展示了PointRPN学习的代表点能捕捉目标轮廓；图9-11展示了最终检测结果，验证了框架的有效性。

图8：PointRPN 在 DOTA-v1.0 测试集上学习到的一些代表性点（红点）的可视化结果:

6. 结论 (Conclusions)

Point RCNN 是一个纯无角度的两阶段旋转目标检测框架。
核心组件是 PointRPN（学习代表点生成RRoI）和 PointReg（精炼角点）。
提出了平衡数据集策略缓解遥感图像的长尾问题。
在多个大型航空图像数据集上实现了新的SOTA性能，显著超越了之前的基于角度和无角度的方法，证明了其解决边界不连续问题的有效性和优越性。

7. 意义与展望

意义: 提供了一种新颖且有效的解决旋转目标检测核心挑战（边界不连续）的思路，性能显著提升。
局限与未来工作 (Discussion):
- 在某些类别（如DOTA中的“Plane”）性能仍有提升空间。
- 仍需依赖旋转NMS去除冗余框，可能误删正确检测。
- 未来可探索基于Transformer的端到端NMS-free方法。

总结: Point RCNN 通过创新的“代表点学习->RRoI生成->角点精炼”的纯无角度流程，成功规避了旋转目标检测中的边界不连续难题，并结合数据重采样策略处理长尾分布，在多个权威数据集上取得了显著的性能突破，是该领域的一项重要进展。

6篇论文核心思想与技术范式总结

至此，我们已经详细解读了6篇在3D检测/旋转检测领域具有里程碑意义的论文。它们分别代表了不同时期、不同问题域下的技术演进方向。

论文	核心领域	主要贡献 / 解决的问题	技术范式
SECOND	LiDAR 3D检测	引入稀疏3D卷积，解决了VoxelNet的效率瓶颈，使3D体素方法变得实用。	纯体素（Voxel-based），单模态
PointPillars	LiDAR 3D检测	提出Pillar编码器，将3D卷积完全替换为高效的2D卷积，实现了速度的巨大飞跃。	纯体素（Pillar也是一种Voxel），单模态
PV-RCNN	LiDAR 3D检测	点-体素混合，通过Voxel-to-Keypoint的特征抽象，结合了体素的效率和点云的精度。	混合表示（Point-Voxel），单模态
Voxel R-CNN	LiDAR 3D检测	提出高效的Voxel RoI Pooling，证明了纯体素两阶段框架也能达到SOTA精度，挑战了点云特征的必要性。	纯体素（Voxel-based），单模态
TransFusion (PKU/Alibaba)	LiDAR-相机融合	关注鲁棒性，提出解耦双流架构，解决了主流融合方法对LiDAR输入的强依赖和传感器故障问题。	BEV空间融合，多模态
TransFusion (MIT/Huawei)	LiDAR-相机融合	关注信息保真度，首创用Transformer进行“软关联”融合，解决了硬关联融合对标定和图像质量敏感的问题。	隐式查询空间融合，多模态
Point RCNN	2D遥感影像旋转检测	关注边界不连续性，提出纯粹的无角度框架，用代表点和角点回归替代角度回归。	2D图像，单模态

那么我们对于3D目标检测领域的论文阅读暂时告一段落，后续我会将目前正在研究的模型的架构和代码理解分享给大家。

车载诊断架构 ---面向售后的DTC应该怎么样填写？汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列 EV（电动汽车）常规知识必备架构面向售后的DTC 车载诊断架构 OEM怎么掌握软件开发能力车载通信网络槪述 android ZEVonUDS-J1979
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
【ARM】FPU,VFP,ASE,NEON,SVE...是什么意思？亿道电子Emdoor ARM arm开发 ARM
1、文档目标对执行浮点和SIMD操作的逻辑的各种名称的缩写词进行简要解释。2、问题场景Arm处理器内核中有用于执行浮点和SIMD操作的逻辑，有各种名称。它们通常是一系列的缩写形式，因此本文旨在对每一个缩写词进行简要解释。3、软硬件环境1、软件版本：不涉及2、电脑环境：不涉及4、相关缩写FPU(Floating-PointUnit)浮点单元浮点单元是处理器核心中的一个模块，用于使用浮点数执行算术运算
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
selenium 特殊场景处理
文章目录前言一、windows的弹窗二、内嵌网页frame三、页签切换四、截图五、弹窗六、JS执行总结前言selenium处理web操作师，有很多特殊的情况需要处理，例如弹窗、内嵌网页，页签切换，js执行等，下面介绍一些可能会遇到的特殊场景一、windows的弹窗importwin32com.client'''创建了一个WScript.ShellCOM(ComponentObjectModel)对
[Ljava.lang.Object; cannot be cast to [Ljava.lang.String; 这些不会的
解释：这个错误是很常见的错误，错误的提示已经很清楚了就是java的Object数组不能转换成为String[]数组，这就说明你要转换的数组它本身是Object类型的数组，但是你却非要把它转换为String类的数组，这当然是错误的。示例：[java]viewplaincopypackagecom.dada;importjava.util.ArrayList;importjava.util.List;
登录功能详解开往1982 java 登录 spring boot
本项目由maven项目改造springboot项目导入依赖org.springframework.bootspring-boot-starter-parent2.7.6org.springframework.bootspring-boot-starter-web2.7.6org.springframework.bootspring-boot-starter-test2.7.5org.springf
Spring Boot 2整合Druid的两种方式玩代码 spring boot 后端 java Druid
一、自定义整合Druid（非Starter方式）适用于需要完全手动控制配置的场景添加依赖（pom.xml）com.alibabadruid1.2.8org.springframework.bootspring-boot-starter-jdbc创建配置类@ConfigurationpublicclassDruidConfig{@Bean@ConfigurationProperties(prefix
Java：数据结构-ArrayList和顺序表（2） blammmp java 数据结构开发语言
一ArrayList的使用1.ArrayList的构造方法第一种（指定容量的构造方法）创建一个空的ArrayList，指定容量为initialCapacity。publicArrayList(intinitialCapacity){if(initialCapacity>0){this.elementData=newObject[initialCapacity];}elseif(initialCap
mysql创建线程处理链接请求斜不靠谱
mysqld通过RUN_HOOK(server_state,before_handle_connection,(NULL));调用/**Threadhandlerforaconnection@paramargConnectionobject(Channel_info)Thisfunction(normally)doesthefollowing:-Initializethread//初始化线程-In
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
数据结构2-集合类ArrayList与洗牌算法
文章目录★引言：一.MyArrayList模拟实现（一）IList（二）MyArrayList（1）add(Tdata)（2）add(intpos,Tdata)（3）IllgalPosException（4）indexOf(ObjecttoFind)（5）contains(ObjecttoFind)（6）get(intpos)（7）set(intpos,Tvalue)（8）remove(Objec
Java 笔记 transient 用法
transient关键字用于标记不希望被序列化（Serialization）的字段。序列化是指将对象的状态保存到字节流中，以便将其传输或存储。当使用如ObjectOutputStream进行序列化时，transient修饰的字段将不会被序列化。✅1.使用场景避免序列化敏感信息privatetransientStringpassword;某些字段不需要持久化（如缓存、临时数据）privatetran
论文阅读：《针对多目标优化和应用的 NSGA-II 综述》一些关于优化算法的简介行然梦实优化算法论文阅读算法数学建模
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。内容由AI辅助生成，仅经笔者审核整理，请甄别食用。文章目录前言一些关于优化算法的缩写优化算法Ma,Haiping&Zhang,Yajing&Sun,Shengyi&Liu,Ting&S
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
斗破苍穹｜第四章：休妻上分享生活3
欢迎大家收听长篇玄幻小说《斗破苍穹》。第四章休息。那么，炼丹最重要的三个条件，物质，火，灵魂，感知。材料自然是各种天才和宝物。毕竟药剂师不是神。没有顶级的材料，她们也是聪明的女人，没有米饭就不能做饭，所以好的材料很重要。火种。也就是炼药所需的火焰。用普通的火来炼制丹药是不可能的。而是必须使用由火属性斗气催化的斗气火焰。当然，这个世界充满了不同的火焰，一些强大的炼金术士也将取代他们的位置。用这些奇火
yolo 目标检测600类目标大霸王龙行业+领域+业务场景=定制 YOLO 目标检测人工智能
1.模型架构调整类别适配：将YOLO输出层的类别节点数调整为600（如YOLOv5的detect.yaml中修改nc=600），并更新类别名称映射表（classes.txt）。骨干网络优化：若使用YOLOv5/v8，可升级骨干网络（如C3模块深度）或替换为更高性能的主干（如EfficientNet、ResNet-101），以增强复杂场景的特征提取能力。多尺度检测头：保留或扩展YOLO的多尺度输出（
环境艺术设计必学的“3D建模与渲染软件”指南
在环境艺术设计领域，掌握高效的设计软件是学生入门阶段普遍关注的核心问题。优秀的软件如同设计师的得力助手，能够精准表达设计创意、显著提升工作效率，在设计流程的各个环节都发挥着不可或缺的作用。根据功能划分，环艺设计常用软件主要涵盖建模、渲染、后期处理及辅助工具四大类。本文将为您梳理环艺设计中必学的核心软件。一、核心建模软件建模是将设计构思转化为三维模型的关键步骤。以下两款软件在环艺设计中应用最为广泛：
2025年7月技术问答第1期大势智慧实景三维三维建模教程问答答疑干货
1.如图，用重建大师时重建好几次空间区域都是空的，周围的建模成功，该如何处理？答：确定下是中间两个缺失瓦块的名称，可以对瓦块右键清理中间结果，重新提交下生产。2.网格大师可以合并OSGB和3Dtiles的根结点吗，，不是想要的单独只有一个目录的那种，是不是只有最高级的那个文件夹里面的瓦片才是最终结果？答：根节点合并，只合并头文件，不会把瓦块整个合并。网格大师是一款能够解决实景三维模型空间参考、原点
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
Gradient-Adaptive Policy Optimization:Towards Multi-Objective Alignment of Large Language Models 樱花的浪漫大模型与智能体对抗生成网络与动作识别强化学习语言模型人工智能自然语言处理深度学习机器学习
2025.acl-long.549.pdfhttps://aclanthology.org/2025.acl-long.549.pdf1.概述大型语言模型（LLMs）（Anthropic,2023;OpenAI,2024）已经在广泛的实际应用中展示了显著的能力（Bubecketal.,2023），包括内容创作（Yuanetal.,2022）、编程辅助（Chenetal.,2021;Gaoetal.
Unity 程序运行一段时间后Game界面出现黑屏的一种情况 zhannghong2003 Unity unity 游戏引擎
经过排查，发现是Camera(相机)的Z轴一直变大导致的黑屏。造成这种情况的原因是代码：VMouseTransform.position=Camera.main.ScreenToWorldPoint(Input.mousePosition)；Camera(相机)设置成为跟随VMouseTransform。所以会出现Z轴逐渐变大的情况，最后导致黑屏。改代码为：Vector2vMouseNeed=Ca
C#返回两个数组或多个数组，函数方法的一种写法 zhannghong2003 C#c#
public(float[]x,float[]y)GetPolygonCollider2DPoints(PolygonCollider2Dobjects){Vector2[]points=objects.points;float[]x=newfloat[points.Length];float[]y=newfloat[points.Length];for(inti=0;i
Coze开源实战指南：构建企业级AI应用的全链路技术解析（含Kubernetes+服务网格深度实践）
一、Coze技术架构深度解析1.1核心组件与五层异构架构Coze采用五层异构架构（感知层→执行层→决策层→监控层→进化层），实现亚毫秒级实时响应与动态弹性扩展。其核心模块包括：架构亮点支持横向扩展的微服务集群基于Kubernetes的自动扩缩容机制服务网格（Istio）实现流量治理核心组件对比表组件功能特性典型性能指标CozeStudio30+节点类型/多模式编排响应速度提升300%CozeLoo
yolo检测常见指标 bigdata从入门到放弃深度学习yolo YOLO 目标跟踪人工智能深度学习
YOLO（YouOnlyLookOnce）作为经典的单阶段目标检测算法，其性能评估依赖于目标检测领域的通用指标。这些指标既衡量检测精度（是否准确识别物体类别、准确定位），也衡量检测速度（是否实时）。下面用通俗的语言详细解释核心指标：一、基础：判断“预测框是否有效”——IoU（交并比）目标检测的核心是“预测框”（模型输出的矩形框）是否准确覆盖“真实框”（人工标注的物体位置）。IoU是衡量两者重叠程度
尚庭公寓-学习跟敲笔记（二） wenbinglin66 学习笔记 spring boot java
管理端后端开发-租赁管理模块1.看房预约管理1.1根据ID更新预约状态在ViewAppointmenController中增加内容@Operation(summary="根据id更新预约状态")@PostMapping("updateStatusById")publicResultupdateStatusById(@RequestParamLongid,@RequestParamAppointme
常见4种主流ORM介绍与基本使用（Peewee ORM、Django ORM、SQLAlchemy ORM、Tortoise ORM） ACERT333 python后端开发笔记笔记 django python 后端 ORM
ORM对象关系映射（ObjectRelationalMapping，简称ORM）是一种程序设计技术，用于在面向对象编程语言和关系数据库之间进行数据转换。ORM的核心思想是通过创建一个“虚拟对象数据库”，使开发者可以使用面向对象的方式操作数据库，而不需要直接编写复杂的SQL语句。基本原理：ORM的基本原理是将数据库中的表映射为编程语言中的类，将表中的记录映射为类的实例，将表中的字段映射为类的属性。通
AI Agent开发第60课-巧用QWEN3.0 0.6B：小身板扛大旗，AI界的轻骑兵 TGITCIC AI Agent开发大全 qwen3 qwen ali qwen 国产大模型小模型开源小模型 ai agent
第一章：小模型的生存法则——为什么0.6B参数就够了？1.1参数量的"黄金分割点"模型类型参数量推理延迟（ms）并发量（QPS）Qwen-0.6B6亿15-3010万+Qwen-1.5B15亿50-805万Qwen-7B70亿200+1万数据对比显示，当参数量超过6亿后，性能提升与成本增长呈现"抛物线"关系。就像智能手机从4G到5G的迭代，用户感知不到的速度提升，却要为硬件升级买单。Qwen-0.
【亲测免费】探索PF4J：Java插件框架的革命性选择农优影
探索PF4J：Java插件框架的革命性选择项目介绍PF4J（PluginFrameworkforJava）是一个开源的、轻量级的Java插件框架，旨在将传统的单体Java应用转变为模块化应用。PF4J的核心理念是保持简单且高度可扩展，它通过插件机制允许第三方扩展应用功能，同时支持定义和实现扩展点。PF4J不仅依赖少（仅依赖slf4j-api），而且体积小巧（约100KB），是构建现代Java应用的
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d