AI小怪兽

《YOLO小目标检测》专栏介绍 & CSDN独家改进创新实战&专栏目录

Yolo小目标检测，独家首发创新（原创），适用于Yolov5、Yolov7、Yolov8等各个Yolo系列，专栏文章提供每一步步骤和源码，带你轻松实现小目标检测涨点

重点：通过本专栏的阅读，后续你可以结合自己的小目标检测数据集，在网络不同位置（Backbone、head、detect、loss等）进行魔改，实现小目标涨点和创新！！！

专栏介绍：

✨✨✨解决小目标检测难点并提升小目标检测性能；

小目标、遮挡物性能提升和创新；

工业界小目标检测性能提升和部署可行性；

持续更新中，定期更新不同数据集涨点情况；

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
Wasserstein loss	168	3005843	8.1	6103	0.784
yolov8_smallob	207	2921172	12.2	6137	0.878
yolov8_SEAM	219	3109331	8.3	6331	0.785
yolov8_SPD	174	3598739	49.2	7394	0.875
yolov8_EVC	217	7293523	11.5	14513	0.779
yolov8_BiFPN	168	3005849	8.1	6104	0.766
yolov8_ContextAggregation	195	3008092	8.1	6121	0.759
yolov8_EMA	192	3006739	8.1	6114	0.766
yolov8_DCNV3	264	2892317	7.9	5892	0.765
yolov8_MCALayer	209	2545659	7.2	5194	0.769
yolov8_BiFormerBlock	204	3356179	22.4	6800	0.758
yolov8_LSKblockAttention	201	3343333	8.7	6784	0.775
yolov8_GPFN	216	2986131	8.1	6079	0.766
yolov8_C2f_Pconv	177	2716883	7.6	5537	0.758
yolov8_ODConv	179	3012110	7.9	6121	0.76
yolov8_TripletAttention	201	3006443	8.2	6120	0.79
yolov8_ChannelAttention	171	3137427	7.8	6428	0.815
yolov8_DySnakeConv	229	3356287	8.5	6822	0.77
yolov8_MultiSEAM	325	5742291		11711	0.87
yolov8_MobileViTAttention	241	3957659	11.1	7992	0.799
yolov8-RFA	258	3019439	8.2	6166	0.765
yolov8_BasicRFB	303	3440235	8.9	7040	0.762
yolov8_RepViTBlock	186	3338387	7.9	6771	0.791
yolov8-goldyolo	359	6015123	11.9	12123	0.768
yolov8_DualAttention	186	4604819	8.3	9236	0.766

1.小目标检测介绍

1.1 小目标定义

1.2 难点

2. 本专栏小目标数据集

3.小目标专栏难点优化方向

3.1 合理的数据增强

3.2 网络多尺度

3.2.1 多头检测器

3.2.2 BiFPN高效双向跨尺度连接和加权特征融合

3.2.3 小目标到大目标一网打尽，轻骨干重Neck的轻量级目标检测器GiraffeDet

3.2.4 多分支卷积模块RFB

3.2.5 GOLD-YOLO，遥遥领先

3.3 loss优化

3.3.1 Wasserstein Distance Loss

3.4 注意力机制

3.4.1SEAM注意力机制

3.4.2 即插即用的多尺度融合模块EVC

3.4.3 微小目标检测的上下文增强和特征细化网络ContextAggregation

3.4.4 EMA跨空间学习的高效多尺度注意力 | ICASSP2023

3.4.5 动态稀疏注意力BiFormer | CVPR 2023

3.4.6 LSKblockAttention | ICCV 2023

3.4.7 TripletAttention注意力

3.4.8 通道优先卷积注意力（CPCA）| 中科院 2023.6

3.4.8 多尺度MultiSEAM

3.4.9 轻量级注意力MobileViTAttention | ECCV2022

3.4.10 感受野注意力卷积运算

3.4.11 Dual-ViT：一种多尺度双视觉Transformer

3.5 卷积变体

3.5.1 SPD-Conv

3.5.2 DCNv3可形变卷积 | CVPR2023

3.5.3 新的Partial卷积(PConv) | CVPR2023 FasterNet

3.5.4 ODConv | ICLR 2022

3.5.5 动态蛇形卷积（Dynamic Snake Convolution） | ICCV2023

番外篇：工业小目标缺陷检测

1.1 动态蛇形卷积（Dynamic Snake Convolution），实现暴力涨点 | ICCV2023

1.2 微小目标检测可能存在检测能力不佳的现象，添加一个微小物体的检测头

1.3 SPD-Conv，低分辨率图像和小物体涨点明显

1.4大缺陷小缺陷一网打尽的轻量级目标检测器GiraffeDet

1.5 多检测头结合小缺陷到大缺陷一网打尽的轻量级目标检测器GiraffeDet

1.6 Wasserstein Distance Loss，助力工业缺陷检测

1.7 工业部署级解决方案：多头检测器+小缺陷到大缺陷一网打尽的+Wasserstein Distance Loss

1.小目标检测介绍

1.1 小目标定义

1）以物体检测领域的通用数据集COCO物体定义为例，小目标是指小于32×32个像素点（中物体是指32*32-96*96，大物体是指大于96*96）；
2）在实际应用场景中，通常更倾向于使用相对于原图的比例来定义：物体标注框的长宽乘积，除以整个图像的长宽乘积，再开根号，如果结果小于3%，就称之为小目标；

1.2 难点

1）包含小目标的样本数量较少，这样潜在的让目标检测模型更关注中大目标的检测；

2）由小目标覆盖的区域更小，这样小目标的位置会缺少多样性。我们推测这使得小目标检测的在验证时的通用性变得很难；

3）anchor难匹配问题。这主要针对anchor-based方法，由于小目标的gt box和anchor都很小，anchor和gt box稍微产生偏移，IoU就变得很低，导致很容易被网络判断为negative sample；

4）它们不仅仅是小，而且是难，存在不同程度的遮挡、模糊、不完整现象；

等等难点

参考论文：http://sjcj.nuaa.edu.cn/sjcjycl/article/html/202103001

2. 本专栏小目标数据集

数据集下载地址：GitHub - YimianDai/sirst: A dataset constructed for single-frame infrared small target detection

Single-frame InfraRed Small Target

数据集大小：427张，进行3倍数据增强得到1708张，最终训练集验证集测试集随机分配为8：1：1

3.小目标专栏难点优化方向

3.1 合理的数据增强

将小目标在同一张图像中多拷贝几次；增加了匹配到小目标GT的anchor的数量；如涂鸦式增强

3.2 网络多尺度

通过P2层特征引出了新的检测头.P2层检测头分辨率为160×160像素, 相当于在主干网络中只进行了2次下采样操作, 含有目标更为丰富的底层特征信息. 颈部网络中自上而下和自下而上得到的两个P2层特征与主干网络中的同尺度特征通过concat形式进行特征融合, 输出的特征为3个输入特征的融合结果, 这样使得P2层检测头应对微小目标时, 能够快速有效的检测.

3.2.1 多头检测器

亲测在红外弱小目标检测涨点明显，[email protected] 从0.755提升至0.878

Yolov8红外弱小目标检测（3）：多头检测头提升红外弱小目标检测精度_AI小怪兽的博客-CSDN博客

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_smallob	207	2921172	12.2	6137	0.878

3.2.2 BiFPN高效双向跨尺度连接和加权特征融合

BiFPN 的主要思想：高效双向跨尺度连接和加权特征融合

文中提出了BiFPN和联合缩放方法（Compound Scaling），BiFPN考虑到不同特征融合对于输出特征的重要性；联合缩放方法（Compound Scaling）综合考虑图像输入分辨率、网络宽度和深度这些因素，权衡了准确率和效率。如图所示为本文的整体结构图：

Yolov8红外弱小目标检测（7）：BiFPN高效双向跨尺度连接和加权特征融合，助力小目标检测_AI小怪兽的博客-CSDN博客

BiFPN | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.766

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_BiFPN	168	3005849	8.1	6104	0.766

3.2.3 小目标到大目标一网打尽，轻骨干重Neck的轻量级目标检测器GiraffeDet

本文是阿里巴巴在目标检测领域的工作(已被ICLR2022接收)，提出了一种新颖的类“长颈鹿”的GiraffeDet架构，它采用了轻骨干、重Neck的架构设计范式。所提GiraffeDet在COCO数据集上取得了比常规CNN骨干更优异的性能，取得了54.1%mAP指标，具有更优异的处理目标大尺度变化问题的能力。

本文提出了GiraffeDet用于高效目标检测，giraffe包含轻量space-to-depth chain、Generalized-FPN以及预测网络

GFPN | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.766

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_GPFN	216	2986131	8.1	6079	0.766

Yolov8小目标检测（14）：小目标到大目标一网打尽，轻骨干重Neck的轻量级目标检测器GiraffeDet_AI小怪兽的博客-CSDN博客

3.2.4 多分支卷积模块RFB

受启发于人类视觉的Receptive Fields结构，本文提出RFB，将RFs的尺度、离心率纳入考虑范围，使用轻量级主干网也能提取到高判别性特征，使得检测器速度快、精度高；具体地，RFB基于RFs的不同尺度，使用不同的卷积核，设计了多分支的conv、pooling操作（makes use of multi-branch pooling with varying kernels），并通过虫洞卷积（dilated conv）来控制感受野的离心率，最后一步reshape操作后，形成生成的特征

[email protected] 从原始0.755提升至0.762

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_BasicRFB	303	3440235	8.9	7040	0.762

Yolov8小目标检测（23）：多分支卷积模块RFB，扩大感受野提升小目标检测精度_AI小怪兽的博客-CSDN博客

3.2.5 GOLD-YOLO，遥遥领先

链接：https://arxiv.org/pdf/2309.11331.pdf

传统YOLO的问题

在检测模型中，通常先经过backbone提取得到一系列不同层级的特征，FPN利用了backbone的这一特点，构建了相应的融合结构：不层级的特征包含着不同大小物体的位置信息，虽然这些特征包含的信息不同，但这些特征在相互融合后能够互相弥补彼此缺失的信息，增强每一层级信息的丰富程度，提升网络性能。

原始的FPN结构由于其层层递进的信息融合模式，使得相邻层的信息能够充分融合，但也导致了跨层信息融合存在问题：当跨层的信息进行交互融合时，由于没有直连的交互通路，只能依靠中间层充当“中介”进行融合，导致了一定的信息损失。之前的许多工作中都关注到了这一问题，而解决方案通常是通过添加shortcut增加更多的路径，以增强信息流动。

提出了一种全新的信息交互融合机制：信息聚集-分发机制(Gather-and-Distribute Mechanism)。该机制通过在全局上融合不同层次的特征得到全局信息，并将全局信息注入到不同层级的特征中，实现了高效的信息交互和融合。在不显著增加延迟的情况下GD机制显著增强了Neck部分的信息融合能力，提高了模型对不同大小物体的检测能力。

在Gold-YOLO中，针对模型需要检测不同大小的物体的需要，并权衡精度和速度，我们构建了两个GD分支对信息进行融合：低层级信息聚集-分发分支(Low-GD)和高层级信息聚集-分发分支(High-GD)，分别基于卷积和transformer提取和融合特征信息。

[email protected] 从原始0.755提升至0.768

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8-goldyolo	359	6015123	11.9	12123	0.768

YOLOv8-goldYOLO summary: 359 layers, 6015123 parameters, 0 gradients, 11.9 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 3/3 [00:04<00:00,  1.41s/it]
                   all        171        199      0.871      0.679      0.768      0.461
Speed: 0.3ms preprocess, 3.9ms inference, 0.0ms loss, 1.6ms postprocess per image

Yolov8小目标检测（24）：Gold-YOLO，遥遥领先，超越所有YOLO | 华为诺亚NeurIPS23_AI小怪兽的博客-CSDN博客

3.3 loss优化

3.3.1 Wasserstein Distance Loss

1）分析了 IoU 对微小物体位置偏差的敏感性，并提出 NWD 作为衡量两个边界框之间相似性的更好指标；

2）通过将NWD 应用于基于锚的检测器中的标签分配、NMS 和损失函数来设计强大的微小物体检测器；

3）提出的 NWD 可以显着提高流行的基于锚的检测器的 TOD 性能，它在 AI-TOD 数据集上的 Faster R-CNN 上实现了从 11.1% 到 17.6% 的性能提升；

Wasserstein Distance Loss | 亲测在红外弱小目标检测涨点明显，[email protected] 从0.755提升至0.784

Yolov8红外弱小目标检测（2）：Wasserstein Distance Loss，助力小目标涨点_AI小怪兽的博客-CSDN博客

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
Wasserstein loss	168	3005843	8.1	6103	0.784

3.4 注意力机制

3.4.1SEAM注意力机制

SEAM注意力机制，提升遮挡小目标检测性能

即不同小目标之间的遮挡，以及其他物体对小目标的遮挡。前者使得检测精度对 NMS 阈值非常敏感，从而导致漏检。作者使用排斥损失进行小目标检测，它惩罚预测框转移到其他真实目标，并要求每个预测框远离具有不同指定目标的其他预测框，以使检测结果对 NMS 不太敏感。后者导致特征消失导致定位不准确，设计了注意力模块 SEAM 来增强人脸特征的学习。

Yolov8红外弱小目标检测（5）：SEAM注意力机制，提升遮挡小目标检测性能_AI小怪兽的博客-CSDN博客

SEAM | 亲测在红外弱小目标检测涨点明显，[email protected] 从0.755提升至0.785

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_SEAM	219	3109331	8.3	6331	0.785

3.4.2 即插即用的多尺度融合模块EVC

如图2所示，CFP主要由以下部分组成：输入图像、用于提取视觉特征金字塔的CNN主干、提出的显式视觉中心（EVC）、提出的全局集中规则（GCR）以及用于目标检测的去解耦head网络（由分类损失、回归损失和分割损失组成）。在图2中，EVC和GCR在提取的特征金字塔上实现。

提出的EVC主要由两个并行连接的块组成，其中使用轻量级MLP来捕获顶级特征的全局长期依赖性（即全局信息）。

Yolov8红外弱小目标检测（6）：即插即用的多尺度融合模块EVC，即插即用，助力小目标检测_AI小怪兽的博客-CSDN博客

EVC| 亲测在红外弱小目标检测涨点明显，[email protected] 从0.755提升至0.779

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_EVC	217	7293523	11.5	14513	0.779

3.4.3 微小目标检测的上下文增强和特征细化网络ContextAggregation

提供了一个统一视角表明：它们均是更广义方案下通过神经网络集成空间上下文信息的特例。我们提出了CONTAINER(CONText AggregatIon NEtwoRK)，一种用于多头上下文集成（Context Aggregation）的广义构建模块。

ContextAggregation | 亲测在红外弱小目标检测涨点明显，[email protected] 从0.755提升至0.759

Yolov8红外弱小目标检测（8）：微小目标检测的上下文增强和特征细化网络ContextAggregation，助力小目标检测_AI小怪兽的博客-CSDN博客

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_ContextAggregation	195	3008092	8.1	6121	0.759

3.4.4 EMA跨空间学习的高效多尺度注意力 | ICASSP2023

通过通道降维来建模跨通道关系可能会给提取深度视觉表示带来副作用。本文提出了一种新的高效的多尺度注意力(EMA)模块。以保留每个通道上的信息和降低计算开销为目标，将部分通道重塑为批量维度，并将通道维度分组为多个子特征，使空间语义特征在每个特征组中均匀分布。

EMA | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.766

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_EMA	192	3006739	8.1	6114	0.766

Yolov8小目标检测（9）： EMA基于跨空间学习的高效多尺度注意力、效果优于ECA、CBAM、CA | ICASSP2023_AI小怪兽的博客-CSDN博客

3.4.5 动态稀疏注意力BiFormer | CVPR 2023

本文方法：本文提出一种动态稀疏注意力的双层路由方法。对于一个查询，首先在粗略的区域级别上过滤掉不相关的键值对，然后在剩余候选区域（即路由区域）的并集中应用细粒度的令牌对令牌关注力。所提出的双层路由注意力具有简单而有效的实现方式，利用稀疏性来节省计算和内存，只涉及GPU友好的密集矩阵乘法。在此基础上构建了一种新的通用Vision Transformer，称为BiFormer。

BiFormer | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.758

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_BiFormerBlock	204	3356179	22.4	6800	0.758

Yolov8小目标检测（12）：动态稀疏注意力BiFormer | CVPR 2023_AI小怪兽的博客-CSDN博客

3.4.6 LSKblockAttention | ICCV 2023

提出的方法包括动态调整特征提取骨干的感受野，以便更有效地处理被检测物体的不同的广泛背景。这是通过一个空间选择机制来实现的，该机制对一连串的大 depth-wise 卷积核所处理的特征进行有效加权，然后在空间上将它们合并。这些核的权重是根据输入动态确定的，允许该模型自适应地使用不同的大核，并根据需要调整空间中每个目标的感受野。

LSKblockAttention | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.775

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_LSKblockAttention	201	3343333	8.7	6784	0.775

Yolov8小目标检测（13）：LSKblockAttention助力小目标检测 | ICCV 2023 南开大学LSKNet_AI小怪兽的博客-CSDN博客

3.4.7 TripletAttention注意力

所提出的Triplet Attention如下图所示，Triplet Attention由3个平行的Branch组成，其中两个负责捕获通道C和空间H或W之间的跨维交互。最后一个Branch类似于CBAM，用于构建Spatial Attention，最终3个Branch的输出使用平均求和。

TripletAttention | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.79

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_TripletAttention	201	3006443	8.2	6120	0.79

Yolov8小目标检测（16）：TripletAttention注意力，即插即用，效果优于cbam、se，涨点明显_AI小怪兽的博客-CSDN博客

3.4.8 通道优先卷积注意力（CPCA）| 中科院 2023.6

通道先验卷积注意力（CPCA）的整体结构包括通道注意力和空间注意力的顺序放置。特征图的空间信息是由通道注意力通过平均池化和最大池化等操作来聚合的。随后，空间信息通过共享 MLP（多层感知器）进行处理并添加以生成通道注意力图。通道先验是通过输入特征和通道注意力图的元素相乘获得的。随后，通道先验被输入到深度卷积模块中以生成空间注意力图。卷积模块接收空间注意力图以进行通道混合。最终，通过通道混合结果与通道先验的逐元素相乘，获得细化的特征作为输出。通道混合过程有助于增强特征的表示

CPCA | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.815

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_ChannelAttention	171	3137427	7.8	6428	0.815

Yolov8小目标检测（18）：通道优先卷积注意力（Channel Prior Convolutional Attention，CPCA）| 中科院 2023.6发布_AI小怪兽的博客-CSDN博客

3.4.8 多尺度MultiSEAM

解决多尺度问题的主要方法是构建金字塔来融合人脸的多尺度特征。例如，在 YOLOv5 中，FPN 融合了 P3、P4 和 P5 层的特征。但是对于小尺度的目标，经过多层卷积后信息很容易丢失，保留的像素信息很少，即使在较浅的P3层也是如此。因此，提高特征图的分辨率无疑有利于小目标的检测。

MultiSEAM| 亲测在红外弱小目标检测涨点明显，[email protected] 从0.755提升至0.87

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_MultiSEAM	325	5742291		11711	0.87

Yolov8小目标检测（20）：多尺度MultiSEAM，提高特征图的分辨率增强小目标检测能力_AI小怪兽的博客-CSDN博客

3.4.9 轻量级注意力MobileViTAttention | ECCV2022

MobileViT 主要是为了解决 ViT 网络的缺陷而设计提出的，将 CNN 的优点融入到 Transformer 的结构中以解决 Transformer 网络存在的训练困难、迁移困难、调整困难的缺点，加快网络的推理和收敛速度，使得网络更加稳定高效。

MobileViTAttention | 亲测在红外弱小目标检测涨点明显，[email protected] 从0.755提升至0.799

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_MobileViTAttention	241	3957659	11.1	7992	0.799

Yolov8小目标检测（21）：轻量级注意力MobileViTAttention | ECCV2022_AI小怪兽的博客-CSDN博客

3.4.10 感受野注意力卷积运算

关于感受野空间特征，我们提出感受野注意（RFA）。这种方法不仅强调感受野滑块内不同特征的重要性，而且优先考虑感受野空间特征。通过这种方法，彻底解决了卷积核参数共享的问题。感受野空间特征是根据卷积核的大小动态生成的，因此，RFA是卷积的固定组合，离不开卷积运算的帮助，同时依靠RFA来提高性能，所以我们提出感受野注意卷积（RFAConv）。具有3×3尺寸卷积核的RFAConv的整体结构如图2所示。

RFAConv | 亲测在红外弱小目标检测涨点明显，[email protected] 从0.755提升至0.765

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8-RFA	258	3019439	8.2	6166	0.765

Yolov8小目标检测（22）：感受野注意力卷积运算（RFAConv），助力小目标检测_AI小怪兽的博客-CSDN博客

3.4.11 移动端网络架构 RepViT | RepViTBlock | 清华 ICCV 2023

RepViT 通过逐层微观设计来调整轻量级 CNN，这包括选择合适的卷积核大小和优化挤压-激励（Squeeze-and-excitation，简称SE）层的位置。这两种方法都能显著改善模型性能。

RepViTBlock| 亲测在红外弱小目标检测涨点明显，[email protected] 从0.755提升至0.791

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_RepViTBlock	186	3338387	7.9	6771	0.791

Yolov8小目标检测（24）：最新开源移动端网络架构 RepViT | RepViTBlock | 清华 ICCV 2023_AI小怪兽的博客-CSDN博客

3.4.11 Dual-ViT：一种多尺度双视觉Transformer

摘要：以前的工作已经提出了几种降低自注意力机制计算成本的策略。其中许多工作考虑将自注意力过程分解为区域和局部特征提取过程，每个过程产生的计算复杂度要小得多。然而，区域信息通常仅以由于下采样而丢失的不希望的信息为代价。在本文中，作者提出了一种旨在缓解成本问题的新型Transformer架构，称为双视觉Transformer（Dual ViT）。新架构结合了一个关键的语义路径，可以更有效地将token向量压缩为全局语义，并降低复杂性。这种压缩的全局语义通过另一个构建的像素路径，作为学习内部像素级细节的有用先验信息。然后将语义路径和像素路径整合在一起，并进行联合训练，通过这两条路径并行传播增强的自注意力信息。因此，双ViT能够在不影响精度的情况下降低计算复杂度。实证证明，双ViT比SOTA Transformer架构提供了更高的精度，同时降低了训练复杂度。

如图1（a）所示。Twins（上图（b））在SRA之前添加了额外的局部分组自注意力层，以通过区域内相互作用进一步增强表示。RegionViT（上图（c））通过区域和局部自注意力分解原始注意力。然而，由于上述方法严重依赖于特征映射到区域的下采样，在有效节省总计算成本的同时，观察到了明显的性能下降。

如上图（d）所示，双ViT由两个特殊路径组成，分别称为“语义路径”和“像素路径”。通过构造的“像素路径”进行局部像素级特征提取是强烈依赖于“语义路径”之外的压缩全局先验。由于梯度同时通过语义路径和像素路径，因此双ViT训练过程可以有效地补偿全局特征压缩的信息损失，同时减少局部特征提取的困难。前者和后者都可以并行显著降低计算成本，因为注意力大小较小，并且两条路径之间存在强制依赖关系。

在本文中，我们提出了一种新颖的 Transformer 架构，它优雅地利用全局语义进行自注意力学习，即双视觉 Transformer (Dual-ViT)。

[email protected] 从原始0.755提升至0.768

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_DualAttention	186	4604819	8.3	9236	0.766

YOLOv8_DualAttention summary (fused): 186 layers, 4604819 parameters, 0 gradients, 8.3 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 6/6 [00:04<00:00,  1.29it/s]
                   all        171        199      0.865      0.707      0.766      0.452

Yolov8小目标检测（25）：Dual-ViT：一种多尺度双视觉Transformer ，Dualattention助力小目标检测| 顶刊TPAMI 2023_AI小怪兽的博客-CSDN博客

3.5 卷积变体

3.5.1 SPD-Conv

SPD-Conv由一个空间到深度(SPD)层和一个无卷积步长(Conv)层组成，可以应用于大多数CNN体系结构。我们从两个最具代表性的计算即使觉任务:目标检测和图像分类来解释这个新设计。然后，我们将SPD-Conv应用于YOLOv5和ResNet，创建了新的CNN架构，并通过经验证明，我们的方法明显优于最先进的深度学习模型，特别是在处理低分辨率图像和小物体等更困难的任务时。

Yolov8红外弱小目标检测（4）：SPD-Conv，低分辨率图像和小物体涨点明显_AI小怪兽的博客-CSDN博客

SPD-Conv | 亲测在红外弱小目标检测涨点明显，[email protected] 从0.755提升至0.875

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_SPD	174	3598739	49.2	7394	0.875

3.5.2 DCNv3可形变卷积 | CVPR2023

InternImage通过重新设计算子和模型结构提升了卷积模型的可扩展性并且缓解了归纳偏置，包括（1）DCNv3算子，基于DCNv2算子引入共享投射权重、多组机制和采样点调制。

（2）基础模块，融合先进模块作为模型构建的基本模块单元

（3）模块堆叠规则，扩展模型时规范化模型的宽度、深度、组数等超参数。

DCNv3 | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.765

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_DCNV3	264	2892317	7.9	5892	0.765

Yolov8小目标检测（10）：DCNv3可形变卷积助力涨点，COCO新纪录65.4mAP | CVPR2023 InternImage_AI小怪兽的博客-CSDN博客

3.5.3 新的Partial卷积(PConv) | CVPR2023 FasterNet

为了设计快速神经网络，许多工作都集中在减少浮点运算（FLOPs）的数量上。然而，作者观察到FLOPs的这种减少不一定会带来延迟的类似程度的减少。这主要源于每秒低浮点运算（FLOPS）效率低下。为了实现更快的网络，作者重新回顾了FLOPs的运算符，并证明了如此低的FLOPS主要是由于运算符的频繁内存访问，尤其是深度卷积。因此，本文提出了一种新的partial convolution（PConv），通过同时减少冗余计算和内存访问可以更有效地提取空间特征。

PConv | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.758，同时参数量param及计算量FLOPs都有降低

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_C2f_Pconv	177	2716883	7.6	5537	0.758

Yolov8小目标检测（15）：新的Partial卷积(PConv) ，减少冗余计算和内存访问 | CVPR2023 FasterNet_AI小怪兽的博客-CSDN博客

3.5.4 ODConv | ICLR 2022

ODConv通过并行策略引入一种多维注意力机制以对卷积核空间的四个维度学习更灵活的注意力。ODConv可以描述成如下形式：

表示新引入的三个注意力，分别沿空域维度、输入通道维度以及输出通道维度。这四个注意力采用多头注意力模块计算得到

ODConv | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.76

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_ODConv	179	3012110	7.9	6121	0.76

Yolov8小目标检测（17）：ODConv提升小目标检测能力 | ICLR 2022_AI小怪兽的博客-CSDN博客

3.5.5 动态蛇形卷积（Dynamic Snake Convolution） | ICCV2023

主要的挑战源于细长微弱的局部结构特征与复杂多变的全局形态特征。本文关注到管状结构细长连续的特点，并利用这一信息在神经网络以下三个阶段同时增强感知：特征提取、特征融合和损失约束。分别设计了动态蛇形卷积（Dynamic Snake Convolution），多视角特征融合策略与连续性拓扑约束损失。

Dynamic Snake Convolution | 亲测在红外弱小目标检测涨点，[email protected] 从0.755提升至0.77

	layers	parameters	GFLOPs	kb	mAP50
yolov8	168	3005843	8.1	6103	0.755
yolov8_DySnakeConv	229	3356287	8.5	6822	0.77

Yolov8小目标检测（19）：动态蛇形卷积（Dynamic Snake Convolution），增强细长微弱特征 | ICCV2023_AI小怪兽的博客-CSDN博客

持续更新中

番外篇：工业小目标缺陷检测

	layers	parameters	GFLOPs	mAP50	mAP50-95
YOLOv8n	168	3006038	8.1	0.679	0.322
YOLOv8n_smallobject	207	2977720	12.5	0.702	0.359
Wasserstein loss	168	3006038	8.1	0.714	0.342
YOLOv8n_CSPStage	232	2982742	8.1	0.727	0.339
YOLOv8n_smallobject _CSPStage	303	2953528	12.5	0.734	0.376
YOLOv8n_smallobject _CSPStage+Wasserstein loss	303	2953528	12.5	0.814	0.416

工业油污数据集介绍
三星油污缺陷类别：头发丝和小黑点，["TFS","XZW"]

数据集大小：660张，包括部分良品图像，提升背景检测能力。

数据集地址：https://download.csdn.net/download/m0_63774211/87741209

缺陷特点：小目标缺陷，检测难度大，如下图所示；

1.1 动态蛇形卷积（Dynamic Snake Convolution），实现暴力涨点 | ICCV2023

Dynamic Snake Convolution | 亲测在工业小目标缺陷涨点明显，原始[email protected] 0.679提升至0.743

我们希望卷积核一方面能够自由地贴合结构学习特征，另一方面能够在约束条件下不偏离目标结构太远。在观察管状结构的细长连续的特征后，脑海里想到了一个动物——蛇。我们希望卷积核能够像蛇一样动态地扭动，来贴合目标的结构。

原始[email protected] 0.679提升至0.743

YOLOv8-C2f-DySnakeConv summary: 249 layers, 3425894 parameters, 0 gradients, 8.7 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 2/2 [00:04<00:00,  2.15s/it]
                   all         66        187      0.722      0.668      0.743      0.342
                   TFS         66        130      0.582        0.6      0.638      0.295
                   XZW         66         57      0.862      0.737      0.847      0.388

基于Yolov8的工业小目标缺陷检测（2）：动态蛇形卷积（Dynamic Snake Convolution），实现暴力涨点 | ICCV2023_AI小怪兽的博客-CSDN博客

1.2 微小目标检测可能存在检测能力不佳的现象，添加一个微小物体的检测头

多头检测器 | 亲测在工业小目标缺陷涨点明显，原始[email protected] 0.679提升至0.702

原始[email protected] 0.679提升至0.702

YOLOv8n_4 summary (fused): 207 layers, 2977720 parameters, 0 gradients, 12.5 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 3/3 [00:04<00:00,  1.64s/it]
                   all         66        187       0.68      0.612      0.702      0.359
                   TFS         66        130      0.486      0.487       0.52      0.228
                   XZW         66         57      0.875      0.737      0.885       0.49

基于Yolov8的工业小目标缺陷检测（3）：多检测头提升小目标检测精度_AI小怪兽的博客-CSDN博客

1.3 SPD-Conv，低分辨率图像和小物体涨点明显

SPD-Conv | 亲测在工业小目标缺陷涨点明显，原始[email protected] 0.679提升至0.775

SPD- conv由一个空间到深度(SPD)层和一个非跨步卷积层组成。SPD组件推广了一种(原始)图像转换技术[29]来对CNN内部和整个CNN的特征映射进行下采样：

原始[email protected] 0.679提升至0.775

YOLOv8n_SPD summary (fused): 174 layers, 3598934 parameters, 0 gradients, 49.2 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 3/3 [00:13<00:00,  4.51s/it]
                   all         66        187      0.741      0.693      0.775      0.415
                   TFS         66        130      0.593      0.562      0.629      0.314
                   XZW         66         57       0.89      0.825       0.92      0.516

基于Yolov8的工业小目标缺陷检测（4）：SPD-Conv，低分辨率图像和小物体涨点明显_AI小怪兽的博客-CSDN博客

1.4大缺陷小缺陷一网打尽的轻量级目标检测器GiraffeDet

GiraffeDet | 亲测在工业小目标缺陷涨点明显，原始[email protected] 0.679提升至0.727

本文提出了GiraffeDet用于高效目标检测，giraffe包含轻量space-to-depth chain、Generalized-FPN以及预测网络

FPN旨在对CNN骨干网络提取的不同分辨率的多尺度特征进行融合。上图给出了FPN的进化，从最初的FPN到PANet再到BiFPN。我们注意到：这些FPN架构仅聚焦于特征融合，缺少了块内连接。因此，我们设计了一种新的路径融合GFPN：包含跳层与跨尺度连接，见上图d。

原始[email protected] 0.679提升至0.734

YOLOv8n_4_CSPStage summary: 303 layers, 2953528 parameters, 0 gradients, 12.5 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 3/3 [00:04<00:00,  1.56s/it]
                   all         66        187      0.689       0.68      0.734      0.376
                   TFS         66        130      0.523      0.554      0.571      0.267
                   XZW         66         57      0.855      0.807      0.896      0.486

基于Yolov8的工业小目标缺陷检测（5）：大缺陷小缺陷一网打尽的轻量级目标检测器GiraffeDet，暴力提升工业缺陷检测能力_AI小怪兽的博客-CSDN博客

1.5 多检测头结合小缺陷到大缺陷一网打尽的轻量级目标检测器GiraffeDet

多头检测器+ GiraffeDet | 亲测在工业小目标缺陷涨点明显，原始[email protected] 0.679提升至0.734

基于Yolov8的工业小目标缺陷检测（6）：多检测头结合小缺陷到大缺陷一网打尽的轻量级目标检测器GiraffeDet，暴力提升工业小目标缺陷检测能力_AI小怪兽的博客-CSDN博客

原始[email protected] 0.679提升至0.734

YOLOv8n_4_CSPStage summary: 303 layers, 2953528 parameters, 0 gradients, 12.5 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 3/3 [00:04<00:00,  1.56s/it]
                   all         66        187      0.689       0.68      0.734      0.376
                   TFS         66        130      0.523      0.554      0.571      0.267
                   XZW         66         57      0.855      0.807      0.896      0.486

1.6 Wasserstein Distance Loss，助力工业缺陷检测

Wasserstein Distance Loss | 亲测在工业小目标缺陷涨点明显，原始[email protected] 0.679提升至0.727

Wasserstein distance的主要优点是：

无论小目标之间有没有重叠都可以度量分布相似性;
NWD对不同尺度的目标不敏感，更适合测量小目标之间的相似性。

NWD可应用于One-Stage和Multi-Stage Anchor-Based检测器。此外，NWD不仅可以替代标签分配中的IoU，还可以替代非最大抑制中的IoU(NMS)和回归损失函数。在一个新的TOD数据集AI-TOD上的大量实验表明，本文提出的NWD可以持续地提高所有检测器的检测性能。

原始[email protected] 0.679提升至0.727

YOLOv8n summary (fused): 168 layers, 3006038 parameters, 0 gradients, 8.1 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 3/3 [00:04<00:00,  1.45s/it]
                   all         66        187      0.673      0.649      0.714      0.342
                   TFS         66        130      0.573      0.579      0.615      0.283
                   XZW         66         57      0.772      0.719      0.813      0.401

基于Yolov8的工业小目标缺陷检测（7）：Wasserstein Distance Loss，助力工业缺陷检测_AI小怪兽的博客-CSDN博客

1.7 工业部署级解决方案：多头检测器+小缺陷到大缺陷一网打尽的+Wasserstein Distance Loss

原始[email protected] 0.679提升至0.814

YOLOv8_4_CSPStage summary: 303 layers, 2953528 parameters, 0 gradients, 12.5 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 2/2 [00:04<00:00,  2.19s/it]
                   all         66        187      0.783      0.705      0.814      0.416
                   TFS         66        130      0.647      0.619      0.693      0.317
                   XZW         66         57      0.919      0.792      0.935      0.514

基于Yolov8的工业小目标缺陷检测（8）：工业部署解决方案 | 多头检测器+小缺陷到大缺陷一网打尽的+Wasserstein Distance Loss | 助力工业缺陷检测-CSDN博客

番外篇：工业端面小目标计数

端面小目标计数数据集介绍

工业端面小目标计数类别：一类，类别名object

数据集大小：训练集864张，验证集98张

数据集下载地址：目标检测数据集：工业端面小目标缺陷计数数据集_AI小怪兽的博客-CSDN博客

缺陷特点：小目标计数，检测难度大，如下图所示；

原始性能

预测结果：

YOLOv8n summary (fused): 168 layers, 3005843 parameters, 0 gradients, 8.1 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 3/3 [00:47<00:00, 15.76s/it]
                   all         96       5055      0.912      0.915      0.936      0.772

1.1 Gold-YOLO，遥遥领先，超越所有YOLO | 华为诺亚NeurIPS23

原始[email protected] 0.936提升至0.945

YOLOv8-goldYOLO summary: 359 layers, 6015123 parameters, 0 gradients, 11.9 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 3/3 [00:09<00:00,  3.11s/it]
                   all         96       5055       0.91      0.922      0.945      0.787

基于Yolov8的工业端面小目标计数检测（2）：Gold-YOLO，遥遥领先，超越所有YOLO | 华为诺亚NeurIPS23_AI小怪兽的博客-CSDN博客

1.2 小目标计数解决方案: 多头检测器+小缺陷到大缺陷一网打尽的GiraffeDet+Wasserstein Distance Loss

原始[email protected] 0.936提升至0.955

YOLOv8_4_CSPStage summary: 303 layers, 2953396 parameters, 0 gradients, 12.5 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 6/6 [00:22<00:00,  3.75s/it]
                   all         96       5055       0.92      0.951      0.955      0.811

基于YOLOv8的端面小目标计数解决方案: 多头检测器+小缺陷到大缺陷一网打尽的GiraffeDet+Wasserstein Distance Loss | 助力工业小目标缺陷检测_AI小怪兽的博客-CSDN博客

未完待续，持续更新中

你可能感兴趣的:(YOLO小目标检测,目标跟踪,算法,人工智能,目标检测,YOLO,深度学习,计算机视觉)

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
大学播音主持都学什么内容？播音主持专业学什么？配音新手圈
有些喜欢播音主持并且犹豫要不要报考这个大学专业的小伙伴们就会想要了解大学播音主持都学什么内容吧，毕竟如果不够了解就直接选择这个专业真的等选择完进去学习以后才知道这个专业并不是自己想要学习的东西那就来不及了。下面是小编为大家整理出来的一些播音主持专业学习的内容，请往下看吧。大学播音主持专业主要学习的课程有：播音发声、播音创作基础、广播播音主持、电视播音主持、文艺作品演播学概论、新闻学概论、新闻采编、
数据结构奇妙旅程之深入解析快速排序山间漫步人生路数据结构排序算法算法
快速排序（QuickSort）是一种高效的排序算法，它使用了分治法的策略来将一个数组排序。其基本思想是选择一个基准元素，通过一趟排序将待排序的数据分割成独立的两部分，其中一部分的所有数据都比基准元素小，另一部分的所有数据都比基准元素大，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。工作原理选择基准：从待排序的序列中选一个元素作为基准（pivo
我喝醉了，但是与你无关 Z先生的日记本
2019年04月10号晚上我和一个朋友喝酒了，彻彻底底的喝醉了，喝到短片，事后我问L，我说我喝醉了之后，都发生了什么，L没有告诉我详情，但是跟我说了大致，他说我跟他一直聊天，说自己小的时候的事，说自己爸妈的事，说自己现在过得很苦可能，确实是喝醉了酒，才会毫无防备的跟其他人说这些吧。L还说感觉我过得很苦，很心疼。醉了酒之后还哭了，想想还真是丢人一年前，在宿舍也有一瓶红酒，那是舍友出去拉赞助时候，友商
word字号和mathtype磅值关系及批量修改小铁匠-Ma office小技巧经验分享
word字号和mathtype磅值关系及批量修改1.字号与磅值关系字号「八号」对应磅值5字号「七号」对应磅值5.5字号「小六」对应磅值6.5字号「六号」对应磅值7.5字号「小五」对应磅值9字号「五号」对应磅值10.5字号「小四」对应磅值12字号「四号」对应磅值14字号「小三」对应磅值15字号「三号」对应磅值16字号「小二」对应磅值18字号「二号」对应磅值22字号「小一」对应磅值24字号「一号」对应
新网师的精神肤色（幕布笔记）悦读书香
王子老师的《极简100小妙招》收到已经几天了，之前大概的浏览了全书，今天起给自己定了一个计划，必须每天学习极简小妙招里面的一个妙招，并加以运用。一、今天要打卡什么内容因有完成每天学习极简小妙招的计划，所以今天晚饭吃的比较简单，草草吃完以后带着小宝到广场溜达一圈，急忙赶回来学习极简小妙招。再重看的时候不知道自己要学点什么，打卡哪一招，感觉哪个都简单，就看这一环节像王子老师说的“一看就会”，但做这一环
php 把一个数组分成有n个元素的二维数组的算法风清扬-独孤九剑 php php 算法
一、第一种解法0){$columns_map[$position]++;//这个地方格外注意,$position与$columns比较$position=($position<$columns-1)?++$position:0;$array_length--;}foreach($columns_mapas$val){$newarray[]=array_splice($array,0,$val);}
【算法分析与设计】去除重复字母五敷有你算法分析与设计 java javascript 开发语言算法数据结构
个人主页：五敷有你系列专栏：算法分析与设计⛺️稳中求进，晒太阳题目给你一个字符串s，请你去除字符串中重复的字母，使得每个字母只出现一次。需保证返回结果的字典序最小（要求不能打乱其他字符的相对位置）。示例示例1：输入：s="bcabc"输出："abc"示例2：输入：s="cbacdcbc"输出："acdb"思路贪心+单调栈实现【字符串删除一个字符使其字典序最小的贪心策略】：对于两个长度相同的字符串，
浇灌根部山静幽兰
“浇灌根部。”对，浇灌根部。张学青点醒了我。无论是我自己，还是我学生，都，正需要浇灌。正因为虚度了那么多岁月，不曾懂得浇灌自己，我这棵树才长得如此缓慢，四十多岁才长成今天这个样子。好在我现在的学生还小，犹如一棵棵小芽，浇灌正是时候。是的，要浇就浇根部。我的根，在课堂。根在课堂，就认认真真读书，读有“盐”的书，长智的书。以前也常看那些抚慰灵魂的“心灵鸡汤”，但时间长了觉得发腻，对我的语文教学也帮不了
【嵌入式模块】步进电机使用总结记录无知岁月 #嵌入式设备嵌入式硬件步进电机
关于本博客此前上了一门课《自动控制元件》，但是由于学时有限，讲到步进电机就不讲了，留下了一个小遗憾，导致需要使用步进电机时就有点懵，于是找了一篇博客，链接在这里，推荐具有电机知识（如直流电机，异步电机等）的朋友看，如果完全不懂，建议先啃书。
2019.11.28感恩日记 afab5b74f713
1.感谢真我守护，一觉到天明，谢谢谢谢谢谢！2.感谢一大早，橘子就甩来4800的大红包，谢谢谢谢谢谢！3.感谢今天代理宝宝们疯狂加单，钱宝宝流入小十万，太牛了你们，有你们真好，谢谢谢谢谢谢！4.感谢自己拥有钱宝宝，可以去群里给宝宝们发红包，表达我的爱，谢谢谢谢谢谢钱宝宝爱我！5.感谢自己的细胞宝宝们，让我保持健康与活力，可以自由活动，活力满满，谢谢谢谢谢谢！6.感谢芬姐甩来订单，谢谢谢谢谢谢钱宝宝
yarn的安装和使用全网最详细教程 zxj19880502 yarn npm
一、yarn的简介：Yarn是facebook发布的一款取代npm的包管理工具。二、yarn的特点：速度超快。Yarn缓存了每个下载过的包，所以再次使用时无需重复下载。同时利用并行下载以最大化资源利用率，因此安装速度更快。超级安全。在执行代码之前，Yarn会通过算法校验每个安装包的完整性。超级可靠。使用详细、简洁的锁文件格式和明确的安装算法，Yarn能够保证在不同系统上无差异的工作。三、yarn的
图论记录之最短路迪杰斯特拉 Just right 算法图论 java 开发语言
简述思想这个思想能用一句话来概括，精简到的极致:每次找到一个最短距离的点并更新起点到各个点的最短距离如果要可视化的话，B站搜索Dijksra算法，有视频讲解伪代码写到这里，其实是想整一个动画的，这样效果更好点，但由于种种原因所以就拖一下intdijkstr(){dist[1]=0;其余的点的距离全部初始化为真无穷，不要写成int的最大值迭代n次将不在s中的，且距离最近的点给tsj即先到t，再加上t
00后的我和你们三七_f4f4
大部分人认为，这个社会压力最大的莫过于90后。可能上有老下有小，可以正在被催婚。工作压力大。可是也有大部分00后也步入了社会，比起90后，他们更是迷茫，不知所措。虽没有来自家庭的压力，没有来自催婚的烦劳。可迷茫真的很可怕，不知道一会该干嘛，该想那些方面发展。觉得自己以后就这样碌碌无为了吗？就这样过一辈子吗？又不甘。图片发自App前几天在抖音上看见一个视频，他说姚明在苦练篮球。谁谁在苦练什么。问，你
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
账务处理又出错？资深会计来教你，学会效率翻倍！共同学习小橘子要努力吖
作为一名会计，在实际工作中会遇到各种麻烦的账务处理问题。那么，最常用的会计处理方法都有哪些呢？今天小编为大家带来了从业二十六年的资深老会计分享的十四中会计常用的账务处理问题的解决方案，快来看看吧！一、促销品的账务处理在促销时公司经常会把一些商品按进价赠送给消费者使用二、款已付清但发票未到的账务处理三、购买材料发生不合理损耗的账务处理问题公司在购买材料时，常常会发生一些不合理的损耗，那么这种问题该怎
Ai插件脚本合集安装包，免费教程视频网盘分享全网优惠分享君
随着人工智能技术的不断发展，越来越多的插件脚本涌现出来，为我们的生活和工作带来了便利。然而，如何快速、方便地获取和使用这些插件脚本呢？今天，我将为大家分享一个非常实用的资源——AI插件脚本合集安装包，以及免费教程视频网盘分享。首先，让我们来了解一下这个AI插件脚本合集安装包。它是一个集合了众多AI插件脚本的资源包，涵盖了各种领域，如数据分析、自动化办公、智能客服等等。通过这个安装包，用户可以轻松地
过去一年，这16本好书不容错过 m0_54050778 perl
编者按：2023年在动荡与希望中收尾，2023年注定会被载入史册。疫情寒冬结束，ChatGPT横空出世，带动了人工智能技术的飞速发展；淄博烧烤、天津大爷、尔滨之旅等充满感动与幸福。但与此同时，2023年又是动荡与不安的一年，俄乌冲突的延宕，新一轮的巴以冲突，极端天气频发。在这个大环境下，有一些经典的书籍著作诞生。本文将分享2023年最值得一读的16本书籍，文章来自翻译，希望对你有所启示。关于202
[数据集][图像分类]河道污染分类数据集1923张4类别 FL1623863129 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：1922分类类别数：4类别名称:["lianghao","qingwei","yanzhong","zhongdu"]每个类别图片数：lianghao图片数：435qingwei图片数：423yanzhong图片数：577zhongdu图片数：487重要说明
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
【数据结构】实验一实现顺序表各种基本运算的算法张鱼·小丸子数据结构实验 c++数据结构
题目：实现顺序表各种基本运算的算法要求：1、建立一个顺序表，输入n个元素并输出；2、查找线性表中的最大元素并输出；3、在线性表的第i个元素前插入一个正整数x；4、删除线性表中的第j个元素；5、将线性表中的元素按升序排列；6、将线性表中的元素就地逆序（只允许用一个暂存单元）；#include#defineSIZE1000usingnamespacestd;typedefstruct{int*a;//
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
向阳而生——嘉午台游记雪域芳香
今天周日，我们一行十人按原计划驱车前往大秦岭——嘉午台。因为今天西安举行西马赛事，从昨晚开始，长安南路、小寨东路、翠华路等重要路段全部实行管制，我们在昨天已将两辆车开往电视塔以南，也就是管制路段以南地区，并且把车停在了不实行管制区域的地铁口。今天我们乘坐地铁，到达停车场地，一行人按约定均已到齐。出发！（今天太累了，眼睛直打盹，我好想睡觉，算了，先占个地盘，改天一定补齐）
冷门知识 | 大雪冻skr个人，知道其中三条冷知识温暖整个冬天~ 带你玩儿
今日大雪今日节气——大雪，可是并没有下雪。“嗷~~冻死了”“啊~好冷啊”办公室里的伙伴们一进门都是出奇的一致好吧，那今天的冷知识，就让小八给大家来送些温暖吧~温暖整个冬天的冷知识其实喝酒不能暖身子喝酒只会降低身体内部温度，增加患上低体温症的风险，喝酒也会阻断身体自然颤抖保暖的机制。之所以喝酒会感觉暖暖的，因为酒精让血管扩张，将温暖的血液带到体表。所以喝酒带来的暖是暂时的，最后反而会大大降低身体抵抗
电影《外太空的莫扎克》嘉诺
今天妈妈带我去看《外太空的莫扎克》里面讲的是一部适合全家观看的奇幻喜剧，两对“冤家父子”，一只“天外来客”，三位搞笑笨贼，上演一出奇幻爆笑喜剧。任大望一心想把喜好天文的儿子任小天培养成钢琴演奏家，为此父子争吵不断。一天，神秘外星人莫扎特意外出现，从此，莫扎特帮助任小天开启了和爸爸“斗智斗勇”的生活。令任小天没有想到的是，莫扎特来到地球竟另有任务。星人莫扎特。之所以起名莫扎特，是因为他来到地球以后就
道德经第三十四章套马地汉纸
道德经第三十四章原文：大道泛兮，其可左右！万物恃之而生，而不辞，功成不名有。爱养万物而不为主，常无欲，可名于小；万物归焉而不为主，可名为大。是以圣人终不为大，故能成其大。译文：大道广泛流行，无所不到。万物依赖它生长而不推辞，有所成就而不自以为有功。养育万物而不自以为主，永远没有私欲，可以说是渺小得很，所以可称它为“小”；物归附于它而它不自以为主宰，可以说极其伟大，所以可称它为“大”。由于它不自以为
露台烤火到廚房發火 3000烦恼风
露台烤火昨天晚上，和太太兩個孩子在家中頂樓露台。我升起一盆火，在不太冷的冬天晚上，我們特地把晚餐搬上頂樓，大家聚在一起吃飯，「戶外」就像是調味料，食物總是比室內更有味道。用餐後，也沒事，太太烤著火，大兒子跟我聊著他最近讀的小說，這個上高中就酷酷的兒子，好久沒跟我說這麼久的話了。我在火上燉煮著香料奶茶，準備和太太一起享用。女兒則在一旁借太太的手機學習怎麼使用滑板。一切畫面都安安靜靜的，很緩慢的，我現
给史多多的第898封信暖男七千22
你好，这里是七千每日文字输出的第977天你好，史多多今天早上七点多才醒呢儿子，小家伙昨晚就尿了一次床，哈哈把妈妈的睡衣尿湿了。上次是把爸爸的上衣尿湿，这是妈妈的睡裤。哈哈儿子你真的很可以。而且你今早好棒啊，妈妈说抱你去卫生间嘘嘘，结果你很乖的让妈妈抱去。妈妈抱你在卫生间给你把尿，小家伙看着自己嘘嘘在马桶里还扭头对妈妈笑。儿子你真的好迷人啊，这些小小的举动都让妈妈好开心。多多最近越来越是一个小暖男了
#贝小记#〖3〗空间谁都需要陈娇育儿
亲子时间图片发自App图片发自App图片发自App今天宝贝和小表妹玩了一天挺开心，就是玩的有点乱啊。今天还给宝贝的小床做了个床帘，这样宝贝就可以有自己的小空间了，晚上他睡觉时看见自己的小空间很开心，还自己主动的要把小空间收拾好再睡觉。刚开始想做这个小空间时，我想会不会有点多余？后来基于对孩子尊重的原则，每个人都需要有自己的小空间不是吗！所以最后决定给宝贝做了，事实孩子真的很喜欢。晚上和宝贝出门买小
Java回溯知识点（含面试大厂题和源码）一成码农 java 面试开发语言
回溯算法是一种通过遍历所有可能的候选解来寻找所有解的算法，如果候选解被确认不是一个解（或至少不是最后一个解），回溯算法会通过在上一步进行一些变化来丢弃这个解，即“回溯”并尝试另一个候选解。回溯法通常用递归方法来实现，在解决排列、组合、选择问题时非常有效。回溯算法的核心要点：路径：也就是已经做出的选择。选择列表：也就是你当前可以做的选择。结束条件：也就是到达决策树底层，无法再做出选择的条件。回溯算法
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

《YOLO小目标检测》专栏介绍 & CSDN独家改进创新实战&专栏目录

1.小目标检测介绍

1.1 小目标定义

1.2 难点

2. 本专栏小目标数据集

3.小目标专栏难点优化方向

3.1 合理的数据增强

3.2 网络多尺度

3.2.1 多头检测器

3.2.2 BiFPN高效双向跨尺度连接和加权特征融合

3.2.3 小目标到大目标一网打尽，轻骨干重Neck的轻量级目标检测器GiraffeDet

3.2.4 多分支卷积模块RFB

3.2.5 GOLD-YOLO，遥遥领先

3.3 loss优化

3.3.1 Wasserstein Distance Loss

3.4 注意力机制

3.4.1SEAM注意力机制

3.4.2 即插即用的多尺度融合模块EVC

3.4.3 微小目标检测的上下文增强和特征细化网络ContextAggregation

3.4.4 EMA跨空间学习的高效多尺度注意力 | ICASSP2023

3.4.5 动态稀疏注意力BiFormer | CVPR 2023

3.4.6 LSKblockAttention | ICCV 2023

3.4.7 TripletAttention注意力

3.4.8 通道优先卷积注意力（CPCA）| 中科院 2023.6

3.4.8 多尺度MultiSEAM

3.4.9 轻量级注意力MobileViTAttention | ECCV2022

3.4.10 感受野注意力卷积运算

3.4.11 Dual-ViT：一种多尺度双视觉Transformer

3.5 卷积变体

3.5.1 SPD-Conv

3.5.2 DCNv3可形变卷积 | CVPR2023

3.5.3 新的Partial卷积(PConv) | CVPR2023 FasterNet

3.5.4 ODConv | ICLR 2022

3.5.5 动态蛇形卷积（Dynamic Snake Convolution） | ICCV2023

番外篇：工业小目标缺陷检测

1.1 动态蛇形卷积（Dynamic Snake Convolution），实现暴力涨点 | ICCV2023

1.2 微小目标检测可能存在检测能力不佳的现象，添加一个微小物体的检测头

1.3 SPD-Conv，低分辨率图像和小物体涨点明显

1.4大缺陷小缺陷一网打尽的轻量级目标检测器GiraffeDet

1.5 多检测头结合小缺陷到大缺陷一网打尽的轻量级目标检测器GiraffeDet

1.6 Wasserstein Distance Loss，助力工业缺陷检测

1.7 工业部署级解决方案： 多头检测器+小缺陷到大缺陷一网打尽的+Wasserstein Distance Loss

番外篇：工业 端面小目标计数

1.1 Gold-YOLO，遥遥领先，超越所有YOLO | 华为诺亚NeurIPS23

1.2 小目标计数解决方案: 多头检测器+小缺陷到大缺陷一网打尽的GiraffeDet+Wasserstein Distance Loss

你可能感兴趣的:(YOLO小目标检测,目标跟踪,算法,人工智能,目标检测,YOLO,深度学习,计算机视觉)

1.7 工业部署级解决方案：多头检测器+小缺陷到大缺陷一网打尽的+Wasserstein Distance Loss

番外篇：工业端面小目标计数