ultralytics/cfg/models/11/yolo11-RevCol.yaml
使用(ICLR2023)Reversible Column Networks对yolo11主干进行重设计,里面的支持更换不同的C3k2-Block.
EMASlideLoss
使用EMA思想与SlideLoss进行相结合.
ultralytics/cfg/models/11/yolo11-dyhead-DCNV3.yaml
使用DCNV3替换DyHead中的DCNV2.
ultralytics/cfg/models/11/yolo11-C3k2-EMBC.yaml
使用Efficientnet中的MBConv与EffectiveSE改进C3k2.
ultralytics/cfg/models/11/yolo11-GhostHGNetV2.yaml
使用Ghost_HGNetV2作为YOLO11的backbone.
ultralytics/cfg/models/11/yolo11-RepHGNetV2.yaml
使用Rep_HGNetV2作为YOLO11的backbone.
ultralytics/cfg/models/11/yolo11-C3k2-DWR-DRB.yaml
使用UniRepLKNet中的DilatedReparamBlock对DWRSeg中的Dilation-wise Residual(DWR)的模块进行二次创新后改进C3k2.
ultralytics/cfg/models/11/yolo11-ASF-P2.yaml
在ultralytics/cfg/models/11/yolo11-ASF.yaml的基础上进行二次创新,引入P2检测层并对网络结构进行优化.
ultralytics/cfg/models/11/yolo11-CSP-EDLAN.yaml
使用DualConv打造CSP Efficient Dual Layer Aggregation Networks改进yolo11.
ultralytics/cfg/models/11/yolo11-bifpn-SDI.yaml
使用U-NetV2中的 Semantics and Detail Infusion Module对BIFPN进行二次创新.
ultralytics/cfg/models/11/yolo11-goldyolo-asf.yaml
利用华为2023最新GOLD-YOLO中的Gatherand-Distribute与ASF-YOLO中的Attentional Scale Sequence Fusion进行二次创新改进yolo11的neck.
ultralytics/cfg/models/11/yolo11-dyhead-DCNV4.yaml
使用DCNV4对DyHead进行二次创新.(请关闭AMP进行训练,使用教程请看20240116版本更新说明)
ultralytics/cfg/models/11/yolo11-HSPAN.yaml
对MFDS-DETR中的HS-FPN进行二次创新后得到HSPAN改进yolo11的neck.
ultralytics/cfg/models/11/yolo11-GDFPN.yaml
使用DAMO-YOLO中的RepGFPN与ICCV2023 DySample进行二次创新改进Neck.
ultralytics/cfg/models/11/yolo11-HSPAN-DySample.yaml
对MFDS-DETR中的HS-FPN进行二次创新后得到HSPAN再进行创新,使用ICCV2023 DySample改进其上采样模块.
ultralytics/cfg/models/11/yolo11-ASF-DySample.yaml
使用ASF-YOLO中的Attentional Scale Sequence Fusion与ICCV2023 DySample组合得到Dynamic Sample Attentional Scale Sequence Fusion.
ultralytics/cfg/models/11/yolo11-C3k2-DCNV2-Dynamic.yaml
利用自研注意力机制MPCA强化DCNV2中的offset和mask.
ultralytics/cfg/models/11/yolo11-C3k2-iRMB-Cascaded.yaml
使用EfficientViT CVPR2023中的CascadedGroupAttention对EMO ICCV2023中的iRMB进行二次创新来改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-iRMB-DRB.yaml
使用UniRepLKNet中的DilatedReparamBlock对EMO ICCV2023中的iRMB进行二次创新来改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-iRMB-SWC.yaml
使用shift-wise conv对EMO ICCV2023中的iRMB进行二次创新来改进C3k2.
ultralytics/cfg/models/11/yolo11-DBBNCSPELAN.yaml
使用Diverse Branch Block CVPR2021对YOLOV9中的RepNCSPELAN进行二次创新后改进yolo11.
ultralytics/cfg/models/11/yolo11-OREPANCSPELAN.yaml
使用Online Convolutional Re-parameterization (CVPR2022)对YOLOV9中的RepNCSPELAN进行二次创新后改进yolo11.
ultralytics/cfg/models/11/yolo11-DRBNCSPELAN.yaml
使用UniRepLKNet中的DilatedReparamBlock对YOLOV9中的RepNCSPELAN进行二次创新后改进yolo11.
ultralytics/cfg/models/11/yolo11-DynamicHGNetV2.yaml
使用CVPR2024 parameternet中的DynamicConv对CVPR2024 RTDETR中的HGBlokc进行二次创新.
ultralytics/cfg/models/11/yolo11-C3k2-RVB-EMA.yaml
使用CVPR2024 RepViT中的RepViTBlock和EMA注意力机制改进C3k2.
ultralytics/cfg/models/11/yolo11-ELA-HSFPN.yaml
使用Efficient Local Attention改进HSFPN.
ultralytics/cfg/models/11/yolo11-CA-HSFPN.yaml
使用Coordinate Attention CVPR2021改进HSFPN.
ultralytics/cfg/models/11/yolo11-CAA-HSFPN.yaml
使用CVPR2024 PKINet中的CAA模块HSFPN.
ultralytics/cfg/models/11/yolo11-CSMHSA.yaml
对Mutil-Head Self-Attention进行创新得到Cross-Scale Mutil-Head Self-Attention.
ultralytics/cfg/models/11/yolo11-CAFMFusion.yaml
利用具有HCANet中的CAFM,其具有获取全局和局部信息的注意力机制进行二次改进content-guided attention fusion.
ultralytics/cfg/models/11/yolo11-C3k2-Faster-CGLU.yaml
使用TransNeXt CVPR2024中的Convolutional GLU对CVPR2023中的FasterNet进行二次创新.
ultralytics/cfg/models/11/yolo11-C3k2-Star-CAA.yaml
使用StarNet CVPR2024中的StarBlock和CVPR2024 PKINet中的CAA改进C3k2.
ultralytics/cfg/models/11/yolo11-bifpn-GLSA.yaml
使用GLSA模块对bifpn进行二次创新.
ultralytics/cfg/models/11/yolo11-BIMAFPN.yaml
利用BIFPN的思想对MAF-YOLO的MAFPN进行二次改进得到BIMAFPN.
ultralytics/cfg/models/11/yolo11-C3k2-AdditiveBlock-CGLU.yaml
使用CAS-ViT中的AdditiveBlock和TransNeXt CVPR2024中的Convolutional GLU改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-MSMHSA-CGLU.yaml
使用CMTFNet中的M2SA和TransNeXt CVPR2024中的Convolutional GLU改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-IdentityFormer-CGLU.yaml
使用Metaformer TPAMI2024中的IdentityFormer和TransNeXt CVPR2024中的CGLU改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-RandomMixing-CGLU.yaml
使用Metaformer TPAMI2024中的RandomMixing和TransNeXt CVPR2024中的CGLU改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-PoolingFormer-CGLU.yaml
使用Metaformer TPAMI2024中的PoolingFormer和TransNeXt CVPR2024中的CGLU改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-ConvFormer-CGLU.yaml
使用Metaformer TPAMI2024中的ConvFormer和TransNeXt CVPR2024中的CGLU改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-CaFormer-CGLU.yaml
使用Metaformer TPAMI2024中的CaFormer和TransNeXt CVPR2024中的CGLU改进C3k2.
ultralytics/cfg/models/11/yolo11-MAN-Faster.yaml
使用Hyper-YOLO中的 Mixed Aggregation Network和FasterNet CVPR2023中的Faster-Block进行二次创新改进yolo11.
ultralytics/cfg/models/11/yolo11-MAN-FasterCGLU.yaml
使用Hyper-YOLO中的 Mixed Aggregation Network和FasterNet CVPR2023中的Faster-Block和TransNeXt CVPR2024中的Convolutional GLU进行二次创新改进yolo11.
ultralytics/cfg/models/11/yolo11-MAN-Star.yaml
使用Hyper-YOLO中的 Mixed Aggregation Network和StarNet CVPR2024中的StarBlock进行二次创新改进yolo11.
ultralytics/cfg/models/11/yolo11-MutilBackbone-MSGA.yaml
使用MSA^2 Net中的Multi-Scale Adaptive Spatial Attention Gate对自研系列MutilBackbone再次创新.
ultralytics/cfg/models/11/yolo11-slimneck-WFU.yaml
使用ACMMM2024 WFEN中的Wavelet Feature Upgrade改进slimneck.
ultralytics/cfg/models/11/yolo11-MAN-FasterCGLU-WFU.yaml
使用ACMMM2024 WFEN中的Wavelet Feature Upgrade和Hyper-YOLO中的 Mixed Aggregation Network和FasterNet CVPR2023中的Faster-Block和TransNeXt CVPR2024中的Convolutional GLU进行二次创新改进yolo11.
ultralytics/cfg/models/11/yolo11-CDFA.yaml
使用ACMMM2024 WFEN中的WaveletConv与AAAI2025 ConDSeg的ContrastDrivenFeatureAggregation结合改进yolo11.
ultralytics/cfg/models/11/yolo11-C3k2-Faster-KAN.yaml
使用ICLR2025 Kolmogorov-Arnold Transformer中的KAN对(CVPR2023)fasternet中的FastetBlock进行二次创新.
ultralytics/cfg/models/11/yolo11-C3k2-ELGCACGLU.yaml
使用ELGC-Net中的ELGCA和和TransNeXt CVPR2024中的Convolutional GLU改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-StripCGLU.yaml
使用Strip R-CNN中的StripBlock和TransNeXt CVPR2024中的Convolutional GLU改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-DIMB-KAN.yaml
在ultralytics/cfg/models/11/yolo11-C3k2-DIMB.yaml的基础上把mlp模块换成ICLR2025 Kolmogorov-Arnold Transformer中的KAN.
ultralytics/cfg/models/11/yolo11-C2TSSA-DYT.yaml
使用CVPR2025 DyT中的DynamicTan和ICLR2025 Token Statistics Transformer中的Token Statistics Self-Attention改进C2PSA.
ultralytics/cfg/models/11/yolo11-C2Pola-DYT.yaml
使用CVPR2025 DyT中的DynamicTan和ICLR2025 PolaFormer中的PolaAttention改进C2PSA.
ultralytics/cfg/models/12/yolo12-A2C2f-CGLU-DYT.yaml
使用CVPR2025 DyT中的DynamicTanh和TransNeXt CVPR2024中的Convolutional GLU改进A2C2f.
ultralytics/cfg/models/12/yolo12-A2C2f-DFFN-DYT.yaml
使用CVPR2025 DyT中的DynamicTanh和FreqFormer中的DFFN改进A2C2f.
ultralytics/cfg/models/11/yolo11-LAWDS.yaml
Light Adaptive-weight downsampling.自研模块,具体讲解请看百度云链接中的视频.
ultralytics/cfg/models/11/yolo11-C3k2-EMSC.yaml
Efficient Multi-Scale Conv.自研模块,具体讲解请看百度云链接中的视频.
ultralytics/cfg/models/11/yolo11-C3k2-EMSCP.yaml
Efficient Multi-Scale Conv Plus.自研模块,具体讲解请看百度云链接中的视频.
Lightweight Shared Convolutional Detection Head
自研轻量化检测头.
detect:ultralytics/cfg/models/11/yolo11-LSCD.yaml
seg:ultralytics/cfg/models/11/yolo11-seg-LSCD.yaml
pose:ultralytics/cfg/models/11/yolo11-pose-LSCD.yaml
obb:ultralytics/cfg/models/11/yolo11-obb-LSCD.yaml
Task Align Dynamic Detection Head
自研任务对齐动态检测头.
detect:ultralytics/cfg/models/11/yolo11-TADDH.yaml
seg:ultralytics/cfg/models/11/yolo11-seg-TADDH.yaml
pose:ultralytics/cfg/models/11/yolo11-pose-TADDH.yaml
obb:ultralytics/cfg/models/11/yolo11-obb-TADDH.yaml
ultralytics/cfg/models/11/yolo11-FDPN.yaml
自研特征聚焦扩散金字塔网络(Focusing Diffusion Pyramid Network)
ultralytics/cfg/models/11/yolo11-FDPN-DASI.yaml
使用HCFNet中的Dimension-Aware Selective Integration Module对自研的Focusing Diffusion Pyramid Network再次创新.
ultralytics/cfg/models/11/yolo11-RGCSPELAN.yaml
自研RepGhostCSPELAN.
Lightweight Shared Convolutional Separamter BN Detection Head
基于自研轻量化检测头上,参考NASFPN的设计思路把GN换成BN,并且BN层参数不共享.
detect:ultralytics/cfg/models/11/yolo11-LSCSBD.yaml
seg:ultralytics/cfg/models/11/yolo11-seg-LSCSBD.yaml
pose:ultralytics/cfg/models/11/yolo11-pose-LSCSBD.yaml
obb:ultralytics/cfg/models/11/yolo11-obb-LSCSBD.yaml
ultralytics/cfg/models/11/yolo11-EIEStem.yaml
ultralytics/cfg/models/11/yolo11-C3k2-EIEM.yaml
提出了一种新的EIEStem模块,旨在作为图像识别任务中的高效前端模块。该模块结合了提取边缘信息的SobelConv分支和提取空间信息的卷积分支,能够学习到更加丰富的图像特征表示。
ultralytics/cfg/models/11/yolo11-ContextGuideFPN.yaml
Context Guide Fusion Module(CGFM)是一个创新的特征融合模块,旨在改进YOLO11中的特征金字塔网络(FPN)。该模块的设计考虑了多尺度特征融合过程中上下文信息的引导和自适应调整。
ultralytics/cfg/models/11/yolo11-LSDECD.yaml
基于自研轻量化检测头上(LSCD),使用detail-enhanced convolution进一步改进,提高检测头的细节捕获能力,进一步改善检测精度.
detect:ultralytics/cfg/models/11/yolo11-LSDECD.yaml
segment:ultralytics/cfg/models/11/yolo11-seg-LSDECD.yaml
pose:ultralytics/cfg/models/11/yolo11-pose-LSDECD.yaml
obb:ultralytics/cfg/models/11/yolo11-obb-LSDECD.yaml
ultralytics/cfg/models/11/yolo11-C3k2-SMPCGLU.yaml
Self-moving Point Convolutional GLU模型改进C3k2.
SMP来源于CVPR2023-SMPConv,Convolutional GLU来源于TransNeXt CVPR2024.
Re-CalibrationFPN
为了加强浅层和深层特征的相互交互能力,推出重校准特征金字塔网络(Re-CalibrationFPN).
P2345:ultralytics/cfg/models/11/yolo11-ReCalibrationFPN-P2345.yaml(带有小目标检测头的ReCalibrationFPN)
P345:ultralytics/cfg/models/11/yolo11-ReCalibrationFPN-P345.yaml
P3456:ultralytics/cfg/models/11/yolo11-ReCalibrationFPN-P3456.yaml(带有大目标检测头的ReCalibrationFPN)
ultralytics/cfg/models/11/yolo11-CSP-PTB.yaml
Cross Stage Partial - Partially Transformer Block
在计算机视觉任务中,Transformer结构因其强大的全局特征提取能力而受到广泛关注。然而,由于Transformer结构的计算复杂度较高,直接将其应用于所有通道会导致显著的计算开销。为了在保证高效特征提取的同时降低计算成本,我们设计了一种混合结构,将输入特征图分为两部分,分别由CNN和Transformer处理,结合了卷积神经网络(CNN)和Transformer机制的模块,旨在增强特征提取的能力。
我们提出了一种名为CSP_PTB(Cross Stage Partial - Partially Transformer Block)的模块,旨在结合CNN和Transformer的优势,通过对输入通道进行部分分配来优化计算效率和特征提取能力。
ultralytics/cfg/models/11/yolo11-SOEP.yaml
小目标在正常的P3、P4、P5检测层上略显吃力,比较传统的做法是加上P2检测层来提升小目标的检测能力,但是同时也会带来一系列的问题,例如加上P2检测层后计算量过大、后处理更加耗时等问题,日益激发需要开发新的针对小目标有效的特征金字塔,我们基于原本的PAFPN上进行改进,提出SmallObjectEnhancePyramid,相对于传统的添加P2检测层,我们使用P2特征层经过SPDConv得到富含小目标信息的特征给到P3进行融合,然后使用CSP思想和基于AAAI2024的OmniKernel进行改进得到CSP-OmniKernel进行特征整合,OmniKernel模块由三个分支组成,即三个分支,即全局分支、大分支和局部分支、以有效地学习从全局到局部的特征表征,最终从而提高小目标的检测性能。(该模块需要在train.py中关闭amp、且在ultralytics/engine/validator.py 115行附近的self.args.half设置为False、跑其余改进记得修改回去!)
出现这个报错的:RuntimeError: cuFFT error: CUFFT_INTERNAL_ERROR,如果你是40系显卡,需要更新torch大于2.0,并且cuda大于12.0.
ultralytics/cfg/models/11/yolo11-CGRFPN.yaml
Context-Guided Spatial Feature Reconstruction Feature Pyramid Network.
ultralytics/cfg/models/11/yolo11-FeaturePyramidSharedConv.yaml
APT(Adaptive Power Transformation)-TAL.
为了使不同gt预测对的匹配质量和损失权重更具鉴别性,我们通过自定义的PowerTransformer显著增强高质量预测框的权重,抑制低质量预测框的影响,并使模型在学习的过程可以更关注质量高的预测框。
ultralytics/cfg/models/11/yolo11-EMBSFPN.yaml
基于BIFPN、MAF-YOLO、CVPR2024 EMCAD提出全新的Efficient Multi-Branch&Scale FPN.
Efficient Multi-Branch&Scale FPN拥有<轻量化>、<多尺度特征加权融合>、<多尺度高效卷积模块>、<高效上采样模块>、<全局异构核选择机制>。
ultralytics/cfg/models/11/yolo11-CSP-PMSFA.yaml
自研模块:CSP-Partial Multi-Scale Feature Aggregation.
ultralytics/cfg/models/11/yolo11-MutilBackbone-DAF.yaml
自研MutilBackbone-DynamicAlignFusion.
ultralytics/cfg/models/11/yolo11-C3k2-MutilScaleEdgeInformationEnhance.yaml
自研CSP-MutilScaleEdgeInformationEnhance.
MutilScaleEdgeInformationEnhance模块结合了多尺度特征提取、边缘信息增强和卷积操作。它的主要目的是从不同尺度上提取特征,突出边缘信息,并将这些多尺度特征整合到一起,最后通过卷积层输出增强的特征。这个模块在特征提取和边缘增强的基础上有很好的表征能力.
ultralytics/cfg/models/11/yolo11-CSP-FreqSpatial.yaml
FreqSpatial 是一个融合时域和频域特征的卷积神经网络(CNN)模块。该模块通过在时域和频域中提取特征,旨在捕捉不同层次的空间和频率信息,以增强模型在处理图像数据时的鲁棒性和表示能力。模块的主要特点是将 Scharr 算子(用于边缘检测)与 时域卷积 和 频域卷积 结合,通过多种视角捕获图像的结构特征。
ultralytics/cfg/models/11/yolo11-C3k2-MutilScaleEdgeInformationSelect.yaml
基于自研CSP-MutilScaleEdgeInformationEnhance再次创新.
我们提出了一个 多尺度边缘信息选择模块(MutilScaleEdgeInformationSelect),其目的是从多尺度边缘信息中高效选择与目标任务高度相关的关键特征。为了实现这一目标,我们引入了一个具有通过聚焦更重要的区域能力的注意力机制ICCV2023 DualDomainSelectionMechanism, DSM。该机制通过聚焦图像中更重要的区域(如复杂边缘和高频信号区域),在多尺度特征中自适应地筛选具有更高任务相关性的特征,从而显著提升了特征选择的精准度和整体模型性能。
GlobalEdgeInformationTransfer
实现版本1:ultralytics/cfg/models/11/yolo11-GlobalEdgeInformationTransfer1.yaml
实现版本2:ultralytics/cfg/models/11/yolo11-GlobalEdgeInformationTransfer2.yaml
实现版本3:ultralytics/cfg/models/11/yolo11-GlobalEdgeInformationTransfer3.yaml
总所周知,物体框的定位非常之依赖物体的边缘信息,但是对于常规的目标检测网络来说,没有任何组件能提高网络对物体边缘信息的关注度,我们需要开发一个能让边缘信息融合到各个尺度所提取的特征中,因此我们提出一个名为GlobalEdgeInformationTransfer(GEIT)的模块,其可以帮助我们把浅层特征中提取到的边缘信息传递到整个backbone上,并与不同尺度的特征进行融合。
ultralytics/cfg/models/11/yolo11-C3k2-DIMB.yaml
自研模块DynamicInceptionDWConv2d.(更详细点说明看项目的配置文件.md)
ultralytics/cfg/models/11/yolo11-HAFB-1.yaml
自研模块Hierarchical Attention Fusion Block, HAFB.(更详细点说明看项目的配置文件.md)
ultralytics/cfg/models/11/yolo11-HAFB-2.yaml
自研模块Hierarchical Attention Fusion Block, HAFB.(更详细点说明看项目的配置文件.md)
ultralytics/cfg/models/11/yolo11-MutilBackbone-HAFB.yaml
在yolo11-MutilBackbone-DAF.yaml的自研创新上引入HAFB.
ultralytics/cfg/models/11/yolo11-efficientViT.yaml
(CVPR2023)efficientViT替换yolo11主干.
ultralytics/cfg/models/11/yolo11-fasternet.yaml
(CVPR2023)fasternet替换yolo11主干.
ultralytics/cfg/models/11/yolo11-timm.yaml
使用timm支持的主干网络替换yolo11主干.
ultralytics/cfg/models/11/yolo11-convnextv2.yaml
使用convnextv2网络替换yolo11主干.
ultralytics/cfg/models/11/yolo11-EfficientFormerV2.yaml
使用EfficientFormerV2网络替换yolo11主干.(需要看常见错误和解决方案的第五点)
ultralytics/cfg/models/11/yolo11-vanillanet.yaml
vanillanet替换yolo11主干.
ultralytics/cfg/models/11/yolo11-LSKNet.yaml
LSKNet(2023旋转目标检测SOTA的主干)替换yolo11主干.
ultralytics/cfg/models/11/yolo11-swintransformer.yaml
SwinTransformer-Tiny替换yolo11主干.
ultralytics/cfg/models/11/yolo11-repvit.yaml
RepViT替换yolo11主干.
ultralytics/cfg/models/11/yolo11-CSwinTransformer.yaml
使用CSWin-Transformer(CVPR2022)替换yolo11主干.(需要看常见错误和解决方案的第五点)
ultralytics/cfg/models/11/yolo11-HGNetV2.yaml
使用HGNetV2作为YOLO11的backbone.
ultralytics/cfg/models/11/yolo11-unireplknet.yaml
使用UniRepLKNet替换yolo11主干.
ultralytics/cfg/models/11/yolo11-TransNeXt.yaml
使用TransNeXt改进yolo11的backbone.(需要看常见错误和解决方案的第五点)
ultralytics/cfg/models/rt-detr/yolo11-rmt.yaml
使用CVPR2024 RMT改进rtdetr的主干.
ultralytics/cfg/models/11/yolo11-pkinet.yaml
使用CVPR2024 PKINet改进backbone.(需要安装mmcv和mmengine)
ultralytics/cfg/models/11/yolo11-mobilenetv4.yaml
使用MobileNetV4改进yolo11-backbone.
ultralytics/cfg/models/11/yolo11-starnet.yaml
使用StarNet CVPR2024改进yolo11-backbone.
ultralytics/cfg/models/11/yolo11-inceptionnext.yaml
使用InceptionNeXt CVPR2024替换backbone.
ultralytics/cfg/models/11/yolo11-mambaout.yaml
使用CVPR2025 MambaOut中的MambaOut替换BackBone.
ultralytics/cfg/models/11/yolo11-MobileMamba.yaml
使用CVPR2025 MobileMamba中的MobileMamba改进Backbone.
ultralytics/cfg/models/11/yolo11-FocalModulation.yaml
使用Focal Modulation替换SPPF.
ultralytics/cfg/models/11/yolo11-SPPF-LSKA.yaml
使用LSKA注意力机制改进SPPF,增强多尺度特征提取能力.
ultralytics/cfg/models/11/yolo11-AIFI.yaml
使用RT-DETR中的Attention-based Intrascale Feature Interaction(AIFI)改进yolo11.
ultralytics/cfg/models/11/yolo11-AIFIRepBN.yaml
使用ICML-2024 SLAB中的RepBN改进AIFI.
ultralytics/cfg/models/11/yolo11-bifpn.yaml
添加BIFPN到yolo11中.
其中BIFPN中有三个可选参数:
ultralytics/cfg/models/11/yolo11-slimneck.yaml
使用VoVGSCSP\VoVGSCSPC和GSConv替换yolo11 neck中的C3k2和Conv.
Asymptotic Feature Pyramid Networkreference
a. ultralytics/cfg/models/11/yolo11-AFPN-P345.yaml
b. ultralytics/cfg/models/11/yolo11-AFPN-P345-Custom.yaml
c. ultralytics/cfg/models/11/yolo11-AFPN-P2345.yaml
d. ultralytics/cfg/models/11/yolo11-AFPN-P2345-Custom.yaml
其中Custom中的block支持大部分C3k2-XXX结构.
ultralytics/cfg/models/11/yolo11-RCSOSA.yaml
使用RCS-YOLO中的RCSOSA替换C3k2.
ultralytics/cfg/models/11/yolo11-goldyolo.yaml
利用华为2023最新GOLD-YOLO中的Gatherand-Distribute进行改进特征融合模块
ultralytics/cfg/models/11/yolo11-GFPN.yaml
使用DAMO-YOLO中的RepGFPN改进Neck.
ultralytics/cfg/models/11/yolo11-EfficientRepBiPAN.yaml
使用YOLOV6中的EfficientRepBiPAN改进Neck.
ultralytics/cfg/models/11/yolo11-ASF.yaml
使用ASF-YOLO中的Attentional Scale Sequence Fusion改进yolo11.
ultralytics/cfg/models/11/yolo11-SDI.yaml
使用U-NetV2中的 Semantics and Detail Infusion Module对yolo11中的feature fusion部分进行重设计.
ultralytics/cfg/models/11/yolo11-HSFPN.yaml
使用MFDS-DETR中的HS-FPN改进yolo11的neck.
ultralytics/cfg/models/11/yolo11-CSFCN.yaml
使用Context and Spatial Feature Calibration for Real-Time Semantic Segmentation中的Context and Spatial Feature Calibration模块改进yolo11.
ultralytics/cfg/models/11/yolo11-CGAFusion.yaml
使用DEA-Net中的content-guided attention fusion改进yolo11-neck.
ultralytics/cfg/models/11/yolo11-SDFM.yaml
使用PSFusion中的superficial detail fusion module改进yolo11-neck.
ultralytics/cfg/models/11/yolo11-PSFM.yaml
使用PSFusion中的profound semantic fusion module改进yolo11-neck.
ultralytics/cfg/models/11/yolo11-GLSA.yaml
使用GLSA模块改进yolo11的neck.
ultralytics/cfg/models/11/yolo11-CTrans.yaml
使用[AAAI2022] UCTransNet中的ChannelTransformer改进yolo11-neck.(需要看常见错误和解决方案的第五点)
ultralytics/cfg/models/11/yolo11-p6-CTrans.yaml
使用[AAAI2022] UCTransNet中的ChannelTransformer改进yolo11-neck.(带有p6版本)(需要看常见错误和解决方案的第五点)
ultralytics/cfg/models/11/yolo11-MAFPN.yaml
使用MAF-YOLO的MAFPN改进Neck.
ultralytics/cfg/models/11/yolo11-hyper.yaml
使用Hyper-YOLO中的Hypergraph Computation in Semantic Space改进yolov11.
ultralytics/cfg/models/11/yolo11-msga.yaml
使用MSA^2 Net中的Multi-Scale Adaptive Spatial Attention Gate改进yolo11-neck.
ultralytics/cfg/models/11/yolo11-WFU.yaml
使用ACMMM2024 WFEN中的Wavelet Feature Upgrade改进yolo11-neck.
ultralytics/cfg/models/11/yolo11-mpcafsa.yaml
使用BIBM2024 Spatial-Frequency Dual Domain Attention Network For Medical Image Segmentation的Frequency-Spatial Attention和Multi-scale Progressive Channel Attention改进yolo11-neck.
ultralytics/cfg/models/11/yolo11-fsa.yaml
使用BIBM2024 Spatial-Frequency Dual Domain Attention Network For Medical Image Segmentation的Frequency-Spatial Attention改进yolo11.
ultralytics/cfg/models/11/yolo11-dyhead.yaml
添加基于注意力机制的目标检测头到yolo11中.
ultralytics/cfg/models/11/yolo11-EfficientHead.yaml
对检测头进行重设计,支持2种轻量化检测头.详细请看ultralytics/nn/extra_modules/head.py中的Detect_Efficient class.
ultralytics/cfg/models/11/yolo11-aux.yaml
参考YOLOV7-Aux对YOLO11添加额外辅助训练头,在训练阶段参与训练,在最终推理阶段去掉.
其中辅助训练头的损失权重系数可在ultralytics/utils/loss.py中的class v8DetectionLoss中的__init__函数中的self.aux_loss_ratio设定,默认值参考yolov7为0.25.
ultralytics/cfg/models/11/yolo11-seg-EfficientHead.yaml(实例分割)
对检测头进行重设计,支持2种轻量化检测头.详细请看ultralytics/nn/extra_modules/head.py中的Detect_Efficient class.
ultralytics/cfg/models/11/yolo11-SEAMHead.yaml
使用YOLO-Face V2中的遮挡感知注意力改进Head,使其有效地处理遮挡场景.
ultralytics/cfg/models/11/yolo11-MultiSEAMHead.yaml
使用YOLO-Face V2中的遮挡感知注意力改进Head,使其有效地处理遮挡场景.
ultralytics/cfg/models/11/yolo11-PGI.yaml
使用YOLOV9的programmable gradient information改进YOLO11.(PGI模块可在训练结束后去掉)
Lightweight Asymmetric Detection Head
detect:ultralytics/cfg/models/11/yolo11-LADH.yaml
segment:ultralytics/cfg/models/11/yolo11-seg-LADH.yaml
pose:ultralytics/cfg/models/11/yolo11-pose-LADH.yaml
obb:ultralytics/cfg/models/11/yolo11-obb-LADH.yaml
使用Faster and Lightweight: An Improved YOLOv5 Object Detector for Remote Sensing Images中的Lightweight Asymmetric Detection Head改进yolo11-head.
ultralytics/cfg/models/11/yolo11-atthead.yaml
B站注意力教程例子.链接:https://www.bilibili.com/video/BV1mXkVYAEGM/
Adaptive Training Sample Selection匹配策略.
在ultralytics/utils/loss.py中的class v8DetectionLoss中自行选择对应的self.assigner即可.
soft-nms(IoU,GIoU,DIoU,CIoU,EIoU,SIoU,ShapeIoU)
soft-nms替换nms.(建议:仅在val.py时候使用,具体替换请看20240122版本更新说明)
ultralytics/cfg/models/11/yolo11-nmsfree.yaml
仿照yolov10的思想采用双重标签分配和一致匹配度量进行训练,后处理不需要NMS!
ultralytics/cfg/models/11/yolo11-ContextGuidedDown.yaml
使用CGNet中的Light-weight Context Guided DownSample进行下采样.
ultralytics/cfg/models/11/yolo11-SPDConv.yaml
使用SPDConv进行下采样.
ultralytics/cfg/models/11/yolo11-dysample.yaml
使用ICCV2023 DySample改进yolo11-neck中的上采样.
ultralytics/cfg/models/11/yolo11-CARAFE.yaml
使用ICCV2019 CARAFE改进yolo11-neck中的上采样.
ultralytics/cfg/models/11/yolo11-HWD.yaml
使用Haar wavelet downsampling改进yolo11的下采样.(请关闭AMP情况下使用)
ultralytics/cfg/models/11/yolo11-v7DS.yaml
使用YOLOV7 CVPR2023的下采样结构改进YOLO11中的下采样.
ultralytics/cfg/models/11/yolo11-ADown.yaml
使用YOLOV9的下采样结构改进YOLO11中的下采样.
ultralytics/cfg/models/11/yolo11-SRFD.yaml
使用A Robust Feature Downsampling Module for Remote Sensing Visual Tasks改进yolo11的下采样.
ultralytics/cfg/models/11/yolo11-WaveletPool.yaml
使用Wavelet Pooling改进YOLO11的上采样和下采样。
ultralytics/cfg/models/11/yolo11-LDConv.yaml
使用LDConv改进下采样.
ultralytics/cfg/models/11/yolo11-PSConv.yaml
使用AAAI2025 Pinwheel-shaped Convolution and Scale-based Dynamic Loss for Infrared Small Target Detection中的Pinwheel-shaped Convolution改进yolo11.
ultralytics/cfg/models/11/yolo11-C3k2-Faster.yaml
使用C3k2-Faster替换C3k2.(使用FasterNet中的FasterBlock替换C3k2中的Bottleneck)
ultralytics/cfg/models/11/yolo11-C3k2-ODConv.yaml
使用C3k2-ODConv替换C3k2.(使用ODConv替换C3k2中的Bottleneck中的Conv)
ultralytics/cfg/models/11/yolo11-C3k2-ODConv.yaml
使用C3k2-ODConv替换C3k2.(使用ODConv替换C3k2中的Bottleneck中的Conv)
ultralytics/cfg/models/11/yolo11-C3k2-Faster-EMA.yaml
使用C3k2-Faster-EMA替换C3k2.(C3k2-Faster-EMA推荐可以放在主干上,Neck和head部分可以选择C3k2-Faster)
ultralytics/cfg/models/11/yolo11-C3k2-DBB.yaml
使用C3k2-DBB替换C3k2.(使用DiverseBranchBlock替换C3k2中的Bottleneck中的Conv)
ultralytics/cfg/models/11/yolo11-C3k2-CloAtt.yaml
使用C3k2-CloAtt替换C3k2.(使用CloFormer中的具有全局和局部特征的注意力机制添加到C3k2中的Bottleneck中)(需要看常见错误和解决方案的第五点)
ultralytics/cfg/models/11/yolo11-C3k2-SCConv.yaml
SCConv(CVPR2020 http://mftp.mmcheng.net/Papers/20cvprSCNet.pdf)与C3k2融合.
ultralytics/cfg/models/11/yolo11-C3k2-SCcConv.yaml
ScConv(CVPR2023 https://openaccess.thecvf.com/content/CVPR2023/papers/Li_SCConv_Spatial_and_Channel_Reconstruction_Convolution_for_Feature_Redundancy_CVPR_2023_paper.pdf)与C3k2融合.
(取名为SCcConv的原因是在windows下命名是不区分大小写的)
ultralytics/cfg/models/11/yolo11-KernelWarehouse.yaml
使用Towards Parameter-Efficient Dynamic Convolution添加到yolo11中.
使用此模块需要注意,在epoch0-20的时候精度会非常低,过了20epoch会正常.
ultralytics/cfg/models/11/yolo11-C3k2-DySnakeConv.yaml
DySnakeConv与C3k2融合.
ultralytics/cfg/models/11/yolo11-C3k2-DCNV2.yaml
使用C3k2-DCNV2替换C3k2.(DCNV2为可变形卷积V2)
ultralytics/cfg/models/11/yolo11-C3k2-DCNV3.yaml
使用C3k2-DCNV3替换C3k2.(DCNV3为可变形卷积V3(CVPR2023,众多排行榜的SOTA))
官方中包含了一些指定版本的DCNV3 whl包,下载后直接pip install xxx即可.具体和安装DCNV3可看百度云链接中的视频.
ultralytics/cfg/models/11/yolo11-C3k2-OREPA.yaml
使用C3k2-OREPA替换C3k2.Online Convolutional Re-parameterization (CVPR2022)
ultralytics/cfg/models/11/yolo11-C3k2-REPVGGOREPA.yaml
使用C3k2-REPVGGOREPA替换C3k2.Online Convolutional Re-parameterization (CVPR2022)
ultralytics/cfg/models/11/yolo11-C3k2-DCNV4.yaml
使用DCNV4改进C3k2.(请关闭AMP进行训练,使用教程请看20240116版本更新说明)
ultralytics/cfg/models/11/yolo11-C3k2-ContextGuided.yaml
使用CGNet中的Light-weight Context Guided改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-MSBlock.yaml
使用YOLO-MS中的MSBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-DLKA.yaml
使用deformableLKA改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-DAttention.yaml
使用Vision Transformer with Deformable Attention(CVPR2022)改进C3k2.(需要看常见错误和解决方案的第五点)
使用注意点请看百度云视频.(DAttention(Vision Transformer with Deformable Attention CVPR2022)使用注意说明.)
使用ParC-Net中的ParC_Operator改进C3k2.(需要看常见错误和解决方案的第五点)
使用注意点请看百度云视频.(20231031更新说明)
ultralytics/cfg/models/11/yolo11-C3k2-DWR.yaml
使用DWRSeg中的Dilation-wise Residual(DWR)模块,加强从网络高层的可扩展感受野中提取特征.
ultralytics/cfg/models/11/yolo11-C3k2-RFAConv.yaml
使用RFAConv中的RFAConv改进yolo11.
ultralytics/cfg/models/11/yolo11-C3k2-RFCBAMConv.yaml
使用RFAConv中的RFCBAMConv改进yolo11.
ultralytics/cfg/models/11/yolo11-C3k2-RFCAConv.yaml
使用RFAConv中的RFCAConv改进yolo11.
ultralytics/cfg/models/11/yolo11-C3k2-FocusedLinearAttention.yaml
使用FLatten Transformer(ICCV2023)中的FocusedLinearAttention改进C3k2.(需要看常见错误和解决方案的第五点)
使用注意点请看百度云视频.(20231114版本更新说明.)
ultralytics/cfg/models/11/yolo11-C3k2-MLCA.yaml
使用Mixed Local Channel Attention 2023改进C3k2.(用法请看百度云视频-20231129版本更新说明)
ultralytics/cfg/models/11/yolo11-C3k2-AKConv.yaml
使用AKConv 2023改进C3k2.(用法请看百度云视频-20231129版本更新说明)
ultralytics/cfg/models/11/yolo11-C3k2-UniRepLKNetBlock.yaml
使用UniRepLKNet中的UniRepLKNetBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-DRB.yaml
使用UniRepLKNet中的DilatedReparamBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-AggregatedAtt.yaml
使用TransNeXt中的聚合感知注意力改进C3k2.(需要看常见错误和解决方案的第五点)
ultralytics/cfg/models/11/yolo11-C3k2-SWC.yaml
使用shift-wise conv改进yolo11中的C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-iRMB.yaml
使用EMO ICCV2023中的iRMB改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-VSS.yaml
使用最新的Mamba架构Mamba-UNet中的VSS对C3k2中的BottleNeck进行改进,使其能更有效地捕获图像中的复杂细节和更广泛的语义上下文.
ultralytics/cfg/models/11/yolo11-C3k2-LVMB.yaml
使用最新的Mamba架构Mamba-UNet中的VSS与Cross Stage Partial进行结合,使其能更有效地捕获图像中的复杂细节和更广泛的语义上下文.
ultralytics/cfg/models/11/yolo11-RepNCSPELAN.yaml
使用YOLOV9中的RepNCSPELAN进行改进yolo11.
ultralytics/cfg/models/11/yolo11-C3k2-DynamicConv.yaml
使用CVPR2024 parameternet中的DynamicConv改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-GhostDynamicConv.yaml
使用CVPR2024 parameternet中的GhostModule改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-RVB.yaml
使用CVPR2024 RepViT中的RepViTBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-DGCST.yaml
使用Lightweight Object Detection中的Dynamic Group Convolution Shuffle Transformer改进yolo11.
ultralytics/cfg/models/11/yolo11-C3k2-RetBlock.yaml
使用CVPR2024 RMT中的RetBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-PKI.yaml
使用CVPR2024 PKINet中的PKIModule和CAA模块改进C3k2.
ultralytics/cfg/models/11/yolo11-RepNCSPELAN_CAA.yaml
使用CVPR2024 PKINet中的CAA模块改进RepNCSPELAN.
ultralytics/cfg/models/11/yolo11-C3k2-fadc.yaml
使用CVPR2024 Frequency-Adaptive Dilated Convolution改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-PPA.yaml
使用HCFNet中的Parallelized Patch-Aware Attention Module改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-Star.yaml
使用StarNet CVPR2024中的StarBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-KAN.yaml
KAN In! Mamba Out! Kolmogorov-Arnold Networks.
目前支持:
ultralytics/cfg/models/11/yolo11-C3k2-DEConv.yaml
使用DEA-Net中的detail-enhanced convolution改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-Heat.yaml
使用vHeat中的HeatBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-WTConv.yaml
使用ECCV2024 Wavelet Convolutions for Large Receptive Fields中的WTConv改进C3k2-BottleNeck.
ultralytics/cfg/models/11/yolo11-C3k2-FMB.yaml
使用ECCV2024 SMFANet的Feature Modulation block改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-gConv.yaml
使用Rethinking Performance Gains in Image Dehazing Networks的gConvblock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-WDBB.yaml
使用YOLO-MIF中的WDBB改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-DeepDBB.yaml
使用YOLO-MIF中的DeepDBB改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-AdditiveBlock.yaml
使用CAS-ViT中的AdditiveBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-MogaBlock.yaml
使用MogaNet ICLR2024中的MogaBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-IdentityFormer.yaml
使用Metaformer TPAMI2024中的IdentityFormer改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-RandomMixing.yaml
使用Metaformer TPAMI2024中的RandomMixingFormer改进C3k2.(需要看常见错误和解决方案的第五点)
ultralytics/cfg/models/11/yolo11-C3k2-PoolingFormer.yaml
使用Metaformer TPAMI2024中的PoolingFormer改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-ConvFormer.yaml
使用Metaformer TPAMI2024中的ConvFormer改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-CaFormer.yaml
使用Metaformer TPAMI2024中的CaFormer改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-FFCM.yaml
使用Efficient Frequency-Domain Image Deraining with Contrastive Regularization ECCV2024中的Fused_Fourier_Conv_Mixer改C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-SFHF.yaml
使用SFHformer ECCV2024中的block改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-MSM.yaml
使用Revitalizing Convolutional Network for Image Restoration TPAMI2024中的MSM改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-HDRAB.yaml
使用Pattern Recognition 2024|DRANet中的RAB( residual attention block)改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-RAB.yaml
使用Pattern Recognition 2024|DRANet中的HDRAB(hybrid dilated residual attention block)改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-LFE.yaml
使用Efficient Long-Range Attention Network for Image Super-resolution ECCV2022中的Local feature extraction改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-SFA.yaml
使用FreqFormer的Frequency-aware Cascade Attention-SFA改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-CTA.yaml
使用FreqFormer的Frequency-aware Cascade Attention-CTA改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-IDWC.yaml
使用InceptionNeXt CVPR2024中的InceptionDWConv2d改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-IDWD.yaml
使用InceptionNeXt CVPR2024中的InceptionDWBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-PConv.yaml
使用FasterNet CVPR2023中的PConv改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-EMA.yaml
B站注意力教程例子.链接:https://www.bilibili.com/video/BV1mXkVYAEGM/
ultralytics/cfg/models/11/yolo11-C3k2-CAMixer.yaml
使用CAMixerSR CVPR2024中的CAMixer改进C3k2.
ultralytics/cfg/models/11/yolo11-MAN.yaml
使用Hyper-YOLO TPAMI2025中的Mixed Aggregation Network改进yolov11.
ultralytics/cfg/models/11/yolo11-C3k2-HFERB.yaml
使用ICCV2023 CRAFT-SR中的high-frequency enhancement residual block改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-DTAB.yaml
使用AAAI2025 TBSN中的DTAB改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-JDPM.yaml
使用ECCV2024 FSEL中的joint domain perception module改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-ETB.yaml
使用ECCV2024 FSEL中的entanglement transformer block改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-FDT.yaml
使用ACMMM2024 WFEN中的Full-domain Transformer改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-AP.yaml
使用AAAI2025 Pinwheel-shaped Convolution and Scale-based Dynamic Loss for Infrared Small Target Detection中的Asymmetric Padding bottleneck改进yolo11.
ultralytics/cfg/models/11/yolo11-C3k2-Kat.yaml
使用ICLR2025 Kolmogorov-Arnold Transformer中的KAT改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-ELGCA.yaml
使用ELGC-Net中的ELGCA改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-Strip.yaml
使用Strip R-CNN中的StripBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-GlobalFilter.yaml
使用T-PAMI Global Filter Networks for Image Classification中的GlobalFilterBlock和TransNeXt CVPR2024中的Convolutional GLU改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-DynamicFilter.yaml
使用AAAI2024 FFT-Based Dynamic Token Mixer for Vision中的DynamicFilter改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-TSSA.yaml
使用Token Statistics Transformer中的Token Statistics Self-Attention和Metaformer TPAMI2024的metaformer改进C3k2.
ultralytics/cfg/models/11/yolo11-RepHMS.yaml
使用MHAF-YOLO中的RepHMS改进yolo11.
ultralytics/cfg/models/11/yolo11-C3k2-SAVSS.yaml
使用CVPR2025 SCSegamba中的Structure-Aware Scanning Strategy改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-MobileMamba.yaml
使用CVPR2025 MobileMamba中的MobileMambaBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C3k2-MambaOut.yaml
使用CVPR2025 MambaOut中的MambaOutBlock改进C3k2.
ultralytics/cfg/models/11/yolo11-C2BRA.yaml
使用BIFormer CVPR2023中的Bi-Level Routing Attention改进C2PSA.
ultralytics/cfg/models/11/yolo11-C2CGA.yaml
使用EfficientViT CVPR2023中的CascadedGroupAttention改进C2PSA.
ultralytics/cfg/models/11/yolo11-C2DA.yaml
使用Vision Transformer with Deformable Attention(CVPR2022)中的DAttention改进C2PSA.
ultralytics/cfg/models/11/yolo11-C2DPB.yaml
使用CrossFormer中的DynamicPosBias-Attention改进C2PSA.
ultralytics/cfg/models/11/yolo11-DTAB.yaml
使用AAAI2025 TBSN中的DTAB替换C2PSA.
ultralytics/cfg/models/11/yolo11-ETB.yaml
使用ECCV2024 FSEL中的entanglement transformer block替换C2PSA.
ultralytics/cfg/models/11/yolo11-FDT.yaml
使用ACMMM2024 WFEN中的Full-domain Transformer替换C2PSA.
ultralytics/cfg/models/11/yolo11-C2Pola.yaml
使用ICLR2025 PolaFormer)中的PolaAttention改进C2PSA.
ultralytics/cfg/models/11/yolo11-C2TSSA.yaml
使用Token Statistics Transformer中的Token Statistics Self-Attention改进C2PSA.
ultralytics/cfg/models/11/yolo11-C2ASSA.yaml
使用CVPR2024 Adapt or Perish: Adaptive Sparse Transformer with Attentive Feature Refinement for Image Restoration中的Adaptive Sparse Self-Attention改进C2PSA.
ultralytics/cfg/models/11/yolo11-ASSR.yaml
使用CVPR2025 MambaIR中的Attentive State Space Group改进yolo11.
ultralytics/cfg/models/11/yolo11-C2PSA-DYT.yaml
使用CVPR2025 DyT中的DynamicTanh改进C2PSA.
ultralytics/cfg/models/12/yolo12-A2C2f-CGLU.yaml
使用TransNeXt CVPR2024中的Convolutional GLU改进A2C2f.
ultralytics/cfg/models/12/yolo12-A2C2f-KAN.yaml
使用ICLR2025 Kolmogorov-Arnold Transformer中的KAN改进A2C2f.
ultralytics/cfg/models/12/yolo12-A2C2f-DFFN.yaml
使用FreqFormer中的DFFN改进A2C2f.
ultralytics/cfg/models/12/yolo12-A2C2f-FRFN.yaml
使用CVPR2024 Adapt or Perish: Adaptive Sparse Transformer with Attentive Feature Refinement for Image Restoration中的feature refinement feed-forward改进A2C2f.
ultralytics/cfg/models/12/yolo12-A2C2f-DYT.yaml
使用CVPR2025 DyT中的DynamicTanh改进A2C2f.
ultralytics/cfg/models/11/yolo11-fasternet-bifpn.yaml
fasternet与bifpn的结合.
其中BIFPN中有三个可选参数:
ultralytics/cfg/models/11/yolo11-ELA-HSFPN-TADDH.yaml
使用Efficient Local Attention改进HSFPN,使用自研动态动态对齐检测头改进Head.
ultralytics/cfg/models/11/yolo11-FDPN-TADDH.yaml
自研结构的融合.
ultralytics/cfg/models/11/yolo11-starnet-C3k2-Star-LSCD.yaml
轻量化模型组合.
Mamba-YOLO
集成Mamba-YOLO.(需要编译请看百度云视频-20240619版本更新说明)
ultralytics/cfg/models/mamba-yolo/Mamba-YOLO-T.yaml
ultralytics/cfg/models/mamba-yolo/Mamba-YOLO-B.yaml
ultralytics/cfg/models/mamba-yolo/Mamba-YOLO-L.yaml
ultralytics/cfg/models/mamba-yolo/yolo-mamba-seg.yaml
Hyper-YOLO(TPAMI2025)
20241013-yolov11-v1.1
20241018-yolov11-v1.2
20241027-yolov11-v1.3
20241103-yolov11-v1.4
20241112-yolov11-v1.5
20241124-yolov11-v1.6
20241207-yolov11-v1.7
20241221-yolov11-v1.8
20241228-yolov11-v1.9
20250112-yolo11-v1.10
20250119-yolo11-v1.11
20250205-yolo11-v1.12
20250215-yolo11-v1.13
20250222-yolo11-v1.14
20250301-yolo11-v1.15
20250312-yolo11-v1.16
20250319-yolo11-v1.17