慕溪同学

YOLOv3：算法与论文详细解读

【yolov1：背景介绍与算法精讲】
【yolo9000：Better, Faster, Stronger的目标检测网络】

目录

一、YOLOv3概述
二、创新与改进
三、改进细节
- 3.1 多尺度特征
- 3.2 不同尺度先验框
- 3.3 完整的网络结构
- 3.3 Darknet-53主干网络
- 3.4 残差网络
- - 3.4.1 恒等映射
  - 3.4.2 网络退化
  - 3.4.3 残差结构
  - 3.4.4 残差的两个堆叠形式
  - 3.4.5 YOLOV3中的残差连接
- 3.5 head输入部分
- 3.7 Neck特征拼接部分
- 3.7 head输出部分
四、损失函数
五、yolov3训练过程与预测过程

一、YOLOv3概述

YOLOv3是YOLO系列目标检测算法的第三个版本，由Joseph Redmon和Alexey Bochkovskiy于2018年发布。在YOLOv2的基础上进行了改进，引入了一系列的变化以提高检测性能。在该论文中最主要的就是需要去理解它的网络结构，像残差链接、多尺度训练这两块内容，因为在原论文中相关细节其实说的并不清楚，所以自己在网上查阅了很多相关资料才能理解网络的设计思路与详细细节。

原论文传送门：【YOLOv3: An Incremental Improvement】

二、创新与改进

YOLOv3的创新与改进主要有以下几点：

进行多尺度训练，网络输出三个尺度的feature map
设计了新的网络结构，使用FPN网络特征金字塔进行特征融合，添加了残差连接模块
在分类部分使用了Logistic来代替之前的softmax

三、改进细节

3.1 多尺度特征

在详细介绍YOLOV3多尺度特征之前我们先来看一下YOLOV1和YOLOV2的特征图输出结构。
yolov1 输入输出
YOLOV1输入的图像在经过网络输出之后，输出的是7x7x30的特征向量参数，详细参数请移步YOLOV1文章中，

yolov2 输入输出
在YOLOv2论文中，图像输入到Darknet-19网络后，经过32倍下采样之后输出的是13x13x5x25，具体细节可以参考yolov2算法解读文章。

YOLOV3特征图输出
在yolov3输出不再是一个尺度的feature map,而是三个尺度，分别是经过32倍下采样、16倍下采样、8倍下采样的特征图。

详细实现细节可以参考这幅图，416x416x3的图像在经过特征提取网络和残差连接之后输出了三个尺度的特征图，再经过32倍、16倍、8倍下采样之后获得的分别是13x13x255，26x26x255、52x52x255特征图，这三个参数分别代表含义已经在上面这幅图展示出来了。

13x13表示生成的grid cell数，每个grid cell生成3个anchor(这一块和yolov2不一样，v2每个grid cell生成的是5个anchor)，每个anchor包含边框坐标、边界框置信度、对象类别数，yolov3训练使用的是MS COCO数据集一共80个类别。

3.2 不同尺度先验框

为什么要使用多尺度特征呢，因为我们在yolov1和yolov2训练过程中会发现很多小目标的物体无法被识别，在yolov3中生成的三个尺度的特征可以识别大目标、中目标、小目标。

分配上，在最小的13x13特征图上 （有最大的感受野） 应用较大的先验框，适合检测较大的对象。中等的26x26特征图上 （中等感受野） 应用中等的先验框，适合检测中等大小的对象。较大的52x52特征图上 （较小的感受野） 应用较小的先验框适合检测较小的对象。

随着输出的特征图的数量和尺度的变化，先验框的尺寸也需要相应的调整。YOLO2已经开始采用K-means聚类得到先验框的尺寸，YOLO3延续了这种方法，为每种下采样尺度设定3种先验框，总共聚类出9种尺寸的先验框。在COCO数据集这9个先验框是：(10x13)，(16x30)，(33x23)，(30x61)，(62x45)，(59x119)，(116x90)，(156x198)，(373x326)。

3.3 完整的网络结构

完整的YOLOv3网络是由4个部分组成：输入层、Backbone特征提取部分，也就是Darknet-53，Neck特征拼接部分，head头分类部分。

Backbone主干网络负责从输入图像中提取有用的特征。它通常是在大规模图像分类任务（例如 ImageNet）上训练的卷积神经网络 (CNN)。主干网捕获不同尺度的层次特征，在较早的层中提取较低级别的特征（例如边缘和纹理），在较深层中提取较高级别的特征（例如对象部分和语义信息）。
Neck颈部是连接脊柱和头部的中间部件。它聚合和细化主干提取的特征，通常侧重于增强不同尺度的空间和语义信息。颈部可能包括额外的卷积层、特征金字塔网络（FPN）或其他机制来改善特征的表示。
head头部是物体探测器的最后一个部件；它负责根据主干和颈部提供的特征进行预测。它通常由一个或多个特定于任务的子网络组成，这些子网络执行分类、定位以及最近的实例分割和姿势估计。头部处理颈部提供的特征，为每个候选对象生成预测。最后，后处理步骤（例如非极大值抑制 (NMS)）会过滤掉重叠的预测，并仅保留最置信度的检测。

3.3 Darknet-53主干网络

YOLOv3 Darknet-53 主干网。 YOLOv3 的架构由 53 个卷积层组成，每个层都具有批量归一化和 Leaky ReLU 激活功能。此外，残差连接将整个网络中 1 × 1 卷积的输入与 3 × 3 卷积的输出连接起来。此处所示的架构仅包含主干；不包括多尺度预测组成的检测头。虚框中每两个卷积之后就会进行一次Residual残差连接，右边的x8、x4表示当前模块的个数。

3.4 残差网络

很多博主只是说了残差结构，但是并没有说明为什么要使用残差，在学习残差网络之前一定要学习两个概念：恒等映射和网络退化

3.4.1 恒等映射

恒等映射（Identity Mapping）是指将输入直接映射到输出，不进行任何变换或处理的映射方式。在神经网络中，恒等映射常常与残差连接（Residual Connection）一起使用。

考虑一个神经网络的层，用数学表示为 (F(x))，其中 (x) 是输入，(F) 是网络的变换。恒等映射的形式是 (F(x) = x)，即输入直接等于输出。残差连接通过引入跳跃连接，将输入直接添加到输出中，即 (H(x) = F(x) + x)。

残差连接的思想是，如果网络学到的变换是恒等映射，那么网络就可以轻松地学到一个接近零的残差。这样的设计有助于缓解深层网络中的梯度消失问题，促使网络更容易学习有效的表示。

在深度残差网络（Residual Networks，ResNets）中，这种结构被广泛使用。ResNet的基本块由两个路径组成，一个是普通的网络变换路径，另一个是恒等映射的路径，两者相加形成输出。这种设计使得神经网络在学习过程中可以选择性地使用恒等映射，从而更容易训练深层网络。

总的来说，恒等映射在神经网络中的应用是为了促使网络更容易学习恒等变换，以改善训练的稳定性和效果。

3.4.2 网络退化

常规思考：越深的网络拟合能力越强，因此越深的网络训练误差应该越低，但实际相反。随着网络的加深，模型训练的精度下降。

原因：并非过拟合问题，而是网络优化比较困难。这个时候就是需要想办法让深层网络的性能逼近浅层网络。

3.4.3 残差结构

首先看一下普通网络和残差网络的一个差异，后面解释过程中会用到一些名词，分别是：
Plain network：普通结构网络
Building block：组件，数个网络层构成的固定系列操作
普通网络

Plain network：Block_out = H（x）

残差网络

Residual learning：Block_out = H（x） = F（x）+ x

我们残差学习的目的是让网络层拟合H(x)-x，也就是F(x)，而非H(x)

先思考以下几个残差相关的问题

问：为什么拟合F(x)?
答：提供building block更容易学到**恒等映射（identity mapping）**的可能

问：为什么拟合F（x）就使得building block容易学到恒等映射？
答:在深度学习中，通过拟合 F(x) = H(x) - x)（即残差）的形式，模型变得更容易学到恒等映射。这是因为对于 H(x)学习到的变换，如果 H(x)本身就接近于恒等映射，那么 F(x) = H(x) - x 的残差项就会趋近于零。考虑一个深层网络的建筑块，其中 H(x) 表示网络的变换，x 是输入。如果 H(x) 学到的是一个接近于恒等映射的变换，那么 H(x) - x 的残差项就会接近零。这使得训练更容易，因为模型只需要学到微小的调整，而不是复杂的映射。具体来说，如果 H(x) 学到了有效的特征表示，那么 F(x) = H(x) - x 中的 H(x) 就趋近于 (x)，使得 F(x) 接近于零。这就相当于告诉模型：“如果你学到的是一个有效的表示，就尽量保持输入和输出相同，不要进行太多的变换。”这种设计使得模型更容易训练，因为它不需要从零开始学习复杂的映射。

问：为什么要恒等映射？
答：让深层网络不至于比浅层网络差

3.4.4 残差的两个堆叠形式

注意：残差连接只有大小维度完全相同的两个feature map才能进行残差连接。

第一种Basic：两个3x3卷积堆叠
第二种Bottleneck：利用1x1卷积减少计算量

Bottleneck
第一个1x1下降1/4通道数
第二个1x1提升4倍通道数

3.4.5 YOLOV3中的残差连接

在yolov3中一共进行了5次残差连接，这里以第二次残差连接举例，在进入残差模块之前我们输入的特征图是104x104x128，在经过一次1x1卷积和一次3x3卷积之后，输出的特征图维度104x104x128，将输入特征与输出特征进行残差连接得到的特征图为104x104x128，残差连接之后特征图的尺寸不会发生变化。

3.5 head输入部分

yolov3依旧使用的全卷积网络结构，所以可以进行多尺度图片输入，不同的图片输入最后得到的特征图尺寸也不一样，但是需要注意，因为生成的3个尺度的feature map分别是经过32倍、16倍、8倍下采样，所以我们输入的图片尺寸一定要为32的倍数。

3.7 Neck特征拼接部分

关于Neck详细拼接部分可以看下面这幅详细网络图，这里以256x256x3尺寸为例，最后输出的feature map分别是8x8x255、16x16x255、32x32x255。

先看第一个concat操作，我们希望将16x16x512与8x8x512的特征图拼接成16x16x255，我们对8x8x512特征图使用1x1卷积进行降维操作，减少了一半的通道数，变为了8x8x256，再进行上采样提升特征图的尺寸，变为16x16x256；再将16x16x512与16x16x256进行concat操作(concat可以理解为将两个尺寸一样，但是厚度不一样的书堆叠在一块)，通道相加变为16x16x765，再经过一系列卷积操作变为我们想要的feature map。

第二个concat是将我们第一个concat之后16x16x256与中间的32x32x256特征图进行concat，所以我们下采样8倍的feature map既有深层的特征参数，也有第一个concat的特征参数。

3.7 head输出部分

预测对象类别时不使用softmax，改成使用逻辑回归logistic的输出进行预测。这样能够支持多标签对象（比如一个人有Woman 和 Person两个标签）

四、损失函数

正负样本
预测框可以分为三种情况：

正样本：与标准框IOU最大的框
不参与：与标注框IOU>0.5，但不是最大
负样本：与标注框IOU<0.5

以下面这幅图为例，橙色框有两个，假设我们阈值IOU=0.5，这两个橙色框与标注框之间的IOU>0.5，我们选取最大IOU值的为正样本，另外一个橙色框不参与。

像蓝色框和绿色框与标注框之间的IOU<0.5，则为负样本。

损失函数计算公式

五、yolov3训练过程与预测过程

你可能感兴趣的:(YOLO,目标检测,YOLO,深度学习,目标检测,yolo)

数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
yolo 目标检测600类目标大霸王龙行业+领域+业务场景=定制 YOLO 目标检测人工智能
1.模型架构调整类别适配：将YOLO输出层的类别节点数调整为600（如YOLOv5的detect.yaml中修改nc=600），并更新类别名称映射表（classes.txt）。骨干网络优化：若使用YOLOv5/v8，可升级骨干网络（如C3模块深度）或替换为更高性能的主干（如EfficientNet、ResNet-101），以增强复杂场景的特征提取能力。多尺度检测头：保留或扩展YOLO的多尺度输出（
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
学苑教育杂志《学苑教育》杂志社学苑教育编辑部2025年第21期目录 QQ296078736 人工智能
专题研究推进“教-学-评”一体化，打造小学语文高效课堂刘月兰;4-6教育管理新高考制度下普通高中生涯教育课程设计的研究霍亚贞;马玲;7-9课堂教学核心素养下小学数学深度学习课堂的构建策略康贵景;10-12“双减”背景下初中英语教学的课堂模式高燕;13-15小学低年级数学说理课堂构建策略玉洁;16-18基于法治观念培育的道法课项目式教学策略许静;19-21“双师课堂”在初中语文写作教学中的实践孙巧玲
yolo检测常见指标 bigdata从入门到放弃深度学习yolo YOLO 目标跟踪人工智能深度学习
YOLO（YouOnlyLookOnce）作为经典的单阶段目标检测算法，其性能评估依赖于目标检测领域的通用指标。这些指标既衡量检测精度（是否准确识别物体类别、准确定位），也衡量检测速度（是否实时）。下面用通俗的语言详细解释核心指标：一、基础：判断“预测框是否有效”——IoU（交并比）目标检测的核心是“预测框”（模型输出的矩形框）是否准确覆盖“真实框”（人工标注的物体位置）。IoU是衡量两者重叠程度
使用 PyTorch 和 Pandas 进行 Kaggle 房价预测 Clang's Blog AI pytorch pandas 人工智能
文章目录1、环境设置2、数据下载3、数据预处理4、模型构建5、训练和验证6、训练模型并生成预测结果7、完整代码在本篇博文中，我们将探索如何使用PyTorch和Pandas库，构建一个用于Kaggle房价预测的模型。我们将详细讨论数据加载、预处理、模型构建、训练、验证及最终预测的全过程。1、环境设置我们首先需要导入所需的库，包括用于数据处理的pandas和numpy，以及用于深度学习的torch。i
使用中转API在Python中调用大型语言模型 (LLM) 的实践** qq_37836323 python 语言模型开发语言
**在人工智能技术中，大型语言模型(LLM)已成为自然语言处理(NLP)和生成任务的重要工具。然而，由于网络限制，直接访问OpenAI的API在中国可能面临挑战。因此，本文将介绍如何使用中转API地址http://api.wlai.vip来调用LLM，并提供相关的demo代码。什么是大型语言模型(LLM)？大型语言模型是一种深度学习模型，训练于大量文本数据上，能够生成、总结、翻译和回答问题等。Op
【免费下载】探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破
探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破在这个数字化时代，人工智能正逐步改变我们的生活，其中深度学习在农业领域的应用尤其引人注目。PlantVillage-Dataset是一个开放源代码的项目，它提供了一个庞大的植物病害识别数据集，旨在帮助开发人员和研究者利用机器学习技术改善农作物健康状况的监测。本文将深入探讨该项目的技术细节、应用价值及其独特之处。项目简
Python爬虫【五十八章】Python数据清洗与分析全攻略：从Pandas到深度学习的异常检测进阶程序员_CLUB Python入门到进阶 python 爬虫 pandas
目录背景与需求分析第一章：结构化数据清洗实战（Pandas核心技法）1.1数据去重策略矩阵1.2智能缺失值处理体系第二章：深度学习异常检测进阶2.1自动编码器异常检测（时序数据）2.2图神经网络异常检测（关系型数据）第三章：综合案例实战案例1：金融交易反欺诈系统案例2：工业传感器异常检测第四章：性能优化与工程实践4.1大数据处理加速技巧4.2模型部署方案第五章：方法论总结与展望5.1方法论框架5.
大模型【进阶】（一）MoE（mixture of experts）混合专家结构 ReinaXue 人工智能笔记语言模型神经网络
什么是MoE结构？MoE（MixtureofExperts，专家混合模型）是一种深度学习模型架构，通常用于处理大规模模型和计算资源效率的挑战。在MoE结构中，模型由多个“专家”组成，每个专家处理不同的任务或输入数据的不同部分，而不是让所有专家都参与每次计算。这种方式提高了计算效率，并在某些情况下有助于增强模型的表现。MoE结构的核心思想专家：在MoE模型中，专家通常指的是网络中的子模型，每个专家具
【YOLO系列】YOLOv1详解：模型结构、损失函数、训练方法及代码实现一碗白开水一 yolo系列助你拿捏AI算法 YOLO 人工智能目标检测计算机视觉
YOLOv1（YouOnlyLookOnce）：实时目标检测的革命性突破✨motivation在目标检测领域，传统方法如R-CNN系列存在计算冗余、推理速度慢的问题。2016年提出的YOLO（YouOnlyLookOnce）首次实现端到端单阶段检测，将检测速度提升至45FPS（FasterR-CNN仅7FPS），彻底改变了实时目标检测的格局。其核心思想是将检测视为回归问题，实现"看一眼即知全貌"的
【三维目标检测】Complex-Yolov4详解（二）：模型结构 Coding的叶子 Python三维点云实战宝典 Complex-Yolo Complex-Yolov4 三维目标检测目标检测 python
本文为博主原创文章，未经博主允许不得转载。本文为专栏《python三维点云从基础到深度学习》系列文章，地址为“https://blog.csdn.net/suiyingy/article/details/124017716”。Complex-Yolo网络模型的核心思想是用鸟瞰图BEV替换Yolo网络输入的RGB图像。因此，在完成BEV处理之后，模型的训练和推理过程基本和Yolo完全一致。Yolov
YOLOv4详细介绍不是二哈的柯基 YOLO系列深度学习 pdf YOLO 计算机视觉
YOLOv4是一种目标检测算法，是YOLO(YouOnlyLookOnce)系列的最新版本，由AlexeyBochkovskiy、Chien-YaoWang和Hong-YuanMarkLiao共同提出。相比于之前的版本，YOLOv4在速度和精度方面都有了显著的提升。下面是YOLOv4的一些详细介绍：模型结构YOLOv4采用了一种新的模型结构，称为CSPDarknet。这个结构类似于ResNet的残
YOLOV8模型及损失函数山居秋暝LS 计算机视觉 Python YOLO
YOLOV8代码分析1.YOLOV8相对于YOLOV5的改进2模型2.1模型主要模块2.1.1模型主要模块：2.1.2CBS、SPPF、Bottleneck、C2f、model3损失ultralytics/models/yolo/detect/train.py3.2.1生成anchor_points3.3.1把targets[9,6]变为[bs,max_gt,1+4]3.4获取预测框Pboxes3
YOLOv4 介绍及其模型优化方法
1、YOLOv4介绍2020年4月，YOLOv4在悄无声息中重磅发布，在目标检测领域引起广泛的讨论。在YOLO系列的原作者JosephRedmon宣布退出CV领域后，表明官方不再更新YOLOv3。但在过去的两年中，AlexeyAB继承了YOLO系列的思想和理念，在YOLOv3的基础上不断进行改进和开发，于今年4月发布YOLOv4，并得到了原作者JosephRedmon的承认。YOLOv4可以使用传
【YOLO系列】YOLOv4详解：模型结构、损失函数、训练方法及代码实现一碗白开水一 yolo系列助你拿捏AI算法 YOLO 目标跟踪人工智能目标检测计算机视觉论文阅读
YOLOv4详解：模型结构、损失函数、训练方法及代码实现motivationYOLO系列作者JosephRedmon与AlexeyBochkovskiy致力于解决目标检测领域的核心矛盾：精度与速度的平衡。YOLOv4的诞生源于两大需求：工业落地：在移动端/边缘设备实现实时检测（>30FPS）学术突破：无需昂贵算力（如1080Ti即可训练），在MSCOCO数据集达到SOTAmethods1.数据加载
基于深度学习的图像分类：使用ShuffleNet实现高效分类 Blossom.118 机器学习与人工智能深度学习分类人工智能机器学习数据挖掘 python 目标检测
前言图像分类是计算机视觉领域中的一个基础任务，其目标是将输入的图像分配到预定义的类别中。近年来，深度学习技术，尤其是卷积神经网络（CNN），在图像分类任务中取得了显著的进展。ShuffleNet是一种轻量级的深度学习架构，专为移动和嵌入式设备设计，能够在保持较高分类精度的同时，显著减少计算量和模型大小。本文将详细介绍如何使用ShuffleNet实现高效的图像分类，从理论基础到代码实现，带你一步步掌
OpenCV基础02_图像预处理白槿_cha 计算机视觉基础 opencv 人工智能计算机视觉笔记
图像预处理在计算机视觉和图像处理领域，图像预处理是一个重要的步骤，它能够提高后续处理（如特征提取、目标检测等）的准确性和效率。OpenCV提供了许多图像预处理的函数和方法，一些常见的图像预处理操作：图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学一、图像翻转cv2.flip是OpenCV库中的一个函数，用于翻转图像。翻转可以是水平翻转、垂
AI人工智能领域深度学习的在线学习方法 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习学习方法 ai
AI人工智能领域深度学习的在线学习方法关键词：深度学习、在线学习、AI教育、实战项目、知识体系摘要：本文为想系统学习深度学习的初学者/转行者量身打造，通过拆解深度学习的核心概念、梳理在线学习的科学路径、提供可落地的实战案例与资源清单，帮你用“游戏通关”的思路高效掌握这门技术。无论你是学生、程序员还是跨行者，都能找到适合自己的学习节奏，避免“看视频就会，动手就废”的陷阱。背景介绍目的和范围深度学习是
AI人工智能深度学习的模型评估与选择 AI大模型应用之禅人工智能深度学习 ai
AI人工智能深度学习的模型评估与选择关键词：AI、人工智能、深度学习、模型评估、模型选择摘要：本文聚焦于AI人工智能深度学习中的模型评估与选择。在深度学习迅猛发展的当下，构建一个有效的模型并非易事，而准确评估和恰当选择模型对于模型性能的发挥和应用效果至关重要。文章将详细介绍模型评估与选择的相关背景知识，深入剖析核心概念与联系，阐述核心算法原理及具体操作步骤，运用数学模型和公式进行详细讲解并举例说明
破解电梯场景难题：陌讯识别算法 mAP 达 98.7% 2501_92474790 算法计算机视觉目标检测智慧城市目标跟踪
开篇痛点：电梯间电动车识别的行业困局传统视觉算法在电梯间电动车检测场景中始终面临三重挑战：复杂光线环境下（如强光直射、夜间低照度）目标特征提取不稳定，电动车与婴儿车、行李箱等相似物体的误判率高达35%；电梯轿厢狭小空间导致目标畸变严重，小目标检测漏检率超过20%；普通模型在边缘设备部署时难以兼顾精度与速度，FPS普遍低于15帧[实测数据显示]。这些问题直接导致物业安防系统告警泛滥，真正的安全隐患却
夜间监控模糊不清？陌讯低光目标检测方案解读 2501_92474779 目标跟踪人工智能计算机视觉算法目标检测
开篇痛点：安防监控的检测困局在智慧城市建设浪潮下，安防监控面临核心矛盾：复杂场景中传统算法的泛化性短板日益凸显。某市级公安部门数据显示，夜间监控的误报率高达34%，雨雾天气下漏检率超40%。更严峻的是，密集人流场景中YOLOv5的ID丢失率达28%，实时预警几乎瘫痪——这恰是陌讯视觉算法v3.2的破局切入点。技术解析：三阶时空融合架构传统单帧检测在遮挡场景易失效，陌讯的创新在于时空联合建模：#陌讯
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他