一碗白开水一

【YOLO系列】YOLOv1详解：模型结构、损失函数、训练方法及代码实现

YOLOv1（You Only Look Once）：实时目标检测的革命性突破

✨ motivation

在目标检测领域，传统方法如R-CNN系列存在计算冗余、推理速度慢的问题。2016年提出的YOLO（You Only Look Once）首次实现端到端单阶段检测，将检测速度提升至45 FPS（Faster R-CNN仅7 FPS），彻底改变了实时目标检测的格局。其核心思想是将检测视为回归问题，实现"看一眼即知全貌"的突破。

数据处理

采用PASCAL VOC 2007+2012数据集：

图像预处理：统一缩放至 $448 \times 448$ ，RGB三通道归一化
标签编码：将真值框编码为 $\times S \times (B \times 5 + C)$ 张量
其中 $S = 7$ （网格数）， $B = 2$ （每个网格预测框数）， $C = 20$ （类别数）
数据增强：随机缩放（±20%）、平移（最大偏移0.2倍图像尺寸）、HSV色彩扰动

模型结构

YOLOv1（You Only Look Once）是一种实时目标检测模型，由Joseph Redmon等人在2015年提出。其核心思想是将目标检测视为一个回归问题，一次性预测图像中的边界框（bounding boxes）和类别概率。相比于传统的两阶段检测器（如R-CNN），YOLOv1具有速度快、端到端训练的优势。下面我将详细介绍其模型结构，分步解释关键组件。

1. 整体架构概述

YOLOv1基于卷积神经网络（CNN），采用了一种简化的架构，类似于GoogLeNet，但针对目标检测任务进行了优化。模型输入为固定尺寸的图像（通常为448×448像素），输出是一个7×7的网格张量。每个网格单元负责预测多个边界框和类别信息。整个网络由24个卷积层和2个全连接层组成，结构紧凑，便于实时推理。

2. 网络层结构详解

YOLOv1的CNN部分主要用于特征提取，其层级结构如下：

卷积层：前20层使用卷积操作提取图像特征。这些层包括：
- 多个卷积块，每个块包含卷积、激活（ReLU）和池化操作。
- 卷积核尺寸逐渐减小，从7×7到3×3，以捕获多尺度特征。
- 使用步长（stride）和填充（padding）控制特征图尺寸。
全连接层：最后2层是全连接层，用于将特征图展平并生成最终预测。
- 第一全连接层：将特征图转换为4096维向量。
- 第二全连接层：输出7×7×30的张量（即1470维），这是模型的最终输出。

网络参数总结：

输入尺寸：448×448×3（RGB图像）。
输出尺寸：7×7×30（张量）。
总参数量：约45百万，模型轻量，适合实时应用。

3. 输出张量解释

YOLOv1的输出是一个7×7×30的三维张量，其中：

7×7网格：将输入图像划分为7×7的网格单元（grid cell）。每个单元对应图像中的一个区域（约64×64像素），负责检测中心点落在该区域的目标。
每个网格单元的预测：包含两部分：
- 边界框预测：每个网格单元预测2个边界框（bounding boxes）。每个边界框由5个值表示：
  - 中心坐标 $(x, y)$ ：相对于网格单元的相对位置，范围在[0,1]。
  - 宽度 $w$ 和高度 $h$ ：相对于整个图像的尺寸，归一化到[0,1]。
  - 置信度（confidence score）：表示该框包含目标的可能性，定义为 $P(object)×IOUP(\text{object}) \times \text{IOU}$ ，其中IOU（交并比）是预测框与真实框的重叠度。数学上，置信度公式为：
    $\text{confidence} = P(\text{object}) \cdot \text{IOU}_{\text{pred}}^{\text{truth}}$
    这里， $P(object)P(\text{object})$ 是目标存在的概率， $IOUpredtruth\text{IOU}_{\text{pred}}^{\text{truth}}$ 是预测框与真实框的IOU。
- 类别概率预测：每个网格单元预测20个类别的条件概率（基于PASCAL VOC数据集）。条件概率表示为 $P(classi∣object)P(\text{class}_i | \text{object})$ ，即在目标存在的前提下，该目标属于类别 $i$ 的概率。

因此，每个网格单元的输出维度为：2个框 × 5个值（x,y,w,h,confidence） + 20个类别概率 = 30维。整个输出张量可表示为：
$\text{输出} \in \mathbb{R}^{7 \times 7 \times 30}$

4. 预测机制工作流程

YOLOv1的预测过程分为三步：

图像划分：输入图像被划分为7×7网格。每个网格单元独立处理局部特征。
边界框生成：对于每个网格单元，模型预测2个边界框。这些框通过非极大值抑制（NMS）后处理去除冗余，保留置信度最高的框。
类别分配：每个网格单元计算类别概率分布。最终检测时，边界框的类别由网格单元的类别概率和置信度共同决定：
- 具体公式：某个边界框属于类别 $i$ 的得分为：
  $\text{score}_i = P(\text{class}_i | \text{object}) \times \text{confidence}$
  得分最高的类别被分配给该框。

5. 优势与局限性总结

YOLOv1的结构简单高效，实现了端到端训练，推理速度快（可达45帧/秒）。然而，其网格划分机制可能导致小目标检测精度较低，因为每个网格单元仅预测固定数量的框。后续版本（如YOLOv2/v3）通过改进锚框（anchor boxes）和多尺度预测优化了这些不足。

⚖️ 损失函数

YOLOv1损失函数详细介绍

YOLOv1（You Only Look Once version 1）是一种单阶段目标检测模型，其核心创新是将目标检测视为一个回归问题，直接在图像网格上预测边界框（bounding box）和类别概率。损失函数的设计是YOLOv1的关键，它通过加权组合多个误差项来平衡位置、置信度和分类任务，确保模型高效训练。损失函数采用平方误差（Sum-Squared Error）形式，因为它易于优化，但通过权重系数解决了不同任务间的不平衡问题。下面我将逐步分解YOLOv1损失函数的各个部分。

损失函数总体结构

YOLOv1损失函数是一个加权和，包含五个主要部分：

位置损失：用于预测边界框的坐标（中心点 $x, y$ 和尺寸 $w, h$ ）。
置信度损失：用于预测边界框是否包含对象（objectness）。
分类损失：用于预测对象所属类别。

整体损失函数公式如下：
$L_{\text{coord}} + L_{\text{conf}} + L_{\text{class}}$
其中：

$LcoordL_{\text{coord}}$ 是位置损失。
$LconfL_{\text{conf}}$ 是置信度损失。
$LclassL_{\text{class}}$ 是分类损失。

每个部分都涉及权重系数和指示函数，以处理不同情况（如有对象或无对象）。YOLOv1将图像划分为 $\times S$ 网格（通常 $S = 7$ ），每个网格单元预测 $B$ 个边界框（通常 $B = 2$ ）。下面详细解释每个组件。

1. 位置损失（ $LcoordL_{\text{coord}}$ ）

位置损失负责优化边界框的坐标预测，包括中心点 $(x, y)$ 和尺寸 $(w, h)$ 。为了平衡不同尺寸边界框的误差，YOLOv1对宽度和高度使用平方根变换，以减少大尺寸框的误差影响。位置损失仅应用于“负责”检测对象的边界框（即与真实框IoU最高的预测框）。

公式：
$Lcoord=λcoord∑i=0S2∑j=0B1ijobj[(xi−x^i)2+(yi−y^i)2]+λcoord∑i=0S2∑j=0B1ijobj[(wi−w^i)2+(hi−h^i)2]L_{\text{coord}} = \lambda_{\text{coord}} \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{1}_{ij}^{\text{obj}} \left[ (x_i - \hat{x}_i)^2 + (y_i - \hat{y}_i)^2 \right] + \lambda_{\text{coord}} \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{1}_{ij}^{\text{obj}} \left[ (\sqrt{w_i} - \sqrt{\hat{w}_i})^2 + (\sqrt{h_i} - \sqrt{\hat{h}_i})^2 \right]$

其中：

$1ijobj\mathbb{1}_{ij}^{\text{obj}}$ 是指示函数，当第 $i$ 个网格单元的第 $j$ 个边界框负责检测对象时值为1（即该框与真实框的IoU最大），否则为0。
$x_i, y_i, w_i, h_i$ 是预测值。
$x^i,y^i,w^i,h^i\hat{x}_i, \hat{y}_i, \hat{w}_i, \hat{h}_i$ 是真实值（ground truth）。
$λcoord\lambda_{\text{coord}}$ 是位置损失的权重系数，通常设为5，以增强坐标误差的重要性（因为位置精度对检测任务至关重要）。

关键点：

中心点误差 $(xi−x^i)2+(yi−y^i)2(x_i - \hat{x}_i)^2 + (y_i - \hat{y}_i)^2$ 直接使用平方误差。
尺寸误差 $(wi−w^i)2+(hi−h^i)2(\sqrt{w_i} - \sqrt{\hat{w}_i})^2 + (\sqrt{h_i} - \sqrt{\hat{h}_i})^2$ 通过平方根处理，使得小尺寸框的误差更敏感（例如，预测 $w_i=10$ 和真实 $w^i=1\hat{w}_i=1$ 时，误差较大；而 $w_i=100$ 和 $w^i=91\hat{w}_i=91$ 时，误差较小）。

2. 置信度损失（ $LconfL_{\text{conf}}$ ）

置信度损失用于预测边界框的“对象存在概率”（即置信度分数 $C_i$ ，范围[0,1]）。它分为两部分：

有对象损失：当边界框负责检测对象时，优化置信度接近1。
无对象损失：当边界框不负责对象时，优化置信度接近0（减少负样本的影响）。

公式：
$Lconf=∑i=0S2∑j=0B1ijobj(Ci−C^i)2+λnoobj∑i=0S2∑j=0B1ijnoobj(Ci−C^i)2L_{\text{conf}} = \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{1}_{ij}^{\text{obj}} (C_i - \hat{C}_i)^2 + \lambda_{\text{noobj}} \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{1}_{ij}^{\text{noobj}} (C_i - \hat{C}_i)^2$

其中：

$1ijnoobj\mathbb{1}_{ij}^{\text{noobj}}$ 是指示函数，当第 $i$ 个网格单元的第 $j$ 个边界框不负责对象时值为1，否则为0（注意： $1ijnoobj=1−1ijobj\mathbb{1}_{ij}^{\text{noobj}} = 1 - \mathbb{1}_{ij}^{\text{obj}}$ ）。
$C_i$ 是预测置信度。
$C^i\hat{C}_i$ 是真实置信度（有对象时为1，无对象时为0）。
$λnoobj\lambda_{\text{noobj}}$ 是无对象损失的权重系数，通常设为0.5，以减少负样本的梯度影响（因为图像中大部分网格不包含对象）。

关键点：

第一项 $∑1ijobj(Ci−C^i)2\sum \mathbb{1}_{ij}^{\text{obj}} (C_i - \hat{C}_i)^2$ 强制有对象框的置信度接近1。
第二项 $λnoobj∑1ijnoobj(Ci−C^i)2\lambda_{\text{noobj}} \sum \mathbb{1}_{ij}^{\text{noobj}} (C_i - \hat{C}_i)^2$ 强制无对象框的置信度接近0，但权重较低（ $λnoobj=0.5\lambda_{\text{noobj}}=0.5$ ），避免无对象样本主导训练。

3. 分类损失（ $LclassL_{\text{class}}$ ）

分类损失用于预测对象所属类别概率。每个网格单元预测一个条件概率分布 $p(c∣object)p(c|\text{object})$ ，表示如果网格包含对象中心，则对象属于类别 $c$ 的概率。损失仅应用于包含对象中心的网格单元。

公式：
$Lclass=∑i=0S21iobj∑c=1C(pi(c)−p^i(c))2L_{\text{class}} = \sum_{i=0}^{S^2} \mathbb{1}_{i}^{\text{obj}} \sum_{c=1}^{C} (p_i(c) - \hat{p}_i(c))^2$

其中：

$1iobj\mathbb{1}_{i}^{\text{obj}}$ 是指示函数，当第 $i$ 个网格单元包含对象中心时值为1，否则为0。
$p_i(c)$ 是预测的第 $c$ 个类别的概率。
$p^i(c)\hat{p}_i(c)$ 是真实概率（one-hot编码，真实类别为1，其他为0）。
$C$ 是类别总数（如PASCAL VOC数据集有20类）。

关键点：

分类损失是平方误差，而非交叉熵，因为YOLOv1整体采用平方误差框架。
每个网格单元只预测一个类别分布（与边界框数 $B$ 无关），因此损失基于网格单元而非边界框。

权重系数的意义

$λcoord=5\lambda_{\text{coord}} = 5$ ：增加位置损失的权重，因为坐标误差对检测精度影响更大（例如，位置偏移可能导致误检）。
$λnoobj=0.5\lambda_{\text{noobj}} = 0.5$ ：降低无对象置信度损失的权重，因为图像中负样本（无对象区域）远多于正样本，防止负样本梯度淹没正样本。

损失函数特点总结

整体公式：结合上述部分，完整损失函数为：
$L=λcoord∑i=0S2∑j=0B1ijobj[(xi−x^i)2+(yi−y^i)2+(wi−w^i)2+(hi−h^i)2]+∑i=0S2∑j=0B1ijobj(Ci−C^i)2+λnoobj∑i=0S2∑j=0B1ijnoobj(Ci−C^i)2+∑i=0S21iobj∑c=1C(pi(c)−p^i(c))2L = \lambda_{\text{coord}} \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{1}_{ij}^{\text{obj}} \left[ (x_i - \hat{x}_i)^2 + (y_i - \hat{y}_i)^2 + (\sqrt{w_i} - \sqrt{\hat{w}_i})^2 + (\sqrt{h_i} - \sqrt{\hat{h}_i})^2 \right] + \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{1}_{ij}^{\text{obj}} (C_i - \hat{C}_i)^2 + \lambda_{\text{noobj}} \sum_{i=0}^{S^2} \sum_{j=0}^{B} \mathbb{1}_{ij}^{\text{noobj}} (C_i - \hat{C}_i)^2 + \sum_{i=0}^{S^2} \mathbb{1}_{i}^{\text{obj}} \sum_{c=1}^{C} (p_i(c) - \hat{p}_i(c))^2$
优点：通过权重平衡，解决了位置、置信度和分类任务的不平衡问题；平方误差简化了优化。
局限：平方误差对分类任务不是最优（后续版本如YOLOv2改用交叉熵），且对小对象检测不够鲁棒。

YOLOv1损失函数的设计体现了端到端回归的思想，使其在速度和精度上取得了平衡。训练时，该损失函数通过反向传播优化模型参数，实现高效的目标检测。

训练方法

优化器：SGD动量优化器（动量0.9）
学习率：分段衰减 $10^{-3} \to 10^{-2} \to 10^{-3} \to 10^{-4}$
批次大小：64
训练周期：135 epoch
正则化：Dropout (rate=0.5) + L2权重衰减(0.0005)

实验效果

在PASCAL VOC 2007测试集：

指标	YOLOv1	Faster R-CNN
mAP	63.4%	70.0%
FPS	45	7
模型尺寸	约750MB	约1.2GB

核心优势：在保持 $AP_{50}$ 达88%的同时，推理速度提升6倍以上！

关键代码

以下展示YOLOv1的关键实现代码（基于PyTorch框架），包含模型架构和损失函数的核心部分：

import torch
import torch.nn as nn

class YOLOv1(nn.Module):
    def __init__(self, grid_size=7, num_boxes=2, num_classes=20):
        super().__init__()
        self.grid_size = grid_size
        self.num_boxes = num_boxes
        self.num_classes = num_classes
        
        # 特征提取网络（简化版，原文使用24层卷积）
        self.features = nn.Sequential(
            nn.Conv2d(3, 64, 7, stride=2, padding=3),
            nn.LeakyReLU(0.1),
            nn.MaxPool2d(2, stride=2),
            nn.Conv2d(64, 192, 3, padding=1),
            nn.LeakyReLU(0.1),
            nn.MaxPool2d(2, stride=2)
        )
        
        # 检测头（输出层）
        self.detector = nn.Sequential(
            nn.Linear(192 * grid_size * grid_size, 4096),
            nn.LeakyReLU(0.1),
            nn.Linear(4096, grid_size * grid_size * (num_classes + num_boxes * 5))
        )

    def forward(self, x):
        x = self.features(x)
        x = torch.flatten(x, 1)
        x = self.detector(x)
        # 重塑为 [batch, S, S, (C + B*5)] 张量
        return x.view(-1, self.grid_size, self.grid_size, self.num_classes + 5 * self.num_boxes)

损失函数核心实现

def yolo_loss(preds, targets, lambda_coord=5, lambda_noobj=0.5):
    """
    preds:  预测张量 [batch, S, S, C+B*5]
    targets: 标签张量 [batch, S, S, C+5]
    """
    # 坐标损失权重
    coord_mask = targets[..., 20:21]  # 物体存在指示器
    noobj_mask = 1 - coord_mask
    
    # 边界框坐标损失
    box_pred = preds[..., 21:25]
    box_target = targets[..., 21:25]
    box_loss = lambda_coord * coord_mask * torch.sum(
        (box_pred[..., :2] - box_target[..., :2])**2 + 
        (torch.sqrt(box_pred[..., 2:4]) - torch.sqrt(box_target[..., 2:4]))**2,
        dim=-1
    )
    
    # 物体置信度损失
    conf_pred = preds[..., 20:21]
    conf_target = targets[..., 20:21]
    conf_loss = coord_mask * (conf_pred - conf_target)**2 + \
                lambda_noobj * noobj_mask * (conf_pred - conf_target)**2
    
    # 分类损失
    class_pred = preds[..., :20]
    class_target = targets[..., :20]
    class_loss = coord_mask * torch.sum((class_pred - class_target)**2, dim=-1)
    
    # 总损失
    total_loss = torch.sum(box_loss + conf_loss + class_loss)
    return total_loss

【完结】

三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
关于流媒体播放器EasyPlayer和EasyPlayerPro的介绍以及其区别 EasyDarwin EasyDarwin 音视频 ffmpeg 人工智能大数据 ar
EasyPlayer是一款流媒体播放器系列项目，它支持多种流媒体协议的播放，包括但不限于RTSP、RTMP、HTTP、HLS、UDP、RTP、File等。除此之外，EasyPlayer还支持本地文件播放和多种功能特性，包括本地抓拍、本地录像、播放旋转、多屏播放、倍数播放等。EasyPlayer核心基于ffmpeg，稳定、高效、可靠、可控。随着多年的不断发展和迭代，EasyPlayer基于成功的实践
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
【ARM】FPU,VFP,ASE,NEON,SVE...是什么意思？亿道电子Emdoor ARM arm开发 ARM
1、文档目标对执行浮点和SIMD操作的逻辑的各种名称的缩写词进行简要解释。2、问题场景Arm处理器内核中有用于执行浮点和SIMD操作的逻辑，有各种名称。它们通常是一系列的缩写形式，因此本文旨在对每一个缩写词进行简要解释。3、软硬件环境1、软件版本：不涉及2、电脑环境：不涉及4、相关缩写FPU(Floating-PointUnit)浮点单元浮点单元是处理器核心中的一个模块，用于使用浮点数执行算术运算
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
EasyPlayer播放器系列开发计划2025 xiejiashu EasyPlayer EasyPlayer EasyPlayer播放器 RTSP播放器 js播放器 Web播放器
EasyPlayer系列产品发展至今，已经超过10年，从最早的EasyPlayerRTSP播放器，到如今维护的3条线：EasyPlayer-RTSP播放器：Windows、Android、iOS；EasyPlayerPro播放器：Windows、Android、iOS；EasyPlayer.js播放器：H5；这3个播放器各有各的应用场景，用户量也是巨大，像RTSP版本的播放器，到今天依然还有很多低
人物系列首篇｜总会有人陪你走一段路诗小蛮5786400
主题纲要：1.总会有人陪你走一段路2.不打扰也是一种幸福3.留在身边的，哪怕瞎逼逼一番也是珍贵一、总会有人陪你走一段路在综艺《向往的生活》，任嘉伦曾问过这样一个问题：“你们有没有过那样一种朋友：你们小时候关系很好，但因为你事业越来越好；他觉得你们之间的距离越来越远，然后他就自己疏远你的那种。”何炅说：我们要接受这是常态，我们每个人都有在乎的、喜欢的人，但我从来没有奢望，要把谁留在身边一辈子，因为这
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
STM32入门之TIM基本定时器嵌入式白话 STM32入门学习 stm32 嵌入式硬件单片机
一、定时器简介定时器是嵌入式系统中的关键外设之一，它可以用于生成精确的延时、周期性中断、PWM波形生成等功能。在STM32F1系列单片机中，定时器不仅能为系统提供精确的时钟，还支持外部事件的捕获以及信号输出。对于定时器的功能，我们可以通过一个生活中非常常见的例子来形象地描述：微波炉的定时器。想象你正在使用微波炉加热食物。在微波炉里，定时器的作用就是帮助你控制食物加热的时间。当你设置了加热时间后，定
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

【YOLO系列】YOLOv1详解：模型结构、损失函数、训练方法及代码实现

YOLOv1（You Only Look Once）：实时目标检测的革命性突破

✨ motivation

数据处理

模型结构

1. 整体架构概述

2. 网络层结构详解

3. 输出张量解释

4. 预测机制工作流程

5. 优势与局限性总结

⚖️ 损失函数

YOLOv1损失函数详细介绍

损失函数总体结构

1. 位置损失（LcoordL_{\text{coord}}Lcoord​）

2. 置信度损失（LconfL_{\text{conf}}Lconf​）

3. 分类损失（LclassL_{\text{class}}Lclass​）

权重系数的意义

损失函数特点总结

训练方法

实验效果

关键代码

损失函数核心实现

你可能感兴趣的:(yolo系列助你拿捏AI算法,YOLO,人工智能,目标检测,计算机视觉)

1. 位置损失（ $LcoordL_{\text{coord}}$ ）

2. 置信度损失（ $LconfL_{\text{conf}}$ ）

3. 分类损失（ $LclassL_{\text{class}}$ ）