LIUDAN'S WORLD

从零开始：YOLOv4 目标检测实战指南 (环境配置、训练到优化全流程)

本篇博客将带你一步步从零开始，完成 YOLOv4 的环境配置、数据集准备与训练，并涵盖常见的优化和问题解决。本文将以 Darknet 框架下的 YOLOv4 实现为主，因为它是由 YOLOv4 原作者团队维护和优化的官方版本，能够提供最原汁原味的体验和性能。

我们将涵盖以下内容：

环境配置详解：Python、CUDA、cuDNN、GCC、Make 等前置依赖，以及 Darknet 的编译。
数据集准备与预处理：目标检测数据集的格式要求、常用标注工具、数据文件组织。
参数配置与训练流程：核心配置文件详解、迁移学习、训练命令、日志解读。
常见问题及解决方案：编译错误、CUDA 问题、数据路径错误、训练过程中的 NaN 等。
超参数调优技巧：学习率策略、Batch Size、数据增强等对训练效果的影响。
性能评估与可视化分析：mAP 计算、检测结果可视化。

重要提示: 训练深度学习模型，尤其是 YOLOv4 这样参数量较大的模型，通常需要一块性能较好的 NVIDIA GPU。本文的环境配置部分将重点介绍如何在 Linux 系统下配置 CUDA 环境，这是 GPU 训练的基石。

1. 环境配置详解

这是进行深度学习训练的第一步，也是最容易遇到问题的一步。耐心、仔细是关键。

操作系统:

推荐使用 Linux (如 Ubuntu 18.04 或 20.04)。虽然 Darknet 也可以在 Windows 上编译，但在 Linux 环境下配置 CUDA 和各种库更加方便和稳定。

硬件要求:

GPU: NVIDIA GPU 是必须的，显存越大越好 (建议 8GB 或以上)。
CPU: 性能适中即可。
内存: 建议 16GB 或以上。
硬盘空间: 需要足够的空间存储数据集、预训练权重和训练过程中生成的权重文件 (几十 GB 到几百 GB 不等)。

前置依赖:

在安装 Darknet 之前，你需要安装一些基础的开发工具和库。

GCC/G++: C/C++ 编译器。通常 Linux 发行版自带。
Make: 构建工具。通常 Linux 发行版自带。
CMake: 用于构建软件的工具。 Bash
```
sudo apt update
sudo apt install cmake
```

Python: 推荐安装 Python 3.6 或更高版本。Anaconda 或 Miniconda 是管理 Python 环境的好选择。 Bash

# 使用 Miniconda 为例
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
# 按照提示安装
# 创建并激活虚拟环境 (可选但强烈推荐)
conda create -n yolov4_env python=3.8
conda activate yolov4_env
# 安装一些常用库
pip install numpy opencv-python matplotlib

CUDA Toolkit: NVIDIA 提供的并行计算平台，是 GPU 加速的关键。版本选择取决于你的 GPU 型号和操作系统。务必检查你的显卡支持的最高 CUDA 版本。 可以在 NVIDIA 官网查找兼容性。
- 安装步骤: 访问 NVIDIA CUDA Toolkit Archive (CUDA Toolkit Archive | NVIDIA Developer) 下载对应版本的安装包 (选择 runfile 方式通常更灵活)。
- 重要: 安装时可以选择不安驱动，如果你已经通过其他方式安装了驱动。如果选择安装驱动，务必确认安装的驱动版本与你的显卡兼容。
- 安装完成后: 将 CUDA 的 bin 目录添加到系统环境变量 PATH 中，将 lib64 目录添加到 LD_LIBRARY_PATH 中。通常在 ~/.bashrc 文件中添加： Bash
```
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
```
  然后执行 source ~/.bashrc 使其生效。
- 验证安装: 打开新的终端，运行 nvcc -V。如果显示 CUDA 版本信息，则安装成功。
cuDNN: NVIDIA 深度学习加速库。它依赖于 CUDA。cuDNN 版本必须与 CUDA 版本兼容。
- 下载: 访问 NVIDIA cuDNN Download (https://developer.nvidia.com/cudnn/downloads) 下载对应 CUDA 版本的 cuDNN (需要注册 NVIDIA 开发者账号)。下载 cuDNN Library for Linux 的 tar 文件。
- 安装: 解压下载的文件，将 include 目录下的头文件复制到 CUDA 的 include 目录，将 lib64 目录下的库文件复制到 CUDA 的 lib64 目录。 Bash
```
tar -xvf cudnn-*-archive.tar.xz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
```
- 验证安装: 可以运行 CUDA 提供的示例 (deviceQuery, bandwidthTest) 来验证 CUDA 和驱动，cuDNN 通常没有独立的验证程序，但如果后续 Darknet 编译开启 cuDNN 成功，则说明安装正确。
OpenCV: 用于图像处理和可视化的库。Darknet 可以选择性地使用 OpenCV 来进行图像加载和结果可视化。 Bash
```
sudo apt install libopencv-dev
```

安装 Darknet:

我们将使用 AlexeyAB 维护的 Darknet 开源项目，它是目前最活跃和功能最完善的 Darknet 版本。

克隆仓库: Bash

git clone https://github.com/AlexeyAB/darknet.git
cd darknet

修改 Makefile: 这是编译 Darknet 的关键步骤。根据你的需求和环境修改 Makefile 文件。使用任意文本编辑器打开 Makefile： Bash

# 开启 GPU 支持 (必须)
GPU=1
# 开启 cuDNN 加速 (强烈推荐)
CUDNN=1
# 开启 OpenCV 支持 (推荐，用于可视化)
OPENCV=1
# 开启 LIBSO 支持 (可选，用于编译为动态库，方便 Python 调用)
# LIBSO=1

# 根据你的 CUDA 版本设置 ARCH (Compute Capability)
# 如果不确定，可以运行 nvidia-smi 查看 GPU 型号，然后到 NVIDIA 官网查询对应的 Compute Capability
# 例如，对于 RTX 30系列，ARCH=86
# 如果是较旧的显卡，可能需要设置多个 ARCH，例如 ARCH=61 75
# 或者尝试不设置 ARCH，让 make 自动检测 (有时会出错)
# ARCH= -gencode arch=compute_61,code=[sm_61,compute_61] \
#       -gencode arch=compute_75,code=[sm_75,compute_75]
# ... (找到 ARCH 相关的行，根据注释或你的显卡修改)

# 如果使用了 CUDNN_HALF=1，需要 GPU 支持 FP16 (通常是 Volta 及更新架构)
# CUDNN_HALF=1

# 如果使用了 OPENCV=1，确保 PKG_CONFIG_PATH 包含了你的 OpenCV 安装路径
# (如果使用 apt 安装，通常不需要额外设置)

保存并关闭 Makefile。

编译: Bash
```
make
```
编译过程可能需要几分钟到十几分钟，取决于你的 CPU 性能。如果一切顺利，你会看到编译成功的提示，并在 darknet 目录下生成可执行文件 darknet。

验证安装:

运行 ./darknet，如果能看到 Darknet 的使用说明，说明编译成功。

运行一个简单的测试 (需要下载预训练权重，后面会介绍): Bash

wget https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.weights

1 ./darknet detector test cfg/coco.data cfg/yolov4.cfg yolov4.weights data/dog.jpg # 如果能看到检测结果图片 predictions.jpg，说明环境配置和 Darknet 基本功能正常 ```

1. github.com

github.com

2. 数据集准备与预处理

训练目标检测模型需要大量的标注数据。每个数据样本包含一张图片和其中所有目标的位置和类别信息。

数据集格式 (YOLO Darknet 格式):

Darknet 期望的标注格式是针对每张图片生成一个同名的 .txt 文件。例如，图片文件是 image.jpg，对应的标注文件就是 image.txt。

在 .txt 文件中，每一行代表图片中的一个目标，格式如下：

: 目标的类别 ID，从 0 开始计数。例如，如果你有 "cat" 和 "dog" 两个类别，"cat" 是 0，"dog" 是 1。
, , , : 这些都是 归一化 的浮点数，范围在 [0.0, 1.0] 之间。
- : 目标框中心的 X 坐标，除以图片宽度进行归一化。
- : 目标框中心的 Y 坐标，除以图片高度进行归一化。
- : 目标框的宽度，除以图片宽度进行归一化。
- : 目标框的高度，除以图片高度进行归一化。

例子:

如果一张 640x480 的图片中有一个目标框，左上角坐标 (100, 50)，右下角坐标 (300, 450)，类别 ID 是 0 (猫)。

中心 X: (100 + 300) / 2 = 200
中心 Y: (50 + 450) / 2 = 250
宽度: 300 - 100 = 200
高度: 450 - 50 = 400

归一化后：

: 200 / 640 = 0.3125
: 250 / 480 = 0.5208
: 200 / 640 = 0.3125
: 400 / 480 = 0.8333

则对应的 .txt 文件中的一行就是：

0 0.3125 0.5208 0.3125 0.8333

常用标注工具:

如果你有自己的图片需要从头标注，可以使用以下工具：

LabelImg: (推荐) 开源的图形界面标注工具，支持多种格式输出 (包括 YOLO)。安装和使用都很方便。
VGG Image Annotator (VIA): 基于 Web 的标注工具。
Makesense.ai: 在线标注工具。

数据集文件组织:

通常将数据集组织成以下结构：

your_dataset/
├── images/       # 存放所有图片文件 (.jpg, .png等)
│   ├── image1.jpg
│   ├── image2.png
│   └── ...
└── labels/       # 存放所有标注文件 (.txt)，与 images 下的文件一一对应且同名
    ├── image1.txt
    ├── image2.txt
    └── ...

创建数据文件:

Darknet 需要几个文件来了解你的数据集：

.names 文件: 包含所有类别的名称，每行一个。例如 obj.names:
```
cat
dog
person
```
注意顺序要和你的标注中的对应。

.data 文件: 告诉 Darknet 数据集的相关信息。例如 obj.data:

classes = 3           # 类别数量
train = data/train.txt  # 训练图片列表文件路径
valid = data/val.txt    # 验证图片列表文件路径 (可选)
names = data/obj.names  # .names 文件路径
backup = /path/to/backup/weights/  # 训练过程中保存权重文件的目录
# eval=coco             # 评估方式 (可选，通常不需要设置)

训练图片列表 (train.txt): 包含所有用于训练的图片文件的绝对路径或相对路径，每行一个。
验证图片列表 (val.txt): (可选) 包含所有用于验证的图片文件的路径，格式同 train.txt。用于在训练过程中评估模型性能。

你可以编写一个简单的 Python 脚本来生成 train.txt 和 val.txt 文件，将 images 目录下的图片路径随机划分到这两个文件中。

Python

import os
import random

image_dir = 'your_dataset/images/'
train_file = 'data/train.txt'
val_file = 'data/val.txt'
split_ratio = 0.9 # 90% 训练，10% 验证

image_list = [os.path.join(image_dir, img) for img in os.listdir(image_dir) if img.endswith(('.jpg', '.png', '.jpeg'))]
random.shuffle(image_list)

train_count = int(len(image_list) * split_ratio)
train_list = image_list[:train_count]
val_list = image_list[train_count:]

with open(train_file, 'w') as f:
    for img_path in train_list:
        f.write(img_path + '\n')

with open(val_file, 'w') as f:
    for img_path in val_list:
        f.write(img_path + '\n')

print(f"Generated {train_file} with {len(train_list)} images")
print(f"Generated {val_file} with {len(val_list)} images")

将上述 Python 脚本放在 darknet 目录下，修改 image_dir 路径，运行即可生成 data/train.txt 和 data/val.txt (确保 darknet 目录下有 data 文件夹)。

3. 参数配置与训练流程详解

训练 YOLOv4 需要配置模型结构、训练参数以及指定数据集信息。

模型配置文件 (.cfg):

YOLOv4 的模型结构和许多训练参数都定义在 .cfg 文件中，例如 cfg/yolov4.cfg。你需要根据你的数据集修改这个文件。

找到文件末尾的 [yolo] 层及其前面的 [convolutional] 层。对于每个 [yolo] 层 (通常有 3 个，对应不同尺度的检测):

[convolutional] 层 (在 [yolo] 前): 修改 filters 参数。其值应为 (classes + 5) * 3。
- classes: 你的数据集的类别数量。
- 5: 表示边界框的 (center_x, center_y, width, height) 和目标性得分 (objectness score)。
- 3: 表示该层对应的 Anchor 数量 (YOLOv4 在每个检测层使用 3 个 Anchor)。例如，如果你的数据集有 3 个类别，则 filters = (3 + 5) * 3 = 24。
[yolo] 层: 修改 classes 参数为你的类别数量。修改 anchors 参数。这一步非常重要! 默认的 anchors 是在 COCO 数据集上聚类得到的，你需要根据你的数据集重新聚类生成适合你的目标的 anchors。

如何生成 Anchors: Darknet 提供了工具来根据你的数据集计算最佳的 anchors。运行以下命令：
Bash
```
./darknet detector calc_anchors data/obj.data -cfg cfg/yolov4.cfg -num_of_clusters 9 -width 416 -height 416
# data/obj.data: 你的数据文件
# cfg/yolov4.cfg: 你的配置文件
# num_of_clusters: Anchor 数量 (通常 YOLOv4 使用 9 个)
# width/height: 你训练时将使用的输入图片尺寸 (比如 416x416)
```
该命令会输出计算得到的 9 个 anchors (9个数值对)。将这些数值复制粘贴到 cfg/yolov4.cfg 中所有 [yolo] 层的 anchors 参数后面，并删除原有的 anchors。确保格式正确，例如：anchors = 10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326 (注意逗号和空格)。

其他重要参数 (在文件顶部):

batch: 训练时使用的图片数量。越大越稳定，但越耗显存。
subdivisions: 将一个 batch 分割成多少份送入 GPU。实际送入 GPU 的图片数量是 batch / subdivisions。这是为了在显存不足时模拟大 batch size。例如 batch=64, subdivisions=16，则每次送入 4 张图片。
width, height: 网络输入的图片尺寸。通常是 32 的倍数，例如 416x416, 608x608。更大的尺寸通常精度更高，但速度更慢且需要更多显存。
learning_rate: 初始学习率。
policy: 学习率衰减策略 (如 steps, polynomial, exponential)。
steps, scales: 与 policy=steps 配合使用，定义在哪些迭代次数 (steps) 将学习率乘以对应的因子 (scales) 进行衰减。
max_batches: 总共训练的迭代次数。建议设置为 classes * 2000，但不小于 6000。
burn_in: 在前 burn_in 迭代内，学习率会从一个很小的值逐渐增加到初始学习率。
mosaic, cutmix: 数据增强技术，默认开启 (1)。
hue, saturation, exposure: 颜色抖动参数。
random: 是否使用随机尺寸输入进行训练 (每 10 个迭代随机改变一次输入尺寸，范围从 width/32*32 到 width，步长为 32)。默认开启 (1)。这有助于提高模型的鲁棒性。

迁移学习 (Transfer Learning):

从预训练权重开始训练可以大大缩短训练时间并提高性能，尤其是在数据集较小的情况下。

下载预训练权重: 下载在大型数据集 (如 COCO 或 ImageNet) 上预训练的 YOLOv4 权重。
- 在 ImageNet 上预训练的权重 (只包含 backbone): yolov4.conv.137 (约 160MB) Bash
```
wget https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137
```
- 在 COCO 上预训练的完整权重: yolov4.weights (约 245MB) Bash
```
wget https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v4_pre/yolov4.weights
```
建议使用 yolov4.conv.137 从头开始在你的数据集上训练，因为 yolov4.weights 是在 80 个类别的 COCO 上训练的，直接在少量类别的数据集上微调可能会遇到类别不匹配的问题 (虽然 Darknet 也能处理，但从 conv 权重开始更规范)。

开始训练:

使用 Darknet 的 detector train 命令开始训练。

Bash

./darknet detector train data/obj.data cfg/yolov4.cfg yolov4.conv.137 -map
# data/obj.data: 你的数据文件路径
# cfg/yolov4.cfg: 你的配置文件路径
# yolov4.conv.137: 用于迁移学习的预训练权重文件路径 (如果是从头训练，可以省略或使用一个较小的 backbone 权重如 darknet53.conv.74)
# -map: (可选) 在训练过程中定期计算验证集上的 mAP (Mean Average Precision)，用于监控训练效果。这会稍微降低训练速度。

训练开始后，你会看到类似以下的输出：

...
Loading weights from yolov4.conv.137...Done!
Learning Rate: 0.00261
Batch Size: 64, Subdivisions: 16
...
Epoch   Iteration   Region Avg IOU   Class Avg IOU   Object Avg IOU    Total Avg IOU  Recall  Precision   Avg Loss   Rate
   1         100           0.7580          0.9032          0.7890           0.8167    0.88    0.91       0.543210   0.001000
   1         200           0.7801          0.9115          0.8103           0.8340    0.90    0.93       0.487654   0.002610
...
Saving weights to /path/to/backup/weights/yolov4_xxxx.weights

Iteration: 当前的训练迭代次数。
Region Avg IOU: 预测框与真实框的平均 IoU。
Class Avg IOU: 预测框中正确分类的目标的平均 IoU。
Object Avg IOU: 预测框中包含目标的平均 IoU。
Total Avg IOU: 整体平均 IoU。
Recall: 召回率。
Precision: 精确率。
Avg Loss: 平均损失值。这是监控训练是否收敛的重要指标，应随着训练进行逐渐下降。
Rate: 当前的学习率。

Darknet 会定期在 backup 目录 (在 .data 文件中指定) 下保存权重文件 (.weights)，通常是每 100 次迭代保存一次 .weights 文件，以及每 1000 次迭代保存一次完整的 .weights 文件。

中断与恢复训练:

如果你需要中断训练 (例如关机或显存不足)，可以直接关闭终端。下次训练时，使用以下命令从保存的最新权重文件继续：

Bash

./darknet detector train data/obj.data cfg/yolov4.cfg /path/to/backup/weights/yolov4_last.weights -map
# 将 yolov4_last.weights 替换为你想要恢复的权重文件路径

Darknet 会查找指定权重文件同目录下的 _last.weights 文件作为最新的保存点。

4. 常见问题及解决方案

在 YOLOv4 训练过程中，可能会遇到各种问题。以下是一些常见问题及其解决方法：

编译错误 (尤其是 CUDA 相关):
- 问题: undefined reference to 'cudaFree' 或其他 CUDA 函数。
- 原因: CUDA Toolkit 或驱动安装不正确，或者 Makefile 中的 CUDA 路径配置错误。
- 解决方案: 重新安装 CUDA Toolkit，确保 PATH 和 LD_LIBRARY_PATH 包含正确的 CUDA 路径。检查 Makefile 中的 GPU 和 CUDNN 是否开启，以及 ARCH 是否与你的显卡兼容。
- 问题: fatal error: cudnn.h: No such file or directory
- 原因: cuDNN 没有正确安装或复制到 CUDA 目录。
- 解决方案: 检查 cuDNN 文件是否正确复制到 /usr/local/cuda/include 和 /usr/local/cuda/lib64。确保文件权限正确 (chmod a+r ...)。
- 问题: undefined reference to 'cv::' 或其他 OpenCV 函数。
- 原因: OpenCV 没有正确安装，或者 Makefile 中的 OPENCV 没有开启。
- 解决方案: 安装 libopencv-dev，确保 OPENCV=1 在 Makefile 中。
CUDA/cuDNN 版本不兼容:
- 问题: 运行时报 CUDA 或 cuDNN 相关错误，提示版本不匹配。
- 原因: 安装的 CUDA Toolkit、cuDNN 和 NVIDIA 驱动之间版本不兼容。
- 解决方案: 仔细查阅 NVIDIA 官方文档，确认你的 GPU、驱动、CUDA 和 cuDNN 之间的兼容性，然后安装对应的版本。通常建议先安装驱动，再安装兼容的 CUDA 和 cuDNN。
数据集路径错误:
- 问题: Couldn't open file data/obj.data 或 Cannot load image data/train.txt 中的图片。
- 原因: .data 文件中指定的路径错误，或者 train.txt/val.txt 中指定的图片路径错误。
- 解决方案: 仔细检查 obj.data 文件中的 train, valid, names, backup 路径是否正确，以及 train.txt/val.txt 文件中的图片路径是否准确。使用绝对路径可以避免相对路径带来的问题。
配置文件错误 (.cfg):
- 问题: Error in cfg file... 或训练开始后立即崩溃。
- 原因: .cfg 文件中有语法错误，或者修改 filters, classes, anchors 时计算或复制错误。
- 解决方案: 仔细检查你修改的 [convolutional] 和 [yolo] 层中的 filters, classes, anchors 参数是否正确。filters 必须是 (classes + 5) * 3。确保 anchors 格式正确。
训练过程中出现 NaN Loss:
- 问题: 训练输出的 Avg Loss 突然变成 nan。
- 原因: 学习率过高、数据异常 (标注错误、图片损坏) 或模型不稳定。
- 解决方案:
  - 降低学习率: 初始学习率可能过高，尝试减小一点。
  - 检查数据集: 检查训练集中是否有标注错误、空白标注文件、损坏的图片或尺寸极小的图片。
  - 减小 Batch Size: 减小 batch 和 subdivisions。
  - 从上一个稳定权重恢复: 从出现 NaN 之前的最后一个正常权重文件恢复训练。
  - 关闭或调整数据增强: 有时过于激进的数据增强可能导致问题。
显存不足 (Out of Memory):
- 问题: 训练过程中报 CUDA 内存错误。
- 原因: Batch size 或输入图片尺寸过大，超过了 GPU 显存容量。
- 解决方案:
  - 减小 batch 和/或增大 subdivisions: 实际送入 GPU 的图片数量是 batch / subdivisions，减小这个值可以降低显存占用。
  - 减小输入图片尺寸: 修改 .cfg 文件中的 width 和 height。
  - 开启 CUDNN_HALF=1: 如果你的 GPU 支持 FP16，开启这个选项可以减少显存使用 (需要修改 Makefile 并重新编译)。

5. 超参数调优技巧

超参数的选择对模型的训练效果至关重要。调优是一个需要经验和耐心的过程。

以下是一些关键的超参数和调优技巧：

学习率 (learning_rate, policy, steps, scales):
- 学习率是影响训练收敛速度和最终性能的最重要参数之一。
- 通常从一个较小的初始学习率开始 (0.001 或 0.00261 是常见的起始值)。
- 使用学习率衰减策略 (policy=steps) 是必要的，可以在训练后期减小学习率，帮助模型更稳定地收敛到最优解。steps 和 scales 需要根据 max_batches 合理设置。例如，在总迭代次数的 80% 和 90% 进行两次衰减，每次衰减因子为 0.1 (scales=0.1,0.1)。
- 如果训练初期 loss 下降缓慢，可以尝试增大初始学习率。如果 loss 震荡或出现 NaN，说明学习率可能过高，需要减小。
Batch Size (batch, subdivisions):
- Batch size 越大，梯度估计越准确，训练通常越稳定，也更容易收敛到更好的局部最优解。但受限于显存。
- 尽量使用你能负担的最大 Batch size。如果显存不足，可以通过增大 subdivisions 来模拟大 Batch size。
输入图片尺寸 (width, height):
- 更大的输入尺寸通常能提高对小目标的检测能力，从而提高精度。
- 缺点是需要更多显存，推理速度也会变慢。
- 可以先使用较小的尺寸 (如 416x416) 进行快速实验，确定其他参数后，再尝试更大的尺寸 (如 608x608) 进行最终训练。
- random=1 (随机尺寸训练) 是一个很有效的正则化手段，能提高模型对不同尺寸目标的鲁棒性。
Anchors:
- Anchors 的选择对模型的收敛速度和性能有很大影响。务必根据你的数据集重新聚类生成。
数据增强 (mosaic, cutmix, hue, saturation, exposure 等):
- 数据增强是提高模型泛化能力的重要手段。Darknet 内置了多种数据增强方法。
- mosaic 和 cutmix 是很有效的增强技术，通常建议开启。
- 颜色抖动参数 (hue, saturation, exposure) 可以适度调整，模拟不同的光照条件。
- 如果数据集较小，可以考虑使用更强的数据增强。如果数据集很大，可以适度减弱。
优化器参数:
- Darknet 使用 SGD 优化器。.cfg 文件中的 momentum (动量) 和 decay (权重衰减) 是重要的优化器参数。默认值通常工作良好，一般不需要大幅调整。decay 用于防止过拟合，较大的 decay 会惩罚大的权重。
训练迭代次数 (max_batches):
- 训练到 loss 收敛并且验证集性能不再提升即可停止。设置过大的 max_batches 只会浪费计算资源，甚至可能导致过拟合。
- 监控训练日志中的 Avg Loss 和 -map 选项输出的 mAP 来判断何时停止。

调优策略:

从基础开始: 使用推荐的默认参数和在 ImageNet 上预训练的 yolov4.conv.137 开始训练。
监控指标: 密切关注训练日志中的 Avg Loss 和验证集上的 mAP。
一次调整少量参数: 避免一次修改太多超参数，否则很难判断哪个修改起作用了。
学习率优先: 通常先从学习率开始调优。
Batch Size 限制: 在显存允许范围内选择最大的 Batch Size 或通过 subdivisions 模拟。
Anchor 聚类: 务必为你的数据集重新计算 anchors。
数据增强: 根据数据集大小和特性调整数据增强参数。
耐心和实验: 超参数调优是一个实验过程，需要耐心尝试不同的组合。

6. 性能评估与可视化分析

训练完成后，你需要评估模型的性能并可视化检测结果。

性能评估 (mAP):

mAP (Mean Average Precision) 是目标检测中最常用的评估指标，它综合考虑了模型的准确率和召回率。Darknet 可以方便地计算 mAP。

修改 obj.data 文件，确保 valid 路径指向你的验证集图片列表文件。

运行以下命令计算 mAP：

Bash

./darknet detector map data/obj.data cfg/yolov4.cfg /path/to/your_trained_weights.weights
# data/obj.data: 你的数据文件
# cfg/yolov4.cfg: 你的配置文件
# /path/to/your_trained_weights.weights: 你训练好的权重文件路径 (通常选择验证集上 mAP 最高或 loss 最低的权重)

输出会显示不同 IoU 阈值下的 Average Precision (AP) 以及它们的平均值 (mAP)。例如：

...
Calculating mAP (mean average precision)...
For class_id = 0 name = cat: [email protected] = 0.856789
For class_id = 1 name = dog: [email protected] = 0.923456
For class_id = 2 name = person: [email protected] = 0.891234
 avg [email protected] = 0.890493
...

[email protected]: 在 IoU 阈值为 0.5 时的平均精确率。
avg [email protected]: 所有类别在 IoU 阈值为 0.5 时的平均 mAP。

通常，avg [email protected] 是最重要的评估指标。一些比赛或研究也会关注更高 IoU 阈值下的 mAP (如 [email protected] 或 [email protected]:0.95，表示在 IoU 从 0.5 到 0.95 以 0.05 为步长的多个阈值下的平均 mAP)。

可视化分析:

将模型应用到新的图片或视频上，直观地查看检测结果。

检测单张图片:

Bash

./darknet detector test data/obj.data cfg/yolov4.cfg /path/to/your_trained_weights.weights /path/to/your_image.jpg
# data/obj.data: 你的数据文件
# cfg/yolov4.cfg: 你的配置文件
# /path/to/your_trained_weights.weights: 训练好的权重文件路径
# /path/to/your_image.jpg: 要检测的图片路径
# -thresh 0.5: (可选) 设置置信度阈值，只显示置信度高于该值的检测框 (默认通常是 0.25)

检测结果会保存在 predictions.jpg 文件中。

检测视频:

Bash

./darknet detector demo data/obj.data cfg/yolov4.cfg /path/to/your_trained_weights.weights /path/to/your_video.mp4 -thresh 0.5 -out_filename results.avi
# ... (前面参数同上)
# /path/to/your_video.mp4: 要检测的视频文件路径
# -out_filename results.avi: (可选) 将检测结果保存为视频文件

这会在窗口中实时显示检测结果。

绘制 loss/mAP 曲线:

Darknet 的训练日志包含了每次迭代的 loss 和 mAP 信息。你可以编写一个 Python 脚本来解析日志文件，并使用 Matplotlib 等库绘制 loss 曲线和 mAP 曲线，以便更直观地分析训练过程。

Python

import matplotlib.pyplot as plt

def parse_log(log_file):
    iterations = []
    losses = []
    ious = []
    maps = [] # 如果使用了 -map 选项

    with open(log_file, 'r') as f:
        for line in f:
            if 'Iteration' in line and 'Avg Loss' in line:
                parts = line.split()
                iterations.append(int(parts[1]))
                losses.append(float(parts[-2]))
                ious.append(float(parts[5])) # Region Avg IOU

            if 'avg [email protected]' in line: # 如果使用了 -map 选项
                parts = line.split()
                # 找到 avg mAP 值，注意日志格式可能略有不同
                try:
                    map_val = float(parts[-1])
                    maps.append((iterations[-1], map_val)) # 记录迭代次数和mAP
                except (ValueError, IndexError):
                    pass # 处理解析错误

    return iterations, losses, ious, maps

# 修改为你的日志文件路径
log_file = 'path/to/your_darknet_train.log'
iterations, losses, ious, maps = parse_log(log_file)

# 绘制 Loss 和 IOU 曲线
plt.figure(figsize=(12, 5))
plt.subplot(1, 2, 1)
plt.plot(iterations, losses)
plt.xlabel('Iteration')
plt.ylabel('Average Loss')
plt.title('Training Loss Curve')

plt.subplot(1, 2, 2)
plt.plot(iterations, ious)
plt.xlabel('Iteration')
plt.ylabel('Region Avg IOU')
plt.title('Training Region Avg IOU Curve')

plt.tight_layout()
plt.show()

# 绘制 mAP 曲线 (如果解析到 mAP 数据)
if maps:
    map_iterations, map_values = zip(*maps)
    plt.figure(figsize=(6, 5))
    plt.plot(map_iterations, map_values)
    plt.xlabel('Iteration')
    plt.ylabel('[email protected]')
    plt.title('Validation mAP Curve')
    plt.show()

将上述脚本保存为 .py 文件，修改 log_file 路径并运行，即可看到训练过程的曲线图。

结论

通过本篇博客，你应该已经了解了 YOLOv4 在 Darknet 框架下的环境配置、数据集准备、模型训练、问题解决、超参数调优以及性能评估的全流程。从实际动手的角度出发，我们详细讲解了每一个步骤，并提供了相应的命令和代码示例。

YOLOv4 是一个强大的目标检测模型，掌握其训练过程是进行目标检测项目的基础。希望这篇博客能够帮助你成功地在自己的数据集上训练出高性能的 YOLOv4 模型。

记住，深度学习模型的训练是一个不断尝试和优化的过程。耐心、细致地检查每一步，并结合训练日志进行分析，你一定能取得好结果。

下一步:

尝试在更大的数据集或更复杂的场景下训练 YOLOv4。
探索 YOLOv4 的其他变种 (如 YOLOv4-tiny) 或更新的模型 (如 YOLOv5, YOLOv7, YOLOv8)。
将训练好的模型部署到实际应用中 (如使用 Darknet 的 C++ API 或将其转换为其他框架格式如 ONNX)。

你可能感兴趣的:(YOLO系列教程,YOLO,目标检测,人工智能)

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
yolo 目标检测600类目标大霸王龙行业+领域+业务场景=定制 YOLO 目标检测人工智能
1.模型架构调整类别适配：将YOLO输出层的类别节点数调整为600（如YOLOv5的detect.yaml中修改nc=600），并更新类别名称映射表（classes.txt）。骨干网络优化：若使用YOLOv5/v8，可升级骨干网络（如C3模块深度）或替换为更高性能的主干（如EfficientNet、ResNet-101），以增强复杂场景的特征提取能力。多尺度检测头：保留或扩展YOLO的多尺度输出（
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
H800核心技术突破与行业应用实战智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
智慧工地系统：建筑行业数字化变革的引领者青云智慧园区 java
在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
yolo检测常见指标 bigdata从入门到放弃深度学习yolo YOLO 目标跟踪人工智能深度学习
YOLO（YouOnlyLookOnce）作为经典的单阶段目标检测算法，其性能评估依赖于目标检测领域的通用指标。这些指标既衡量检测精度（是否准确识别物体类别、准确定位），也衡量检测速度（是否实时）。下面用通俗的语言详细解释核心指标：一、基础：判断“预测框是否有效”——IoU（交并比）目标检测的核心是“预测框”（模型输出的矩形框）是否准确覆盖“真实框”（人工标注的物体位置）。IoU是衡量两者重叠程度
AGI和AIGC傻傻分不清楚，一篇文章告诉你如何分辨！
Look！我们的大模型商业化落地产品更多AI资讯请关注Free三天集训营助教在线为您火热答疑‍什么是AGI(人工通用智能)?AGI是ArtificialGeneralIntelligence的缩写，中文翻译为“通用人工智能”，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。与狭义的人工智能(ANI)不同，狭义的人工智能是为特定领域或问题而设计的，而AGI旨在实现一般的认知能力，能够适应任
新一代数据库：融合多模智能，重塑数据价值
一、场景重塑产业格局：数据库“融合进化”AI浪潮奔涌而至，数字产业格局加速重构。云计算、移动互联、万物互联（IoT）、人工智能（AI）等技术的深度融合与快速落地，正以前所未有的速度重塑着企业的应用形态。新业务场景层出不穷——从高并发的在线交易、实时精准的分析决策，到海量物联网设备监控、基于图关系的风控反欺诈，再到AI驱动的智能推荐与内容生成，应用场景的多样性与复杂性已突破传统数据库的能力边界。这对
基于知识图谱技术增强大模型RAG知识库应用效果罗伯特之技术屋知识图谱人工智能
【摘要】本文是AI落地实践的优秀案例，利用RAG技术（Retrieval-AugmentedGeneration，检索增强生成）的知识库实践为背景，介绍了RAG技术的发展及存在的不足，以及知识图谱相关的知识，利用RAG技术去完善和智能化知识图谱。在AI技术大量涌现，但应用不足的情况下，指明了现有应用场景、技术与AI结合的具体做法。1.引言随着人工智能技术的加速演进，AI大模型如雨后春笋般纷纷涌现，
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默