吴师兄大模型

PyTorch实战：基于 PyTorch 和 ResNet 预训练模型的迁移学习实战（猫狗分类）

Langchain系列文章目录

01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南
02-玩转 LangChain Memory 模块：四种记忆类型详解及应用场景全覆盖
03-全面掌握 LangChain：从核心链条构建到动态任务分配的实战指南
04-玩转 LangChain：从文档加载到高效问答系统构建的全程实战
05-玩转 LangChain：深度评估问答系统的三种高效方法（示例生成、手动评估与LLM辅助评估）
06-从 0 到 1 掌握 LangChain Agents：自定义工具 + LLM 打造智能工作流！

系列文章目录

Pytorch基础篇

01-PyTorch新手必看：张量是什么？5 分钟教你快速创建张量！
02-张量运算真简单！PyTorch 数值计算操作完全指南
03-Numpy 还是 PyTorch？张量与 Numpy 的神奇转换技巧
04-揭秘数据处理神器：PyTorch 张量拼接与拆分实用技巧
05-深度学习从索引开始：PyTorch 张量索引与切片最全解析
06-张量形状任意改！PyTorch reshape、transpose 操作超详细教程
07-深入解读 PyTorch 张量运算：6 大核心函数全面解析，代码示例一步到位！
08-自动微分到底有多强？PyTorch 自动求导机制深度解析

Pytorch实战篇

09-从零手写线性回归模型：PyTorch 实现深度学习入门教程
10-PyTorch 框架实现线性回归：从数据预处理到模型训练全流程
11-PyTorch 框架实现逻辑回归：从数据预处理到模型训练全流程
12-PyTorch 框架实现多层感知机（MLP）：手写数字分类全流程详解
13-PyTorch 时间序列与信号处理全解析：从预测到生成
14-深度学习必备：PyTorch数据加载与预处理全解析
15-PyTorch实战：手把手教你完成MNIST手写数字识别任务
16-PyTorch 训练循环全攻略：从零到精通的深度学习秘籍
17-PyTorch实现CNN：CIFAR-10图像分类实战教程
18-RNN 实战指南：用 PyTorch 从零实现文本分类
19-PyTorch实战：基于 PyTorch 和 ResNet 预训练模型的迁移学习实战（猫狗分类）

文章目录

Langchain系列文章目录
系列文章目录
前言
一、什么是迁移学习
- 1.1 核心概念
- 1.2 为何需要迁移学习
- 1.3 迁移学习的主要方式
二、预训练模型：巨人的肩膀
- 2.1 什么是预训练模型
- 2.2 ResNet 模型简介
- 2.3 为何选择 ResNet
三、实战：使用 ResNet 微调进行猫狗分类
- 3.1 环境准备与数据加载
- - 3.1.1 安装 PyTorch 和 TorchVision
  - 3.1.2 数据集准备
  - 3.1.3 数据预处理与增强
  - 3.1.4 创建 DataLoader
- 3.2 加载预训练 ResNet 模型
- - 3.2.1 导入模型
  - 3.2.2 理解模型结构
- 3.3 修改模型以适应新任务
- - 3.3.1 冻结部分层参数 (可选但常用)
  - 3.3.2 替换或修改分类层
- 3.4 定义损失函数和优化器
- - 3.4.1 损失函数
  - 3.4.2 优化器
- 3.5 训练与验证模型
- - 3.5.1 训练循环
  - 3.5.2 启动训练
  - 3.5.3 模型保存
- 3.6 完整代码示例 (整合)
四、常见问题与进阶技巧
- 4.1 如何选择合适的预训练模型？
- 4.2 如何设置学习率？
- 4.3 过拟合与欠拟合怎么办？
- 4.4 进一步提升性能？
五、总结

前言

在深度学习领域，尤其是在计算机视觉任务中，从零开始训练一个高性能的模型往往需要海量的数据和强大的计算资源。然而，现实项目中我们常常面临数据量有限、标注成本高昂或训练时间紧迫等挑战。这时，“迁移学习”（Transfer Learning）便成为了一个强大而高效的解决方案。它允许我们站在“巨人”的肩膀上，利用在大规模数据集（如 ImageNet）上预训练好的模型作为起点，针对我们自己的特定任务进行微调（Fine-tuning），从而在数据相对较少的情况下，也能快速构建出性能优异的模型。

本文作为 PyTorch 实战篇 系列的第三篇，将聚焦于迁移学习的核心思想与实践。我们将以经典的“猫狗分类”任务为例，手把手教你如何利用 PyTorch 加载强大的预训练模型 ResNet，并通过微调技术，高效地训练一个准确的图像分类器。无论你是深度学习初学者，还是希望提升模型性能的进阶者，都能从中获益。

一、什么是迁移学习

1.1 核心概念

迁移学习，顾名思义，就是将从一个任务（源任务）中学到的知识“迁移”到另一个相关但不完全相同的任务（目标任务）上。

想象一下，你学会了骑自行车（源任务），这个过程中你掌握了平衡、转向等基本技能。当你再去学骑摩托车（目标任务）时，虽然摩托车更复杂，但你之前学到的平衡感和转向技巧依然适用，让你能更快上手。这就是迁移学习的直观类比。

在深度学习中，源任务通常是在一个非常庞大的通用数据集（如包含1000类物体的 ImageNet）上训练模型。这个过程中，模型学会了识别图像的各种底层和高层特征，比如边缘、纹理、形状，甚至是一些物体的部件。这些学到的特征对于许多其他的视觉任务（目标任务，如我们的猫狗分类）同样具有很强的泛化能力。

1.2 为何需要迁移学习

迁移学习之所以备受青睐，主要得益于以下几个显著优势：

数据需求减少: 目标任务不再需要庞大的标注数据集。利用预训练模型学到的通用特征，我们只需要相对少量的数据就能进行有效的微调。
训练时间缩短: 基于预训练模型的权重进行微调，模型的起点更好，收敛速度通常比从零开始训练快得多。
模型性能提升: 预训练模型在大数据集上学到的特征表示通常非常强大和鲁棒，有助于提升模型在目标任务上的泛化能力和最终性能，尤其是在目标数据有限时。
降低计算成本: 缩短了训练时间，也就意味着减少了 GPU/TPU 等计算资源的使用。

1.3 迁移学习的主要方式

迁移学习在实践中主要有两种常见方式：

特征提取（Feature Extraction）: 将预训练模型（通常是卷积层部分）当作一个固定的特征提取器。输入图像通过预训练模型，得到其特征表示（通常是某个中间层或最后卷积层的输出），然后只训练一个新的、简单的分类器（如全连接层）来处理这些提取到的特征，完成目标任务。预训练模型的权重在此过程中保持不变（冻结）。
微调（Fine-tuning）: 加载预训练模型的权重，并替换掉模型原有的、针对源任务的分类头（如最后的全连接层）。然后，使用目标任务的数据对模型的部分或全部层的权重进行“微调”，使其更适应新任务。通常，我们会“冻结”模型早期的卷积层（它们学习的是通用特征），只微调后面的层和新加的分类层，或者以较小的学习率微调所有层。

本文将重点介绍和实践第二种方式：微调。

二、预训练模型：巨人的肩膀

2.1 什么是预训练模型

预训练模型（Pre-trained Model）是指已经在一个大型基准数据集上（最著名的是 ImageNet 数据集，包含超过百万张图像和1000个类别）训练好的神经网络模型。这些模型通常由顶尖的研究机构或公司开发和训练，耗费了大量的计算资源，其学到的权重参数蕴含了丰富的通用视觉知识。

常见的图像领域预训练模型包括：

AlexNet
VGG (VGG16, VGG19)
GoogLeNet / Inception
ResNet (ResNet18, ResNet34, ResNet50, ResNet101, ResNet152)
DenseNet
EfficientNet
Vision Transformer (ViT)
… 等等

PyTorch 通过 torchvision.models 模块提供了许多常用的预训练模型及其权重，方便我们直接加载使用。

2.2 ResNet 模型简介

ResNet（Residual Network，残差网络）是深度学习发展史上的一个里程碑式模型，由 Kaiming He 等人在 2015 年提出。它巧妙地引入了“残差块”（Residual Block）结构，解决了深度神经网络训练中常见的梯度消失/梯度爆炸问题，使得训练非常深的网络（甚至超过1000层）成为可能。

其核心思想是：与其让网络层直接学习目标映射 $H (x)$ ，不如让它学习残差映射 $F (x) = H (x) - x$ ，其中 $x$ 是该层的输入。原始的目标映射则变为 $H (x) = F (x) + x$ 。这个 $+ x$ 的操作通过一个“快捷连接”（Shortcut Connection）或“跳跃连接”（Skip Connection）实现，直接将输入 $x$ 添加到后面层的输出上。

残差块

快捷连接

卷积层/激活层...

输入 x

输出 H(x)

这种结构使得信息可以直接跨层传播，梯度也更容易回传，极大地提升了深层网络的训练效率和性能。

2.3 为何选择 ResNet

在众多的预训练模型中，ResNet 因其以下优点而成为迁移学习的热门选择：

性能优异: 在 ImageNet 等多个基准数据集上表现出色。
结构灵活: 有不同深度（层数）的版本（如 ResNet18, ResNet34, ResNet50 等），可以根据任务复杂度和计算资源进行选择。层数较少的版本（如 ResNet18/34）计算量相对较小，适合快速实验和资源受限的场景。
广泛可用: 在主流深度学习框架（如 PyTorch, TensorFlow）中都有现成的实现和预训练权重。
效果稳定: 相较于一些更复杂的模型，ResNet 的训练通常更加稳定。

因此，在本实战中，我们选择 ResNet（具体选择如 ResNet18 或 ResNet34，因其效率较高）作为我们的预训练模型。

三、实战：使用 ResNet 微调进行猫狗分类

接下来，我们将一步步展示如何使用 PyTorch 加载预训练的 ResNet 模型，并对其进行微调，以完成猫狗图像的二分类任务。

3.1 环境准备与数据加载

3.1.1 安装 PyTorch 和 TorchVision

确保你的 Python 环境中安装了 PyTorch 和 TorchVision。如果尚未安装，可以通过 pip 或 conda 安装：

# 使用 pip 安装
pip install torch torchvision torchaudio

# 或者使用 conda 安装 (根据你的 CUDA 版本选择合适的命令，参考 PyTorch 官网)
# conda install pytorch torchvision torchaudio cudatoolkit=x.x -c pytorch

3.1.2 数据集准备

你需要一个包含猫和狗图像的数据集。一个常见的数据集是 Kaggle 上的 “Dogs vs. Cats” 竞赛数据集。你需要将其整理成 PyTorch ImageFolder 能够识别的格式，通常是这样：

/path/to/your/dataset/
├── train/
│   ├── cat/
│   │   ├── cat.0.jpg
│   │   ├── cat.1.jpg
│   │   └── ...
│   └── dog/
│       ├── dog.0.jpg
│       ├── dog.1.jpg
│       └── ...
└── val/  (或者 test)
    ├── cat/
    │   ├── cat.10000.jpg
    │   └── ...
    └── dog/
        ├── dog.10000.jpg
        └── ...

其中，train 目录包含训练图片，val 目录包含验证图片（用于模型选择和评估）。每个目录下再按类别（cat, dog）分子目录存放对应的图片。

3.1.3 数据预处理与增强

使用 torchvision.transforms 来定义数据预处理和数据增强操作。对于预训练模型，关键一步 是使用其在 ImageNet 上训练时所用的相同的归一化参数。

import torch
import torchvision
from torchvision import transforms, datasets
from torch.utils.data import DataLoader

# 定义数据变换
# 注意：预训练模型通常在 ImageNet 数据集上训练，需要使用其均值和标准差进行归一化
# ImageNet 均值和标准差
mean = [0.485, 0.456, 0.406]
std = [0.229, 0.224, 0.225]

data_transforms = {
    'train': transforms.Compose([
        transforms.RandomResizedCrop(224), # 随机裁剪并缩放到 224x224
        transforms.RandomHorizontalFlip(), # 随机水平翻转
        transforms.ToTensor(),             # 转换为 Tensor
        transforms.Normalize(mean, std)    # 归一化
    ]),
    'val': transforms.Compose([
        transforms.Resize(256),            # 缩放到 256x256
        transforms.CenterCrop(224),        # 中心裁剪到 224x224
        transforms.ToTensor(),             # 转换为 Tensor
        transforms.Normalize(mean, std)    # 归一化
    ]),
}

# 数据集路径 (请替换成你的实际路径)
data_dir = '/path/to/your/dataset'

RandomResizedCrop(224): 对于训练集，随机裁剪输入图像到 224x224 大小，这是一种常用的数据增强手段。ResNet 通常使用 224x224 的输入。
RandomHorizontalFlip(): 随机以 50% 的概率水平翻转图像，增加数据多样性。
Resize(256) 和 CenterCrop(224): 对于验证集，通常先将图像等比例缩放到稍大尺寸（如 256x256），然后从中心裁剪出 224x224，以获得稳定的评估结果。
ToTensor(): 将 PIL 图像或 NumPy ndarray 转换为 PyTorch Tensor，并将像素值从 [0, 255] 缩放到 [0.0, 1.0]。
Normalize(mean, std): 使用 ImageNet 的均值和标准差对图像进行归一化。这是使用预训练模型时非常重要的一步！

3.1.4 创建 DataLoader

使用 datasets.ImageFolder 加载数据，并用 DataLoader 创建数据加载器，以便在训练时按批次（batch）加载数据。

# 加载数据集
image_datasets = {x: datasets.ImageFolder(f"{data_dir}/{x}", data_transforms[x])
                  for x in ['train', 'val']}

# 创建数据加载器
dataloaders = {x: DataLoader(image_datasets[x], batch_size=32, # 可调整 batch size
                             shuffle=True if x == 'train' else False, # 训练集打乱，验证集不打乱
                             num_workers=4) # 可调整工作进程数
               for x in ['train', 'val']}

# 获取数据集大小和类别名称
dataset_sizes = {x: len(image_datasets[x]) for x in ['train', 'val']}
class_names = image_datasets['train'].classes
num_classes = len(class_names)

print(f"训练集大小: {dataset_sizes['train']}")
print(f"验证集大小: {dataset_sizes['val']}")
print(f"类别名称: {class_names}") # 输出应为 ['cat', 'dog'] 或类似
print(f"类别数量: {num_classes}")   # 输出应为 2

3.2 加载预训练 ResNet 模型

3.2.1 导入模型

使用 torchvision.models 来加载预训练的 ResNet 模型。这里我们以 ResNet18 为例。设置 pretrained=True 会自动下载并加载 ImageNet 上的预训练权重。

import torchvision.models as models
import torch.nn as nn

# 加载预训练的 ResNet18 模型
model_ft = models.resnet18(pretrained=True)
# 如果你想用 ResNet34 或 ResNet50，只需替换：
# model_ft = models.resnet34(pretrained=True)
# model_ft = models.resnet50(pretrained=True)

print("原始 ResNet18 模型结构:")
# print(model_ft) # 可以取消注释这行来查看完整结构

3.2.2 理解模型结构

打印模型结构（如取消上面代码的注释）会显示 ResNet 的所有层。你会注意到最后通常有一个名为 fc（全连接）的层，它的输出维度是 1000，对应 ImageNet 的 1000 个类别。我们需要修改这一层以适应我们的猫狗二分类任务。

3.3 修改模型以适应新任务

3.3.1 冻结部分层参数 (可选但常用)

为了保留预训练模型学到的通用特征，并加速训练，我们通常会“冻结”模型早期的卷积层，使其在训练过程中权重不被更新。只训练后面的层和我们新添加的分类层。

# 冻结所有卷积层的参数 (可选策略)
# for param in model_ft.parameters():
#     param.requires_grad = False

# 更精细的策略：只冻结部分层，或完全不冻结（让所有层都微调，但可能需要更小的学习率）
# 例如，冻结除了最后几个 block 之外的所有层
# ct = 0
# for child in model_ft.children():
#     ct += 1
#     if ct < 7: # 假设我们想冻结前 6 个 'child' 模块 (这需要根据具体模型结构调整)
#         for param in child.parameters():
#             param.requires_grad = False

# 简单的策略：先冻结所有，再解冻最后的全连接层（将在下一步替换）
for param in model_ft.parameters():
    param.requires_grad = False

注意: 冻结哪些层是一个可以调整的超参数。如果你的目标任务与 ImageNet 非常相似且数据量充足，可以考虑微调更多层甚至所有层。如果数据量很少，冻结大部分层通常效果更好。

3.3.2 替换或修改分类层

ResNet 原始的 fc 层是为 ImageNet 的 1000 类设计的。我们需要将其替换为一个新的全连接层，其输出维度等于我们的目标任务类别数（猫狗分类为 2）。

# 获取原始全连接层的输入特征数
num_ftrs = model_ft.fc.in_features
print(f"原始 FC 层输入特征数: {num_ftrs}")

# 创建一个新的全连接层，替换掉原来的 fc 层
# 输出维度为我们的类别数 (num_classes = 2)
model_ft.fc = nn.Linear(num_ftrs, num_classes)

print("\n修改后的模型结构 (只看最后部分):")
print(model_ft.fc)

# 确保新的全连接层的参数是可训练的 (如果之前冻结了所有层)
for param in model_ft.fc.parameters():
    param.requires_grad = True

# 将模型移动到 GPU (如果可用)
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model_ft = model_ft.to(device)
print(f"\n模型已移动到: {device}")

现在，model_ft 就是我们准备好用于微调的模型了。只有最后的全连接层（以及可能解冻的其他层）的参数会在训练中更新。

3.4 定义损失函数和优化器

3.4.1 损失函数

对于多分类（包括二分类）任务，交叉熵损失（Cross Entropy Loss）是标准的损失函数。

criterion = nn.CrossEntropyLoss()

3.4.2 优化器

选择一个优化器，如 SGD 或 Adam。关键点：优化器应该只更新那些 requires_grad=True 的参数。我们可以通过过滤模型的参数列表来实现这一点。同时，为微调设置一个合适的学习率通常比从零训练要小。

import torch.optim as optim
from torch.optim import lr_scheduler

# 定义优化器 - 只优化需要更新的参数
# 将 model_ft.parameters() 替换为只包含 requires_grad=True 的参数列表
params_to_update = model_ft.parameters()
print("需要更新的参数:")
params_to_update_list = []
for name,param in model_ft.named_parameters():
    if param.requires_grad == True:
        params_to_update_list.append(param)
        # print("\t",name) # 取消注释可查看具体哪些参数会被更新

# 使用 Adam 优化器
optimizer_ft = optim.Adam(params_to_update_list, lr=0.001) # 学习率可以调整

# (可选) 添加学习率调度器，例如每隔 N 个 epoch 降低学习率
# exp_lr_scheduler = lr_scheduler.StepLR(optimizer_ft, step_size=7, gamma=0.1)

3.5 训练与验证模型

现在我们可以编写标准的 PyTorch 训练和验证循环。

3.5.1 训练循环

import time
import copy

def train_model(model, criterion, optimizer, # scheduler, # 如果使用了学习率调度器
                num_epochs=25):
    since = time.time()

    best_model_wts = copy.deepcopy(model.state_dict())
    best_acc = 0.0

    for epoch in range(num_epochs):
        print(f'Epoch {epoch}/{num_epochs - 1}')
        print('-' * 10)

        # 每个 epoch 分为训练和验证阶段
        for phase in ['train', 'val']:
            if phase == 'train':
                model.train()  # 设置模型为训练模式
            else:
                model.eval()   # 设置模型为评估模式

            running_loss = 0.0
            running_corrects = 0

            # 迭代数据
            for inputs, labels in dataloaders[phase]:
                inputs = inputs.to(device)
                labels = labels.to(device)

                # 清零梯度
                optimizer.zero_grad()

                # 前向传播
                # 只在训练阶段跟踪历史记录
                with torch.set_grad_enabled(phase == 'train'):
                    outputs = model(inputs)
                    _, preds = torch.max(outputs, 1) # 获取预测结果
                    loss = criterion(outputs, labels)

                    # 只在训练阶段进行反向传播和优化
                    if phase == 'train':
                        loss.backward()
                        optimizer.step()

                # 统计损失和准确率
                running_loss += loss.item() * inputs.size(0)
                running_corrects += torch.sum(preds == labels.data)

            # # 如果使用学习率调度器，则在训练阶段后更新学习率
            # if phase == 'train' and scheduler is not None:
            #      scheduler.step()

            epoch_loss = running_loss / dataset_sizes[phase]
            epoch_acc = running_corrects.double() / dataset_sizes[phase]

            print(f'{phase} Loss: {epoch_loss:.4f} Acc: {epoch_acc:.4f}')

            # 如果是验证阶段，并且当前准确率是最好的，则保存模型权重
            if phase == 'val' and epoch_acc > best_acc:
                best_acc = epoch_acc
                best_model_wts = copy.deepcopy(model.state_dict())
                print(f'找到更好的模型，验证集准确率: {best_acc:.4f}')


        print()

    time_elapsed = time.time() - since
    print(f'训练完成，耗时 {time_elapsed // 60:.0f}m {time_elapsed % 60:.0f}s')
    print(f'最佳验证集准确率: {best_acc:4f}')

    # 加载最佳模型权重
    model.load_state_dict(best_model_wts)
    return model

3.5.2 启动训练

调用 train_model 函数开始训练。

# 开始训练模型
model_ft = train_model(model_ft, criterion, optimizer_ft, # exp_lr_scheduler, # 如果使用调度器
                       num_epochs=15) # 可以调整训练轮数

3.5.3 模型保存

训练完成后，model_ft 变量中包含了在验证集上表现最好的模型权重。你可以将其保存到文件，以便后续使用或部署。

# 保存训练好的模型
model_save_path = 'resnet18_finetuned_catdog.pth'
torch.save(model_ft.state_dict(), model_save_path)
print(f"最佳模型已保存至: {model_save_path}")

# 如何加载已保存的模型 (示例)
# model_loaded = models.resnet18(pretrained=False) # 注意这里 pretrained=False
# num_ftrs = model_loaded.fc.in_features
# model_loaded.fc = nn.Linear(num_ftrs, num_classes)
# model_loaded.load_state_dict(torch.load(model_save_path))
# model_loaded = model_loaded.to(device)
# model_loaded.eval() # 设置为评估模式

3.6 完整代码示例 (整合)

# -----------------------------------
# --- 导入必要的库 ---
# -----------------------------------
import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim import lr_scheduler
import torchvision
from torchvision import datasets, models, transforms
import time
import os
import copy

print("PyTorch Version: ", torch.__version__)
print("Torchvision Version: ", torchvision.__version__)

# -----------------------------------
# --- 1. 数据准备与加载 ---
# -----------------------------------
# 数据集路径 (!!!请务必修改为你的实际路径!!!)
data_dir = '/path/to/your/cat_dog_dataset' # 例如 './data/cats_vs_dogs_small'

# 数据变换 (使用 ImageNet 均值和标准差)
mean = [0.485, 0.456, 0.406]
std = [0.229, 0.224, 0.225]

data_transforms = {
    'train': transforms.Compose([
        transforms.RandomResizedCrop(224),
        transforms.RandomHorizontalFlip(),
        transforms.ToTensor(),
        transforms.Normalize(mean, std)
    ]),
    'val': transforms.Compose([
        transforms.Resize(256),
        transforms.CenterCrop(224),
        transforms.ToTensor(),
        transforms.Normalize(mean, std)
    ]),
}

# 创建数据集
image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x), data_transforms[x])
                  for x in ['train', 'val']}

# 创建数据加载器
dataloaders = {x: torch.utils.data.DataLoader(image_datasets[x], batch_size=32,
                                             shuffle=True if x == 'train' else False, num_workers=4)
               for x in ['train', 'val']}

dataset_sizes = {x: len(image_datasets[x]) for x in ['train', 'val']}
class_names = image_datasets['train'].classes
num_classes = len(class_names)

# 检查设备
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print(f"将在 {device} 上进行训练...")
print(f"类别: {class_names}")

# -----------------------------------
# --- 2. 加载和修改预训练模型 ---
# -----------------------------------
# 加载预训练的 ResNet18
model_ft = models.resnet18(pretrained=True)

# (可选) 冻结模型的部分或全部层
freeze_layers = True # 设置为 False 则微调所有层
if freeze_layers:
    for param in model_ft.parameters():
        param.requires_grad = False

# 获取最后一层输入特征数，并替换为新的适应我们任务的层
num_ftrs = model_ft.fc.in_features
model_ft.fc = nn.Linear(num_ftrs, num_classes)

# 将模型移到指定设备
model_ft = model_ft.to(device)

# 打印需要更新的参数 (确认哪些层被冻结/解冻)
print("\n需要更新梯度的参数:")
params_to_update = []
for name, param in model_ft.named_parameters():
    if param.requires_grad:
        params_to_update.append(param)
        print("\t", name)

# -----------------------------------
# --- 3. 定义损失函数和优化器 ---
# -----------------------------------
criterion = nn.CrossEntropyLoss()

# 只优化 requires_grad=True 的参数
optimizer_ft = optim.Adam(params_to_update, lr=0.001) # 学习率可调

# (可选) 学习率调度器
# exp_lr_scheduler = lr_scheduler.StepLR(optimizer_ft, step_size=7, gamma=0.1)

# -----------------------------------
# --- 4. 训练和验证函数 ---
# -----------------------------------
def train_model(model, criterion, optimizer, # scheduler, # 如果使用调度器
                num_epochs=25):
    since = time.time()
    best_model_wts = copy.deepcopy(model.state_dict())
    best_acc = 0.0
    val_acc_history = [] # 记录验证集准确率历史

    for epoch in range(num_epochs):
        print(f'Epoch {epoch}/{num_epochs - 1}')
        print('-' * 10)

        for phase in ['train', 'val']:
            if phase == 'train':
                model.train()
            else:
                model.eval()

            running_loss = 0.0
            running_corrects = 0

            for inputs, labels in dataloaders[phase]:
                inputs = inputs.to(device)
                labels = labels.to(device)

                optimizer.zero_grad()

                with torch.set_grad_enabled(phase == 'train'):
                    outputs = model(inputs)
                    loss = criterion(outputs, labels)
                    _, preds = torch.max(outputs, 1)

                    if phase == 'train':
                        loss.backward()
                        optimizer.step()

                running_loss += loss.item() * inputs.size(0)
                running_corrects += torch.sum(preds == labels.data)

            # # 更新学习率
            # if phase == 'train' and scheduler is not None:
            #     scheduler.step()

            epoch_loss = running_loss / dataset_sizes[phase]
            epoch_acc = running_corrects.double() / dataset_sizes[phase]

            print(f'{phase} Loss: {epoch_loss:.4f} Acc: {epoch_acc:.4f}')

            if phase == 'val':
                val_acc_history.append(epoch_acc) # 记录验证准确率
                if epoch_acc > best_acc:
                    best_acc = epoch_acc
                    best_model_wts = copy.deepcopy(model.state_dict())
                    print(f'  >> 新的最佳验证准确率: {best_acc:.4f}')

        print()

    time_elapsed = time.time() - since
    print(f'训练完成，耗时 {time_elapsed // 60:.0f}m {time_elapsed % 60:.0f}s')
    print(f'最佳验证集准确率 (Best Val Acc): {best_acc:4f}')

    model.load_state_dict(best_model_wts)
    return model, val_acc_history

# -----------------------------------
# --- 5. 开始训练 ---
# -----------------------------------
# 设置训练轮数
num_training_epochs = 15 # 可根据需要调整

# 训练！
model_ft_trained, val_acc_hist = train_model(model_ft, criterion, optimizer_ft,
                                            # exp_lr_scheduler, # 如果使用调度器
                                             num_epochs=num_training_epochs)

# -----------------------------------
# --- 6. 保存模型 ---
# -----------------------------------
model_save_path = 'resnet18_finetuned_catdog_final.pth'
torch.save(model_ft_trained.state_dict(), model_save_path)
print(f"\n训练好的模型已保存至: {model_save_path}")

# (可选) 可视化训练过程中的验证准确率
# import matplotlib.pyplot as plt
# plt.figure()
# plt.title("Validation Accuracy vs. Number of Training Epochs")
# plt.xlabel("Training Epochs")
# plt.ylabel("Validation Accuracy")
# # 需要将 Tensor 类型的准确率转换为 Python float
# plt.plot(range(1, num_training_epochs+1), [acc.cpu().numpy() for acc in val_acc_hist])
# plt.ylim((0,1.))
# plt.xticks(range(1, num_training_epochs+1))
# plt.legend()
# plt.show()

请务必将代码中的 /path/to/your/cat_dog_dataset 替换为你自己存放猫狗数据集的实际路径！

四、常见问题与进阶技巧

4.1 如何选择合适的预训练模型？

任务相似度: 目标任务与预训练任务（通常是 ImageNet 分类）越相似，迁移效果通常越好。猫狗分类与 ImageNet 的物体识别任务相关度较高。
数据集大小: 目标数据集非常小时，选择层数较少、参数量较小的模型（如 ResNet18/34）并冻结大部分层可能更稳妥，防止过拟合。数据集稍大时，可以尝试更深的模型（ResNet50+）或微调更多层。
计算资源: 更深、更宽的模型（如 ResNet152, EfficientNet-B7）性能可能更好，但也需要更多的显存和计算时间。根据你的硬件条件选择。
模型特性: 不同的模型架构各有侧重，例如 EfficientNet 在效率（性能与计算量平衡）上做了优化。可以查阅相关论文或基准测试结果进行选择。

4.2 如何设置学习率？

基础学习率: 微调时通常使用比从零训练更小的学习率，例如 1e-3 到 1e-4。
差异化学习率 (Differential Learning Rates): 一个常见的技巧是为模型的不同部分设置不同的学习率。例如，对新添加的分类层使用较大的学习率（因为它需要从随机初始化开始学习），而对预训练的、被解冻的卷积层使用非常小的学习率（因为它们只需要微小的调整）。在 PyTorch 中，可以在定义优化器时传入多个参数组，每个组指定不同的学习率。
```
# 示例：差异化学习率
fc_params = list(map(id, model_ft.fc.parameters()))
base_params = filter(lambda p: id(p) not in fc_params, model_ft.parameters())
optimizer = optim.Adam([
    {'params': base_params, 'lr': 1e-4}, # 预训练层使用较小学习率
    {'params': model_ft.fc.parameters(), 'lr': 1e-3} # 新分类层使用较大学习率
], lr=1e-3) # 默认学习率（虽然这里被覆盖了）
```
学习率调度器 (Learning Rate Scheduler): 在训练过程中动态调整学习率，如 StepLR（按步长衰减）、ReduceLROnPlateau（当指标不再提升时衰减）等，有助于模型更好地收敛和跳出局部最优。

4.3 过拟合与欠拟合怎么办？

过拟合 (Overfitting): 模型在训练集上表现很好，但在验证集上表现差。
- 解决方法:
  - 增加数据: 获取更多标注数据或使用更强的数据增强技术 (e.g., transforms.ColorJitter, transforms.RandomRotation, Mixup, CutMix)。
  - 减少模型复杂度: 使用更浅的网络（如 ResNet18 而非 ResNet50），或者冻结更多的层。
  - 正则化: 在优化器中增加 weight_decay（L2 正则化），或者使用 Dropout (虽然在预训练模型微调时，有时效果不明显或需要谨慎使用)。
  - 早停 (Early Stopping): 监控验证集性能，在性能不再提升时停止训练。我们的 train_model 函数实际上已经实现了保存最佳模型权重的逻辑，这也是一种形式的早停。
欠拟合 (Underfitting): 模型在训练集和验证集上表现都不好。
- 解决方法:
  - 增加模型复杂度: 使用更深或更宽的网络，或者解冻/微调更多的预训练层。
  - 训练更长时间: 确保模型有足够的时间学习。
  - 调整学习率: 学习率可能过小，尝试增大一点或使用更有效的学习率策略。
  - 检查数据预处理: 确保数据加载和预处理步骤正确无误。
  - 换用更好的预训练模型: 当前模型可能不足以捕捉数据的复杂性。

4.4 进一步提升性能？

更强的预训练模型: 尝试 VGG, Inception, DenseNet, EfficientNet, ViT 等其他预训练模型。
更丰富的数据增强: 探索 AutoAugment, RandAugment, Mixup, CutMix 等高级数据增强策略。
集成学习 (Ensemble Methods): 训练多个不同的模型（或同一模型使用不同初始化/数据子集训练），并将它们的预测结果进行融合（如投票或平均）。
优化器选择: 尝试不同的优化器，如 SGD with momentum, AdamW 等，并仔细调整其超参数。
超参数调优: 使用网格搜索、随机搜索或贝叶斯优化等方法系统地寻找最佳的超参数组合（学习率、batch size、冻结策略、优化器参数等）。
测试时增强 (Test Time Augmentation, TTA): 在预测阶段，对输入图像进行多种增强（如翻转、不同裁剪），分别预测后综合结果，可以提高预测的鲁棒性。

五、总结

本文详细介绍了迁移学习的核心概念、优势及其在 PyTorch 中的实战应用。我们通过一个经典的猫狗分类任务，演示了如何利用强大的预训练模型 ResNet 进行微调，从而高效地构建高性能图像分类器。核心步骤总结如下：

理解迁移学习: 认识到其价值在于利用已有知识加速学习、减少数据依赖并提升模型性能。
选择预训练模型: 了解 ResNet 等常用模型的特点，并根据任务需求选择合适的模型（如 ResNet18）。
数据准备: 使用 torchvision.transforms 进行数据预处理和增强，关键是使用与预训练模型一致的归一化参数。利用 ImageFolder 和 DataLoader 高效加载数据。
模型加载与修改: 使用 torchvision.models 加载预训练权重 (pretrained=True)，并**替换掉模型的最后一层（分类头）**以适应目标任务的类别数量。
微调策略: (可选但常用) 冻结部分或全部预训练层的参数 (requires_grad=False)，只训练新添加的层或少量解冻的层，以保留通用特征并防止过拟合。
定义训练组件: 选择合适的损失函数（如 nn.CrossEntropyLoss）和优化器（如 Adam, SGD），注意优化器只应更新 requires_grad=True 的参数，并通常设置较小的学习率。
训练与验证: 编写标准的训练循环，包含前向传播、损失计算、反向传播和参数更新。在验证集上评估模型性能，并保存表现最佳的模型权重。
问题排查与进阶: 了解如何根据训练/验证曲线判断过拟合或欠拟合，并掌握相应的解决策略，以及进一步提升性能的技巧（如差异化学习率、更强模型、高级增强等）。

通过掌握迁移学习，你可以显著提升在各种计算机视觉任务（甚至扩展到 NLP 等领域）中的开发效率和模型效果，尤其是在数据有限的情况下。希望本文能为你打开迁移学习的大门，并在你的 PyTorch 实战之路上提供有力的支持！

你可能感兴趣的:(PyTorch,pytorch,迁移学习,分类,ResNet,猫狗分类,人工智能,深度学习)

三件事—小白猫·雨天·八段锦咸鱼月亮
1.最近楼下出现一只非常漂亮的粘人小白猫，看着不像是流浪猫，非常亲人。眼睛比蓝球的还大，而且是绿色的，很漂亮。第一次遇到它，它就跟我到电梯口，如果我稍微招招手，肯定就跟我进电梯了。后来我喂过它几次，好可惜不能养它，一只蓝球就是我的极限了。2.下雨天就心烦，好奇怪。明明以前我超爱看窗外的雨和听雨声，看来近来的心情不够宁静了。3.最近在练八段锦，从第一次就爱上了这个运动，很轻松缓慢，但是却出汗。感觉可
冯玙哲诗歌。你的微笑。冯玙哲
图片发自App黑夜的河流流过我的臂弯静谧的爱情无声无息的穿行关于一首诗的故事，没有苍凉说好的相聚，总会有日子分分离离总要团圆谁在你的玻璃上写下名字诗句上泛滥着生与死长久的相依依靠着你的承诺，才站立着望见远方火热的太阳，优雅的月亮明媚的笑靥背后藏匿的悲伤总让人疼痛一天过去，寺庙的钟声没有响起一束束鲜花灿烂，姑娘的背囊里有猫古老的瓷器，破烂的木头，多肉花盆不经意的就触碰了爱人的眼泪于是我匍匐在路上，夜
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
绕口令集合（每日练习）蓉女侠
八百标兵奔北坡，炮兵并排北边跑，炮兵怕把标兵碰，标兵怕碰炮兵炮。炮兵攻打八面坡，排排炮弹齐发射。步兵攻打八面坡，歼敌八千八百八十多。调到敌岛打特盗，特盗太刁投短刀，挡推顶打短刀掉，踏盗得刀盗打倒。哥挎瓜筐过宽沟，赶快过沟看怪狗，光看怪狗瓜筐扣，瓜滚筐空哥怪狗。一位爷爷他姓顾，上街打醋又买布。买了布，打了醋，回头看见鹰抓兔。放下布，搁下醋，上前去追鹰和兔。飞了鹰，跑了兔，打翻醋，醋湿布。牛郎恋刘娘，
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
散步随记拂尘记
2018.4.27一个人散步，有人在跳舞，有人带着孩子玩，有人在跑步，有人牵着宠物狗……有人在跳舞，有人在带孩子胡思乱想，任思绪飘荡。在这个人生中点，回望前半生，展望后半生，有时候想想，谁都不知道明天会发生什么，明天会怎样，一切顺其自然吧，最好。常常会想，是不是已经江郎才尽，再也写不出让自己满意的东西了？昨晚正好看到刘墉写的文章，大意是说他的文章画作都是被真正感动以后的作品，因此每篇每幅都是真情实
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
猪狗请安息一林人间
黑暗中一双大手拽住黎明的黑眼珠使了什么魔咒？灵魂的锁簧很快被合上那是什么魔力？喔世界是圆的喔世界就是圆的苍蝇也不能借助翅膀的力量蚊子最好别来凑热闹妖魔鬼怪住在一个圈志同道合也不例外渡船在那个岸口？喔，上帝我需要你虔诚的指引让猪狗的灵魂在天国的天梯飞升喔，上帝我不上天堂听说罪恶也能开花索性你摘了去也带走另外请准许一丝超能力砍断那双手喂了狗我便走
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
基于随机森林的白酒风味智能分类系统：从数据到洞察的完整实践笙囧同学 python
作者：笙囧同学|中科院计算机大模型方向硕士|全栈开发爱好者座右铭：偷懒是人生进步的阶梯联系方式：[email protected]各大平台账号/公众号：笙囧同学前言大家好，我是笙囧同学！今天给大家分享一个超级有趣且技术含量爆表的项目——白酒风味智能分类系统。作为一个既爱技术又爱美酒的程序员，我花了大量时间研究如何用机器学习的方法来"品酒"，让AI帮我们识别白酒的风味特征。这个项目融合了机器学习、数
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
PaddleOCR 快速开始张欣-男 PaddlePaddle PaddleOCR OCR
1.安装1.1安装PaddlePaddle#GPUcudapipinstallpaddlepaddle-gpu#CPUpipinstallpaddlepaddle1.2安装PaddleOCRwhl包pipinstallpaddleocr2.便捷使用2.1命令行使用2.1.1中英文模型检测+方向分类器+识别全流程：–use_angle_clstrue设置使用方向分类器识别180度旋转文字，–use_
【随笔】镜子里的黑米（三九九）浩然H_H
除夕夜里放过烟火，我抱着阿宝宝上楼，看了一会儿远处的烟火。忽然听见身后的小黑米，对着屋子里呜呜呜的吼着。我很纳闷，跑过去看他究竟在对着什么吼呢。结果小黑米见我跟着来了，狗仗人势，大胆地冲进了屋子，对着穿衣镜一顿狂吠。原来，他是第一次见到镜子里的自己。估计在想，这是哪里来的一只大狗，从来没见过，居然跑到我们屋子里来了。他自己面对还有些害怕，要躲着，等有人壮胆就敢冲上去了。我们哈哈大笑，把黑米赶到一边
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
【数据分析】抓包工具的定义常见类型分类使用场景及注意事项
抓包工具的定义常见类型分类使用场景及注意事项-CSDN直播抓包工具的定义常见类型分类使用场景及注意事项抓包工具的定义常见类型分类使用场景及注意事项抓包工具概述抓包工具顾名思义是一种用于捕获并分析网络数据包的软件或硬件工具它能够在数据传输过程中截取并记录网络流量让用户能够深入理解并排查网络问题这类工具的用途广泛从网络安全测试到应用程序调试都离不开抓包工具的帮助在众多的抓包工具中WiresharkFi
ChatGPT还不能写小说吗？刘若愚
最近，ChatGPT大热，据说可以写论文，编故事，好像无所不能。于是，我给它出了个题目：写一篇5万字的科幻小说。人物：刘若愚，化学家；刘子琪，大律师；仔仔，刘子琪的宠物猫；周金凝，医生；刘泽余，大侦探；赵政淇，程序猿；杰夫（Jeff）机器人它给我的回答是：我很抱歉，我是一个AI语言模型，无法写出如此长篇的小说。但我可以为您提供一些写作灵感和指导：确定故事背景和时间线：在科幻小说中，背景和时间线非常
Spring AI与机器学习：智能应用开发新范式 tmjpz04412 人工智能 spring 机器学习
SpringAI与机器学习的整合SpringAI是一个基于Spring生态的AI开发框架，旨在简化智能应用的开发流程。通过SpringAI，开发者可以快速集成机器学习模型，构建高效的智能应用。SpringAI支持多种机器学习库和框架，如TensorFlow、PyTorch和Scikit-learn，提供统一的API接口。SpringAI的核心优势在于其模块化设计和自动化配置。开发者无需关心复杂的依
在奋斗的年华里，怎么让你的一年顶别人的十年呢丨看看剽悍一只猫十里荷塘秋水长
“剽悍一只猫”在自媒体时代是传奇之一，据说这个人让自己从一无所有的普通人到现在的网络江湖的传奇人物也没有用太长的时间，但是人家现在是樊登读书首席社群顾问、社群商业战略专家、个人成长战略深度研究者&践行者。他自己的微信公众号矩阵有百万读者。早早就借助于互联网的力量实现了财务自由。很多人希望能取经咨询，但是老师的时间极其宝贵高效，一般个人的咨询没有办法安排时间接，再加上收费也不好控制，高了低了对口碑来
《陆总别虐了，梁小姐真嫁给你小叔了》梁晚棠陆晏礼(完结篇)全文免费阅读【笔趣阁】小说推书
《陆总别虐了，梁小姐真嫁给你小叔了》梁晚棠陆晏礼(完结篇)全文免费阅读【笔趣阁】主角：梁晚棠陆晏礼简介：梁晚棠想不到第一次相亲，竟然是她最爱的男人安排的。相亲对象不仅双腿残疾，大她十五岁，而且还是他的小叔叔！男人倨傲冷漠地说：“能嫁给我四叔，是你高攀。”她红了眼眶，“陆晏礼你混蛋！”男人不置可否，她的抗拒与挣扎，不过是一场猫逗老鼠的游戏罢了。后来，梁晚棠真的同意嫁人了。陆晏礼却猩红着双眼，将她逼进
java学习笔记8 幸福，你等等我学习笔记 java
一、异常处理Error：错误，程序员无法处理，如OOM内存溢出错误、内存泄漏...会导出程序崩溃1.异常：程序中一些程序自身处理不了的特殊情况2.异常类Exception3.异常的分类:（1）.检查型异常(编译异常):在编译时就会抛出的异常(代码上会报错),需要在代码中编写处理方式(和程序之外的资源访问)直接继承Exception（2）.运行时异常:在代码运行阶段可能会出现的异常,可以不用明文处理
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息