吴师兄大模型

【深度学习-Day 23】框架实战：模型训练与评估核心环节详解 (MNIST实战)

Langchain系列文章目录

01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南
02-玩转 LangChain Memory 模块：四种记忆类型详解及应用场景全覆盖
03-全面掌握 LangChain：从核心链条构建到动态任务分配的实战指南
04-玩转 LangChain：从文档加载到高效问答系统构建的全程实战
05-玩转 LangChain：深度评估问答系统的三种高效方法（示例生成、手动评估与LLM辅助评估）
06-从 0 到 1 掌握 LangChain Agents：自定义工具 + LLM 打造智能工作流！
07-【深度解析】从GPT-1到GPT-4：ChatGPT背后的核心原理全揭秘
08-【万字长文】MCP深度解析：打通AI与世界的“USB-C”，模型上下文协议原理、实践与未来

Python系列文章目录

PyTorch系列文章目录

机器学习系列文章目录

深度学习系列文章目录

Java系列文章目录

JavaScript系列文章目录

深度学习系列文章目录

01-【深度学习-Day 1】为什么深度学习是未来？一探究竟AI、ML、DL关系与应用
02-【深度学习-Day 2】图解线性代数：从标量到张量，理解深度学习的数据表示与运算
03-【深度学习-Day 3】搞懂微积分关键：导数、偏导数、链式法则与梯度详解
04-【深度学习-Day 4】掌握深度学习的“概率”视角：基础概念与应用解析
05-【深度学习-Day 5】Python 快速入门：深度学习的“瑞士军刀”实战指南
06-【深度学习-Day 6】掌握 NumPy：ndarray 创建、索引、运算与性能优化指南
07-【深度学习-Day 7】精通Pandas：从Series、DataFrame入门到数据清洗实战
08-【深度学习-Day 8】让数据说话：Python 可视化双雄 Matplotlib 与 Seaborn 教程
09-【深度学习-Day 9】机器学习核心概念入门：监督、无监督与强化学习全解析
10-【深度学习-Day 10】机器学习基石：从零入门线性回归与逻辑回归
11-【深度学习-Day 11】Scikit-learn实战：手把手教你完成鸢尾花分类项目
12-【深度学习-Day 12】从零认识神经网络：感知器原理、实现与局限性深度剖析
13-【深度学习-Day 13】激活函数选型指南：一文搞懂Sigmoid、Tanh、ReLU、Softmax的核心原理与应用场景
14-【深度学习-Day 14】从零搭建你的第一个神经网络：多层感知器(MLP)详解
15-【深度学习-Day 15】告别“盲猜”：一文读懂深度学习损失函数
16-【深度学习-Day 16】梯度下降法 - 如何让模型自动变聪明？
17-【深度学习-Day 17】神经网络的心脏：反向传播算法全解析
18-【深度学习-Day 18】从SGD到Adam：深度学习优化器进阶指南与实战选择
19-【深度学习-Day 19】入门必读：全面解析 TensorFlow 与 PyTorch 的核心差异与选择指南
20-【深度学习-Day 20】PyTorch入门：核心数据结构张量(Tensor)详解与操作
21-【深度学习-Day 21】框架入门：神经网络模型构建核心指南 (Keras & PyTorch)
22-【深度学习-Day 22】框架入门：告别数据瓶颈 - 掌握PyTorch Dataset、DataLoader与TensorFlow tf.data实战
23-【深度学习-Day 23】框架实战：模型训练与评估核心环节详解 (MNIST实战)

文章目录

Langchain系列文章目录
Python系列文章目录
PyTorch系列文章目录
机器学习系列文章目录
深度学习系列文章目录
Java系列文章目录
JavaScript系列文章目录
深度学习系列文章目录
前言
一、准备工作：定义损失函数与优化器
- 1.1 为何需要损失函数与优化器？
- 1.2 选择合适的损失函数
- - 1.2.1 回归任务
  - 1.2.2 分类任务
- 1.3 选择合适的优化器
二、核心引擎：详解模型训练循环
- 2.1 训练循环的五个关键步骤
- 2.2 步骤详解与代码示例
- - 2.2.1 前向传播：获取模型预测
  - 2.2.2 计算损失：量化预测误差
  - 2.2.3 梯度清零：为新一轮计算做准备
  - 2.2.4 反向传播：计算损失函数对参数的梯度
  - 2.2.5 参数更新：向最优解迈进
- 2.3 迭代训练：Epoch 与 Batch
三、公正的裁判：模型评估
- 3.1 为何需要评估模式？
- 3.2 评估流程
- 3.3 常用评估指标
- - 3.3.1 分类任务
  - 3.3.2 回归任务
- 3.4 代码示例：计算准确率
四、实战演练：使用 PyTorch 训练 MNIST 分类模型
- 4.1 准备工作
- 4.2 加载并预处理 MNIST 数据集
- 4.3 定义一个简单的 MLP 模型
- 4.4 定义损失函数和优化器
- 4.5 编写训练循环
- 4.6 编写评估函数
- 4.7 执行训练与评估
五、常见问题与进一步思考
- 5.1 损失不下降怎么办？
- 5.2 如何进一步提升模型性能？
- 5.3 训练过程的可视化
六、总结

前言

在前面的系列文章中，我们已经逐步学习了深度学习框架的基础知识，包括张量的操作（Day 20）、如何使用框架构建神经网络模型（Day 21），以及如何高效地加载和处理数据（Day 22）。这些知识点如同建造房屋的砖瓦和工具，现在，是时候将它们整合起来，搭建并运行我们深度学习项目的“引擎”——模型训练与评估循环。

本篇文章将聚焦于使用深度学习框架（以 PyTorch 为例，但核心思想同样适用于 TensorFlow/Keras 等）进行模型训练和评估的完整流程。我们将深入探讨训练循环的每一个关键步骤，理解评估模式的重要性，并学习如何计算和解读常用的评估指标。最终，我们将通过一个经典的 MNIST 手写数字识别实战案例，将所有理论知识付诸实践。学完本篇，您将能够独立编写并执行一个完整的模型训练与评估流程，为后续更复杂的项目打下坚实的基础。

一、准备工作：定义损失函数与优化器

在正式开始训练循环之前，我们需要明确两件重要的事情：如何衡量模型的预测与真实标签之间的差异（损失函数），以及如何根据这个差异来调整模型的参数以使其表现更好（优化器）。

1.1 为何需要损失函数与优化器？

损失函数 (Loss Function)：它是一个数学函数，用于量化模型预测结果与真实目标值之间的差距。我们的目标是在训练过程中最小化这个损失值。
优化器 (Optimizer)：它实现了特定的算法（如梯度下降、Adam等），根据损失函数计算出的梯度来更新模型的权重和偏置，从而逐步减小损失值。

选择合适的损失函数和优化器对于模型的训练效果至关重要。

1.2 选择合适的损失函数

深度学习框架通常内置了多种常用的损失函数，我们可以根据任务类型进行选择。

1.2.1 回归任务

对于预测连续值的回归任务，常用的损失函数是：

均方误差损失 (Mean Squared Error Loss, MSELoss)：计算预测值与真实值之差的平方的均值。
- PyTorch: torch.nn.MSELoss()
- TensorFlow/Keras: tf.keras.losses.MeanSquaredError()

1.2.2 分类任务

对于预测离散类别标签的分类任务，常用的损失函数是：

交叉熵损失 (Cross-Entropy Loss)：在分类问题中非常常用。
- 对于二分类问题，通常使用二元交叉熵损失 (Binary Cross-Entropy Loss)。
  - PyTorch: torch.nn.BCELoss() (通常需要配合 Sigmoid 输出) 或 torch.nn.BCEWithLogitsLoss() (内部集成了 Sigmoid，更稳定)
  - TensorFlow/Keras: tf.keras.losses.BinaryCrossentropy()
- 对于多分类问题，通常使用分类交叉熵损失 (Categorical Cross-Entropy Loss)。
  - PyTorch: torch.nn.CrossEntropyLoss() (内部集成了 LogSoftmax 和 NLLLoss，期望输入为原始 logits)
  - TensorFlow/Keras: tf.keras.losses.CategoricalCrossentropy() (期望one-hot编码的标签和softmax输出) 或 tf.keras.losses.SparseCategoricalCrossentropy() (期望整数编码的标签和softmax输出)

在我们的 MNIST 示例中，由于是多分类问题，我们将使用 torch.nn.CrossEntropyLoss()。

# PyTorch 示例
import torch
import torch.nn as nn

# 假设是多分类任务，模型输出10个类别的logits
criterion = nn.CrossEntropyLoss()

# 示例：
# outputs = model(inputs) # 模型的原始输出 (logits)
# loss = criterion(outputs, labels) # labels 是真实的类别索引

1.3 选择合适的优化器

优化器的选择同样重要，它关系到模型收敛的速度和效果。

常见的优化器有：

SGD (Stochastic Gradient Descent)：随机梯度下降，可以配合动量 (momentum) 使用。
Adam (Adaptive Moment Estimation)：一种自适应学习率的优化算法，通常在各种任务中都有不错的表现，是目前比较常用的选择。
RMSprop, Adagrad 等。

在 PyTorch 中，优化器通常在 torch.optim 模块下。在 TensorFlow/Keras 中，它们在 tf.keras.optimizers 模块下。

# PyTorch 示例
import torch.optim as optim

# model 是我们定义的神经网络模型实例
# learning_rate 是学习率，一个重要的超参数
# optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)
optimizer = optim.Adam(model.parameters(), lr=0.001)

这里的 model.parameters() 会告诉优化器需要更新哪些参数。

二、核心引擎：详解模型训练循环

万事俱备，现在我们可以构建模型训练的核心循环了。训练循环本质上是一个迭代过程，在每个迭代（通常称为一个 epoch）中，模型会遍历整个训练数据集（或分批次遍历），并根据损失进行参数更新。

2.1 训练循环的五个关键步骤

一个典型的训练迭代（针对一个 batch 的数据）通常包含以下五个步骤：

前向传播 (Forward Propagation)：将输入数据喂给模型，得到模型的预测输出。
计算损失 (Calculate Loss)：使用预定义的损失函数，计算模型预测输出与真实标签之间的差异。
梯度清零 (Zero Gradients)：在进行反向传播计算新的梯度之前，需要清除上一轮迭代中累积的梯度。
反向传播 (Backward Propagation)：根据损失值，自动计算损失函数关于模型各个参数的梯度。
参数更新 (Parameter Update)：优化器根据计算得到的梯度，更新模型的参数（权重和偏置）。

2.2 步骤详解与代码示例

假设我们已经有了模型 model，损失函数 criterion，优化器 optimizer，以及一批输入数据 inputs 和对应的标签 labels。

2.2.1 前向传播：获取模型预测

将输入数据传递给模型，模型会执行其内部定义的一系列运算（例如线性变换、激活函数等），最终输出预测结果。

# PyTorch 示例
# inputs 是当前批次的数据
outputs = model(inputs)  # outputs 是模型对这批输入的预测结果

2.2.2 计算损失：量化预测误差

使用之前定义的损失函数，比较模型的预测 outputs 和真实的 labels。

# PyTorch 示例
loss = criterion(outputs, labels) # loss 是一个标量，表示当前批次的平均损失

2.2.3 梯度清零：为新一轮计算做准备

在 PyTorch 中，梯度是会累积的（这在某些高级应用如 RNN 中有用）。但在大多数情况下，每次进行反向传播计算梯度之前，我们需要将模型参数的梯度清零，以避免受到之前批次梯度的影响。

# PyTorch 示例
optimizer.zero_grad()

关键点：这一步非常重要，如果忘记清零梯度，梯度会不断累积，导致训练过程出错。

2.2.4 反向传播：计算损失函数对参数的梯度

这是深度学习框架的核心魔法之一。调用损失张量的 .backward() 方法，框架会自动利用链式法则计算损失函数关于网络中所有可训练参数（requires_grad=True 的张量）的梯度。这些梯度会存储在对应参数的 .grad 属性中。

# PyTorch 示例
loss.backward() # 自动计算梯度

2.2.5 参数更新：向最优解迈进

一旦梯度计算完毕，优化器就可以使用这些梯度来更新模型的参数了。更新的规则由所选的优化器算法（如 SGD、Adam）决定。

# PyTorch 示例
optimizer.step() # 根据梯度更新模型参数

2.3 迭代训练：Epoch 与 Batch

通常，我们不会一次性将整个数据集都喂给模型进行训练，原因有二：

数据集可能非常大，内存可能无法一次性容纳。
分批次训练有助于模型跳出局部最优，并加速收敛。

Batch (批次)：将整个训练数据集划分为若干个较小的数据块，每个数据块称为一个 batch。
Batch Size (批大小)：每个 batch 中包含的样本数量。
Iteration (迭代)：处理一个 batch 数据的过程（即完成上述五个步骤）称为一次迭代。
Epoch (轮次)：当模型完整地遍历了训练数据集中所有样本一次后，称为完成了一个 epoch。

一个典型的训练流程会包含多个 epoch，每个 epoch 包含多个 iteration。

# PyTorch 伪代码结构
num_epochs = 10
for epoch in range(num_epochs):
    # 在每个 epoch 开始时，通常会将模型设置为训练模式
    model.train() # 作用是启用 Dropout 和 Batch Normalization 等层的训练行为

    for inputs, labels in train_loader: # train_loader 是一个数据加载器，按批次提供数据
        # 1. 梯度清零
        optimizer.zero_grad()
        # 2. 前向传播
        outputs = model(inputs)
        # 3. 计算损失
        loss = criterion(outputs, labels)
        # 4. 反向传播
        loss.backward()
        # 5. 参数更新
        optimizer.step()

    # 通常在一个 epoch结束后，会进行模型评估 (详见下一节)
    # print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}")

三、公正的裁判：模型评估

仅仅训练模型是不够的，我们还需要知道模型在未见过的数据上的表现如何，即模型的泛化能力。这就需要进行模型评估。

3.1 为何需要评估模式？

在评估模型时，我们通常需要将模型切换到评估模式。这主要是因为某些层（如 Dropout 层和 Batch Normalization 层）在训练和评估时的行为是不同的：

Dropout 层：在训练时会随机失活一部分神经元以防止过拟合，但在评估时，我们希望使用完整的网络来进行预测，因此需要关闭 Dropout。
Batch Normalization 层：在训练时会计算当前 batch 的均值和方差并进行归一化，同时会更新全局的均值和方差；在评估时，它会使用训练过程中学习到的全局均值和方差进行固定的归一化操作。

在 PyTorch 中，通过 model.eval() 来将模型切换到评估模式。相应地，model.train() 用于切换回训练模式。

此外，在评估阶段，我们不需要计算梯度，因为我们不进行参数更新。关闭梯度计算可以减少内存消耗并加速计算。在 PyTorch 中，这可以通过 torch.no_grad() 上下文管理器来实现。

# PyTorch 示例
model.eval() # 将模型设置为评估模式
with torch.no_grad(): # 在这个块内部，所有计算都不会追踪梯度
    # 进行评估...
    # test_outputs = model(test_inputs)
    # ...
model.train() # 如果后续还需要训练，记得切换回训练模式

3.2 评估流程

评估流程通常在验证集 (validation set) 或测试集 (test set) 上进行：

将模型设置为评估模式 (model.eval())。
使用 torch.no_grad() 包裹评估代码。
遍历评估数据集的每一个批次。
进行前向传播，得到模型预测。
累积预测结果和真实标签。
根据累积的结果计算评估指标（如准确率、精确率、召回率等）。

3.3 常用评估指标

选择什么评估指标取决于具体的任务。

3.3.1 分类任务

准确率 (Accuracy)：预测正确的样本数占总样本数的比例。是最常用的指标之一，但对于类别不平衡的数据集可能具有误导性。
计算公式： $Accuracy = \\frac{TP+TN}{TP+TN+FP+FN}$ (TP: True Positive, TN: True Negative, FP: False Positive, FN: False Negative)
精确率 (Precision)：模型预测为正类的样本中，实际也为正类的比例。关注的是“预测的有多准”。
计算公式： $Precision = \\frac{TP}{TP+FP}$
召回率 (Recall) / 灵敏度 (Sensitivity)：实际为正类的样本中，被模型成功预测为正类的比例。关注的是“有没有漏网之鱼”。
计算公式： $Recall = \\frac{TP}{TP+FN}$
F1 分数 (F1-Score)：精确率和召回率的调和平均值，综合了两者的表现。
计算公式： $F1 = 2 \\times \\frac{Precision \\times Recall}{Precision + Recall}$
混淆矩阵 (Confusion Matrix)：一个表格，用于可视化模型在各个类别上的预测情况。

3.3.2 回归任务

均方误差 (Mean Squared Error, MSE)： $MSE = \\frac{1}{n}\\sum\_{i=1}^{n}(y\_i - \\hat{y}\_i)^2$
均方根误差 (Root Mean Squared Error, RMSE)： $RMSE = \\sqrt{MSE}$
平均绝对误差 (Mean Absolute Error, MAE)： $MAE = \\frac{1}{n}\\sum\_{i=1}^{n}|y\_i - \\hat{y}\_i|$

3.4 代码示例：计算准确率

对于分类任务，计算准确率是一个常见的评估步骤。

# PyTorch 示例 (假设在评估循环内部)
# correct_predictions = 0
# total_samples = 0
#
# model.eval()
# with torch.no_grad():
#     for inputs, labels in test_loader: # test_loader 是测试数据加载器
#         outputs = model(inputs)
#         _, predicted_classes = torch.max(outputs.data, 1) # 获取概率最高的类别索引
#         total_samples += labels.size(0)
#         correct_predictions += (predicted_classes == labels).sum().item()
#
# accuracy = 100 * correct_predictions / total_samples
# print(f'Accuracy on the test set: {accuracy:.2f}%')

四、实战演练：使用 PyTorch 训练 MNIST 分类模型

现在，我们将把前面讨论的所有概念整合起来，用 PyTorch 框架从头开始训练一个简单的多层感知器 (MLP) 来对 MNIST 手写数字数据集进行分类。

4.1 准备工作

首先，导入所有必要的库，并定义一些超参数。

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
from torch.utils.data import DataLoader

# 定义超参数
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') # 优先使用GPU
input_size = 28 * 28  # MNIST 图像是 28x28 像素
hidden_size = 128     # 隐藏层大小
num_classes = 10      # 数字 0-9，共10类
num_epochs = 5        # 训练轮次
batch_size = 64       # 批大小
learning_rate = 0.001 # 学习率

4.2 加载并预处理 MNIST 数据集

PyTorch 的 torchvision 模块提供了直接加载 MNIST 数据集的功能，并可以方便地进行数据转换。

# 数据预处理：转换为张量，并进行归一化
transform = transforms.Compose([
    transforms.ToTensor(), # 将 PIL Image 或 numpy.ndarray 转换为 torch.Tensor，并将像素值从 [0, 255] 缩放到 [0.0, 1.0]
    transforms.Normalize((0.1307,), (0.3081,)) # MNIST 数据集的均值和标准差 (经验值)
])

# 下载并加载训练数据集
train_dataset = torchvision.datasets.MNIST(root='./data',
                                           train=True,
                                           transform=transform,
                                           download=True)

# 下载并加载测试数据集
test_dataset = torchvision.datasets.MNIST(root='./data',
                                          train=False,
                                          transform=transform)

# 创建数据加载器
train_loader = DataLoader(dataset=train_dataset,
                          batch_size=batch_size,
                          shuffle=True) # 训练时打乱数据

test_loader = DataLoader(dataset=test_dataset,
                         batch_size=batch_size,
                         shuffle=False) # 测试时不需要打乱

4.3 定义一个简单的 MLP 模型

我们构建一个包含一个隐藏层的简单 MLP。

class MLP(nn.Module):
    def __init__(self, input_size, hidden_size, num_classes):
        super(MLP, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size) # 输入层到隐藏层
        self.relu = nn.ReLU()                         # ReLU 激活函数
        self.fc2 = nn.Linear(hidden_size, num_classes)  # 隐藏层到输出层

    def forward(self, x):
        # 将输入的 28x28 图像展平为 784 维向量
        x = x.reshape(-1, 28 * 28)
        out = self.fc1(x)
        out = self.relu(out)
        out = self.fc2(out)
        # 注意：对于 nn.CrossEntropyLoss()，不需要在模型末尾加 Softmax 层，它内部会处理
        return out

model = MLP(input_size, hidden_size, num_classes).to(device) # 将模型移动到 GPU (如果可用)

回顾Day 21：[框架]入门（二）：构建模型，我们学习了如何使用框架定义模型。

4.4 定义损失函数和优化器

# 损失函数：交叉熵损失，适用于多分类任务
criterion = nn.CrossEntropyLoss()

# 优化器：Adam
optimizer = optim.Adam(model.parameters(), lr=learning_rate)

4.5 编写训练循环

现在，我们整合第二节中学习的训练循环五个步骤。

print("开始训练...")
total_steps = len(train_loader)
for epoch in range(num_epochs):
    model.train() # 设置为训练模式
    for i, (images, labels) in enumerate(train_loader):
        # 将数据移动到 GPU (如果可用)
        images = images.to(device)
        labels = labels.to(device)

        # 1. 前向传播
        outputs = model(images)

        # 2. 计算损失
        loss = criterion(outputs, labels)

        # 3. 梯度清零
        optimizer.zero_grad()

        # 4. 反向传播
        loss.backward()

        # 5. 参数更新
        optimizer.step()

        if (i + 1) % 100 == 0: # 每 100 个 batch 打印一次信息
            print(f'Epoch [{epoch+1}/{num_epochs}], Step [{i+1}/{total_steps}], Loss: {loss.item():.4f}')
print("训练完成!")

4.6 编写评估函数

为了在训练后或训练过程中监控模型性能，我们编写一个评估函数。

def evaluate_model(model_to_eval, data_loader):
    model_to_eval.eval()  # 设置为评估模式
    correct_predictions = 0
    total_samples = 0
    with torch.no_grad(): # 在评估阶段不计算梯度
        for images, labels in data_loader:
            images = images.to(device)
            labels = labels.to(device)

            outputs = model_to_eval(images.reshape(-1, 28 * 28)) # 确保输入形状正确
            _, predicted_classes = torch.max(outputs.data, 1) # 获取预测类别

            total_samples += labels.size(0)
            correct_predictions += (predicted_classes == labels).sum().item()

    accuracy = 100 * correct_predictions / total_samples
    return accuracy

4.7 执行训练与评估

在训练循环结束后，调用评估函数。

# 评估模型在测试集上的表现
test_accuracy = evaluate_model(model, test_loader)
print(f'模型在测试集上的准确率: {test_accuracy:.2f}%')

# 如果需要，也可以在每个 epoch 结束后评估在验证集上的表现 (此处我们直接用测试集)
# for epoch in range(num_epochs):
#     # ... 训练代码 ...
#     val_accuracy = evaluate_model(model, test_loader) # 或 validation_loader
#     print(f'Epoch [{epoch+1}/{num_epochs}], Validation Accuracy: {val_accuracy:.2f}%')

通过以上步骤，我们就完成了一个使用 PyTorch 框架训练和评估 MNIST 分类模型的完整流程。您可以尝试调整超参数（如学习率、批大小、隐藏层大小、epoch 数）或者模型结构，观察它们对最终结果的影响。

五、常见问题与进一步思考

在实际的模型训练与评估过程中，可能会遇到各种问题，同时也存在许多可以进一步优化和探索的方向。

5.1 损失不下降怎么办？

这是初学者常遇到的问题，可能的原因有：

学习率设置不当：学习率过大可能导致损失震荡或发散；学习率过小可能导致收敛缓慢或陷入局部最优。可以尝试调整学习率。
数据问题：
- 数据未正确加载或预处理（如忘记归一化）。
- 标签错误或与输入不匹配。
- 数据量过小。
模型结构问题：
- 模型过于简单，无法拟合数据。
- 模型过于复杂，难以训练（可能需要更复杂的优化策略或正则化）。
梯度消失/爆炸：在深层网络中常见，可以尝试使用合适的激活函数（如ReLU）、权重初始化方法或 Batch Normalization。
代码 Bug：例如，忘记 optimizer.zero_grad()，或者损失函数选择错误等。仔细检查代码逻辑。

5.2 如何进一步提升模型性能？

当基础训练流程跑通后，可以从以下方面尝试提升模型性能：

超参数调优：如学习率、批大小、网络层数、每层单元数、优化器选择等（Day 28）。
正则化技术：防止过拟合，如 L1/L2 正则化、Dropout (Day 25, Day 26)。
更复杂的模型架构：例如，对于图像任务，可以使用卷积神经网络 (CNN) (后续章节)。
数据增强：通过对训练数据进行变换（如旋转、裁剪、颜色抖动）来扩充数据集，提升模型泛化能力 (Day 27, Day 35)。
早停法 (Early Stopping)：在验证集上监控性能，当性能不再提升时提前停止训练，防止过拟合 (Day 27)。
使用预训练模型与迁移学习：对于某些任务，可以利用在大型数据集上预训练好的模型进行微调 (Day 39)。

5.3 训练过程的可视化

仅仅打印损失值和最终的准确率可能不够直观。使用 TensorBoard (TensorFlow生态) 或类似的工具 (如 matplotlib 配合 PyTorch) 来可视化训练过程中的损失曲线、准确率曲线等指标，可以帮助我们更好地理解模型的学习动态，并进行诊断。

例如，可以绘制每个 epoch 的训练损失和验证准确率：

# 伪代码 - 使用 matplotlib 绘制曲线
# train_losses = []
# val_accuracies = []

# for epoch in range(num_epochs):
#     # ... 训练 ...
#     # current_train_loss = ...
#     # train_losses.append(current_train_loss)
#
#     # ... 评估 ...
#     # current_val_accuracy = ...
#     # val_accuracies.append(current_val_accuracy)

# import matplotlib.pyplot as plt
# plt.figure(figsize=(10, 4))
# plt.subplot(1, 2, 1)
# plt.plot(train_losses, label='Training Loss')
# plt.xlabel('Epoch')
# plt.ylabel('Loss')
# plt.legend()
#
# plt.subplot(1, 2, 2)
# plt.plot(val_accuracies, label='Validation Accuracy')
# plt.xlabel('Epoch')
# plt.ylabel('Accuracy')
# plt.legend()
# plt.show()

六、总结

本篇文章详细介绍了使用深度学习框架进行模型训练与评估的完整流程，这是深度学习实践中至关重要的一环。核心要点回顾：

准备阶段：正确选择并定义损失函数（如交叉熵损失）以量化模型误差，以及优化器（如Adam）来指导参数更新。
训练循环核心五步：
- 梯度清零 (optimizer.zero_grad())：清除旧梯度。
- 前向传播 (outputs = model(inputs))：获取模型预测。
- 计算损失 (loss = criterion(outputs, labels))：评估预测与真实值的差异。
- 反向传播 (loss.backward())：计算损失对各参数的梯度。
- 参数更新 (optimizer.step())：根据梯度调整模型参数。
Epoch 与 Batch：理解整个数据集的一次完整遍历（Epoch）和分批处理数据（Batch）的概念及其在训练中的作用。
评估模式：通过 model.eval() 切换模型到评估状态，关闭 Dropout 和 Batch Normalization 的训练行为，并使用 torch.no_grad() 节约计算资源。
评估指标：根据任务类型选择合适的指标，如分类任务中的准确率、精确率、召回率、F1分数，回归任务中的 MSE、MAE 等。
MNIST 实战：通过一个完整的手写数字识别案例，将理论知识应用于实践，包括数据加载与预处理、模型定义、训练循环编写和模型评估。
持续改进：模型训练是一个迭代优化的过程，需要关注常见问题（如损失不降），并思考如何通过超参数调优、正则化、数据增强等手段进一步提升模型性能。

掌握了模型训练与评估的流程，就如同掌握了驾驶汽车的核心技能。接下来，我们将面临更多样化的道路（更复杂的模型和任务），但基本的驾驶原理是相通的。希望本篇内容能为您在深度学习的道路上提供坚实的支撑。

你可能感兴趣的:(深度学习入门到精通,深度学习,人工智能,python,MNIST,大模型,pytorch,LLM)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
【备孕故事】她一直想做个大差不离的人，没想到在这件事上拔了尖儿宜嘉阿姨
图片发自App杨婷说从小到大自己就是个中规中矩的人，不出格，不落单，一直随着大流。学业上从未出类拔萃，却也跟着大部队一起考上了一本；做事从不冒尖，搞个大差不离就行，因此，这么多年以来，差不多就行成了她对自己人生的要求。22岁大学毕业进了一家国企，外型不出挑但文静可人的她也遇上了两位追求者，简单的观察和交往后，她从中选了李广作为自己的婚恋对象。25岁那年，在父母亲朋的祝福声中杨婷和李广步入了婚姻。婚
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul