拉拉拉拉拉拉拉马

PyTorch torch.no_grad() 指南（笔记）

PyTorch `torch.no_grad()` 权威

在PyTorch深度学习框架中，高效的显存管理对于训练复杂模型和执行大规模推理任务至关重要。显存不足（Out Of Memory, OOM）错误是开发者经常面临的挑战之一。torch.no_grad() 作为PyTorch提供的一个核心工具，能够在推理（inference）和验证（validation）阶段显著优化显存使用并提升计算速度。本报告旨在全面、深入地剖析 torch.no_grad() 的工作原理、使用方法、对显存和性能的具体影响，并通过实例代码展示其应用，同时指出常见的使用陷阱与误区，帮助读者更精确、自信地运用这一工具。

一、 PyTorch中的显存管理与`torch.no_grad()`的重要性

PyTorch凭借其灵活性和动态图机制，在学术界和工业界得到了广泛应用。然而，随着模型规模的增大和数据量的激增，GPU显存往往成为瓶颈。训练过程中，为了进行反向传播和参数更新，PyTorch需要构建计算图并存储中间变量（激活值），这会消耗大量显存。在模型推理或评估阶段，这些梯度计算和历史追踪通常是不必要的。此时，若不加以控制，依然会产生不必要的显存开销，甚至导致OOM错误，中断程序运行。

torch.no_grad() 正是PyTorch为解决这一问题提供的关键机制。它能够临时关闭自动求导引擎的部分功能，从而在不需要计算梯度的代码块中，避免存储计算历史和中间激活值，达到节省显存、加速计算的目的。理解并正确使用 torch.no_grad() 对于编写高效、稳健的PyTorch推理代码至关重要。本报告将系统性地阐述torch.no_grad()的各个方面，旨在为PyTorch用户提供一份详尽的实践指南。

II. 理解PyTorch的自动求导机制 (Autograd)

为了充分理解 torch.no_grad() 的作用，首先需要对PyTorch的自动求导机制（Autograd）有一个清晰的认识。Autograd是PyTorch实现神经网络训练的核心。

A. 计算图 (Computation Graph) 基础

PyTorch采用动态计算图（Dynamic Computation Graph）的方式进行运算。当执行张量（Tensor）操作时，如果这些操作需要被追踪（通常是为了后续的梯度计算），PyTorch会即时构建一个有向无环图 (DAG) 。在这个图中：

节点 (Nodes) 代表张量。
边 (Edges) 代表产生输出张量的操作（函数）。

这个计算图记录了数据是如何从输入张量一步步计算得到输出张量的。例如，如果 y=x1+x2，z=y∗x3，那么 x1,x2,x3 是叶子节点， y,z 是中间节点或根节点。这个图的关键作用在于反向传播：当计算损失函数关于模型参数的梯度时，Autograd会从表示损失的节点开始，沿着图反向追溯，利用链式法则计算并累积梯度至各个叶子节点（通常是模型的参数）。

PyTorch计算图的动态性意味着图是在运行时定义的，并且在每次迭代（例如，每个训练批次）后都可以从头开始重新构建。这种特性为使用Python的控制流语句（如循环和条件判断）提供了极大的灵活性，因为图的结构可以根据运行时的条件而改变。然而，这也意味着如果某些操作持续被追踪而没有及时释放，计算图可能会变得非常庞大，从而消耗大量内存。

B. `requires_grad` 属性

张量的 requires_grad 属性是控制Autograd是否追踪其操作的关键。

默认情况下，新创建的张量的 requires_grad 为 False。
如果一个张量是模型的参数（即 torch.nn.Parameter 的实例），那么它的 requires_grad 默认为 True 。
可以通过 tensor.requires_grad_(True) 或在创建时指定 requires_grad=True 来显式设置。

当一个操作至少有一个输入张量的 requires_grad 为 True 时，其输出张量通常也会具有 requires_grad=True，并且该操作会被记录在计算图中，以便后续的梯度计算。

C. Autograd 如何追踪历史

如果一个张量的 requires_grad 为 True，并且它是由某个操作产生的，那么它会拥有一个 .grad_fn 属性。这个属性指向一个特殊的对象（如 AddBackward0, MulBackward0 等），该对象记录了创建该张量的函数以及其输入。这些 .grad_fn 对象相互连接，构成了从输出回溯到输入的路径，即计算图的一部分。

在执行 .backward() 操作时（通常在损失张量上调用），Autograd引擎会：

从调用 .backward() 的张量开始，沿着 .grad_fn 链反向遍历计算图。
计算每个操作相对于其输入的梯度。
将计算得到的梯度累积到相应张量的 .grad 属性中（仅对 requires_grad=True 的叶子节点有效）。

为了完成梯度计算，Autograd需要在前向传播过程中存储一些中间结果，即激活值（activations）。例如，对于乘法操作 z=x×y，计算 ∂x∂L 需要 y 和 ∂z∂L。这些中间激活值的存储是导致训练过程中显存消耗较大的主要原因之一。正是因为Autograd需要存储这些用于梯度计算的中间激活值，我们才需要像torch.no_grad()这样的机制来在不需要梯度时避免这种存储，从而节省显存。

III. 深入剖析 `torch.no_grad()`

torch.no_grad() 是PyTorch中用于控制梯度计算上下文的一个重要工具。它可以作为上下文管理器（context manager）或装饰器（decorator）使用。

A. 定义与核心功能

torch.no_grad() 的核心功能是在其作用域内临时禁用梯度计算和历史追踪 。这意味着，在 with torch.no_grad(): 代码块内或被 @torch.no_grad() 装饰的函数内执行的所有PyTorch张量运算，都不会被Autograd引擎记录到计算图中。

B. `torch.no_grad()` 如何影响计算图和 `requires_grad`

当进入 torch.no_grad() 上下文后：

不构建计算图：在该上下文中执行的任何操作都不会创建新的计算图节点或边。即使输入张量本身具有 requires_grad=True 的属性，这些操作也不会被记录。
输出张量的 requires_grad 属性：在 torch.no_grad() 块内，任何计算的结果张量，其 requires_grad 属性都会被设置为 False，即使所有输入张量的 requires_grad 都为 True 7。这确保了这些输出张量不会参与后续的梯度计算。

一个重要的例外是工厂函数（factory functions）。如果一个函数用于创建新的张量，并且接受一个 requires_grad 关键字参数（例如 torch.nn.Parameter() 或 torch.ones(..., requires_grad=True)），那么即使在 no_grad 上下文中，这些函数创建的张量如果被显式指定 requires_grad=True，其 requires_grad 属性仍然会是 True 。然而，对此类张量进行的后续操作（仍在 no_grad 上下文内）所产生的输出，其 requires_grad 仍将为 False。这种设计确保了参数初始化等场景的灵活性，同时不影响 no_grad 上下文对后续计算的梯度追踪控制。

C. 显存节省机制

torch.no_grad() 节省显存的主要机制在于它阻止了Autograd引擎存储用于反向传播的中间激活值 。如前所述，在正常的训练模式下（即梯度计算开启时），前向传播过程中产生的许多中间张量需要被保留在内存中，因为它们是计算梯度所必需的。当模型非常深或批次较大时，这些中间激活值会占据大量的GPU显存。

在 torch.no_grad() 上下文中，由于PyTorch知道不需要进行梯度计算，因此它不会保留这些中间激活值。一旦某个中间张量不再被后续的（无梯度）计算所直接需要，其占用的内存就可以被更快地回收或重用。这在模型推理、验证或任何不需要梯度更新的计算场景中，能够显著降低峰值显存占用。

D. 性能提升机制

除了节省显存，torch.no_grad() 还能带来性能上的提升，主要体现在以下几个方面：

减少Autograd开销：Autograd引擎在追踪操作、构建计算图以及管理相关元数据时会引入一定的计算开销。禁用梯度计算可以避免这部分开销。
更快的计算：由于不需要为反向传播准备数据（如存储中间激活值），某些操作本身可能会执行得更快。尤其是在计算图构建本身成为性能瓶颈时，torch.no_grad() 的效果更为明显。

总而言之，torch.no_grad() 通过阻止Autograd追踪新的操作历史，使得新产生的张量不附带梯度信息，从而避免了为这些新操作存储中间激活值。这不仅直接减少了内存消耗，也因减少了Autograd的簿记工作而可能加速计算。它影响的是在其作用域内发生的操作，而不是永久改变输入张量本身的 requires_grad 状态（输入张量若原本 requires_grad=True，在离开 no_grad 作用域后，参与新的、有梯度追踪的操作时，依然会按其原有属性行事）。

IV. `torch.no_grad()` 实战演练：示例代码

以下通过几个具体示例来演示 torch.no_grad() 的实际用法。

A. 基本用法：上下文管理器

上下文管理器是 torch.no_grad() 最常见的用法。它清晰地界定了禁用梯度计算的代码范围。

import torch

# 创建一个需要梯度的张量 x
x = torch.tensor([1., 2., 3.], requires_grad=True)
print(f"Original x.requires_grad: {x.requires_grad}")

# 在 torch.no_grad() 上下文管理器内部进行操作
with torch.no_grad():
    y = x * 2  # 对 x 进行操作得到 y
    # 此时，y 是在 no_grad 上下文中创建的，因此 y.requires_grad 会是 False
    print(f"Inside no_grad: y.requires_grad: {y.requires_grad}")

    # 任何在此上下文中进行的操作，其输出都不会追踪梯度
    z = torch.matmul(y, x.T) # 即使 x 仍然是 requires_grad=True, 但 matmul 的输出 z 不会追踪梯度
    print(f"Inside no_grad: z.requires_grad: {z.requires_grad}")

# 离开 no_grad 上下文后
# y 和 z 是在 no_grad 块内创建的，它们的 requires_grad 已经是 False
print(f"Outside no_grad: y.requires_grad: {y.requires_grad}")
print(f"Outside no_grad: z.requires_grad: {z.requires_grad}")

# 如果我们用原始的 x (requires_grad=True) 进行新的操作，梯度会被追踪
# w = x + 10
# print(f"Outside no_grad, new op on x: w.requires_grad: {w.requires_grad}") # 这会是 True

在这个例子中，尽管输入张量 x 设置了 requires_grad=True，但在 with torch.no_grad(): 块内执行的乘法操作 x * 2 所产生的张量 y，其 requires_grad 属性被设置为 False 。同样，后续使用 y 和 x 计算得到的 z 也具有 requires_grad=False。

B. 典型的模型推理/验证循环

在模型评估（验证或测试）阶段，通常不需要计算梯度。因此，将整个评估循环置于 torch.no_grad() 的上下文中是标准做法。

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset

# 示例模型定义
class SimpleModel(nn.Module):
    def __init__(self):
        super(SimpleModel, self).__init__()
        self.linear1 = nn.Linear(10, 5)
        self.relu = nn.ReLU()
        self.linear2 = nn.Linear(5, 1)
        self.dropout = nn.Dropout(0.5) # 包含 Dropout 层以演示 model.eval() 的作用

    def forward(self, x):
        x = self.linear1(x)
        x = self.relu(x)
        x = self.dropout(x) # Dropout 在训练和评估时行为不同
        x = self.linear2(x)
        return x

# 假设 model 和 valid_dataloader 已经定义
# model = SimpleModel()
# # 假设有一些训练好的权重
# # model.load_state_dict(torch.load('model_weights.pth'))
#
# # 创建虚拟数据加载器
# dummy_data = torch.randn(100, 10)
# dummy_labels = torch.randn(100, 1)
# valid_dataset = TensorDataset(dummy_data, dummy_labels)
# valid_dataloader = DataLoader(valid_dataset, batch_size=16)
#
# criterion = nn.MSELoss()
# device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
# model.to(device)

# --------- 实际演示代码 ---------
model = SimpleModel() # 实例化模型
# 创建一个虚拟的验证数据加载器
X_valid = torch.randn(64, 10)
y_valid = torch.randn(64, 1)
valid_dataset = TensorDataset(X_valid, y_valid)
valid_dataloader = DataLoader(valid_dataset, batch_size=32)
criterion = nn.MSELoss() # 损失函数

# 关键步骤1: 将模型设置为评估模式
model.eval() # 这会影响 Dropout 和 BatchNorm 等层的行为

total_loss = 0
num_samples = 0

# 关键步骤2: 使用 torch.no_grad() 包裹整个验证循环
with torch.no_grad():
    for inputs, labels in valid_dataloader:
        # inputs, labels = inputs.to(device), labels.to(device) # 如果使用GPU

        outputs = model(inputs)  # 前向传播
        # 此时 outputs.requires_grad 会是 False

        loss = criterion(outputs, labels) # 计算损失 (对于纯推理，此步骤可选)
        # 此时 loss.requires_grad 会是 False

        # 使用.item() 获取Python标量值，避免累积张量历史
        # 即使在 no_grad() 中 loss.requires_grad 已为 False，
        #.item() 仍然是好习惯，因为它更节省内存且是训练中累积loss的标准做法。
        total_loss += loss.item() * inputs.size(0)
        num_samples += inputs.size(0)

avg_loss = total_loss / num_samples
print(f"Validation - Average Loss: {avg_loss:.4f}")

这里有两个关键点：

model.eval()：在评估循环开始前调用。这会通知模型中所有模块（特别是如 Dropout 和 BatchNorm 这类在训练和评估时行为不同的模块）切换到评估模式。例如，Dropout 层在评估模式下会被禁用，BatchNorm 层会使用其在训练期间学习到的运行均值和方差，而不是当前批次的统计数据。
with torch.no_grad():：包裹整个循环体。这确保了在前向传播和损失计算过程中不会构建计算图，从而节省显存并可能加速计算。

关于 loss.item() 的使用：在此 no_grad 上下文中，outputs = model(inputs) 产生的 outputs 的 requires_grad 属性为 False。因此，后续计算得到的 loss = criterion(outputs, labels) 的 requires_grad 属性也将为 False。从理论上讲，直接累加 loss 张量（total_loss += loss）在此特定情境下不会累积计算图历史，因为 loss 本身就不带历史。然而，使用 loss.item() 将一个零维张量转换为Python标量数字，是一种更通用的良好实践。这不仅因为Python数字比零维张量对象更轻量，更重要的是，这种做法源于训练循环中的经验：在训练时，loss 张量会带有计算历史（requires_grad=True），如果不使用 .item() 或 .detach()，累积 loss 会导致显存泄漏。因此，在验证循环中也使用 .item() 是一种稳健的习惯，确保了代码的一致性和对显存最友好的处理方式。这种做法体现了PyTorch编程的一种“卫生习惯”，即将 model.eval()、torch.no_grad() 和 .item() 结合使用，以确保评估代码的正确性、高效性和稳健性。

C. 使用 `@torch.no_grad()` 作为装饰器

对于专门用于推理或评估的辅助函数，可以使用 @torch.no_grad() 装饰器，使整个函数体都在无梯度上下文中执行。

import torch
import torch.nn as nn

# 假设模型已定义并加载权重
# model = MyModel().to(device)
# model.eval() # 别忘了在调用前设置评估模式

# --------- 实际演示代码 ---------
model = nn.Linear(10, 1) # 虚拟模型
model.eval() # 设置为评估模式

@torch.no_grad()  # 装饰器将 no_grad 应用于整个函数
def predict_fn(input_tensor, model_instance):
    # input_tensor = input_tensor.to(device) # 如果使用GPU
    output = model_instance(input_tensor)
    # 此时 output.requires_grad 会是 False

    # 在这里可以进行任何后处理操作
    # 例如：probabilities = torch.softmax(output, dim=1)
    return output # return probabilities

# 示例用法
sample_input = torch.randn(1, 10)
prediction = predict_fn(sample_input, model)
print(f"Prediction: {prediction}")
print(f"Prediction requires_grad: {prediction.requires_grad}")

这种方式非常适合封装独立的预测逻辑，使得代码更简洁。当调用被 @torch.no_grad() 装饰的函数时，其内部所有PyTorch运算都不会追踪梯度。

V. 精通 `torch.no_grad()` 进行推理：有效节省GPU显存

在进行模型推理时，合理使用 torch.no_grad() 是节省GPU显存的关键策略。

A. 何处添加 `torch.no_grad()`

指导原则：将 torch.no_grad() 应用于代码中任何执行模型推理或评估且不需要计算梯度的部分。

典型场景包括：

完整的验证或测试循环：如IV.B节示例所示，迭代处理 DataLoader 中的数据，进行前向传播并计算评估指标。
专用的预测函数：如IV.C节示例所示，接收输入数据并返回模型输出的函数。
模型输出的后处理步骤：如果这些后处理步骤涉及到PyTorch张量运算，并且这些运算在默认情况下可能会追踪梯度（例如，如果输入到后处理的张量 requires_grad=True），那么也应该将它们包含在 no_grad 上下文中。

目标是阻止Autograd引擎为推理流程的任何部分存储中间激活或构建计算历史。

B. 添加一次就足够了吗？理解作用域

torch.no_grad() 的作用效果严格限于其定义的作用域（scope）。它是一个上下文管理器或装饰器，其影响不会泄露到其定义的代码块之外。

对于单一、连贯的推理阶段：如果整个推理逻辑（例如，遍历数据加载器、获取模型输出、计算指标）都包含在一个 with torch.no_grad(): 块内，或者一个由 @torch.no_grad() 装饰的函数内，那么是的，将其应用于该整个作用域一次就足够了。该作用域内的所有PyTorch操作都将受益。

# 假设 model 和 test_loader 已定义
model.eval()
predictions_list =
# 整个推理过程使用一个 no_grad 块
with torch.no_grad():
    for data_batch in test_loader:
        # data_batch = data_batch.to(device)
        outputs = model(data_batch)
        # outputs.requires_grad 为 False
        # processed_outputs = some_pytorch_postprocessing(outputs) # 同样不追踪梯度
        # predictions_list.append(processed_outputs.cpu())
# 从模型前向传播到后处理的所有操作都被覆盖。

对于分段的推理逻辑：如果推理过程被分解为多个独立的Python函数或代码块，并且它们是独立执行的（即没有嵌套在单个 no_grad 上下文中），那么每个执行PyTorch操作并希望禁用梯度的段落，都需要其自身的 torch.no_grad() 包装。

def get_embeddings(model, data_batch):
    # 这个函数可能从不同地方调用，
    # 有些调用可能需要梯度，有些则不需要。
    # data_batch = data_batch.to(device)
    return model.feature_extractor(data_batch)

#... 在后续的特定于推理的代码中...
model.eval()
# inference_sample = inference_sample.to(device)
# 此处需要 no_grad 来进行本次特定的推理调用
with torch.no_grad():
    raw_features = get_embeddings(model, inference_sample)
    # raw_features.requires_grad 为 False
    final_prediction = model.classifier(raw_features)
    # final_prediction.requires_grad 为 False

可以将其类比为房间的电灯开关。当你按下开关（进入 no_grad 上下文），房间内（作用域内）的灯（梯度追踪）就关闭了。当你离开房间（退出上下文），外面的灯不受影响。如果你进入另一个房间（另一个代码块），如果想让那里的灯也关闭，就需要操作那个房间的开关。

许多用户可能错误地认为 torch.no_grad() 会以某种方式永久性地“标记”张量，或者改变PyTorch的全局状态。澄清其作用域的限制性至关重要，这有助于防止此类误解，并帮助调试意外的梯度追踪行为。torch.no_grad() 并不会永久改变输入张量 x 本身的 requires_grad 状态；它只改变在上下文中对 x 进行操作所产生的输出的梯度追踪行为。这表明 torch.no_grad() 是对一段代码的临时状态改变，而不是对张量或全局Autograd引擎状态的永久修改。

C. 可视化影响 (概念层面)

若不使用 torch.no_grad()，推理过程的显存占用图会显示出因存储激活值而产生的峰值，类似于训练过程中的显存图。这些激活值是为潜在的反向传播而保留的。

当使用 torch.no_grad() 时，这些与激活值相关的显存分配大部分会消失，从而在前向传播过程中形成一个更平坦、更低的显存占用曲线。此时，主要的显存消耗将来自于模型参数本身以及当前处理批次的输入和输出张量。

VI. 注意！常见陷阱与误解

虽然 torch.no_grad() 功能强大且易于使用，但在实践中仍存在一些常见的陷阱和误解，可能导致其被误用或效果不佳。

A. `torch.no_grad()` vs. `model.eval()`：不可互换！

这是初学者乃至一些有经验用户非常容易混淆的一点。两者都常用于“评估阶段”，这造成了语义上的重叠。然而，它们的作用目标和机制完全不同。

model.eval():
- 目的：将模型设置为评估模式。这主要影响模型中特定层的行为，如 torch.nn.Dropout（在评估时禁用 dropout）和 torch.nn.BatchNorm2d（在评估时使用训练阶段学习到的运行均值和方差，而不是当前批次的统计数据）。
- 影响：改变特定层的行为，使其适合推理或测试。它本身并不禁用梯度计算。
with torch.no_grad()::
- 目的：禁用Autograd引擎的梯度计算和历史追踪功能。
- 影响：通过不构建用于反向传播的计算图，节省显存并可能加速计算。
为何推理时两者都需要：
- 使用 model.eval() 来确保模型的各层（如Dropout, BatchNorm）表现出正确的、确定性的推理行为。
- 使用 with torch.no_grad(): 来避免不必要的梯度计算和显存消耗。

下表清晰地总结了 model.eval() 和 with torch.no_grad(): 的区别：

特性	model.eval()	with torch.no_grad():
主要目的	将模块设置为评估模式。	禁用Autograd的梯度计算。
影响对象	Dropout, BatchNorm等特定层的行为。	Autograd引擎；新操作输出的 `requires_grad` 属性。
梯度计算	不直接禁用梯度计算。	禁用梯度计算和历史追踪。
显存节省	间接节省（如果层在评估模式下行为更简单）。	直接且显著地节省，因不存储用于梯度的激活值。
速度提升	可能（如果层在评估模式下计算更少）。	直接地提升，因减少了Autograd的开销。
典型用法	在任何评估/推理阶段开始前调用一次。	包裹评估/推理代码块，或装饰相关函数。

这种混淆的根源在于两者都用于“评估阶段”。model.eval() 针对的是模型的行为状态（确保层的行为是确定性的），而 torch.no_grad() 针对的是Autograd引擎的操作状态（是否追踪梯度）。理解这一本质区别至关重要。

B. 训练过程中的意外使用

如果在训练循环中本应计算梯度的部分（例如，计算损失并调用 loss.backward() 之前的模型前向传播）错误地被 torch.no_grad() 包裹，那么这些操作的梯度将不会被计算。

# 错误的训练步骤示例：
# optimizer.zero_grad()
# with torch.no_grad(): # 错误！不应在计算训练损失时使用
#     outputs = model(train_inputs)
#     loss = criterion(outputs, train_labels)
# loss.backward() # 这可能会报错，或者梯度为None，无法有效更新参数
# optimizer.step()

这将导致模型权重无法正确更新，从而 фактически停止受影响部分的学习过程。在强化学习等领域，这种错误尤为常见，因为数据收集和策略评估的界限有时比较模糊。

C. 与 `tensor.detach()` 的混淆

tensor.detach() 和 torch.no_grad() 都与计算图和梯度有关，但它们的作用方式和范围不同。

tensor.detach():
- 是一个应用于特定张量的方法。
- 它返回一个新的张量，这个新张量与原始张量共享底层数据存储，但从当前的计算图中被“分离”出来。这意味着通过这个新张量进行的操作不会影响原始计算图的梯度传播，其 requires_grad 属性为 False 。
- 原始张量及其计算历史（如果存在其他引用）保持不变。
- 常用于需要将某个中间结果用于非微分操作，或者希望阻止梯度流向网络特定部分等复杂训练场景。例如，在某些生成对抗网络(GANs)或强化学习算法中，可能需要阻止梯度通过网络的某一部分。
- 它不会全局禁用其后代码块中的梯度追踪。
- .detach() 本身可以减少特定张量历史所占用的内存，因为它创建了一个不带历史的新视图。
with torch.no_grad()::
- 是一个上下文管理器（或装饰器），影响其作用域内所有的PyTorch操作。
- 它阻止为作用域内新执行的操作创建计算图历史。
推理时显存节省的关键区别：对于整个推理过程的显存优化，torch.no_grad() 通常是更直接和全面的选择。因为它全局性地（在其作用域内）禁用了图的构建。如果试图用 detach() 达到同样的目的，理论上需要对每个中间输出都调用 .detach()，这既繁琐又不高效。torch.no_grad() 通过从源头上阻止计算历史的累积，从而更有效地管理内存。

D. `torch.no_grad()` 并非万能的显存清理器

torch.no_grad() 的作用是预防性的：它阻止Autograd引擎追踪新操作并为梯度计算存储新的中间激活值。

它并不能：

释放已经被现有张量占用的显存。
清除PyTorch的CUDA缓存。

要显式释放不再需要的张量所占用的显存，你需要：

删除对这些张量的所有Python引用（例如，使用 del tensor_reference）。
可以调用 gc.collect() 来尝试触发Python的垃圾回收机制。

要释放PyTorch缓存分配器持有的但当前未被张量使用的显存（使其在 nvidia-smi 等工具中显示为空闲），应使用 torch.cuda.empty_cache() 。

因此，torch.no_grad() 是关于阻止未来为计算图历史分配显存，而不是清理过去的分配。

E. 工厂函数例外

官方文档明确指出了一个例外情况：“所有工厂函数，或创建新张量并接受 requires_grad 关键字参数的函数，将不受此模式影响” 。

这意味着，如果你在 no_grad 块内部通过这类函数（如 torch.nn.Parameter() 或 torch.ones(..., requires_grad=True)）显式创建一个 requires_grad=True 的张量，那么该张量确实会具有 requires_grad=True。

import torch
import torch.nn as nn

with torch.no_grad():
    # torch.nn.Parameter 默认设置 requires_grad=True
    param = nn.Parameter(torch.randn(5))
    print(f"param.requires_grad inside no_grad: {param.requires_grad}") # 输出: True

    # torch.zeros 默认 requires_grad=False
    a = torch.zeros(5)
    print(f"a.requires_grad inside no_grad: {a.requires_grad}") # 输出: False

    # 在工厂函数中显式设置 requires_grad=True
    b = torch.ones(5, requires_grad=True)
    print(f"b.requires_grad inside no_grad: {b.requires_grad}") # 输出: True

    # 然而，对此类张量 (如 param 或 b) 在 no_grad 上下文内进行的后续操作，
    # 其输出的 requires_grad 仍将为 False
    output_from_param = param * 2
    print(f"output_from_param.requires_grad: {output_from_param.requires_grad}") # 输出: False
    output_from_b = b + 1
    print(f"output_from_b.requires_grad: {output_from_b.requires_grad}") # 输出: False

这种行为在实践中是合理的：例如，模型参数（nn.Parameter）即使在 no_grad 上下文中被访问或参与某种形式的“元操作”，其作为可训练参数的本质（即 requires_grad=True）不应改变。但任何利用这些参数进行的、发生在 no_grad 块内的计算（如一次前向传播），其结果不应再追踪梯度。

F. `torch.no_grad()` 不改变张量的值

torch.no_grad() 只影响梯度追踪和计算图的构建，它不改变在其上下文中执行的任何操作的数值结果。假设 model.eval() 已被正确调用以确保层行为的一致性，那么在 no_grad 块内进行的前向传播所产生的输出张量的值，与在块外进行同样的前向传播所产生的值是相同的。

理解这些常见陷阱对于有效调试至关重要。例如，如果一个模型没有按预期学习，检查代码中是否存在错放的 no_grad 块是一个关键的调试步骤。如果显存没有如预期那样节省下来，那么理解 no_grad 的作用域、工厂函数例外以及它与显存清理操作的区别就非常重要。特别地，用户有时可能试图通过将网络的一部分包裹在 no_grad 中来实现训练时的“冻结”，但这通常是错误的做法。如果目标是冻结某些层的参数不参与训练更新，但允许梯度流经这些层的激活值到达更早的层，正确的做法是设置这些参数的 param.requires_grad = False 。no_grad 会阻止其作用域内操作的输出产生梯度历史，这会中断梯度向更早层的传播。

VII. 总结：使用 `torch.no_grad()`

torch.no_grad() 是PyTorch中一个简洁而强大的工具，它通过在特定代码区域禁用梯度计算，为模型推理和评估带来了显著的显存节省和潜在的速度提升。

核心益处回顾：

显存优化：通过避免存储用于反向传播的中间激活值，大幅降低推理时的峰值显存占用。
性能提升：减少了Autograd引擎的开销，可能加速计算过程。

关键实践：

在进行任何形式的模型评估、验证或纯推理时，务必将相关代码块包裹在 with torch.no_grad(): 上下文中，或对专用推理函数使用 @torch.no_grad() 装饰器。
始终将 model.eval() 与 torch.no_grad() 结合使用，以确保模型层（如Dropout、BatchNorm）行为正确，同时实现计算效率的最大化。
理解其作用域限制：torch.no_grad() 的影响仅限于其直接包裹的代码块或函数。

你可能感兴趣的:(pytorch,人工智能,python,笔记,深度学习)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
【花了N长时间读《过犹不及》，不断练习，可以越通透】君君Love
我已经记不清花了多长时间去读《过犹不及》，读书笔记都写了42页，这算是读得特别精细的了。是一本难得的好书，虽然书中很多内容和圣经吻合，我不是基督徒，却觉得这样的文字值得细细品味，和我们的生活息息相关。我是个界线建立不牢固的人，常常愧疚，常常害怕他人的愤怒，常常不懂拒绝，还有很多时候表达不了自己真实的感受，心里在说不嘴里却在说好……这本书给我很多的启示，让我学会了怎样去建立属于自己的清晰的界限。建立
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
第八课: 写作出版你最关心的出书流程和市场分析（无戒学堂复盘）人在陌上
今天是周六，恰是圣诞节。推掉了两个需要凑腿的牌局，在一个手机，一个笔记本，一台电脑，一杯热茶的陪伴下，一个人静静地回听无戒学堂的最后一堂课。感谢这一个月，让自己的习惯开始改变，至少，可以静坐一个下午而不觉得乏味枯燥难受了，要为自己点个赞。我深知，这最后一堂课的内容，以我的资质和毅力，可能永远都用不上。但很明显，无戒学堂是用了心的，毕竟，有很多优秀学员，已经具备了写作能力，马上就要用到这堂课的内容。
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
《感官品牌》读书笔记 1 西红柿阿达
原文:最近我在东京街头闲逛时，与一位女士擦肩而过，我发现她的香水味似曾相识。“哗”的一下，记亿和情感立刻像潮水般涌了出来。这个香水味把我带回了15年前上高中的时候，我的一位亲密好友也是用这款香水。一瞬间，我呆站在那里，东京的街景逐渐淡出，取而代之的是我年少时的丹麦以及喜悦、悲伤、恐惧、困惑的记忆。我被这熟悉的香水味征服了。感想:感官是有记忆的，你所听到，看到，闻到过的有代表性的事件都会在大脑中深深
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
我不想再当知识的搬运工楚煜楚尧
因为学校课题研究的需要，这个暑假我依然需要完成一本书的阅读笔记。我选的是管建刚老师的《习课堂十讲》。这本书，之前我读过，所以重读的时候，感到很亲切，摘抄起来更是非常得心应手。20页，40面，抄了十天，终于在今天大功告成了。这对之前什么事都要一拖再拖的我来说，是破天荒的改变。我发现至从认识小尘老师以后，我的确发生了很大的改变。遇到必须做却总是犹豫不去做的事，我学会了按照小尘老师说的那样，在心里默默数
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
20210517坚持分享53天读书摘抄笔记非暴力沟通——爱自己 f79a6556cb19
让生命之花绽放在赫布·加德纳（HerbGardner）编写的《一千个小丑》一剧中，主人公拒绝将他12岁的外甥交给儿童福利院。他郑重地说道：“我希望他准确无误地知道他是多么特殊的生命，要不，他在成长的过程中将会忽视这一点。我希望他保持清醒，并看到各种奇妙的可能。我希望他知道，一旦有机会，排除万难给世界一点触动是值得的。我还希望他知道为什么他是一个人，而不是一张椅子。”然而，一旦负面的自我评价使我们看
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe

PyTorch torch.no_grad() 指南（笔记）

PyTorch torch.no_grad() 权威

一、 PyTorch中的显存管理与torch.no_grad()的重要性