吴师兄大模型

【深度学习-Day 21】框架入门：神经网络模型构建核心指南 (Keras & PyTorch)

Langchain系列文章目录

01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南
02-玩转 LangChain Memory 模块：四种记忆类型详解及应用场景全覆盖
03-全面掌握 LangChain：从核心链条构建到动态任务分配的实战指南
04-玩转 LangChain：从文档加载到高效问答系统构建的全程实战
05-玩转 LangChain：深度评估问答系统的三种高效方法（示例生成、手动评估与LLM辅助评估）
06-从 0 到 1 掌握 LangChain Agents：自定义工具 + LLM 打造智能工作流！
07-【深度解析】从GPT-1到GPT-4：ChatGPT背后的核心原理全揭秘
08-【万字长文】MCP深度解析：打通AI与世界的“USB-C”，模型上下文协议原理、实践与未来

Python系列文章目录

PyTorch系列文章目录

机器学习系列文章目录

深度学习系列文章目录

Java系列文章目录

JavaScript系列文章目录

深度学习系列文章目录

01-【深度学习-Day 1】为什么深度学习是未来？一探究竟AI、ML、DL关系与应用
02-【深度学习-Day 2】图解线性代数：从标量到张量，理解深度学习的数据表示与运算
03-【深度学习-Day 3】搞懂微积分关键：导数、偏导数、链式法则与梯度详解
04-【深度学习-Day 4】掌握深度学习的“概率”视角：基础概念与应用解析
05-【深度学习-Day 5】Python 快速入门：深度学习的“瑞士军刀”实战指南
06-【深度学习-Day 6】掌握 NumPy：ndarray 创建、索引、运算与性能优化指南
07-【深度学习-Day 7】精通Pandas：从Series、DataFrame入门到数据清洗实战
08-【深度学习-Day 8】让数据说话：Python 可视化双雄 Matplotlib 与 Seaborn 教程
09-【深度学习-Day 9】机器学习核心概念入门：监督、无监督与强化学习全解析
10-【深度学习-Day 10】机器学习基石：从零入门线性回归与逻辑回归
11-【深度学习-Day 11】Scikit-learn实战：手把手教你完成鸢尾花分类项目
12-【深度学习-Day 12】从零认识神经网络：感知器原理、实现与局限性深度剖析
13-【深度学习-Day 13】激活函数选型指南：一文搞懂Sigmoid、Tanh、ReLU、Softmax的核心原理与应用场景
14-【深度学习-Day 14】从零搭建你的第一个神经网络：多层感知器(MLP)详解
15-【深度学习-Day 15】告别“盲猜”：一文读懂深度学习损失函数
16-【深度学习-Day 16】梯度下降法 - 如何让模型自动变聪明？
17-【深度学习-Day 17】神经网络的心脏：反向传播算法全解析
18-【深度学习-Day 18】从SGD到Adam：深度学习优化器进阶指南与实战选择
19-【深度学习-Day 19】入门必读：全面解析 TensorFlow 与 PyTorch 的核心差异与选择指南
20-【深度学习-Day 20】PyTorch入门：核心数据结构张量(Tensor)详解与操作
21-【深度学习-Day 21】框架入门：神经网络模型构建核心指南 (Keras & PyTorch)

文章目录

Langchain系列文章目录
Python系列文章目录
PyTorch系列文章目录
机器学习系列文章目录
深度学习系列文章目录
Java系列文章目录
JavaScript系列文章目录
深度学习系列文章目录
前言
一、理解模型构建的基石：模型容器
- 1.1 为什么需要模型容器？
- - 1.1.1 组织与管理网络层
  - 1.1.2 便于参数管理与训练
- 1.2 TensorFlow (Keras) 中的模型容器
- - 1.2.1 Sequential API：线性堆叠的艺术
  - - （1）概念与适用场景
    - （2）如何使用 Sequential API
  - 1.2.2 Functional API：构建复杂模型的利器
  - - （1）概念与适用场景
    - （2）如何使用 Functional API
- 1.3 PyTorch 中的模型容器：`nn.Module`
- - 1.3.1 `nn.Module`：万物皆模块
  - - （1）核心理念
    - （2）如何定义模型
- 1.4 模型容器选择小结
- - 1.4.1 Keras Sequential vs Functional
  - 1.4.2 PyTorch `nn.Module` 的灵活性
二、神经网络的核心组件：常用层
- 2.1 全连接层 (Dense Layer / Linear Layer)
- - 2.1.1 原理与作用
  - 2.1.2 Keras 中的 `layers.Dense`
  - 2.1.3 PyTorch 中的 `nn.Linear`
- 2.2 激活层 (Activation Layer)
- - 2.2.1 为什么需要激活函数？
  - 2.2.2 Keras 中的激活
  - - （1）作为层（如 `Dense`）的参数
    - （2）作为独立的层 `layers.Activation`
  - 2.2.3 PyTorch 中的激活
  - - （1）`torch.nn` 模块中的激活函数
    - （2）`torch.nn.functional` 中的激活函数
- 2.3 Dropout 层 (Dropout Layer)
- - 2.3.1 原理与作用 (简述)
  - 2.3.2 Keras 中的 `layers.Dropout`
  - 2.3.3 PyTorch 中的 `nn.Dropout`
- 2.4 其他常用层 (简介)
- - 2.4.1 卷积层 (Convolutional Layers)
  - 2.4.2 池化层 (Pooling Layers)
  - 2.4.3 展平层 (Flatten Layer)
  - 2.4.4 批量归一化层 (Batch Normalization Layer)
三、洞悉模型结构：如何查看你的网络
- 3.1 为什么需要查看模型结构？
- - 3.1.1 验证模型定义是否正确
  - 3.1.2 理解参数数量与计算量
  - 3.1.3 便于沟通与文档撰写
- 3.2 Keras 中的模型可视化
- - 3.2.1 `model.summary()`
  - 3.2.2 `keras.utils.plot_model()` (可选，依赖 `pydot` 和 `graphviz`)
- 3.3 PyTorch 中的模型可视化
- - 3.3.1 打印模型实例 `print(model)`
  - 3.3.2 使用 `torchsummary` 库 (推荐)
  - 3.3.3 使用 TensorBoard (高级，简提)
四、实践：用框架搭建一个简单的多层感知器 (MLP)
- 4.1 任务定义
- - 4.1.1 问题描述
  - 4.1.2 MLP 结构设计
- 4.2 Keras 实现
- - 4.2.1 使用 Sequential API
  - 4.2.2 (可选) 使用 Functional API
  - 4.2.3 查看模型结构
- 4.3 PyTorch 实现
- - 4.3.1 定义 `nn.Module` 子类
  - 4.3.2 查看模型结构
- 4.4 代码关键点解析
- - 4.4.1 输入形状的指定
  - 4.4.2 激活函数的应用位置
  - 4.4.3 框架间的细微差异
五、常见问题与排查建议 (Q&A)
- 5.1 输入维度不匹配错误 (Input Dimension Mismatch Error)
- - 5.1.1 原因分析
  - 5.1.2 解决方案
- 5.2 如何选择 Sequential 还是 Functional API (Keras)？
- - 5.2.1 简单线性模型
  - 5.2.2 复杂模型
- 5.3 PyTorch 模型中 `forward` 方法的 `x` 是什么？
- - 5.3.1 输入数据
  - 5.3.2 确保数据流正确
- 5.4 我的模型参数数量为什么这么多/这么少？
- - 5.4.1 参数来源
  - 5.4.2 检查与调整
六、总结

前言

大家好！在上一篇【深度学习-Day 20】我们初步认识了深度学习框架中的核心数据结构——张量（Tensors），并学习了如何在 TensorFlow 和 PyTorch 中进行张量操作及自动求导。掌握了“原材料”的处理，今天我们将更进一步，学习如何使用这些框架来“搭建房子”——构建神经网络模型。

构建模型是深度学习流程中的核心环节。一个设计良好的模型结构是决定项目成败的关键因素之一。本文将带你深入了解两大主流框架 TensorFlow (主要通过其高级 API Keras) 和 PyTorch 中模型构建的机制，包括模型容器（Model Containers）的选择与使用、常用神经网络层的定义，以及如何查看和理解你所搭建的模型结构。最终，我们将通过实践，亲手用框架搭建一个简单的多层感知器（MLP）模型。

无论你是初学者还是希望系统梳理知识的进阶者，本文都将为你提供清晰、易懂的指引，助你轻松迈出用框架构建模型的第一步。

一、理解模型构建的基石：模型容器

想象一下，你要用乐高积木搭建一个复杂的城堡。你需要一个“蓝图”或者一个“底座”来有条不紊地组织这些积木块。在深度学习中，“模型容器”就扮演了类似的角色。它帮助我们将一个个独立的神经网络层（如全连接层、激活层等）有序地组合起来，形成一个完整的模型。

1.1 为什么需要模型容器？

1.1.1 组织与管理网络层

神经网络，尤其是深度神经网络，往往包含许多层。模型容器提供了一种结构化的方式来定义这些层以及它们之间的连接关系。

类比：就像一个项目经理，模型容器负责管理各个“施工队”（网络层），确保它们按照预定的“施工图”（网络结构）协同工作。
简化复杂架构：对于复杂的模型结构（例如，有多个输入、多个输出，或者层之间有共享），模型容器能够清晰地表达这种拓扑关系。

1.1.2 便于参数管理与训练

模型容器不仅仅是层的简单堆叠，它还承担着重要的“后勤”工作。

自动参数跟踪：一旦将层加入到模型容器中，容器会自动收集并管理这些层内部所有可训练的参数（权重和偏置）。
流线化训练过程：在模型训练时，我们通常会直接对整个模型容器进行操作，如传递输入数据、计算损失、执行反向传播和参数更新，而无需手动管理每一层的这些过程。

1.2 TensorFlow (Keras) 中的模型容器

TensorFlow 的高级 API Keras 提供了两种主要的模型构建方式：Sequential API 和 Functional API。

1.2.1 Sequential API：线性堆叠的艺术

keras.Sequential 模型是最简单的一种模型，适用于层的线性堆叠。顾名思义，它允许你像搭积木一样，一层一层地顺序添加网络层。

（1）概念与适用场景

概念：Sequential 模型是一个简单的层栈，其中每一层只有一个输入张量和一个输出张量。
适用场景：非常适合初学者入门，以及构建结构相对简单、没有分支或共享层的模型，例如标准的多层感知器（MLP）或简单的卷积神经网络（CNN）。

（2）如何使用 Sequential API

你可以通过向 Sequential 构造函数传递一个层列表，或通过 .add() 方法逐个添加层来创建模型。

# TensorFlow Keras Sequential API Example
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

# 假设输入数据是 784 维的向量 (例如 MNIST 图片展平后)
# 输出是 10 个类别的概率

# 方法一：通过列表传递层
model_sequential_list = keras.Sequential([
    layers.Dense(128, activation='relu', input_shape=(784,)), # 输入层 + 第一个隐藏层
    layers.Dropout(0.2), # 添加 Dropout 层防止过拟合
    layers.Dense(64, activation='relu'), # 第二个隐藏层
    layers.Dense(10, activation='softmax') # 输出层
], name="MySequentialModel_List")

# 方法二：通过 .add() 方法
model_sequential_add = keras.Sequential(name="MySequentialModel_Add")
model_sequential_add.add(layers.Dense(128, activation='relu', input_shape=(784,)))
model_sequential_add.add(layers.Dropout(0.2))
model_sequential_add.add(layers.Dense(64, activation='relu'))
model_sequential_add.add(layers.Dense(10, activation='softmax'))

# 查看模型摘要
model_sequential_list.summary()

关键行注释:

layers.Dense(128, activation='relu', input_shape=(784,)): 定义一个全连接层，有128个神经元，使用ReLU激活函数，并指定输入数据的形状为(784,)。input_shape 只在第一层需要指定。
layers.Dropout(0.2): 添加一个Dropout层，随机失活20%的神经元，用于正则化。
layers.Dense(10, activation='softmax'): 定义输出层，有10个神经元（对应10个类别），使用Softmax激活函数输出概率分布。

1.2.2 Functional API：构建复杂模型的利器

当模型结构不是简单的线性堆叠时，例如模型有多个输入或多个输出、层之间存在共享、或者网络拓扑结构比较复杂（如有向无环图 DAG），keras.Model (Functional API) 提供了更大的灵活性。

（1）概念与适用场景

概念：Functional API 允许你定义更复杂的模型，层可以像函数一样被调用，并处理张量。你通过连接这些“层函数”来构建模型的计算图。
适用场景：多输入多输出模型、共享层模型（例如 Siamese 网络）、带有残差连接的模型（例如 ResNet）等。

（2）如何使用 Functional API

使用 Functional API 时，你需要：

定义一个输入节点（keras.Input）。
像调用函数一样调用层，并将前一层的输出作为当前层的输入。
使用 keras.Model 类，通过指定模型的输入和输出来实例化模型。

# TensorFlow Keras Functional API Example
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

# 定义输入
inputs = keras.Input(shape=(784,), name="input_layer")

# 定义层并连接
x = layers.Dense(128, activation='relu', name="hidden_layer_1")(inputs)
x = layers.Dropout(0.2, name="dropout_layer")(x)
x = layers.Dense(64, activation='relu', name="hidden_layer_2")(x)
outputs = layers.Dense(10, activation='softmax', name="output_layer")(x)

# 创建模型
model_functional = keras.Model(inputs=inputs, outputs=outputs, name="MyFunctionalModel")

# 查看模型摘要
model_functional.summary()

关键行注释:

inputs = keras.Input(shape=(784,), name="input_layer"): 定义模型的输入张量，指定其形状。
x = layers.Dense(...)(inputs): 调用 Dense 层，并将 inputs 作为其输入，输出结果赋值给 x。这种链式调用是 Functional API 的核心。
model_functional = keras.Model(inputs=inputs, outputs=outputs, ...): 通过指定模型的输入和输出来实例化 Model 对象。

1.3 PyTorch 中的模型容器：`nn.Module`

在 PyTorch 中，所有的神经网络模块，无论是单个的层还是整个复杂的模型，都应该继承自 torch.nn.Module 类。这个类是 PyTorch 构建所有网络的基石。

1.3.1 `nn.Module`：万物皆模块

（1）核心理念

统一基类：nn.Module 是所有网络组件的父类。自定义模型时，你需要创建一个继承自 nn.Module 的类。
层作为属性：通常，你会在模型的 __init__ 方法中将所需的层（如 nn.Linear, nn.ReLU 等）定义为类的属性。
前向传播逻辑：你必须在模型类中实现一个名为 forward 的方法，该方法接收输入数据，并定义数据如何通过网络层进行传播，最终返回模型的输出。

（2）如何定义模型

# PyTorch nn.Module Example
import torch
import torch.nn as nn
import torch.nn.functional as F # F 通常包含无状态的操作，如激活函数

class SimpleMLP_PyTorch(nn.Module):
    def __init__(self, input_size, hidden_size1, hidden_size2, num_classes):
        super(SimpleMLP_PyTorch, self).__init__() # 必须调用父类的构造函数
        # 定义层
        self.fc1 = nn.Linear(input_size, hidden_size1) # 第一个全连接层
        self.relu1 = nn.ReLU() # ReLU 激活
        self.dropout = nn.Dropout(p=0.2) # Dropout 层
        self.fc2 = nn.Linear(hidden_size1, hidden_size2) # 第二个全连接层
        self.relu2 = nn.ReLU() # ReLU 激活
        self.fc3 = nn.Linear(hidden_size2, num_classes) # 输出层

    def forward(self, x):
        # 定义前向传播逻辑
        x = self.fc1(x)
        x = self.relu1(x)
        x = self.dropout(x)
        x = self.fc2(x)
        x = self.relu2(x)
        x = self.fc3(x)
        # 注意：在 PyTorch 中，对于多分类问题，Softmax 通常与损失函数 (如 nn.CrossEntropyLoss) 结合使用，
        # nn.CrossEntropyLoss 内部会自动应用 log_softmax 和 NLLLoss。
        # 如果确实需要直接输出 Softmax 概率，可以显式调用 F.softmax(x, dim=1)
        return x

# 示例实例化
input_dim = 784
h1_dim = 128
h2_dim = 64
output_dim = 10
model_pytorch = SimpleMLP_PyTorch(input_dim, h1_dim, h2_dim, output_dim)

# 打印模型结构（一种查看方式）
print(model_pytorch)

关键行注释:

super(SimpleMLP_PyTorch, self).__init__(): 这是Python中调用父类（即nn.Module）构造函数的标准方式，必须执行。
self.fc1 = nn.Linear(input_size, hidden_size1): 在 __init__ 方法中实例化层，并将它们作为类的属性（例如 self.fc1）。nn.Linear 是全连接层。
def forward(self, x):: 定义了数据 x 如何在网络中流动。这里，x 依次通过定义的层。

1.4 模型容器选择小结

1.4.1 Keras Sequential vs Functional

Sequential API：简单、直接，适用于构建层按顺序线性排列的模型。是快速搭建原型和简单模型的理想选择。
Functional API：更为灵活和强大，能够构建具有复杂拓扑结构（如多输入/输出、层共享、分支等）的模型。当 Sequential API 无法满足需求时，Functional API 是你的不二之选。

1.4.2 PyTorch `nn.Module` 的灵活性

PyTorch 的 nn.Module 提供了一种统一且高度灵活的模型构建方式。无论是简单的线性模型还是极其复杂的架构，都通过继承 nn.Module 并实现 __init__ 和 forward 方法来完成。这种设计赋予了开发者极大的控制权和自由度。

选择哪种方式取决于你的具体需求和模型的复杂度。对于初学者，从 Keras Sequential API 或 PyTorch nn.Module 的简单实现开始会更容易上手。

二、神经网络的核心组件：常用层

模型是由各种不同功能的“层”（Layers）搭建起来的。下面我们介绍一些在构建神经网络时最常遇到的层。

2.1 全连接层 (Dense Layer / Linear Layer)

全连接层，在 Keras 中称为 Dense 层，在 PyTorch 中称为 Linear 层，是神经网络中最基础也最常见的层之一。

2.1.1 原理与作用

原理：全连接层的每一个神经元都与前一层的所有神经元相连接。它对输入数据执行一个线性变换，即权重矩阵与输入向量相乘，再加上一个偏置向量。
数学表示：如果输入是 $x$ ，权重是 $W$ ，偏置是 $b$ ，则输出 $y$ 可以表示为：
$y = W x + b$
对于一个批次的输入 $X$ ，则为 $Y = XW^T + b$ （Keras/TensorFlow中习惯的表示）或者 $Y = X W + b$ （PyTorch中习惯的表示，取决于 $W$ 的形状定义）。
作用：全连接层能够学习输入特征之间的全局模式。在 MLP 中，它们是主要的计算单元；在 CNN 的末端，它们通常用于分类。

2.1.2 Keras 中的 `layers.Dense`

我们已经在前面的模型容器示例中看到了 layers.Dense 的用法。

关键参数：
- units: 整数，输出空间的维度（即该层神经元的数量）。
- activation: 激活函数，可以是字符串形式的预定义激活函数名（如 ‘relu’, ‘sigmoid’, ‘softmax’），也可以是一个激活函数对象。默认为 None（即线性激活 $a (x) = x$ ）。
- use_bias: 布尔值，是否使用偏置向量。默认为 True。
- kernel_initializer, bias_initializer: 权重和偏置的初始化器。
- input_shape: 一个元组，用于指定输入数据的形状。只在模型的第一层需要提供（或者使用 keras.Input）。

# Keras Dense Layer Example
# (已在 Sequential 和 Functional API 示例中展示)
# model.add(layers.Dense(64, activation='relu', input_shape=(784,)))
# dense_output = layers.Dense(10, activation='softmax')(previous_layer_output)

2.1.3 PyTorch 中的 `nn.Linear`

nn.Linear 实现了对输入数据的线性变换。

关键参数：
- in_features: 整数，每个输入样本的大小（即输入特征的数量）。
- out_features: 整数，每个输出样本的大小（即该层神经元的数量）。
- bias: 布尔值，如果设置为 False，则该层将不学习加法偏置。默认为 True。

# PyTorch Linear Layer Example
# (已在 nn.Module 示例中展示)
# self.fc1 = nn.Linear(in_features=784, out_features=128)
# linear_output = self.fc1(input_tensor)

2.2 激活层 (Activation Layer)

激活函数是神经网络的“灵魂”之一，它们为模型引入非线性，使得网络能够学习和表示比线性模型复杂得多的函数。

2.2.1 为什么需要激活函数？

引入非线性：如果没有激活函数（或者说激活函数是线性的），那么无论神经网络有多少层，整个网络本质上仍然是一个线性模型，其表达能力将非常有限，无法解决复杂的非线性问题。
（我们在【深度学习-Day 13】激活函数大阅兵中详细讨论过各种激活函数及其特性，这里不再赘述。）

2.2.2 Keras 中的激活

在 Keras 中，激活函数可以通过两种方式应用：

（1）作为层（如 `Dense`）的参数

这是最常见的方式，直接在定义层时通过 activation 参数指定。

# Keras: Activation as a parameter
hidden_layer = layers.Dense(64, activation='relu')
output_layer = layers.Dense(10, activation='softmax')

（2）作为独立的层 `layers.Activation`

有时，你可能想在没有内置 activation 参数的层之后，或者想更明确地表示激活步骤时，可以使用 layers.Activation 层。

# Keras: Activation as a separate layer
model = keras.Sequential([
    layers.Dense(64, input_shape=(784,)), # 线性输出
    layers.Activation('relu'),             # 应用 ReLU 激活
    layers.Dense(10),                      # 线性输出
    layers.Activation('softmax')           # 应用 Softmax 激活
])

何时使用独立激活层？ 当你使用的层本身不接受 activation 参数，或者你想在多个操作之间插入一个激活函数时，独立的激活层会很有用。

2.2.3 PyTorch 中的激活

在 PyTorch 中，激活函数通常也存在于 torch.nn 模块中（作为有状态的层）或 torch.nn.functional 模块中（作为无状态的函数）。

（1）`torch.nn` 模块中的激活函数

这些激活函数本身也是 nn.Module 的子类，可以像普通层一样在 __init__ 中实例化并在 forward 方法中调用。

# PyTorch: Activations from nn module
class MyModelWithNNActivations(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim):
        super().__init__()
        self.fc1 = nn.Linear(input_dim, hidden_dim)
        self.relu = nn.ReLU() # 实例化 ReLU 层
        self.fc2 = nn.Linear(hidden_dim, output_dim)
        self.softmax = nn.Softmax(dim=1) # 实例化 Softmax 层, dim=1 表示对每行的数值进行softmax

    def forward(self, x):
        x = self.fc1(x)
        x = self.relu(x) # 调用 ReLU 实例
        x = self.fc2(x)
        x = self.softmax(x) # 调用 Softmax 实例
        return x

（2）`torch.nn.functional` 中的激活函数

torch.nn.functional (通常导入为 F) 提供了许多与 nn 模块中层对应的函数式版本。这些函数是无状态的，可以直接在 forward 方法中调用，有时可以使代码更简洁。

# PyTorch: Activations from nn.functional
import torch.nn.functional as F

class MyModelWithFunctionalActivations(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim):
        super().__init__()
        self.fc1 = nn.Linear(input_dim, hidden_dim)
        self.fc2 = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        x = self.fc1(x)
        x = F.relu(x) # 直接调用 F.relu 函数
        x = self.fc2(x)
        x = F.softmax(x, dim=1) # 直接调用 F.softmax 函数
        return x

nn.Module vs nn.functional：如果激活函数有可学习的参数（例如 PReLU），则必须使用 nn 模块中的版本。对于没有可学习参数的激活函数（如 ReLU, Sigmoid, Tanh, Softmax），两者皆可。使用 nn.functional 通常更简洁，但 nn.Module 的方式使得网络结构在 print(model) 时更为清晰，因为激活函数会作为独立的模块显示出来。

2.3 Dropout 层 (Dropout Layer)

Dropout 是一种非常有效的正则化技术，用于减少神经网络中的过拟合现象。（我们将在【深度学习-Day 26】正则化技术（二）：Dropout 中详细讨论其原理。）

2.3.1 原理与作用 (简述)

原理：在训练过程的每次迭代中，Dropout 层会以一定的概率（dropout rate）随机地“丢弃”（即将其输出设置为零）一部分神经元的输出。
作用：通过这种方式，它强迫网络学习更加鲁棒的特征，因为网络不能依赖于任何一个特定的神经元。它类似于训练多个不同的网络然后取平均，但开销小得多。

2.3.2 Keras 中的 `layers.Dropout`

关键参数：
- rate: 浮点数，介于0和1之间，表示要丢弃的输入单元的比例。例如，rate=0.2 表示随机丢弃20%的输入单元。

# Keras Dropout Layer
# model.add(layers.Dense(128, activation='relu'))
# model.add(layers.Dropout(0.5)) # 在激活的全连接层之后添加 Dropout

Dropout 通常放在激活函数的后面。

2.3.3 PyTorch 中的 `nn.Dropout`

关键参数：
- p: 浮点数，元素被归零的概率。默认为 0.5。注意与 Keras 中 rate 的含义相同。
- inplace: 布尔值，如果设置为 True，将就地执行此操作。默认为 False。

# PyTorch Dropout Layer
# self.dropout = nn.Dropout(p=0.5)
# x = self.dropout(activated_x) # 在激活值之后应用

重要提示：Dropout 层在训练和评估（或测试）时的行为是不同的。在训练时，它会随机丢弃神经元；在评估时，它会自动关闭，并对权重进行相应的缩放，以确保输出的期望值与训练时一致。框架会自动处理这种切换（通常通过 model.train() 和 model.eval() 模式）。

2.4 其他常用层 (简介)

除了上述核心层，还有许多其他类型的层，我们将在后续专门的章节中详细介绍它们。这里先做个简要的提及，让你有个初步印象：

2.4.1 卷积层 (Convolutional Layers)

用途：主要用于处理网格状数据，如图像（2D卷积）和序列（1D卷积）。它们通过卷积核（滤波器）在输入数据上滑动来提取局部特征。
Keras: layers.Conv1D, layers.Conv2D, layers.Conv3D
PyTorch: nn.Conv1d, nn.Conv2d, nn.Conv3d
我们将在【阶段三：卷积神经网络 (CNN)】中深入学习。

2.4.2 池化层 (Pooling Layers)

用途：通常用在卷积层之后，用于降低特征图的空间维度（下采样），从而减少参数数量、计算量，并有助于控制过拟合，同时提供一定程度的平移不变性。
类型：最常见的是最大池化（Max Pooling）和平均池化（Average Pooling）。
Keras: layers.MaxPooling1D, layers.MaxPooling2D, layers.AveragePooling2D, etc.
PyTorch: nn.MaxPool1d, nn.MaxPool2d, nn.AvgPool2d, etc.
同样会在 CNN 章节详细介绍。

2.4.3 展平层 (Flatten Layer)

用途：将多维的输入张量“压平”成一个一维张量。例如，在 CNN 中，经过一系列卷积和池化层后得到的特征图通常是多维的，在送入全连接层之前，需要先通过 Flatten 层将其转换为一维向量。
Keras: layers.Flatten()
PyTorch: torch.flatten(input_tensor, start_dim=1) (函数式) 或 nn.Flatten(start_dim=1, end_dim=-1) (模块式)。start_dim=1 通常是为了保留 batch 维度。

# Keras Flatten Example (通常在CNN后接Dense层前使用)
# model.add(layers.Conv2D(32, (3, 3), activation='relu'))
# model.add(layers.MaxPooling2D((2, 2)))
# model.add(layers.Flatten())
# model.add(layers.Dense(10, activation='softmax'))

# PyTorch Flatten Example
# class CNN(nn.Module):
#     def __init__(self):
#         super().__init__()
#         self.conv1 = nn.Conv2d(1, 16, kernel_size=3, stride=1, padding=1)
#         self.relu = nn.ReLU()
#         self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
#         self.flatten = nn.Flatten() # 或者在 forward 中使用 torch.flatten
#         self.fc = nn.Linear(16 * 14 * 14, 10) # 假设输入是28x28的MNIST，池化一次后是14x14

#     def forward(self, x):
#         x = self.pool(self.relu(self.conv1(x)))
#         x = self.flatten(x) # x = x.view(x.size(0), -1) 另一种展平方式
#         x = self.fc(x)
#         return x

2.4.4 批量归一化层 (Batch Normalization Layer)

用途：用于加速深度网络训练，提高模型的稳定性和性能。它通过对每个小批量（mini-batch）数据的激活值进行归一化处理，并学习相应的缩放和平移参数。
Keras: layers.BatchNormalization()
PyTorch: nn.BatchNorm1d, nn.BatchNorm2d, nn.BatchNorm3d
我们将在【深度学习-Day 27】其他正则化与模型改进技巧中更详细地介绍它。

三、洞悉模型结构：如何查看你的网络

当你辛辛苦苦搭建好一个模型后，如何确认它的结构是否如你所愿？参数数量是否合理？这时，查看模型结构的功能就显得尤为重要。

3.1 为什么需要查看模型结构？

3.1.1 验证模型定义是否正确

确保连接无误：特别是对于使用 Functional API 或复杂 nn.Module 构建的模型，可视化或摘要可以帮助你确认各层是否按照预期连接，数据流是否正确。
检查层类型和参数：确认每一层的类型、神经元数量、激活函数等设置是否正确。

3.1.2 理解参数数量与计算量

参数统计：模型摘要通常会列出每一层的参数数量以及总参数数量。这有助于评估模型的复杂度、潜在的内存消耗和计算需求。
调试与优化：如果模型参数过多，可能容易过拟合或训练缓慢；参数过少，则可能表达能力不足。查看参数量是模型优化的第一步。

3.1.3 便于沟通与文档撰写

清晰展示：一个清晰的模型结构图或摘要是与他人交流模型设计、撰写报告或论文时的重要辅助材料。

3.2 Keras 中的模型可视化

3.2.1 `model.summary()`

这是最常用也最直接的方法，它会在控制台打印出模型的文本摘要，包括：

每一层的名称 (如果指定) 和类型。
每一层的输出形状 (Output Shape)。
每一层的参数数量 (Param #)。
总参数数量、可训练参数数量和不可训练参数数量。

# Keras model.summary()
# (已在之前的 Keras 模型示例中展示)
# model_sequential_list.summary()
# model_functional.summary()

输出示例：

Model: "MySequentialModel_List"
_________________________________________________________________
 Layer (type)                Output Shape              Param #
=================================================================
 dense (Dense)               (None, 128)               100480

 dropout (Dropout)           (None, 128)               0

 dense_1 (Dense)             (None, 64)                8256

 dense_2 (Dense)             (None, 10)                650

=================================================================
Total params: 109386 (427.29 KB)
Trainable params: 109386 (427.29 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________

(None, 128) 中的 None 表示该维度可以是任意大小，通常对应批处理大小 (batch size)。

3.2.2 `keras.utils.plot_model()` (可选，依赖 `pydot` 和 `graphviz`)

如果你希望得到一个更直观的图形化模型结构，可以使用 keras.utils.plot_model 函数。它可以将模型结构保存为一张图片。

依赖：这个功能需要安装 pydot 和 graphviz。你可以通过 pip 安装 pydot (pip install pydot)，而 graphviz 是一个系统级的软件包，需要根据你的操作系统进行安装（例如，在 Ubuntu 上 sudo apt-get install graphviz）。

# Keras keras.utils.plot_model()
# (确保已安装 pydot 和 graphviz)
try:
    tf.keras.utils.plot_model(
        model_functional, # 使用 Functional API 构建的模型效果更佳
        to_file='functional_model_plot.png',
        show_shapes=True, # 显示形状信息
        show_dtype=False, # 不显示数据类型
        show_layer_names=True, # 显示层名称
        rankdir='TB', # 'TB' for top-to-bottom; 'LR' for left-to-right
        expand_nested=False, # 是否展开嵌套模型
        dpi=96 # 图像的DPI
    )
    print("模型结构图已保存为 functional_model_plot.png")
except ImportError:
    print("无法生成模型结构图，请确保已安装 pydot 和 graphviz。")

这张图会清晰地展示层与层之间的连接关系，对于理解复杂模型非常有帮助。

3.3 PyTorch 中的模型可视化

3.3.1 打印模型实例 `print(model)`

直接打印 nn.Module 的实例会输出一个模型的概览，显示每一层及其子模块的结构和一些参数信息。

# PyTorch print(model)
# (已在之前的 PyTorch 模型示例中展示)
# print(model_pytorch)

输出示例：

SimpleMLP_PyTorch(
  (fc1): Linear(in_features=784, out_features=128, bias=True)
  (relu1): ReLU()
  (dropout): Dropout(p=0.2, inplace=False)
  (fc2): Linear(in_features=128, out_features=64, bias=True)
  (relu2): ReLU()
  (fc3): Linear(in_features=64, out_features=10, bias=True)
)

这种方式简洁明了，对于理解模型层次结构很有帮助。

3.3.2 使用 `torchsummary` 库 (推荐)

如果你想要类似 Keras model.summary() 那样的详细输出，包括每层的输出形状和参数数量，可以使用第三方库 torchsummary。

安装：pip install torchsummary

# PyTorch torchsummary (推荐)
from torchsummary import summary

# 确保模型和输入数据在同一个设备上 (CPU 或 GPU)
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model_pytorch.to(device)

# 需要提供一个与模型输入匹配的示例输入尺寸
# (batch_size, channel, height, width) for CNNs
# (batch_size, input_features) for MLPs
try:
    summary(model_pytorch, input_size=(input_dim,)) # 对于MLP，通常是 (input_features,)
except Exception as e:
    print(f"使用 torchsummary 时发生错误: {e}")
    print("请确保模型已移至正确设备，且 input_size 与模型 forward 方法的输入匹配。")

输出示例（类似于 Keras 的 summary()）：

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Linear-1                  [-1, 128]         100,480
              ReLU-2                  [-1, 128]               0
           Dropout-3                  [-1, 128]               0
            Linear-4                   [-1, 64]           8,256
              ReLU-5                   [-1, 64]               0
            Linear-6                   [-1, 10]             650
================================================================
Total params: 109,386
Trainable params: 109,386
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.00
Forward/backward pass size (MB): 0.00
Params size (MB): 0.42
Estimated Total Size (MB): 0.42
----------------------------------------------------------------

torchsummary 提供了非常详细的信息，对于分析 PyTorch 模型非常有价值。

3.3.3 使用 TensorBoard (高级，简提)

TensorBoard 是一个强大的可视化工具套件，最初为 TensorFlow 开发，但现在也可以与 PyTorch (通过 torch.utils.tensorboard.SummaryWriter) 很好地集成。它可以用来可视化模型图、训练指标（如损失和准确率）、权重分布等。
在 PyTorch 中，你可以使用 SummaryWriter 将模型图写入 TensorBoard 日志文件：

from torch.utils.tensorboard import SummaryWriter

# writer = SummaryWriter('runs/my_experiment_name')
# # 假设 dummy_input 是一个符合模型输入形状的示例张量
# dummy_input = torch.randn(1, input_dim).to(device) # batch_size=1
# try:
#     writer.add_graph(model_pytorch, dummy_input)
#     writer.close()
#     print("模型图已写入 TensorBoard 日志。启动 TensorBoard 查看：tensorboard --logdir=runs")
# except Exception as e:
#     print(f"写入 TensorBoard 图时出错: {e}")

我们将在后续关于模型训练与监控的文章中更详细地介绍 TensorBoard 的使用。

四、实践：用框架搭建一个简单的多层感知器 (MLP)

理论学习之后，最好的巩固方式就是动手实践。现在，我们将使用 Keras 和 PyTorch 分别搭建一个结构相同的简单多层感知器 (MLP) 模型。

4.1 任务定义

4.1.1 问题描述

我们假设一个通用的分类任务。例如，输入是 $784$ 维的特征向量（比如展平的 $28 \times 28$ 像素的灰度图像，如 MNIST 数据集），我们的目标是将其分为 $10$ 个不同的类别。

4.1.2 MLP 结构设计

我们将设计一个具有以下结构的 MLP：

输入层：接收 $784$ 维的输入。
第一个隐藏层： $128$ 个神经元，使用 ReLU 激活函数。
Dropout 层：丢弃率为 $0.2$ ，防止过拟合。
第二个隐藏层： $64$ 个神经元，使用 ReLU 激活函数。
输出层： $10$ 个神经元（对应 $10$ 个类别），使用 Softmax 激活函数输出每个类别的概率。

我们可以用 Mermaid 语法绘制这个结构图：

graph TD
    A[输入层 (784 特征)] --> B(全连接层 1: 128 单元, ReLU)
    B --> DRP1(Dropout: rate=0.2)
    DRP1 --> C(全连接层 2: 64 单元, ReLU)
    C --> D(输出层: 10 单元, Softmax)

4.2 Keras 实现

我们将主要使用 Sequential API，因为它非常适合这种线性堆叠的结构。

4.2.1 使用 Sequential API

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

# 定义 Keras MLP 模型
def create_keras_mlp(input_shape=(784,), num_classes=10):
    model = keras.Sequential([
        layers.Input(shape=input_shape, name="input"), # 使用 Input 层明确指定输入
        layers.Dense(128, activation='relu', name="hidden_layer_1"),
        layers.Dropout(0.2, name="dropout_1"),
        layers.Dense(64, activation='relu', name="hidden_layer_2"),
        layers.Dense(num_classes, activation='softmax', name="output_layer")
    ], name="Simple_MLP_Keras")
    return model

keras_mlp_model = create_keras_mlp()

4.2.2 (可选) 使用 Functional API

为了对比，我们也可以用 Functional API 实现相同的结构：

def create_keras_mlp_functional(input_shape=(784,), num_classes=10):
    inputs = keras.Input(shape=input_shape, name="input")
    x = layers.Dense(128, activation='relu', name="hidden_layer_1")(inputs)
    x = layers.Dropout(0.2, name="dropout_1")(x)
    x = layers.Dense(64, activation='relu', name="hidden_layer_2")(x)
    outputs = layers.Dense(num_classes, activation='softmax', name="output_layer")(x)
    model = keras.Model(inputs=inputs, outputs=outputs, name="Simple_MLP_Keras_Functional")
    return model

# keras_mlp_model_functional = create_keras_mlp_functional()

4.2.3 查看模型结构

print("Keras MLP Model Summary:")
keras_mlp_model.summary()

# (可选) 生成模型图
# try:
#     tf.keras.utils.plot_model(keras_mlp_model, to_file='keras_mlp_plot.png', show_shapes=True)
#     print("Keras MLP 结构图已保存为 keras_mlp_plot.png")
# except ImportError:
#     print("无法生成 Keras MLP 结构图，请确保 pydot 和 graphviz 已安装。")

4.3 PyTorch 实现

我们将定义一个继承自 nn.Module 的类。

4.3.1 定义 `nn.Module` 子类

import torch
import torch.nn as nn
import torch.nn.functional as F

class PyTorchMLP(nn.Module):
    def __init__(self, input_size=784, num_classes=10):
        super(PyTorchMLP, self).__init__()
        self.fc1 = nn.Linear(input_size, 128)
        self.dropout1 = nn.Dropout(p=0.2)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, num_classes)

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = self.dropout1(x)
        x = F.relu(self.fc2(x))
        # 输出层通常不直接应用 softmax，因为 nn.CrossEntropyLoss 会处理它
        # 如果需要直接概率输出，可以在推理时应用： x = F.softmax(self.fc3(x), dim=1)
        x = self.fc3(x)
        return x

pytorch_mlp_model = PyTorchMLP()

4.3.2 查看模型结构

print("\nPyTorch MLP Model Structure:")
print(pytorch_mlp_model)

from torchsummary import summary
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
pytorch_mlp_model.to(device)
print("\nPyTorch MLP Model Summary (using torchsummary):")
try:
    summary(pytorch_mlp_model, input_size=(784,))
except Exception as e:
    print(f"生成 torchsummary 时出错: {e}")

4.4 代码关键点解析

4.4.1 输入形状的指定

Keras:
- 在 Sequential 模型中，通常在第一层通过 input_shape 参数指定（不含批次大小）。
- 或者，更推荐的方式是使用 keras.Input 层作为第一层，明确定义输入。
- 在 Functional API 中，必须由 keras.Input 层开始。
PyTorch:
- nn.Linear 等层在其 __init__ 方法中通过 in_features 参数接收输入特征数。
- 模型在实例化时并不立即知道完整的输入张量形状（尤其是批次大小），这是在 forward 方法第一次接收到实际数据时确定的。torchsummary 需要你提供一个 input_size 来帮助它推断。

4.4.2 激活函数的应用位置

Keras: 可以作为 Dense 等层的 activation 参数，也可以作为独立的 layers.Activation 层。
PyTorch: 可以在 __init__ 中实例化为 nn.ReLU, nn.Softmax 等模块，然后在 forward 中调用；或者直接在 forward 中使用 torch.nn.functional (如 F.relu, F.softmax) 中的函数。

4.4.3 框架间的细微差异

Softmax 和损失函数：
- 在 Keras 中，用于分类的输出层通常会显式地使用 activation='softmax'。
- 在 PyTorch 中，当使用 nn.CrossEntropyLoss 作为损失函数时，推荐输出层不加 Softmax，因为 nn.CrossEntropyLoss 内部已经包含了 LogSoftmax 和 NLLLoss，这样做可以提高数值稳定性。如果在推理阶段需要概率输出，可以再显式调用 F.softmax。
Dropout 的行为：两个框架都会在 model.eval() (PyTorch) 或推理时 (Keras) 自动关闭 Dropout 并调整权重。

通过这些实践，你应该对如何在两大主流框架中定义和组织神经网络模型有了更清晰的认识。记住，模型构建只是第一步，接下来我们还需要学习如何加载数据、定义损失函数和优化器，并最终训练和评估我们的模型，这些内容将在后续文章中展开（【深度学习-Day 22】和【深度学习-Day 23】）。

五、常见问题与排查建议 (Q&A)

在模型构建过程中，新手常常会遇到一些问题。这里列举几个常见的问题及其排查思路。

5.1 输入维度不匹配错误 (Input Dimension Mismatch Error)

这是最常见的问题之一，通常表现为 “ValueError: Input 0 of layer … is incompatible with the layer: expected axis … to have value … but received input with shape …” (Keras) 或类似 “mat1 and mat2 shapes cannot be multiplied” (PyTorch) 的错误。

5.1.1 原因分析

层间连接错误：当前层的期望输入维度与前一层实际输出的维度不匹配。
input_shape 或 in_features 设置不当：模型的第一层或特定层的输入维度参数设置错误。
数据预处理问题：实际喂给模型的数据形状与模型期望的输入形状不符（这更多是训练时的问题，但设计时也需考虑）。

5.1.2 解决方案

仔细检查 input_shape (Keras) / in_features (PyTorch)：确保每一层的输入输出维度能够正确衔接。
使用 model.summary() (Keras) 或 torchsummary.summary() (PyTorch)：打印出每一层的输出形状，逐层检查维度变化是否符合预期。
对于 CNN 后的 Flatten 层：特别注意 Flatten 层之前的卷积/池化层的输出特征图尺寸，确保 Flatten 后的向量维度能被后续全连接层正确接收。

5.2 如何选择 Sequential 还是 Functional API (Keras)？

5.2.1 简单线性模型

如果你的模型是一条直线的层序列，没有分支、共享层或多个输入/输出，Sequential API 更简洁、更易读。

5.2.2 复杂模型

如果你的模型有以下任一特征：
- 多输入或多输出。
- 层之间有共享权重。
- 非线性的拓扑结构（例如，残差连接）。
  则必须使用 Functional API，它提供了构建这类复杂模型的灵活性。

5.3 PyTorch 模型中 `forward` 方法的 `x` 是什么？

5.3.1 输入数据

在 def forward(self, x): 中，参数 x 代表传递给模型的一批输入数据（a batch of input data）。
它的形状通常是 (batch_size, ...)，其中 ... 代表输入特征的维度。例如，对于 MLP 处理展平的 MNIST 图像，x 的形状可能是 (batch_size, 784)。

5.3.2 确保数据流正确

在 forward 方法内部，你需要确保 x 按照你设计的网络结构，依次通过定义的各个层进行转换。每一行代码 x = self.some_layer(x) 或 x = F.some_function(x) 都在更新 x 的状态，将其从上一层的输出转变为当前操作的输出，最终得到整个模型的输出。

5.4 我的模型参数数量为什么这么多/这么少？

5.4.1 参数来源

全连接层 (Dense/Linear)：参数主要来自权重矩阵 $W$ 和偏置向量 $b$ 。参数数量为 (input_features * output_features) + output_features。
卷积层 (Conv2D)：参数来自卷积核权重和偏置。数量为 (kernel_height * kernel_width * input_channels * output_channels) + output_channels。
其他层：如激活层、池化层、Dropout 层通常没有可训练参数或参数很少。批量归一化层有少量可训练参数（gamma 和 beta）。

5.4.2 检查与调整

使用 model.summary() 或 torchsummary 查看各层参数。
如果参数过多，考虑：
- 减少全连接层的神经元数量。
- 在 CNN 中使用更小的卷积核、更少的输出通道或增加池化层。
- 采用参数共享技术或更高效的模型结构（如 MobileNet, SqueezeNet 中的深度可分离卷积等，这些是进阶主题）。
如果参数过少，模型可能表达能力不足（欠拟合），可以考虑适当增加层数或神经元数量。

六、总结

恭喜你，完成了本次关于使用深度学习框架构建模型的学习！通过本文，我们深入探讨了模型构建的核心概念和实践技巧。现在，让我们回顾一下关键知识点：

模型容器的重要性：
- Keras 提供了 Sequential API 用于快速搭建线性堆叠模型，以及更灵活的 Functional API 用于构建复杂网络拓扑。
- PyTorch 的核心是 nn.Module，所有模型和层都继承自它，通过在 __init__ 中定义层并在 forward 方法中指定数据流向来构建模型，提供了极高的灵活性。
- 模型容器负责组织网络层、管理参数，并简化训练流程。
常用层的功能与实现：
- 全连接层 (Dense/Linear): 实现线性变换，学习全局特征，其参数为权重 $W$ 和偏置 $b$ 。
- 激活层/函数 (Activation/ReLU, Softmax, etc.): 为模型引入非线性，使其能学习复杂模式。可以作为层参数或独立模块/函数使用。
- Dropout 层: 一种正则化技术，在训练时随机丢弃神经元输出，防止过拟合。
- 其他层简介: 初步了解了卷积层、池化层、展平层和批量归一化层等在特定场景下的作用。
模型结构的可视化：
- Keras: model.summary() 提供文本摘要；keras.utils.plot_model() 可生成模型结构图（需 pydot 和 graphviz）。
- PyTorch: print(model) 显示模块层级；推荐使用 torchsummary 库的 summary() 函数获取详细的类 Keras 摘要；TensorBoard 可用于更高级的图可视化。
- 查看模型结构有助于验证定义、理解参数量并辅助调试。
实践构建MLP：
- 我们通过一个具体的多层感知器（MLP）示例，分别用 Keras (Sequential API) 和 PyTorch (nn.Module) 实现了相同的网络结构。
- 比较了两者在输入指定、激活函数应用和输出层处理（如 Softmax 与损失函数的配合）等方面的异同。
框架选择与使用哲学：
- Keras 以用户友好和快速原型开发著称。
- PyTorch 以其动态计算图和 Pythonic 的编程风格受到研究者和需要高度自定义的开发者的青睐。
- 理解不同框架构建模型的核心思想，有助于你根据项目需求和个人偏好做出选择。

你可能感兴趣的:(深度学习入门到精通,深度学习,神经网络,keras,人工智能,python,pytorch,LLM)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
免费编程课程大汇总：从入门到精通的一站式资源大力出奇迹985 人工智能大数据
在数字化时代，编程已成为一项至关重要的技能，无论是为了职业发展还是个人兴趣，学习编程都极具价值。本文精心汇总了丰富的免费编程课程资源，涵盖从基础入门到精通的各个阶段。通过全面介绍如Coursera、edX等在线学习平台，Codecademy、freeCodeCamp等交互式学习网站，以及B站、网易云课堂等视频课程平台的免费课程，为编程学习者提供了一站式的资源指南，帮助读者轻松开启编程学习之旅，逐步
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
神经形态计算如何突破冯·诺依曼架构限制？ AI算力网络与通信 AI人工智能与大数据技术 AI算力网络与通信原理 AI人工智能大数据架构架构 ai
神经形态计算如何突破冯·诺依曼架构限制？关键词：神经形态计算、冯·诺依曼架构、内存墙、存算一体、脉冲神经网络、类脑芯片、低功耗计算摘要：本文将从“冯·诺依曼架构的前世今生”讲起，用“图书馆管理员搬书”的生活案例类比其核心矛盾，再通过“人脑神经元工作模式”的比喻引入神经形态计算的核心原理。我们将一步步拆解冯·诺依曼架构的三大限制（内存墙、高功耗、非结构化数据处理弱），并对应解析神经形态计算的三大突破
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

【深度学习-Day 21】框架入门：神经网络模型构建核心指南 (Keras & PyTorch)

Langchain系列文章目录

Python系列文章目录

PyTorch系列文章目录

机器学习系列文章目录

深度学习系列文章目录

Java系列文章目录

JavaScript系列文章目录

深度学习系列文章目录

文章目录

前言

一、理解模型构建的基石：模型容器

1.1 为什么需要模型容器？

1.1.1 组织与管理网络层

1.1.2 便于参数管理与训练

1.2 TensorFlow (Keras) 中的模型容器

1.2.1 Sequential API：线性堆叠的艺术

（1）概念与适用场景

（2）如何使用 Sequential API

1.2.2 Functional API：构建复杂模型的利器

（1）概念与适用场景

（2）如何使用 Functional API

1.3 PyTorch 中的模型容器：nn.Module

1.3.1 nn.Module：万物皆模块

（1）核心理念

（2）如何定义模型

1.4 模型容器选择小结

1.4.1 Keras Sequential vs Functional

1.4.2 PyTorch nn.Module 的灵活性

二、神经网络的核心组件：常用层

2.1 全连接层 (Dense Layer / Linear Layer)

2.1.1 原理与作用

2.1.2 Keras 中的 layers.Dense

2.1.3 PyTorch 中的 nn.Linear

2.2 激活层 (Activation Layer)

2.2.1 为什么需要激活函数？

2.2.2 Keras 中的激活

（1）作为层（如 Dense）的参数

（2）作为独立的层 layers.Activation

2.2.3 PyTorch 中的激活

（1）torch.nn 模块中的激活函数

（2）torch.nn.functional 中的激活函数

2.3 Dropout 层 (Dropout Layer)

2.3.1 原理与作用 (简述)

2.3.2 Keras 中的 layers.Dropout

2.3.3 PyTorch 中的 nn.Dropout

2.4 其他常用层 (简介)

2.4.1 卷积层 (Convolutional Layers)

2.4.2 池化层 (Pooling Layers)

2.4.3 展平层 (Flatten Layer)

2.4.4 批量归一化层 (Batch Normalization Layer)

三、洞悉模型结构：如何查看你的网络

3.1 为什么需要查看模型结构？

3.1.1 验证模型定义是否正确

3.1.2 理解参数数量与计算量

3.1.3 便于沟通与文档撰写

3.2 Keras 中的模型可视化

3.2.1 model.summary()

3.2.2 keras.utils.plot_model() (可选，依赖 pydot 和 graphviz)

3.3 PyTorch 中的模型可视化

3.3.1 打印模型实例 print(model)

3.3.2 使用 torchsummary 库 (推荐)

3.3.3 使用 TensorBoard (高级，简提)

四、实践：用框架搭建一个简单的多层感知器 (MLP)

4.1 任务定义

4.1.1 问题描述

4.1.2 MLP 结构设计

4.2 Keras 实现

4.2.1 使用 Sequential API

4.2.2 (可选) 使用 Functional API

4.2.3 查看模型结构

4.3 PyTorch 实现

4.3.1 定义 nn.Module 子类

4.3.2 查看模型结构

4.4 代码关键点解析

4.4.1 输入形状的指定

4.4.2 激活函数的应用位置

4.4.3 框架间的细微差异

五、常见问题与排查建议 (Q&A)

5.1 输入维度不匹配错误 (Input Dimension Mismatch Error)

1.3 PyTorch 中的模型容器：`nn.Module`

1.3.1 `nn.Module`：万物皆模块

1.4.2 PyTorch `nn.Module` 的灵活性

2.1.2 Keras 中的 `layers.Dense`

2.1.3 PyTorch 中的 `nn.Linear`

（1）作为层（如 `Dense`）的参数

（2）作为独立的层 `layers.Activation`

（1）`torch.nn` 模块中的激活函数

（2）`torch.nn.functional` 中的激活函数

2.3.2 Keras 中的 `layers.Dropout`

2.3.3 PyTorch 中的 `nn.Dropout`

3.2.1 `model.summary()`

3.2.2 `keras.utils.plot_model()` (可选，依赖 `pydot` 和 `graphviz`)

3.3.1 打印模型实例 `print(model)`

3.3.2 使用 `torchsummary` 库 (推荐)

4.3.1 定义 `nn.Module` 子类

5.3 PyTorch 模型中 `forward` 方法的 `x` 是什么？