吴师兄大模型

【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路

Langchain系列文章目录

01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南
02-玩转 LangChain Memory 模块：四种记忆类型详解及应用场景全覆盖
03-全面掌握 LangChain：从核心链条构建到动态任务分配的实战指南
04-玩转 LangChain：从文档加载到高效问答系统构建的全程实战
05-玩转 LangChain：深度评估问答系统的三种高效方法（示例生成、手动评估与LLM辅助评估）
06-从 0 到 1 掌握 LangChain Agents：自定义工具 + LLM 打造智能工作流！
07-【深度解析】从GPT-1到GPT-4：ChatGPT背后的核心原理全揭秘
08-【万字长文】MCP深度解析：打通AI与世界的“USB-C”，模型上下文协议原理、实践与未来

Python系列文章目录

PyTorch系列文章目录

机器学习系列文章目录

深度学习系列文章目录

Java系列文章目录

JavaScript系列文章目录

深度学习系列文章目录

01-【深度学习-Day 1】为什么深度学习是未来？一探究竟AI、ML、DL关系与应用
02-【深度学习-Day 2】图解线性代数：从标量到张量，理解深度学习的数据表示与运算
03-【深度学习-Day 3】搞懂微积分关键：导数、偏导数、链式法则与梯度详解
04-【深度学习-Day 4】掌握深度学习的“概率”视角：基础概念与应用解析
05-【深度学习-Day 5】Python 快速入门：深度学习的“瑞士军刀”实战指南
06-【深度学习-Day 6】掌握 NumPy：ndarray 创建、索引、运算与性能优化指南
07-【深度学习-Day 7】精通Pandas：从Series、DataFrame入门到数据清洗实战
08-【深度学习-Day 8】让数据说话：Python 可视化双雄 Matplotlib 与 Seaborn 教程
09-【深度学习-Day 9】机器学习核心概念入门：监督、无监督与强化学习全解析
10-【深度学习-Day 10】机器学习基石：从零入门线性回归与逻辑回归
11-【深度学习-Day 11】Scikit-learn实战：手把手教你完成鸢尾花分类项目
12-【深度学习-Day 12】从零认识神经网络：感知器原理、实现与局限性深度剖析
13-【深度学习-Day 13】激活函数选型指南：一文搞懂Sigmoid、Tanh、ReLU、Softmax的核心原理与应用场景
14-【深度学习-Day 14】从零搭建你的第一个神经网络：多层感知器(MLP)详解
15-【深度学习-Day 15】告别“盲猜”：一文读懂深度学习损失函数
16-【深度学习-Day 16】梯度下降法 - 如何让模型自动变聪明？
17-【深度学习-Day 17】神经网络的心脏：反向传播算法全解析
18-【深度学习-Day 18】从SGD到Adam：深度学习优化器进阶指南与实战选择
19-【深度学习-Day 19】入门必读：全面解析 TensorFlow 与 PyTorch 的核心差异与选择指南
20-【深度学习-Day 20】PyTorch入门：核心数据结构张量(Tensor)详解与操作
21-【深度学习-Day 21】框架入门：神经网络模型构建核心指南 (Keras & PyTorch)
22-【深度学习-Day 22】框架入门：告别数据瓶颈 - 掌握PyTorch Dataset、DataLoader与TensorFlow tf.data实战
23-【深度学习-Day 23】框架实战：模型训练与评估核心环节详解 (MNIST实战)
24-【深度学习-Day 24】过拟合与欠拟合：深入解析模型泛化能力的核心挑战
25-【深度学习-Day 25】告别过拟合：深入解析 L1 与 L2 正则化（权重衰减）的原理与实战
26-【深度学习-Day 26】正则化神器 Dropout：随机失活，模型泛化的“保险丝”
27-【深度学习-Day 27】模型调优利器：掌握早停、数据增强与批量归一化
28-【深度学习-Day 28】告别玄学调参：一文搞懂网格搜索、随机搜索与自动化超参数优化
29-【深度学习-Day 29】PyTorch模型持久化指南：从保存到部署的第一步
30-【深度学习-Day 30】从MLP的瓶颈到CNN的诞生：卷积神经网络的核心思想解析
31-【深度学习-Day 31】CNN基石：彻底搞懂卷积层 (Convolutional Layer) 的工作原理
32-【深度学习-Day 32】CNN核心组件之池化层：解密最大池化与平均池化
33-【深度学习-Day 33】从零到一：亲手构建你的第一个卷积神经网络（CNN）
34-【深度学习-Day 34】CNN实战：从零构建CIFAR-10图像分类器（PyTorch）
35-【深度学习-Day 35】实战图像数据增强：用PyTorch和TensorFlow扩充你的数据集
36-【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路

文章目录

Langchain系列文章目录
Python系列文章目录
PyTorch系列文章目录
机器学习系列文章目录
深度学习系列文章目录
Java系列文章目录
JavaScript系列文章目录
深度学习系列文章目录
摘要
一、回顾：为何要学习经典架构？
二、LeNet-5：手写数字识别的先驱
- 2.1 时代背景与核心贡献
- 2.2 深入剖析LeNet-5架构
- 2.3 LeNet-5的创新与局限
- - 2.3.1 主要创新点
  - 2.3.2 历史局限性
- 2.4 [实战] 使用PyTorch构建LeNet-5
三、AlexNet：引爆深度学习革命的巨兽
- 3.1 时代背景与核心贡献
- 3.2 深入剖析AlexNet架构
- 3.3 AlexNet的五大核心创新
- - - （1）使用ReLU作为激活函数
    - （2）使用Dropout防止过拟合
    - （3）使用数据增强（Data Augmentation）
    - （4）使用重叠池化（Overlapping Pooling）
    - （5）使用双GPU并行训练
- 3.4 [实战] 使用PyTorch构建AlexNet
四、从LeNet-5到AlexNet：演进的启示
- 4.1 网络深度的重要性
- 4.2 激活函数的变革
- 4.3 正则化技术的胜利
- 4.4 计算能力的驱动
五、总结

摘要

卷积神经网络（CNN）是深度学习在计算机视觉领域取得巨大成功的核心。然而，任何参天大树都源于最初的种子。在如今动辄上百层的复杂网络结构背后，是那些具有开创性意义的经典模型奠定了基石。本文将带领读者穿越时空，回到CNN发展的早期，深入剖析两个里程碑式的网络架构：LeNet-5 和 AlexNet。我们将详细解读它们的设计理念、网络结构、核心创新点及其历史贡献。通过理解这两个模型的演进，我们不仅能掌握CNN的基本设计原则，更能洞察深度学习技术发展的脉络与驱动力。无论你是初学者还是希望温故知新的进阶者，本文都将为你提供一份清晰、系统且富有洞见的学习指南。

一、回顾：为何要学习经典架构？

在前面的章节中，我们已经掌握了卷积层、池化层等CNN的核心组件，并亲手搭建了一个简单的CNN模型。我们知道，CNN通过局部连接和权值共享两大特性，有效提取了图像的空间特征，并大幅减少了模型参数。

然而，仅仅将这些组件随意堆叠，并不能保证得到一个性能优异的模型。如何科学地组织这些“积木”，使其协同工作，发挥出最大效能？这正是网络架构设计的核心议题。

学习LeNet-5和AlexNet等经典架构，具有以下重要意义：

理解设计思想：它们是无数研究者智慧的结晶，其设计并非偶然，而是针对特定问题（如参数数量、梯度消失、计算效率）的精妙解决方案。
追溯技术源流：现代CNN中许多习以为常的技术，如ReLU激活函数、Dropout、数据增强，都是由这些经典网络首次成功应用并推广开来的。了解其诞生背景，有助于我们更深刻地理解其作用与原理。
获取实践启发：这些经典模型的设计原则至今仍在指导着新模型的设计。学习它们，就像是学习大师的棋谱，能够帮助我们构建自己的“棋感”，在面对新问题时，能更有方向地设计和调试网络。

因此，研究经典架构是从“会用”到“会设计”CNN的必经之路。

二、LeNet-5：手写数字识别的先驱

LeNet-5是卷积神经网络的“开山鼻祖”之一，由“深度学习三巨头”之一的Yann LeCun在1998年提出。它的主要目标是解决手写数字识别问题，并在当时美国的银行、邮政等系统中取得了巨大成功。

2.1 时代背景与核心贡献

在20世纪90年代，如何让计算机自动识别支票上的手写数字是一个重要的商业应用场景。LeNet-5的出现，完美地解决了这一问题。

其最重要的历史贡献在于，它首次将卷积层、池化层和全连接层成功地组合在一起，完整地定义了现代CNN的基本架构范式：输入 -> 卷积 -> 池化 -> 卷积 -> 池化 -> 全连接 -> 输出。这个经典的流水线结构，至今仍是大多数CNN模型的基础。

2.2 深入剖析LeNet-5架构

LeNet-5的结构非常经典，总共包含7层（不计输入层），其中有2个卷积层、2个池化层和3个全连接层。下面我们来逐层解析。

输入层 (INPUT)：一个 $\\times 32$ 的灰度图像。这个尺寸比MNIST数据集的 $\\times 28$ 稍大，是为了让卷积核能捕捉到图像边缘的特征。
C1层 (卷积层)：
- 操作: 使用6个 $\\times 5$ 的卷积核进行卷积。
- 步幅 (Stride): $S = 1$ 。
- 填充 (Padding): $P = 0$ 。
- 输出: 得到6个 $\\times 28$ 的特征图 (Feature Map)。计算过程： $\\times 0) / 1 + 1 = 28$ 。
- 激活函数: Sigmoid或Tanh。
S2层 (池化层)：
- 操作: 平均池化 (Average Pooling)，窗口大小为 $\\times 2$ 。
- 步幅: $S = 2$ 。
- 输出: 6个 $\\times 14$ 的特征图。计算过程： $28/2 = 14$ 。
C3层 (卷积层)：
- 操作: 使用16个 $\\times 5$ 的卷积核进行卷积。
- 输出: 16个 $\\times 10$ 的特征图。计算过程： $(14 - 5) /1 + 1 = 10$ 。
- 特殊连接: 这一层的设计比较特殊，其16个输出特征图并非由S2层所有的6个特征图计算得来，而是通过一个复杂的连接表进行组合，以减少参数量。这是当时计算能力受限下的折中方案。
S4层 (池化层)：
- 操作: 平均池化，窗口大小为 $\\times 2$ 。
- 步幅: $S = 2$ 。
- 输出: 16个 $\\times 5$ 的特征图。计算过程： $10/2 = 5$ 。
C5层 (卷积层/全连接层)：
- 操作: 使用120个 $\\times 5$ 的卷积核。
- 输出: 120个 $\\times 1$ 的特征图。计算过程： $(5 - 5) /1 + 1 = 1$ 。这一层在效果上等同于一个全连接层，因为它将16个 $\\times 5$ 的特征图全部连接了起来。
F6层 (全连接层)：
- 输入: C5层的120个节点。
- 输出: 84个节点。这个84的选择与输出层的字符集有关。
- 激活函数: Sigmoid或Tanh。
输出层 (OUTPUT)：
- 操作: 一个全连接层，包含10个节点，对应0-9这10个数字的概率。当时通常使用高斯径向基函数（RBF），但现在我们更倾向于使用Softmax。

2.3 LeNet-5的创新与局限

2.3.1 主要创新点

奠定CNN基本结构: 首次系统性地集成了卷积、池化和全连接层，证明了其在图像识别任务上的有效性。
权值共享: 大大减少了网络参数，使得训练成为可能。
池化降维: 通过池化层降低了特征图的分辨率，减少了计算量，并引入了一定的平移不变性。

2.3.2 历史局限性

网络规模小: 受限于当时的计算能力，LeNet-5的网络深度和宽度都很有限，难以处理更复杂的图像分类任务。
激活函数问题: 使用Sigmoid或Tanh作为激活函数，在网络较深时容易引发梯度消失问题，导致训练困难。
池化方式: 使用平均池化可能会模糊特征，而现代CNN更倾向于使用能保留更显著特征的最大池化（Max Pooling）。

2.4 [实战] 使用PyTorch构建LeNet-5

下面我们用现代深度学习框架PyTorch来实现一个LeNet-5模型，这能帮助我们更直观地理解其结构。

import torch
import torch.nn as nn

class LeNet5(nn.Module):
    def __init__(self, num_classes=10):
        super(LeNet5, self).__init__()
        # 定义卷积层块
        self.conv_layers = nn.Sequential(
            # C1: 输入1通道, 输出6通道, 卷积核5x5, 步长1
            nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, stride=1),
            nn.Tanh(), # 激活函数
            # S2: 平均池化, 窗口2x2, 步长2
            nn.AvgPool2d(kernel_size=2, stride=2),
            # C3: 输入6通道, 输出16通道, 卷积核5x5, 步长1
            nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5, stride=1),
            nn.Tanh(), # 激活函数
            # S4: 平均池化, 窗口2x2, 步长2
            nn.AvgPool2d(kernel_size=2, stride=2)
        )
        
        # 定义全连接层块
        self.fc_layers = nn.Sequential(
            # C5: 全连接层, 输入16*5*5=400, 输出120
            # 注意: 这里的输入维度需要根据S4的输出计算
            nn.Linear(in_features=16 * 5 * 5, out_features=120),
            nn.Tanh(), # 激活函数
            # F6: 全连接层, 输入120, 输出84
            nn.Linear(in_features=120, out_features=84),
            nn.Tanh(), # 激活函数
            # Output: 全连接层, 输入84, 输出类别数
            nn.Linear(in_features=84, out_features=num_classes)
        )

    def forward(self, x):
        # 首先通过卷积和池化层
        x = self.conv_layers(x)
        # 将多维的特征图展平 (Flatten) 以便输入全连接层
        # x.size(0) 是 batch_size
        x = x.view(x.size(0), -1)
        # 然后通过全连接层
        logits = self.fc_layers(x)
        return logits

# 创建模型实例并打印结构
model = LeNet5()
print(model)

三、AlexNet：引爆深度学习革命的巨兽

如果说LeNet-5是CNN的奠基者，那么AlexNet就是将CNN推向神坛、引爆了本轮深度学习浪潮的革命者。在2012年的ImageNet大规模视觉识别挑战赛（ILSVRC）上，AlexNet以远超第二名的惊人成绩夺冠，错误率从前一年的26.2%骤降至15.3%，一举震惊了整个计算机视觉乃至人工智能领域。

3.1 时代背景与核心贡献

ImageNet是一个包含超过1400万张图像、2万多个类别的大规模数据集。在2012年之前，主流的计算机视觉方法仍然是基于手工设计的特征（如SIFT、HOG）。AlexNet的成功，雄辩地证明了深度学习模型自动学习特征的能力远超传统方法，开启了深度学习在工业界和学术界全面爆发的新时代。

AlexNet的贡献不仅在于其卓越的性能，更在于它成功应用并推广了多种至今仍在广泛使用的关键技术。

3.2 深入剖析AlexNet架构

AlexNet比LeNet-5要深得多、宽得多，它包含5个卷积层和3个全连接层。

输入层 (INPUT): $\\times 227 \\times 3$ 的彩色图像（论文中为 $\\times 224$ ，但根据计算应为 $\\times 227$ ）。
C1 (卷积层): 96个 $\\times 11$ 的卷积核，步幅 $S = 4$ 。输出尺寸： $(227 - 11) /4 + 1 = 55$ 。得到 $\\times 55 \\times 55$ 的特征图。
P1 (池化层): 最大池化， $\\times 3$ 窗口，步幅 $S = 2$ 。输出尺寸： $(55 - 3) /2 + 1 = 27$ 。得到 $\\times 27 \\times 27$ 的特征图。
C2 (卷积层): 256个 $\\times 5$ 卷积核，步幅 $S = 1$ ，填充 $P = 2$ 。输出尺寸： $KaTeX parse error: Undefined control sequence: \* at position 8: (27-5+2\̲*̲2)/1+1=27$ 。得到 $\\times 27 \\times 27$ 的特征图。
P2 (池化层): 最大池化， $\\times 3$ 窗口，步幅 $S = 2$ 。输出尺寸： $(27 - 3) /2 + 1 = 13$ 。得到 $\\times 13 \\times 13$ 的特征图。
C3 (卷积层): 384个 $\\times 3$ 卷积核，步幅 $S = 1$ ，填充 $P = 1$ 。输出尺寸： $KaTeX parse error: Undefined control sequence: \* at position 8: (13-3+2\̲*̲1)/1+1=13$ 。得到 $\\times 13 \\times 13$ 的特征图。
C4 (卷积层): 384个 $\\times 3$ 卷积核，步幅 $S = 1$ ，填充 $P = 1$ 。输出尺寸： $\\times 13$ 。得到 $\\times 13 \\times 13$ 的特征图。
C5 (卷积层): 256个 $\\times 3$ 卷积核，步幅 $S = 1$ ，填充 $P = 1$ 。输出尺寸： $\\times 13$ 。得到 $\\times 13 \\times 13$ 的特征图。
P3 (池化层): 最大池化， $\\times 3$ 窗口，步幅 $S = 2$ 。输出尺寸： $(13 - 3) /2 + 1 = 6$ 。得到 $\\times 6 \\times 6$ 的特征图。
FC6 (全连接层): 将 $\\times 6 \\times 6 = 9216$ 个节点连接到4096个节点。
FC7 (全连接层): 4096个节点连接到4096个节点。
FC8 (输出层): 4096个节点连接到1000个节点（对应ImageNet的1000个类别），使用Softmax。

3.3 AlexNet的五大核心创新

AlexNet的成功并非偶然，而是多项技术突破的集大成者。

（1）使用ReLU作为激活函数

这是AlexNet最重要的改进之一。在此之前，Sigmoid是主流选择，但其在输入值较大或较小时梯度接近于0，导致深层网络中梯度反向传播时逐层衰减，最终消失。ReLU（Rectified Linear Unit, 修正线性单元）的公式为 $\\max(0, x)$ 。

优点:
- 计算简单: 没有复杂的指数运算。
- 缓解梯度消失: 在 $\> 0$ 的区域，梯度恒为1，保证了梯度的有效传递。
- 稀疏性: 能使一部分神经元的输出为0，增加了网络的稀疏性。
实践证明: AlexNet的论文指出，使用ReLU比使用Tanh的训练速度快了6倍。

（2）使用Dropout防止过拟合

AlexNet拥有约6000万个参数，在当时的数据集规模下极易发生过拟合。为此，作者引入了Dropout技术。

原理: 在训练过程中的每次前向传播时，以一定的概率 $p$ （AlexNet中设为0.5）随机地“丢弃”（即输出置为0）一部分神经元。
效果: 这相当于每次都在训练一个不同的、更小的子网络。在测试时，所有神经元都保留，但其输出需要乘以概率 $p$ 来进行缩放。Dropout强迫网络学习更加鲁棒的特征，因为任何一个神经元都不能过分依赖于其他特定的神经元。它是一种非常高效的正则化技术。

（3）使用数据增强（Data Augmentation）

为了扩充训练数据，对抗过拟合，AlexNet使用了大量的数据增强技巧：

随机裁剪与翻转: 从原始的 $\\times 256$ 图像中随机裁剪出 $\\times 224$ 的区域，并进行水平翻转。这使得训练样本数量增加了 $256-224)^2 \\times 2 = 2048$ 倍。
色彩抖动 (PCA Jittering): 对图像的RGB通道进行主成分分析（PCA），然后对主成分添加一个带有高斯扰动的随机值，从而改变图像的颜色和强度，增强模型对光照和颜色变化的鲁棒性。

（4）使用重叠池化（Overlapping Pooling）

在LeNet中，池化层的步幅 $S$ 通常等于池化窗口的大小 $k$ ，这导致相邻的池化窗口之间没有重叠。AlexNet则使用了重叠池化，即步幅小于窗口大小（如 $k = 3, S = 2$ ）。

效果: 重叠池化可以在一定程度上减少池化操作带来的信息损失，提升特征的丰富性，并且实验证明这种方式能轻微降低错误率，并使模型更难过拟合。

（5）使用双GPU并行训练

当时的GPU（GTX 580）只有3GB显存，无法容纳整个AlexNet模型。作者创造性地将网络拆分到两个GPU上进行并行训练，一个GPU负责一部分卷积核的计算。在特定的层（如C3），两个GPU之间还会进行数据交换。这不仅解决了显存瓶颈，也加快了训练速度，是当时一项杰出的工程实践。

3.4 [实战] 使用PyTorch构建AlexNet

import torch
import torch.nn as nn

class AlexNet(nn.Module):
    def __init__(self, num_classes=1000):
        super(AlexNet, self).__init__()
        # 定义特征提取器 (卷积层和池化层)
        self.features = nn.Sequential(
            # C1: 输入3通道, 输出96, 卷积核11x11, 步长4, 填充0
            # 原始输入是227, (227-11)/4+1=55 -> 55x55
            nn.Conv2d(3, 96, kernel_size=11, stride=4, padding=0),
            nn.ReLU(inplace=True), # 使用ReLU激活函数
            # P1: 最大池化, 窗口3x3, 步长2
            # (55-3)/2+1=27 -> 27x27
            nn.MaxPool2d(kernel_size=3, stride=2),
            
            # C2: 输入96, 输出256, 卷积核5x5, 步长1, 填充2
            # (27-5+2*2)/1+1=27 -> 27x27
            nn.Conv2d(96, 256, kernel_size=5, padding=2),
            nn.ReLU(inplace=True),
            # P2: 最大池化, 窗口3x3, 步长2
            # (27-3)/2+1=13 -> 13x13
            nn.MaxPool2d(kernel_size=3, stride=2),
            
            # C3-C5: 连续的卷积层
            nn.Conv2d(256, 384, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(384, 384, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(384, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            # P3: 最大池化, 窗口3x3, 步长2
            # (13-3)/2+1=6 -> 6x6
            nn.MaxPool2d(kernel_size=3, stride=2),
        )
        
        # 定义分类器 (全连接层)
        self.classifier = nn.Sequential(
            # Dropout层, p=0.5
            nn.Dropout(p=0.5),
            # FC6: 输入256*6*6=9216, 输出4096
            nn.Linear(256 * 6 * 6, 4096),
            nn.ReLU(inplace=True),
            
            nn.Dropout(p=0.5),
            # FC7: 输入4096, 输出4096
            nn.Linear(4096, 4096),
            nn.ReLU(inplace=True),
            
            # FC8: 输出层
            nn.Linear(4096, num_classes),
        )

    def forward(self, x):
        # 特征提取
        x = self.features(x)
        # 展平
        x = torch.flatten(x, 1)
        # 分类
        logits = self.classifier(x)
        return logits

# 创建模型实例并打印结构
alexnet_model = AlexNet()
print(alexnet_model)

四、从LeNet-5到AlexNet：演进的启示

对比LeNet-5和AlexNet，我们可以清晰地看到CNN架构演进的四大驱动力：

4.1 网络深度的重要性

AlexNet（8层）比LeNet-5（7层，但卷积池化部分少）更深，后续的VGG、GoogLeNet、ResNet等模型更是将网络深度推向了新的高度。事实证明，增加网络深度能够让模型学习到从低级到高级、更具层次化的特征，是提升模型性能的关键。

4.2 激活函数的变革

从Sigmoid/Tanh到ReLU的转变，是深度学习发展史上的一个关键节点。它极大地解决了深度网络的训练难题，使得构建更深的网络成为可能。

4.3 正则化技术的胜利

面对参数量激增带来的过拟合风险，以Dropout和数据增强为代表的正则化技术应运而生，并被证明是训练大型模型的“必需品”。它们有效地提升了模型的泛化能力。

4.4 计算能力的驱动

从只能处理小型灰度图的CPU，到能够并行训练千万级参数模型的GPU，计算能力的飞跃是深度学习革命的物理基础。没有强大的算力，AlexNet这样“巨大”的模型根本无法实现。

五、总结

本文详细回顾了卷积神经网络发展史上的两个奠基之作：LeNet-5和AlexNet。通过对它们的剖析，我们可以得出以下核心结论：

LeNet-5是CNN的蓝图：它成功确立了卷积-池化-全连接的经典架构范式，是所有现代CNN模型的思想源头，证明了通过分层特征提取解决图像问题的可行性。
AlexNet是深度学习的引爆点：它不仅通过更深、更宽的网络结构在ImageNet挑战赛上取得了突破性成果，更重要的是，它将ReLU、Dropout、数据增强、重叠池化和GPU训练等关键技术成功整合并推广，为后续深度学习的飞速发展铺平了道路。
演进揭示核心原则：从LeNet-5到AlexNet的演进过程，清晰地揭示了深度学习模型设计的几大趋势：追求更深的网络结构、采用更高效的激活函数、运用更强大的正则化技术以及依赖更强劲的计算能力。
学习经典，启迪未来：理解这些经典模型的设计哲学和技术细节，对于我们今天设计、调试和优化自己的神经网络具有不可替代的指导意义。它们是构建更复杂模型（如VGG, ResNet）的知识基石。

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
【备孕故事】她一直想做个大差不离的人，没想到在这件事上拔了尖儿宜嘉阿姨
图片发自App杨婷说从小到大自己就是个中规中矩的人，不出格，不落单，一直随着大流。学业上从未出类拔萃，却也跟着大部队一起考上了一本；做事从不冒尖，搞个大差不离就行，因此，这么多年以来，差不多就行成了她对自己人生的要求。22岁大学毕业进了一家国企，外型不出挑但文静可人的她也遇上了两位追求者，简单的观察和交往后，她从中选了李广作为自己的婚恋对象。25岁那年，在父母亲朋的祝福声中杨婷和李广步入了婚姻。婚
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路

Langchain系列文章目录

Python系列文章目录

PyTorch系列文章目录

机器学习系列文章目录

深度学习系列文章目录

Java系列文章目录

JavaScript系列文章目录

深度学习系列文章目录

文章目录

摘要

一、回顾：为何要学习经典架构？

二、LeNet-5：手写数字识别的先驱

2.1 时代背景与核心贡献

2.2 深入剖析LeNet-5架构

2.3 LeNet-5的创新与局限

2.3.1 主要创新点

2.3.2 历史局限性

2.4 [实战] 使用PyTorch构建LeNet-5

三、AlexNet：引爆深度学习革命的巨兽

3.1 时代背景与核心贡献

3.2 深入剖析AlexNet架构

3.3 AlexNet的五大核心创新

（1） 使用ReLU作为激活函数

（2） 使用Dropout防止过拟合

（3） 使用数据增强（Data Augmentation）

（4） 使用重叠池化（Overlapping Pooling）

（5） 使用双GPU并行训练

3.4 [实战] 使用PyTorch构建AlexNet

四、从LeNet-5到AlexNet：演进的启示

4.1 网络深度的重要性

4.2 激活函数的变革

4.3 正则化技术的胜利

4.4 计算能力的驱动

五、总结

你可能感兴趣的:(深度学习入门到精通,python,pytorch,开发语言,人工智能,CNN,深度学习,大模型)

（1）使用ReLU作为激活函数

（2）使用Dropout防止过拟合

（3）使用数据增强（Data Augmentation）

（4）使用重叠池化（Overlapping Pooling）

（5）使用双GPU并行训练