种子123

深度学习入门

Deep Learning with Pytorch_002

chapter03_深入研究神经网络的构建块

在上一章中，我们使用Py Torch的低级操作来构建模块，如网络体系结构、损失函数和优化器。在本章中，我们将探讨解决现实世界问题所需的神经网络的一些重要组成部分，以及PyTorch如何通过提供大量的高级函数来抽象出大量的复杂性。
本章将讨论以下主题：

深入研究神经网络的各种构建块
探索PyTorch中的高级功能来构建深度学习体系结构
将深度学习应用在一个真实图像分类问题

任何深入的学习训练都需要获取数据，构建一个总体上是将一堆层聚集在一起的体系结构。
理解PyTorch为构建层、损失函数和优化器提供的更高层次的抽象。

层次——神经网络的基本块

最重要的层之一——线性层

对输入的数据应用线性变换： $y = xA^T + by$

 torch.randn(*size, out=None, dtype=None, layout=torch.strided, device=None, requires_grad=False) → Tensor

返回一个由均值为0、方差为1的正态分布（标准正态分布）中的随机数组成的张量。
$o u t i \sim N (0, 1)$
torch.from_numpy(ndarray) → Tensor是将numpy类型转换为Tensor的函数

 # from_numpy 测试 ，从numpy.ndarray中创建一个张量，
 # 返回的张量和ndarray共享相同的内存。张量的变化将反映在ndarray中，反之亦然；
 # 返回的张量是不可调整的（这句话是什么意思）
 a = numpy.array([1, 2, 3])
 t = torch.from_numpy(a)
 print(t)
 # tensor([ 1,  2,  3])
 print(a)
 t[0] = -1
 print(a)
 # array([-1,  2,  3])
 print(t)
 # tensor([-1,  2,  3])

完整的线性变换实现代码（还没用linear）：

 import torch
 torch.__version__
 import numpy as np
 import matplotlib.pyplot as plt
 from torch.autograd import Variable
 #   Creating data for our neural network
 def get_data():
     train_X = np.asarray([3.3, 4.4, 5.5, 6.71, 6.93, 4.168, 9.779, 6.182, 7.59, 2.167, 7.042, 10.791, 5.313, 7.997, 5.654, 9.27, 3.1])
     train_Y = np.asarray([1.7, 2.76, 2.09, 3.19, 1.694, 1.573, 3.366, 2.596, 2.53, 1.221, 2.827, 3.465, 1.65, 2.904, 2.42, 2.94, 1.3])
     dtype = torch.FloatTensor
     X = Variable(torch.from_numpy(train_X).type(dtype), requires_grad=False).view(17, 1)    # 对X进行转置
     y = Variable(torch.from_numpy(train_Y).type(dtype), requires_grad=False)
     return X, y
 # Creating learnable parameters
 def get_weights():
     w = Variable(torch.randn(1), requires_grad=True)
     b = Variable(torch.zeros(1), requires_grad=True)
     return w, b
 #   Network implementation
 def simple_network(x):
     y_pred = torch.matmul(x, w) + b
     return y_pred
 #   loss function
 def loss_fn(y, y_pred):
     loss = torch.mean((y - y_pred) ** 2)
     for param in [w, b]:
         if not param.grad is None: 
            param.grad.data.zero_()  # 第一次时，需要将梯度清零将梯度
            loss.backward()  # 计算可学习参数w和b的梯度
     return loss.data
 # Optimize the neural network
 def optimize(learning_rate):
     w.data -= learning_rate * w.grad.data
     b.data -= learning_rate * b.grad.data
 learning_rate = 0.005
 x,y = get_data()
 w,b = get_weights()
 num_epochs = 100    # 这个数据不能太大，太大会加大误差
 for epoch in range(num_epochs):
     inputs = x
     targets = y
     # Forward pass
     outputs = simple_network(inputs)
     # Backward and optimize
     loss = loss_fn(outputs, targets)
     optimize(learning_rate)
     if (epoch + 1) % 10 == 0:
        print('Epoch [{}/{}], Loss: {:.4f}'.format(epoch + 1, num_epochs, loss.item()))
        print('outputs:')
        print(outputs)
        print(loss.item())
 plt.plot(x.detach().numpy(), y.detach().numpy(), 'ro', label='Original Data')
 plt.plot(x.detach().numpy(), outputs.detach().numpy(), label='Fitting Line')
 plt.legend()
 plt.show()

但在Pytorch中，它的强大之处在于，对于线性层的线性变换：Y=Wx+b，在上面编写的整个函数可以用一行代码编写，如下所示：

from torch.nn import Linear, ReLU
myLayer = Linear(in_features=10,out_features=5,bias=True)  # 输  入张量大小 为10，输出为5

torch.nn.Linear(in_features, out_features, bias=True)   #in_feature ——每个输入样本的大小 ；out_feature——每个输出样本的大小；bias——如果设置为False，则该层将不会学习加性偏差，默认值:True。

具体实现代码如下（包含所需的导入包）：

import torch
from torch.autograd import Variable
from torch.nn import Linear, ReLU
inp = Variable(torch.randn(1,10))    #创建输入数据
print('inp:')
print(inp)
myLayer = Linear(in_features=10,out_features=5,bias=True)  # 输入张量大小为10，输出为5
myLayer(inp)
print('myLayer(inp):')
print(myLayer(inp))
print('myLayer.weight:')
print(myLayer.weight)
print('myLayer.bias:')
print(myLayer.bias)

实现线性变换，使用Pytorch的框架Linear：

# 使用Pytorch中的Linear实现线性变换（能实现的代码）
import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt
# Hyper-parameters
input_size = 1
output_size = 1
num_epochs = 60
learning_rate = 0.001
# Toy dataset
x_train = np.array([[3.3], [4.4], [5.5], [6.71], [6.93], [4.168],[9.779], [6.182], [7.59], [2.167], [7.042],[10.791], [5.313], [7.997], [3.1]], dtype=np.float32)
y_train = np.array([[1.7], [2.76], [2.09], [3.19], [1.694], [1.573],[3.366], [2.596], [2.53], [1.221], [2.827],[3.465], [1.65], [2.904], [1.3]], dtype=np.float32)
# Linear regression model
model = nn.Linear(input_size, output_size)
# Loss and optimizer
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)
# Train the model
for epoch in range(num_epochs):
    # Convert numpy arrays to torch tensors
    inputs = torch.from_numpy(x_train)
    targets = torch.from_numpy(y_train)
    # Forward pass
    outputs = model(inputs)
    loss = criterion(outputs, targets)
    # Backward and optimize
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    if (epoch + 1) % 5 == 0:
       print('Epoch [{}/{}], Loss: {:.4f}'.format(epoch + 1, num_epochs, loss.item()))
# Plot the graph
predicted = model(torch.from_numpy(x_train)).detach().numpy()
plt.plot(x_train, y_train, 'ro', label='Original data')
plt.plot(x_train, predicted, label='Fitted line')
plt.legend()
plt.show()

上面两种实现线性变换的区别，第一种是自己构建的一个简单的网络模型，需要自己设定权值weight及偏置值bias，而Linear框架中能自己生成weight及bias，并且其内部有很强的关联性。构建一个简单的线性网络模型的步骤：首先需要获取数据预测输入及目标输出，对数据进行处理，获得模型输出，然后计算代价loss，并进行优化，不断迭代上述过程。

线性层由不同的名称调用，例如跨不同框架的密集层或完全连接层。用于解决真实世界用例的深层学习体系结构通常包含一个以上的层，在PyTorch中，我们可以通过多种方式来实现它，如下所示：

一种简单的方法是将一个层的输出传递给另一个层

# 将一个层的输出传递给另一个层
myLayer1 = Linear(10,5)
myLayer2 = Linear(5,2)
myLayer2(myLayer1(inp))
print('myLayer1(inp):')
print(myLayer1(inp))
print('myLayer2(myLayer1(inp)):')
print(myLayer2(myLayer1(inp)))

线性层的缺点：具有两个不同层的体系结构可以简单地表示为具有不同层的单层。因此，仅仅叠加多个线性层将无助于算法学习任何新的东西。

示例：

Y=2(3X1)              #  2 Linear Layers
Y=6(X1)               #1 Linear Layer

非线性激活
非线性激活是接受输入，然后应用数学变换并产生输出的函数。为了解决线性变换中的问题，引进不同的非线性函数来帮助学习不同的关系，而不是只关注线性关系。PyTorch将这些非线性功能作为层提供，能够像使用线性层一样使用它们。
一些常用的非线性函数如下：
- Sigmoid
  - Sigmoid函数的表达式如下：
    $σ(x)=1/(1+e^(-x^) )$
  - Sigmoid函数直观地获取一个实数，并输出在0到1之间的一个数字；对于较大的负数，它返回接近于零的值；对于一个较大的正数，它返回接近1的值。
  - Sigmoid函数的缺点：当Sigmoid函数的输出接近于零或1时，Sigmoid函数之前各层的梯度接近于零。前一层的可学习参数使得梯度接近于零，权重不被调整，导致神经元死亡。
- Tanh
  - tanh非线性函数将实数压缩在-1和1的范围内，但当tanh输出接近-1 和1的极值时，tanh也面临同样的饱和梯度问题；然而，它比Sigmoid更好，因为tanh的输出是以零为中心的。
- ReLU
  - 在最近几年里，ReLU变得越来越流行；它有一个简单的数学公式：
    $f (x) = m a x (0, x)$
  - ReLU将所有输入为负值的数压缩为0，并留下正数。
  - ReLU帮助优化器更快地找到正确的权重集；更严格地说，它使随机梯度下降的收敛速度更快。
  - ReLU在计算上很便宜，因为只是在进行阈值处理，而不是像对Sigmoid和切线函数那样计算。
  - ReLU有一个缺点：当一个大的梯度在反向传播过程中通过它时。常常变得没有反应；它们被称为神经元死亡，它可以通过仔细选择学习率来控制。
- Leaky ReLU
  - Leaky ReLU试图解决一个濒死的问题，而不是饱和到零，我们饱和到一个非常小的数字，例如0.001；对于某些使用情况，该激活功能为其他应用提供了卓越的性能，但这并不一致。
- ReLU（线性整流函数）、Leaky ReLU（带泄露线性整流函数）、PReLU（参数化修正线性单元）和RReLU（随机纠正线性单元）的比较：

PyTorch 非线性激活

代码：

#  A quick example of how to use the ReLU function in PyTorch
sample_data = Variable(torch.Tensor([[1,2,-1,-1]]))
myReLU = ReLU()
print('myReLU(sample_data)：')
print(myReLU(sample_data))
print('myReLU(sample_data).size():')
print(myReLU(sample_data).size())

在上面的代码中，取一个具有两个正值和两个负值的张量，并在其上应用一个ReLU函数处理，它将负数阈值化为0并保留原来的正数。
输出结果如下：

myReLU(sample_data)：
tensor([[1., 2., 0., 0.]])
myReLU(sample_data).size():
torch.Size([1, 4])

构建深度学习算法的PyTorch方法

Pytorch中的所有网络都是由类实现的，而Pytorch中的子类由nn.Module调用
类中应该实现__init__方法和__forward__方法
在__init__方法中初始化所有层，例如线性层
在__forward__方法中，将输入数据传递到在__init__方法中初始化的层中，并返回最终输出。
非线性函数通常直接应用于forward函数中，也有一些在init方法中使用。

下面的代码片段展示了如何在PyTorch中实现深度学习架构：

class MyFirstNetwork(nn.Module):
   def __init__(self,input_size,hidden_size,output_size):
      super(MyFirstNetwork,self).__init__()
      self.layer1 = nn.Linear(input_size,hidden_size)
      self.layer2 = nn.Linear(hidden_size,output_size)
   def __forward__(self,input):
      out = self.layer1(input)
      out = nn.ReLU(out)
      out = self.layer2(out)
      return out

上面所示代码中做的是继承父类并在该类中实现两种方法，在Python中，我们将父类作为参数传递给类名，从而实现子类；init方法充当构造函数，super用于将子类的参数传递给父类，在上面的例子中是nn.Module

不同机器学习问题的模型结构

我们正在解决的问题将主要决定我们将使用哪些层，从线性层到用于顺序数据的Long Short-Term Memory(LSTM)，根据所要解决的问题的类型，最后一层是确定的；我们通常使用机器学习或深度学习算法来解决三个问题。
- 1.对于回归问题，例如预测t恤的价格，我们使用最后一层作为一个线性层，具有一个输出，并且输出一个连续的值。
- 2.要将给定的图像分类为t恤或非t恤，可以使用Sigmoid激活函数，因为它输出的值要么接近1，要么接近于0，这通常称为二进制分类问题。
- 3.对于多类别分类，我们必须将给定图像分类为T恤、牛仔裤、衬衫或连衣裙；我们将在网络的末尾使用Softmax层，例如，它接受前一个线性层的输入，并为给定数量的示例输出概率，在我们的例子中，它将被训练来预测每种类型的图像的四个概率，并且这四个概率和为1。

Loss functions

一旦我们定义了我们的网络架构，我们就剩下两个重要的步骤：一个是计算我们的网络在执行特定的回归、分类；下一步就是优化权重。
优化器(梯度下降)通常接受一个标量值，所以loss函数应该生成一个标量值，并且该值在训练中必须最小化。而对于某些用例，如预测道路上的障碍物并将其划分为行人或非行人，将需要两个或更多的损失函数。但即使在这种情况下，也需要将损失合并为一个标量，以便优化器最小化。

PyTorch中用于回归和分类的loss函数，应用示例：

# Loss functions
loss = nn.MSELoss()
input = Variable(torch.randn(3,5),requires_grad=True)
target = Variable(torch.randn(3,5))
output = loss(input,target)
output.backward()
print('input:')
print(input)
print('target:')
print(target)
print('output:')
print(output)

交叉熵损失：它计算了一个预测概率的分类网络的损失，这个概率应该加起来总和为1，就像Softmax层一样；当预测概率偏离正确概率时，交叉熵损失增加；例如，如果我们的分类算法预测某图像的0.1概率是猫，但实际上是熊猫，那么交叉熵损失将更高；如果它预测与实际标签相似，那么交叉熵损失就会降低。
- 交叉熵损失函数的原理：
  在二分类问题模型：例如逻辑回归「Logistic Regression」、神经网络「Neural Network」等，真实样本的标签为 [0，1]，分别表示负类和正类。交叉熵损失模型的最后通常会经过一个 Sigmoid 函数，输出一个概率值，这个概率值反映了预测为正类的可能性：概率越大，可能性越大。
  预测输出即 Sigmoid 函数的输出表征了当前样本标签为 1 的概率可表达为：
  $\hat y=P(y=1|x)$
  当前样本标签为 0 的概率就可以表达成：
  $1-\hat y=P(y=0|x)$
- 单个样本交叉熵损失的公式：
  $L=-[ylog\ \hat y+(1-y)log\ (1-\hat y)]$
- 交叉熵损失函数定义：
```
# cross_entropy loss
def cross_entropy(true_label,prediction):
    if true_label == 1:
        return -log(prediction)    # log这块会提示出错，导入了from math import log
    else:
        return -log(1 - prediction)
```
在分类问题中使用交叉熵损失：
```
# Use a cross-entropy loss in a classification problem
loss = nn.CrossEntropyLoss()
input = Variable(torch.randn(3,5),requires_grad=True)
target = Variable(torch.LongTensor(3).random_(5))
output = loss(input,target)
output.backward()
print('output.backward():')
print(output.backward())
```
但是在上面的代码中会报如下错误：

解决方法是：将output.backward()改为output.backward(retain_graph=True)，该问题是指在默认情况下，网络在反向传播中不允许多个backward()。需要在第一个backward设置retain_graph=True
正确输出如下：
- Pytorch中的一些loss函数及其应用范围：
  - L1 loss——主要用作正则化器
  - MSE loss——回归问题的损失函数
  - Cross-entropy loss——用于二进制和多级分类问题
  - NLL Loss——用于分类问题，并允许我们使用特定的权重来处理不平衡的数据集。
  - NLL Loss2d——用于逐像素分类，主要用于与图像分割有关的问题。

优化网络体系结构
一旦我们计算出我们的网络损失，我们将优化权重以减少损失，从而提高算法的精度，为了简单起见，让我们将这些优化器看作黑匣子，它们接受丢失函数和所有可学习的参数，并稍微移动它们以提高性能。Pytorch所提供的一些优化器如下所示：

ADADELTA
Adagrad——自适应梯度算法
Adam
SparseAdam
Adamax
ASGD
LBFGS
RMSProp
Rprop
SGD——随机梯度下降

创建一个SGD优化器，它将网络的所有可学习参数作为第一个参数，并创建了一个学习速率，它决定可以对可学习的参数进行多大比例的更改：
```
 optimizer = optim.SGD(model.parameters(),lr = 0.01)  # 这处的调试为什么不会继续往下执行,而且model不管导入哪个包都出错，所有关于model的包都没有这个attribute
```
```
 loss = nn.MSELoss()
 for input,target in dataset:
     optimizer.zero_grad()
     output = model(input)
     losss = loss(output,target)
     loss.backward()
     optimizer.step()
     print('loss.backward():')
     print(loss.backward())
```
一旦创建了优化器对象，就要在循环中调用zero_grad()，因为参数将累积在上一次优化器调用期间创建的梯度；当调用了loss函数中的backward函数（计算梯度更新权值）中后，就需要调用optimizer.step()，对可学习参数进行实际更改。
基于深度学习的图像分类
Dogs vs. Cats数据集

调试出现的错误：

import os
dir = 'F:\\inner\\kaggle'             # 数据集路径
list_img = []
list_label = []
data_size = 0
dir = dir + '/train/'
for file in os.listdir(dir):  # 遍历dir文件夹
    list_img.append(dir + file)  # 将图片路径和文件名添加至image list
    data_size += 1  # 数据集增1
    name = file.split(sep='.')  # 分割文件名，"cat.0.jpg"将分割成"cat",".","jpg"3个元素
    # label采用one-hot编码，"1,0"表示猫，"0,1"表示狗，任何情况只有一个位置 为"1"，在采用CrossEntropyLoss()计算Loss情况下，label只需要输入"1"的索引，即猫应输入0，狗应输入1
    if name[0] == 'cat':
        list_label.append(0)  # 图片为猫，label为0
    else:
        list_label.append(1)  # 图片为狗，label为1，注意：list_img和list_label中的内容是一一配对的
print('data_size:')
print(data_size)

同一段代码，在两个项目里运行结果不一样

在本地运行时结果：
服务器运行结果：

人工智能学习资源 Hemy08 人工智能学习
无机器学习基础：https://www.coursera.org/learn/machine-learning有机器学习基础：MachineYearning深度学习入门：https://www.coursera.org/learn/neural-networks-deep-learning
Pytorch深度学习入门基础（二）：python 编辑器的选择、安装及配置（ pycharm、 jupyter）慕奕宸深度学习深度学习 python pytorch
目录一、下载pycharm1.下载pycharm2.pycharm配置3.检查pycharm环境是否配置好二、Jupyter安装三、常见问题：1.为什么torch.cuda.isavailable()为False2.无法定位程序输入点现在来开一个专栏，关于学习Pytorch深度学习的入门基础，分为好几期，我会慢慢更新，希望大家可以互相支持一下，相互学习，相互进步！下面是这个专栏的所有内容，大家可以
pytorch深度学习入门（12）之-神经网络导出onnx模型部署与应用码农呆呆深度学习深度学习 pytorch 神经网络
概述：ONNX（OpenNeuralNetworkExchange）是一种开放神经网络交换格式，它使得不同深度学习框架（如TensorFlow、PyTorch、MXNet等）之间的互操作成为可能。ONNX提供了一种标准化的方式，可以将训练好的模型导出并转换为ONNX格式，然后可以在其他支持ONNX的框架或工具中进行部署和推理。ONNX的主要优势在于它促进了深度学习模型在不同平台之间的互操作性和可移
AI人工智能深度学习入门指南：从基础到实践_副本 AI大模型应用实战 C 人工智能深度学习 ai
AI人工智能深度学习入门指南：从基础到实践关键词：人工智能、机器学习、深度学习、神经网络、梯度下降、反向传播、实战案例摘要：本文是为零基础或初级学习者打造的深度学习入门指南。我们将从“人工智能-机器学习-深度学习”的关系讲起，用“教机器人认猫”的故事串联核心概念，结合生活比喻（如“多层蛋糕”解释神经网络）、数学公式（如梯度下降的“下山游戏”）和Python实战代码（用Keras实现手写数字识别），
深度学习入门指南：从基础概念到代码实践软考和人工智能学堂人工智能 #深度学习 Python开发经验深度学习人工智能
深度学习入门指南：从基础概念到代码实践1.深度学习概述深度学习是机器学习的一个分支，它通过模拟人脑神经元的工作方式，构建多层次的神经网络模型来处理复杂的数据模式。与传统机器学习方法相比，深度学习能够自动从原始数据中学习特征表示，无需过多的人工特征工程。深度学习已经在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展。例如，ImageNet竞赛中深度学习模型的识别准确率已经超过人类水平，而GP
深度学习入门（2）：alexnet qq_776882262 深度学习人工智能
引言主要讲下alexnet里的几个方法，后面深度学习的代码部分应该都是借用别人的，整体安排是从简单到难。本篇借鉴Pytorch之AlexNet花朵分类_基于alexnet的花卉分类识别系统-CSDN博客，如果需要学习直接参考这篇就好了，本文只是作为本人复习记录。正文AlexNet是深度学习时代的开端，它用一场决定性的胜利，证明了深度卷积神经网络在计算机视觉中的巨大潜力。单层alexnet网络架构：
深度学习入门（3）：vgg16 qq_776882262 深度学习人工智能
引言相比于alexnet，vgg16进一步优化了这个黑盒模型，用实验的方式证明了哪些模块有效，哪些模块对检测效果提升有限。奠基了卷积神经网络一些基础的模块。本文参考pytorch实战7：手把手教你基于pytorch实现VGG16_vgg16pytorch-CSDN博客，此处只做记录供本人复习记录。正文VGG16创新点：1.使用小卷积核堆叠代替大卷积核VGG16采用多个连续的3×3小卷积核堆叠，而不
深度学习入门：Python搭建简单神经网络模型缑宇澄 python
在人工智能浪潮中，深度学习凭借强大的特征提取与模式识别能力成为核心技术，而神经网络则是深度学习的基石。从图像识别到自然语言处理，神经网络以独特的结构和学习机制，让计算机能够模拟人类大脑处理复杂信息的过程。本文将带领你从基础理论出发，使用Python和Keras库搭建一个简单的神经网络模型，开启深度学习的探索之旅。一、神经网络基础理论1.1神经元与网络结构神经网络的基本单元是人工神经元（又称节点或单
【大模型入门指南 10】大模型推理部署：vLLM和llama.cpp 青松ᵃⁱ LLM入门系列 llama
【大模型入门指南】系列文章：【大模型入门指南01】深度学习入门【大模型入门指南02】LLM大模型基础知识【大模型入门指南03】提示词工程【大模型入门指南04】Transformer结构【大模型入门指南05】LLM技术选型【大模型入门指南06】LLM数据预处理【大模型入门指南07】量化技术解析【大模型入门指南08】微调和分布式训练【大模型入门指南09】LLM和多模态模型高效推理实践【大模型入门指南1
深度学习入门：从零搭建你的第一个神经网络 layneyao ai 深度学习神经网络人工智能
深度学习入门：从零搭建你的第一个神经网络系统化学习人工智能网站（收藏）：https://www.captainbed.cn/flu文章目录深度学习入门：从零搭建你的第一个神经网络摘要引言第一章：神经网络基础原理1.1神经元模型1.2反向传播算法1.3激活函数对比第二章：开发环境搭建指南2.1硬件要求2.2软件环境2.2.1Anaconda配置2.2.2PyTorch安装2.2.3TensorFlo
深度学习入门:如何从零开始搭建自己的深度学习模型? AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介深度学习（DeepLearning）近几年已经成为人们关注的热点话题。从2012年的ImageNet竞赛开始，激起了众多研究者的兴趣，也带来了越来越多的应用场景。随着技术的飞速发展，深度学习已经成为了各个领域最具潜力的技术。作为一名AI科研工作者，了解、掌握深度学习相关知识可以帮助你更好地理解并解决实际问题。本文将全面介绍深度学习的基础知识、技术要点及其应用。文
第6篇：深度学习入门——神经网络基础 CarlowZJ AI+Python 深度学习神经网络人工智能
目录一、前言二、概念讲解（一）深度学习：人工智能皇冠上的明珠（二）神经网络：深度学习的微观世界三、神经网络的基本组件：构建智能的积木（一）神经元：智能的基本单元（二）权重与偏置：连接的智慧（三）激活函数：非线性的魔法（四）损失函数：衡量差距的标尺（五）优化器：攀登优化高峰的向导四、前向传播与反向传播：神经网络的智慧流转（一）前向传播：信息的逐层传递（二）反向传播：误差的逆向追溯五、代码示例：搭建你
【深度学习入门篇 ②】Pytorch完成线性回归！小森( ﹡ˆoˆ﹡ ) 深度学习入门篇线性回归算法回归
嗨，大家好，我是小森(﹡ˆoˆ﹡)！易编橙·终身成长社群创始团队嘉宾，橙似锦计划领衔成员、阿里云专家博主、腾讯云内容共创官、CSDN人工智能领域优质创作者。易编橙：一个帮助编程小伙伴少走弯路的终身成长社群！上一部分我们自己通过torch的方法完成反向传播和参数更新，在Pytorch中预设了一些更加灵活简单的对象，让我们来构造模型、定义损失，优化损失等；那么接下来，我们一起来了解一下其中常用的API
day33 python深度学习入门 xiaohanbao09 py note python 深度学习机器学习 pandas 人工智能学习
目录深度学习入门：PyTorch实现鸢尾花分类一、环境搭建1.创建Python环境2.安装必要的库3.检查CUDA环境二、数据准备1.加载数据集2.数据预处理3.转换为PyTorch张量三、模型构建1.定义模型结构2.定义损失函数和优化器四、模型训练1.训练过程2.训练结果五、结果可视化六、总结在深度学习的旅程中，神经网络是不可或缺的核心工具之一。今天，我将通过一个简单的项目，使用PyTorch框
遥感深度学习——基于deeplabv3+和GID数据集（1）全域智图深度学习人工智能
博主最近准备进行深度学习入门，因为是做遥感方向的，经过多重考虑，算法最后选择了deeplabv3+。DeepLabV3+是由谷歌提出的一种用于图像语义分割的深度学习模型。它在DeepLabV3的基础上，加入了编码器-解码器结构，以提高分割结果的边缘细节和空间分辨率。以下是DeepLabV3+的主要特点：编码器-解码器结构：编码器部分提取图像的高层次语义特征，解码器部分逐步恢复图像的空间细节，提高分
深度学习入门：从理论到实战的详细指南人工智能教程深度学习人工智能算法目标跟踪机器学习 YOLO 线性回归
的高效学习和理解。对于初学者来说，深度学习的学习曲线可能会显得有些陡峭，但只要掌握正确的方法和步骤，就能轻松入门。本文将为你提供一份从理论到实战的详细指南，帮助你快速掌握深度学习的核心要点。一、深度学习是什么？（一）定义深度学习是机器学习的一个子领域，它通过构建多层的神经网络来学习数据中的复杂模式。与传统的机器学习算法相比，深度学习能够自动提取数据的特征，而不需要人工设计复杂的特征工程。这种自动特
深度学习入门：基于 Python 的理论与实现笔记 u013244720 深度学习 python 笔记
深度学习入门：基于Python的理论与实现笔记在VSCode中运行代码替换库搜索路径#sys.path.append(os.pardir)#为了导入父目录而进行的设定sys.path.append(os.getcwd())替换文件路径#withopen("sample_weight.pkl",'rb')asf:withopen(os.getcwd()+"/ch03/sample_weight.pk
pytorch深度学习入门（15）之-使用onnx模型量化码农呆呆深度学习人工智能 pytorch 深度学习 python 神经网络
量化ONNX模型内容量化概述ONNX量化表示格式量化ONNX模型基于变压器的模型Transformer基于变压器的模型GPU上的量化常问问题量化概述ONNX运行时中的量化是指ONNX模型的8位线性量化。在量化期间，浮点值被映射到以下形式的8位量化空间：val_fp32=scale*(val_quantized-zero_point)scale是一个正实数，用于将浮点数映射到量化空间。计算方法如下：
深度学习入门--基于Python的理论与实现--Python入门语文天才高斯 python 开发语言人工智能深度学习
第一章Python入门1.1Python是什么Python是一种高级编程语言，由GuidovanRossum于1989年创建，并在1991年正式发布。Python具有以下特点：易读易写：Python语法简洁，代码可读性强，使开发者能够更专注于问题本身。跨平台：Python可以在Windows、Linux和macOS上运行，具有良好的可移植性。丰富的库：Python生态系统中包含大量的第三方库，如N
【深度学习入门_NLP自然语言处理】序章沉默的舞台剧 AI 深度学习自然语言处理人工智能
本部分开始深度学习第二大部分NLP章节学习，找了好多资料，终于明确NLP的学习目标了，介于工作之余学习综合考量，还是决定以视频学习为主+后期自主实践为主吧。分享一个总图，其实在定位的时候很迷茫，单各章节领域其实都是很大的范畴，每个部分都是需要专精的，所以在做计划的时候很头大…千里之行始于足下吧，话不多数，直接上NLP的学习应用目标：学习教程的话参照B站实战结合的这个教程【2025NLP自然语言处理
具身智能零碎知识点（三）：深入解析 “1D UNet”：结构、原理与实战墨绿色的摆渡人具身智能零碎知识点 pytorch 人工智能 python transformer 具身智能
深入解析“1DUNet”：结构、原理与实战【深度学习入门】1DUNet详解：结构、原理与实战指南一、1DUNet是什么？二、核心结构与功能1.整体架构2.编码器（Encoder）3.解码器（Decoder）4.跳跃连接（SkipConnection）5.瓶颈层（Bottleneck）三、数学原理与数值示例1.1D卷积运算2.编码-解码流程四、PyTorch代码实现1.完整模型代码2.使用示例五、实
使用Python学习AI的学习攻略 liushangzaibeijing AI学习 python 学习人工智能
基于python的AI学习一、夯实基础二、数学基础三、机器学习基础四、深度学习入门五、进阶学习六、学习资源推荐七、实践项目一、夯实基础对于已经掌握Python基础语法的学习者来说，进一步利用Python学习AI需要夯实以下基础：变量和数据类型：包括整数、浮点数、字符串、列表、字典、元组等。条件语句和循环：熟练使用if-else语句和for、while循环。函数：理解函数的定义、调用以及参数传递。面
深度学习入门（三）：神经网络的学习 WhyNot? 深度学习深度学习神经网络学习
文章目录前言人类思考VS机器学习VS深度学习基础术语损失函数常用的损失函数均方误差MSE（MeanSquareError）交叉熵误差（CrossEntropyError）mini-batch学习为何要设定损失函数数值微分神经网络学习算法的实现两层神经网络的类参考资料前言机器学习的过程通常分为学习（从训练数据中自动获取权重参数的过程）和推理（利用学习到的权重参数对新的数据进行预测）两个环节。本文将主
深度学习入门：从神经网络基础到简单实现 Evaporator Core 人工智能 #深度学习 Python开发经验深度学习神经网络人工智能
深度学习作为人工智能领域最令人兴奋的技术之一，已经在图像识别、自然语言处理、语音识别等多个领域取得了突破性进展。本文将深入浅出地介绍深度学习的基本概念，并通过Python代码实现一个简单的神经网络模型，帮助读者建立直观理解并迈出实践第一步。神经网络的基本原理神经网络的核心思想源自对人类大脑工作方式的简化模拟。想象一下，当你第一次学习骑自行车时，大脑会不断接收来自视觉、平衡感等多方面的信号，经过一系
PyTorch深度学习入门与实战教程 openbiox
本文还有配套的精品资源，点击获取简介：深度学习是AI的核心技术，基于神经网络对数据建模以实现学习和预测。PyTorch是一个灵活易用的开源深度学习框架，适合初学者和研究人员进行实验开发。教程涵盖了从基础概念到模型训练、验证、测试的完整流程，包括张量操作、动态计算图、数据预处理、神经网络构建、优化器使用、训练循环、模型保存加载以及CNN和RNN等关键网络结构的应用实践。通过实例项目如文本分类、图像识
AI入门书籍推荐撬动未来的支点深度学习深度学习人工智能
漫画机械学习入门(（日）大关真之戴凤智张鸿涛孟宇（译）)深度学习入门：基于Python的理论与实现深度学习的数学：使用Python语言[转换版]([美]罗纳德·T.纽塞尔)
手写数字识别（深度学习小实践）我是来学习的你们要干什么深度学习人工智能 pycharm python 机器学习神经网络
小白学习ing文章目录前言一、神经网络学习与实践1.学习2.推理二、手写数字识别1、读入mnist数据集（学习）2、神经网络的推理改进→批处理前言非常简单的深度学习小实践，没有用框架，仅使用简单的Python。参考书籍《深度学习入门：基于Python的理论与实现》一、神经网络学习与实践1.学习训练数据进行权重参数的学习2.推理使用学习到的参数，对输入数据进行分类二、手写数字识别1、读入mnist数
计算机视觉深度学习入门（4） yyc_audio 计算机视觉人工智能计算机视觉深度学习神经网络
在小型数据集上从头开始训练一个卷积神经网络利用少量数据来训练图像分类模型，这是一种很常见的情况。如果你从事与计算机视觉相关的职业，那么很可能会在实践中遇到这种情况。“少量”样本既可能是几百张图片，也可能是上万张图片。我们来看一个实例——猫狗图片分类，数据集包含5000张猫和狗的图片（2500张猫的图片，2500张狗的图片）。我们将2000张图片用于训练，1000张用于验证，2000张用于测试。将介
Python第十六课：深度学习入门 | 神经网络解密程之编 Python全栈通关秘籍 python 神经网络青少年编程
本节目标理解生物神经元与人工神经网络的映射关系掌握激活函数与损失函数的核心作用使用Keras构建手写数字识别模型可视化神经网络的训练过程掌握防止过拟合的基础策略一、神经网络基础（大脑的数字化仿生）1.神经元对比生物神经元人工神经元树突接收信号输入层接收特征数据细胞体整合信号加权求和（∑(权重×输入)+偏置）轴突传递电信号激活函数处理输出2.核心组件解析激活函数：神经元的"开关"（如ReLU：max
大模型学习路线与资源推荐数字化转型2025 AI投资人工智能
以下是基于多篇参考资料整理的大模型学习路线，涵盖从基础到进阶的完整学习路径，帮助您系统掌握大模型核心技术并应用于实际场景：一、基础阶段：构建核心知识体系编程与数学基础编程语言：优先学习Python，掌握其语法、数据结构及常用库（如NumPy、Pandas、PyTorch）37。数学基础：线性代数、概率论与统计学、微积分是理解模型原理的基石，需重点掌握矩阵运算、概率分布等概念39。深度学习入门神经网
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

深度学习入门

Deep Learning with Pytorch_002

chapter03_深入研究神经网络的构建块

你可能感兴趣的:(深度学习入门)