PyTorch深度学习入门笔记(九)卷积操作

课程学习笔记,课程链接
学习笔记同步发布在我的个人网站上,欢迎来访查看。

Pytorch的 nn模块有 Convolution Layers,有3种卷积操作,nn.Conv1dnn.Conv2dnn.Conv3d分别对应一维二维以及三维:
PyTorch深度学习入门笔记(九)卷积操作_第1张图片
注:在Pytorch 官网文档左侧,有 torch.nn和 torch.nn.fuctional,torch.nn 是对 torch.nn.fuctional进行了一个封装,方便用户使用。想细致的了解一些nn模块中的函数可以从 torch.nn.fuctional 入手。
这里主要介绍 nn.Conv2d:
打开 torch.nn.fuctional 对应页面,可以看到对 conv2d 函数的介绍:
PyTorch深度学习入门笔记(九)卷积操作_第2张图片
conv2d 需要的参数有 输入 input、权重 weight(更专业的名称是卷积核)、偏置 bias、步长 stride等。
举例:
PyTorch深度学习入门笔记(九)卷积操作_第3张图片

左侧是输入图像,中间是卷积核,步长为1时,输出为最右侧的3*3的结果。
以此来编写程序:

import torch
import torch.nn.functional as F
input = torch.tensor([[1,2,0,3,1],
                      [0,1,2,3,1],
                      [1,2,1,0,0],
                      [5,2,3,1,1],
                      [2,1,0,1,1]])

kernel = torch.tensor([[1,2,1],
                      [0,1,0],
                      [2,1,0]])

input = torch.reshape(input, (1, 1, 5, 5))
kernel = torch.reshape(kernel, (1, 1, 3, 3))

output = F.conv2d(input, kernel, stride=1)
print(output)

输出;
PyTorch深度学习入门笔记(九)卷积操作_第4张图片
与之前我们计算的结果一致。
这里需要注意是nn.fuctional.conv2d函数的对参数的shape有要求,shape中有四个参数,分别为 Size,Channel,Height,Width。可以用 torch.reshape 函数来进行 shape的设置。

padding是填充的意思,即在输入的四周进行填充,默认是0,不进行填充。
还是用上面的代码,不过将padding设置为1:

output = F.conv2d(input, kernel, stride=1, padding=1)

PyTorch深度学习入门笔记(九)卷积操作_第5张图片

结果:
PyTorch深度学习入门笔记(九)卷积操作_第6张图片
设置为2时,结果为:
PyTorch深度学习入门笔记(九)卷积操作_第7张图片

你可能感兴趣的:(深度学习,pytorch,深度学习,python)