python使用dataset数据集_Python——数据集和数据加载器,pytorchDataset,Dataloader

Dataset和Dataloader

Dataset基类

PyTorch 读取其他的数据,主要是通过 Dataset 类,所以先简单了解一下 Dataset 类。在看很多PyTorch的代码的时候,也会经常看到dataset这个东西的存在。Dataset类作为所有的 datasets 的基类存在,所有的 datasets 都需要继承它。

构建Dataset子类

下面我们构建一下Dataset的子类,叫他MyDataset类:

import torch

from torch.utils.data import Dataset,DataLoader

class MyDataset(Dataset):

def __init__(self):

self.data = torch.tensor([[1,2,3],[2,3,4],[3,4,5],[4,5,6]])

self.label = torch.LongTensor([1,1,0,0])

def __getitem__(self,index):

return self.data[index],self.label[index]

def __len__(self):

return len(self.data)

Init

初始化中,一般是把数据直接保存在这个类的属性中。像是self.data,self.label

getitem

index是一个索引,这个索引的取值范围是要根据__len__这个返回值确定的,在上面的例子中,__len__的返回值是4,所以这个index会在0,1,2,3这个范围内。

datalo

你可能感兴趣的:(python使用dataset数据集_Python——数据集和数据加载器,pytorchDataset,Dataloader)