pytorch中的自定义数据处理详解

2025-03-02 18:42:08

pytorch在数据中采用Dataset的数据保存方式，需要继承data.Dataset类，如果需要自己处理数据的话，需要实现两个基本方法。

：.getitem:返回一条数据或者一个样本，obj[index] = obj.getitem(index). :.len:返回样本的数量。 len(obj) = obj.len()。

Dataset 在data里，调用的时候使用

from torch.utils import data
import os
from PIL import Image

数据在调用getitem的时候才会读取图片数据，如果需要可以修改成自己的getitem函数，根据自己的数据集来设定，比如

def _getitem_(self,index):
   img_path=self.imgs[index]; ##这里理解是加载了所有图像的路径，封装成自身的格式
   labels=[] ##根据自己的格式进行处理
   pil_img=Image.open(img_path); ##根据上面封装好的格式进行读取
   array=np.array(pil_img); ##将读取的图像转成array数据表示的格式
   data=t.from_numpy(array) #转成Tensor格式，方便后面网络操作
   return data,label;

def _len_(self):
   return len(self.imgs); ###imgs是一个绝对路径

在主函数里调用的时候，只需使用

dataset=Dataset('') ##或者调用自定义的数据处理类
data,label=dataset[0]; ##相当于调用了dataset.__getitem__(0)
for img,label in dataset:  ##里面也是以字典形式存放
  print(img.size(),imf.float().mean(),label);

采用Dataset的缺点在于实际中图像的大小不一，对数据处理中很不友好，其次数据太大，容易造成溢出，需要进行归一化，因此torchvision提供了transforms模块对Image进行和Tensor进行操作。

对PIL_Image的常见操作：

Scale,调整图像尺寸。centerCrop：randomcrop:randomsizecrop:裁剪图片

pad:填充

ToTensor:将Image图像转化成tensor，并自动归一化到[0,1]

对Tensor的常见操作：

Normalize:标准化，减去均值，除以标准差。 ToPILImage:将Tensor转变成PILImage格式，可以方便后续的可视化。

—————————我是分割线—————————

上面介绍了需要自定义的数据处理方法，pytorch早封装好了比较常用方便的方法.

transforms中的ImageFolder, 该类的好处是，所有文件按照类别进行保存，文件名就是类别名，不需要另外再生成label.txt了，也不需要像上面预处理下Label，该类会自动生成标签，构造函数如下：

ImageFolder(root,transform= None,target_transforms=None,loader=default_loader) ##其中root指定路径，transform:对PIL_Image进行转换操作，输入参数是loader的返回对象。target_transform：是label的转换，loader:是指定加载图片的函数，默认操作是读取为PIL_Image对象。

通过该函数得到的Lable按照文件夹名顺序排序后形成字典的，比如{类名：序号从0开始}

,一般最好把文件夹命名为从0开始的数字，和Imageloader的实际的Lable一致，如果不是，可以通过self.class_to_ids来查看你得到的数据的映射关系，比如你的文件夹是cat和dog，那么loader就是自动从0开始标签，self.class_to_ids得到的就是{‘cat':0,'dog':1}。

dataset=ImageLoader('root');
dataset.imgs ##返回图片路径和对应的标签
dataset[5][1] ;##返回第5张图的标签
dataset[5][0]; ##返回第5张图的图像数据，显示出来的就是一副图像，这时候并没有转成Tensor格式,所以需要手动转换
dataset[0][0].size(); ##输出第一个图像的大小
##得到的结果如下，表示该图像是3通道，大小为224*224
[3,224,224];

###定义一个transform，对数据进行各种预处理。

mytransform=T.Compose([
   randomSize;
   T.ToTensor()， ##重点是要记得转成Tensor格式
    normlize；
])；
dataset=ImageLoader('root',transform=mytransform);

调用ImageLoader把读取的图像转成dataset存储后，再使用DataLoader对上面得到的图像tensor数据进行抽样，打乱和分批次操作，操作格式如下：

DataLoader(dataset,batch_size,shuffle=False,sampler=None,num_workers=0,collate_fn=default,pin_memory=False,drop_last=False);

其中：

dataset：加载得到的dataset对象，就是上面得到的DataSet和ImageLoader得到的对象(ImageLoader需要进行tensor转换后才行）。

batch_size:批处理的大小

shuffle:是否要把数据进行打乱。（这样可以防止连续多个样本都是同一类别）

sampler:样本抽样.会改变本身dataset的大小（可以在不是batch倍数的时候使用）

num_workers:多进程数量，0表示不使用多进程。

collate_fn:一般采用默认的batch拼接方式。

pin_memory;是否将数据保存在pin_memory里，将这的数据转到GPU会快一些。

drop_last:有可能不是batch的整数倍，将不足一个batch的数据丢弃。

dataloader是一个迭代对象，使用方法与一个迭代器相似，例如：

for batch_data, batch_label in dataloader:
##是按照一batch的数量进行拼接的，以每batch进行迭代。

--------torchvision数据处理和可视化常用工具--------------

models:保存了训练好的模型

datasets:保存了数据集,主要包括minist，imagenet等

transforms:提供常用的数据预处理操作。

make_grid: make_grid(dataloader[0],4)：将第一个batch的图像拼接成4*4网格

save_image:直接将tensor格式的数据保存成图像

tensorboard是tensorflow框架使用的，但是也有针对pytorch的Tensorboardx，能读取数据并进行可视化，使用比tensorflow的更加方便，本文主要介绍另外一种工具visdom，pytorch的专属可视化工具，支持数据，图像，文本，视频的显示。visdom有以下两种概念：

env:环境，默认使用Main环境，不同用户的环境可能不同，需要专门指定。

pane:窗格，用于进行可视化，可以拖放，缩放和保存关闭，可以多个显示。

可以使用pip install visdom直接进行安装，在使用visdom的时候需要注意，保存时候需要手动指定保存的env，其次客户端和服务端之间交互采用tornado框架，不会受其他程序的影响。visdom需要使用nohup python -m visdom.server命令启动,放在后台运行。

import visdom
vis=visdom.Visdom(env=u'test')；指定一个环境，新建一个客户端，还可以指定host和端口
x=;
y=;
vis.line(X=x,Y=y,win='sinx',opts={'title':'y=sinx'}; #画图
-line,-image,-text,-histgram,-scatter,-bar,-pie.

同时支持pytorch的tensor和Numpy结构，但不支持int float类型，vis.updateTrace更新之前的图。

visdom的画图工具可以接受两种，一种是image，接受二维或者三维的，前者是黑白的，后者是彩色图像，Images接受一个4维向量的nch*w,c可以是1或者3，代表黑白或者彩色的，n表示图片的数量。

--------临时记录下已有的Loss函数-------

nn.CrossEntropyLoss(); ##交叉熵函数

nn.MSELoss()； ##均方差函数

nn.NLLLoss()

nn.NLL2dLoss()；

loss函数后面再学习。

以上这篇pytorch中的自定义数据处理详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

pytorch 自定义参数不更新方式

nn.Module中定义参数:不需要加cuda,可以求导,反向传播 class BiFPN(nn.Module): def __init__(self, fpn_sizes): self.w1 = nn.Parameter(torch.rand(1)) print("no---------------------------------------------------",self.w1.data, self.w1.grad) 下面这个例子说明中间变量可能没有梯度,但是最终变量有梯度
pytorch 自定义数据集加载方法

pytorch 官网给出的例子中都是使用了已经定义好的特殊数据集接口来加载数据,而且其使用的数据都是官方给出的数据.如果我们有自己收集的数据集,如何用来训练网络呢?此时需要我们自己定义好数据处理接口.幸运的是pytroch给出了一个数据集接口类(torch.utils.data.Dataset),可以方便我们继承并实现自己的数据集接口. torch.utils.data torch的这个文件包含了一些关于数据集处理的类. class torch.utils.data.Dataset: 一个抽象类
pytorch sampler对数据进行采样的实现

PyTorch中还单独提供了一个sampler模块,用来对数据进行采样.常用的有随机采样器:RandomSampler,当dataloader的shuffle参数为True时,系统会自动调用这个采样器,实现打乱数据.默认的是采用SequentialSampler,它会按顺序一个一个进行采样.这里介绍另外一个很有用的采样方法: WeightedRandomSampler,它会根据每个样本的权重选取数据,在样本比例不均衡的问题中,可用它来进行重采样. 构建WeightedRandomSampler时
Pytorch 数据加载与数据预处理方式

数据加载分为加载torchvision.datasets中的数据集以及加载自己使用的数据集两种情况. torchvision.datasets中的数据集 torchvision.datasets中自带MNIST,Imagenet-12,CIFAR等数据集,所有的数据集都是torch.utils.data.Dataset的子类,都包含 _ _ len _ (获取数据集长度)和 _ getItem _ _ (获取数据集中每一项)两个子方法. Dataset源码如上,可以看到其中包含了两个没有实现的子
pytorch 数据处理:定义自己的数据集合实例

数据处理版本1 #数据处理 import os import torch from torch.utils import data from PIL import Image import numpy as np #定义自己的数据集合 class DogCat(data.Dataset): def __init__(self,root): #所有图片的绝对路径 imgs=os.listdir(root) self.imgs=[os.path.join(root,k) for k in imgs
pytorch中的自定义数据处理详解

pytorch在数据中采用Dataset的数据保存方式,需要继承data.Dataset类,如果需要自己处理数据的话,需要实现两个基本方法. :.getitem:返回一条数据或者一个样本,obj[index] = obj.getitem(index). :.len:返回样本的数量 . len(obj) = obj.len(). Dataset 在data里,调用的时候使用 from torch.utils import data import os from PIL import Image 数
基于python及pytorch中乘法的使用详解

numpy中的乘法 A = np.array([[1, 2, 3], [2, 3, 4]]) B = np.array([[1, 0, 1], [2, 1, -1]]) C = np.array([[1, 0], [0, 1], [-1, 0]]) A * B : # 对应位置相乘 np.array([[ 1, 0, 3], [ 4, 3, -4]]) A.dot(B) : # 矩阵乘法 ValueError: shapes (2,3) and (2,3) not aligned: 3 (dim
PyTorch中permute的用法详解

permute(dims) 将tensor的维度换位. 参数:参数是一系列的整数,代表原来张量的维度.比如三维就有0,1,2这些dimension. 例: import torch import numpy as np a=np.array([[[1,2,3],[4,5,6]]]) unpermuted=torch.tensor(a) print(unpermuted.size()) # --> torch.Size([1, 2, 3]) permuted=unpermuted.permute(
Pytorch 中retain_graph的用法详解

用法分析在查看SRGAN源码时有如下损失函数,其中设置了retain_graph=True,其作用是什么? ############################ # (1) Update D network: maximize D(x)-1-D(G(z)) ########################### real_img = Variable(target) if torch.cuda.is_available(): real_img = real_img.cuda() z = V
PyTorch中的Variable变量详解

一.了解Variable 顾名思义,Variable就是变量的意思.实质上也就是可以变化的量,区别于int变量,它是一种可以变化的变量,这正好就符合了反向传播,参数更新的属性. 具体来说,在pytorch中的Variable就是一个存放会变化值的地理位置,里面的值会不停发生片花,就像一个装鸡蛋的篮子,鸡蛋数会不断发生变化.那谁是里面的鸡蛋呢,自然就是pytorch中的tensor了.(也就是说,pytorch都是有tensor计算的,而tensor里面的参数都是Variable的形式).如果
Pytorch中.new()的作用详解

一.作用创建一个新的Tensor,该Tensor的type和device都和原有Tensor一致,且无内容. 二.使用方法如果随机定义一个大小的Tensor,则新的Tensor有两种创建方法,如下: inputs = torch.randn(m, n) new_inputs = inputs.new() new_inputs = torch.Tensor.new(inputs) 三.具体代码 import torch rectangle_height = 1 rectangle_width
pytorch中index_select()的用法详解

pytorch中index_select()的用法 index_select(input, dim, index) 功能:在指定的维度dim上选取数据,不如选取某些行,列参数介绍第一个参数input是要索引查找的对象第二个参数dim是要查找的维度,因为通常情况下我们使用的都是二维张量,所以可以简单的记忆: 0代表行,1代表列第三个参数index是你要索引的序列,它是一个tensor对象刚开始学习pytorch,遇到了index_select(),一开始不太明白几个参数的意思,后来查了一
pytorch中nn.Flatten()函数详解及示例

torch.nn.Flatten(start_dim=1, end_dim=- 1) 作用:将连续的维度范围展平为张量. 经常在nn.Sequential()中出现,一般写在某个神经网络模型之后,用于对神经网络模型的输出进行处理,得到tensor类型的数据. 有俩个参数,start_dim和end_dim,分别表示开始的维度和终止的维度,默认值分别是1和-1,其中1表示第一维度,-1表示最后的维度.结合起来看意思就是从第一维度到最后一个维度全部给展平为张量.(注意:数据的维度是从0开始的,也就是
pytorch 中transforms的使用详解

目录 transforms ToTensor transforms使用为什么需要tensor数据类型呢? 常见的transforms 内置方法__call__() Normalize Resize Compose transforms 按住Ctrl查看transforms的源码可以知道,transforms就是一个python文件,里面定义了很多类,每一个类都是一个工具在结构那里,可以看到有很多的类 ToTensor Convert a PIL Image or numpy.ndarray t
pytorch中的dataset用法详解

目录 1.torch.utils.data 里面的dataset使用方法 2.torchvision.datasets的使用方法用法1:使用官方数据集用法2:ImageFolder通用的自己数据集加载器 1.torch.utils.data 里面的dataset使用方法当我们继承了一个 Dataset类之后,我们需要重写 len 方法,该方法提供了dataset的大小: getitem 方法, 该方法支持从 0 到 len(self)的索引 from torch.utils.data im

pytorch中的自定义数据处理详解

相关推荐

随机推荐