Despacito1006

Pytorch系列之——数据读取机制&Transforms

DataLoader与DataSet

人民币二分类
DataLoader与DataSet

根据pytorch张量部分中提到的机器学习模型训练的五大步骤：数据、模型、损失函数、优化器和迭代训练。我们这部分主要介绍模型训练的第一个步骤：数据模块。其中，数据模块通常进一步划分为四个子模块，分别为：数据收集、数据划分、数据读取和数据预处理。
这次主要介绍的部分是数据模块中的数据读取子模块DataLoader，其中DataLoader还可以划分为Sampler和DataSet，Sampler是用来生成索引，而DataSet是根据索引获取Img和Label。

DataLoader

torch.utils.data.DataLoader:
功能：构建可迭代的数据装载器

dataset:Dataset类，决定数据从哪儿读取及如何读取
batchsize:批大小
num_works:是否多进程读取数据
shuffle:每个epoch是否乱序
drop_last:当样本数不能被batchsize整除时，是否舍弃最后一批数据
接下来看看在模型训练中必不可少的epoch、Iteration和Batchsize三者都代表什么：
Epoch:所有训练样本都已经输入到模型中，称为一个Epoch
Iteration:一批样本输入到模型中，称之为一个Iteration
Batchsize:批大小，决定一个Epoch有多少个Iteration

比如，我们有样本总数为80，其中设置Batchsize为8，那么有：1 Epoch=10 Iteration；如果样本总数为87，这时其无法被Batchsize整除，那么有如下两种方式解决：
（1）1 Epoch=10 Iteration 需要设置drop_last=True(余下的7个样本将被忽略）
（2）1 Epoch=11 Iteration 需要设置drop_last=False

DataSet

torch.utils.data.DataSet:
功能：DataSet抽象类，所有自定义的DataSet需要继承它，并且复写__getitem__(),其中__getitem__()的作用是接收一个索引，返回一个样本。
在通过人民币二分类问题进行学习之前，我们需要考虑三个问题：

读哪些数据？
从哪读数据？
怎么读数据？

首先我们是先将人民币图像压缩包文件进行解压，之后在通过python的os模块对图像进行读取，这个过程中还需对数据集进行划分，将数据集进一步划分为训练集、验证集和测试集(train、valid、test)，这也就解决了数据读取的第一个问题，即读哪些数据。之后我们再根据划分好的训练集、验证集和测试集依次对人民币图像数据进行读取，这部分是解决了数据读取的第二个问题，即从哪读数据。
最主要的部分是构建MyDataset实例，这里的RMBDataset是需要我们自己构建的，其中传入的两个参数分别为读取数据的文件路径，以及用于数据预处理的transform，这个transform之后会详细介绍。
按住Ctrl键再单击RMBDataset可以使程序跳转到具体的实现类：
可以看到，在RMBDataset实现类里有用于初始化的__init__()方法，以及__getitem__()函数会根据索引值返回一个图像和对应的标签值，len()函数可以用来查看数据的长度，即样本的数量。这里我们是构建两个Dataset，一个是训练数据的Dataset，另一个是验证数据的Dataset，有了Dataset我们就可以构建数据装载器DataLoader了。在DataLoader中我们需要传入之前创建好的Dataset，同时还有batch_size，也就是批处理的样本量，还有是否将数据进行打乱，在训练集中需要将数据进行shuffle而在验证集中则不用。之后我们采用经典的深度神经网络模型LeNet来解决这个人民币二分类问题，接下来我们通过代码的调试来观察pytorch是如何读取数据的：
首先在循环读取数据起始位置设置断点并进行Debug:
之后选择stepinto就能跳转到这个函数中，
可以看到首先函数会获取indices也就是索引，以及batch也就是数据，这个函数也正好告诉了我们数据读取问题中读取哪些数据的问题。之后我们将光标放在获取indices这一行代码上并点击Run to Cursor，将代码运行到光标这一行。接着我们再stepinto光标所在行的代码，看看pytorch是如何获取indices的，进入到了Sampler:
Sampler就是一个采样器，它用来告诉我们每一个batchsize该读取哪些数据。尤其是在__iter__()函数中，这个函数是用产生迭代索引值的，也就是指定每个step需要读取哪些数据。
之后我们再stepover，stepout跳出这个函数，并将光标放在indices下面那一行，即可看到已获取的索引值：

可以看到，已经获得了indices索引值，由于我们的batch_size设置的是16，所以获得的索引数量也就为16。在得到索引之后，就可以根据索引获取相应的数据了。
再在data这一行设置断点，并stepinto查看究竟在这个函数中究竟发生了什么：
可以看到我们stepinto到了__getitem__()这个函数，并根据索引值获取相应的img和label，而获取数据的关键点就在这里。
stepout跳出这个函数之后，我们可以发现函数collate_fn()，这个函数是对获取到的数据进行整理，整理成一个batch：

经过代码调试之后，我们可以更好地解决之前数据读取的三个问题：
读哪些数据？是根据Sampler输出的Index进行读取；从哪读数据？是根据Dataset中的data_dir读取，简单地说就是从相关的硬盘文件读取；怎么读数据？这个就是根据比较重要的Dataset中的getitem函数来读取了。将这一数据读取过程用流程图表示如下：
首先我们根据for循环进入DataLoader,之后判断是采用单进程还是多进程进入DataLoaderIter,进入到DataLoaderIter之后我们会使用Sampler去获取index(indices)索引，拿到索引之后给到DatasetFetcher，在DatasetFetcher中会调用Dataset,Dataset根据我们给定的索引在getitem当中从硬盘当中去读取我们实际的图像和标签，在读取了一个batchsize大小的数据之后，通过一个collate_fn将获取的这些数据进行整理，整理成一个batchdata的形式，然后即可输入到我们的模型当中去训练了。

数据预处理模块——transforms

transforms运行机制
数据标准化——transforms.normalize

在这部分，我们需要安装计算机视觉工具包——torchvision，其中常用的几个方法包括：

torchvision.transforms:常用的图像预处理方法
torchvision.datasets:常用数据集的datasets实现，包括MNIST、CIFAR-10、ImageNet等
torchvision.model:常用的模型预训练，AlexNet,VGG,ResNet,GoogLeNet等

torchvision.transforms:常用的图像预处理方法，主要包括数据中心化、数据标准化、缩放、裁剪、旋转、翻转、填充、噪声添加、灰度变换、线性变换、仿射变换、亮度、饱和度及对比度变换。
这里我们依然采用人民币二分类来对transforms进行说明：
这里的Compose是将我们的一系列transforms方法进行有序的组合，在具体实现的时候会依次地将这些方法对图像进行操作。在train_transform那里，可以看到首先先对图像进行resize把图像缩放到32x32大小的尺寸，接着对图像进行一个随机裁剪，再使用ToTensor将图像转换成张量形式，同时会进行一个归一化操作，把像素值的区间从0-255归一化到0-1，最后一步是标准化将均值变为0，标准差变为1。
现在依然通过代码调试的方式来查看其运行机制，先通过设置断点并stepinto到如下这个函数：

之后我们在self.transforms处进行Run on Cursor并stepinto，即可进入到transforms.py文件中的__call__()函数：
可以看到__call__()函数里是一个for循环，也就是依次地执行对图像的一系列变换操作，这个循环结束后最终返回执行完变换的图像。从这里可以看到，transform是在__getitem__()函数中被调用，再通过__getitem__()返回一个样本，之后不断根据索引总共获取batchsize大小的数据。这就是pytorch数据读取和transform的运行机制。
这次把transform加入到数据读取流程图中。

transforms.Normalize：
功能：逐channel的对图像进行标准化
output = (input - mean) / std

mean:各通道的均值
std:各通道的标准差
inplace:是否原地操作
对数据进行标准化之后可以加快模型的收敛。

transforms图像增强(一)

数据增强
transforms——裁剪
transforms——翻转和旋转

数据增强(Data Augmentation):数据增强又称为数据增广，数据扩增，它是对训练集进行变换，使训练集更丰富，从而让模型更具泛化能力。

裁剪——transforms.CenterCrop:
功能：从图像中心裁剪图片

size:所需裁剪图片尺寸

随机裁剪——transforms.RandomCrop:
功能：从图片中随机裁剪出尺寸为size的图片

size:所需裁剪图片尺寸
padding:设置填充大小
当padding=a时，上下左右均填充a个像素
当padding=(a,b)时，上下填充b个像素，左右填充a个像素
当padding=(a,b,c,d)时，左，上，右，下分别填充a,b,c,d
pad_if_need:若图像小于设定size，则填充
padding_mode:填充模式，有4种模式
1.constant:像素值由fill设定
2.edge:像素值由图像边缘像素设定
3.reflect:镜像填充，最后一个像素不镜像
4.symmetric:镜像填充，最后一个像素镜像
fill:constant时，设置填充的像素值

transforms——Crop
RandomResizedCrop:
功能：随机大小、长宽比裁剪图片
size:所需裁剪图片尺寸
scale:随机裁剪面积比例，默认（0.08,1）
ratio:随机长宽比，默认（3/4，4/3）
interpolation:插值方法
PIL.Image.NEAREST
PIL.Image.BILINEAR
PIL.Image.BICUBIC
FiveCrop、TenCrop:
功能：在图像的上下左右以及中心裁剪出尺寸为size的5张图片，TenCrop对这5张图片进行水平或垂直镜像获得10张图片。
size:所需裁剪图片尺寸
vertical_flip:是否垂直翻转

transforms——翻转、旋转

1.RandomHorizontalFlip
2.RandomVerticalFlip
功能：依概率水平（左右）或垂直（上下）翻转图片

p:翻转概率

3.RandomRotation
功能：随机旋转图片
degrees:旋转角度
当degrees=a时，在（-a,a）之间选择旋转角度
当degrees=(a,b)时，在（a,b）之间选择旋转角度
resample:重采样方法
expand:是否扩大图片，以保持原图信息
center:旋转点位置，默认中心旋转

transforms图像增强(二)

1.Pad
功能：对图片边缘进行填充

padding:设置填充大小
当padding=a时，上下左右均填充a个像素
当padding=(a,b)时，上下填充b个像素，左右填充a个像素
当padding=(a,b,c,d)时，左，上，右，下分别填充a,b,c,d
padding_mode:填充模式，有4种模式，constant,edge,reflect和symmetric
fill:constant时，设置填充的像素值(R,G,B) 或(Gray)

2.ColorJitter
功能：调整亮度、对比度、饱和度和色相

brightness:亮度调整因子
当brightness=a时，从[max(0,1-a),1+a]中随机选择
当brightness=(a,b)时，从[a,b]中选择
contrast:对比度参数，同brightness
saturation:饱和度参数，同brightness
hue:色相参数
当hue=a时，从[-a,a]中选择参数,注：0<=a<=0.5
当hue=(a,b)时，从[a,b]中选择参数，注：-0.5<=a<=b<=0.5

3.Grayscale
4.RandomGrayscale

功能：依概率将图片转换为灰度图

num_output_channels:输出通道数，只能设1或3
p:概率值，图像被转换为灰度图的概率

5.RandomAffine
功能：对图像进行仿射变换，仿射变换是二维的线性变换，由五种基本原子变换构成，分别是旋转、平移、缩放、错切和翻转

degrees:旋转角度设置
translate:平移区间设置，如（a,b），a设置宽（width），b设置高（height）,图像在宽维度平移的区间为-img_width * a< dx
scale:缩放比例（以面积为单位）
fill_color:填充颜色设置
shear:错切角度设置有水平错切和垂直错切
resample:重采样方式，有NEAREST,BILINEAR,BICUBIC

6.RandomErasing
功能：对图像进行随机遮挡（接收张量，是对Tensor进行操作的）

p:概率值，执行该操作的概率
scale:遮挡区域的面积
ratio:遮挡区域的长宽比
value:设置遮挡区域的像素值，（R,G,B）或（Gray）

7.transforms.Lambda
功能：用户自定义lambda方法

lambda:lambda匿名函数
lambda [arg1,[,arg2,…,argn]]:expression

transforms的操作

1.transforms.RandomChoice
功能：从一系列transforms方法中随机挑选一个

2.transforms.RandomApply
功能：依据概率执行一组transforms操作

3.transforms.RandomOrder
功能：对一组transforms操作打乱顺序

自定义transforms

自定义transforms要素：

仅接收一个参数，返回一个参数
注意上下游的输出与输入
通过类实现多参数传入：

椒盐噪声：
椒盐噪声又称为脉冲噪声，是一种随机出现的白点或者黑点，白点称为盐噪声，黑色称为椒噪声。
信噪比（Signal-Noise Rate,SNR）是衡量噪声的比例，图像中为图像像素的占比。

transforms methods总结：

数据增强实战应用
原则：让训练集与测试集更接近

空间位置：平移
色彩：灰度图，色彩抖动
形状：仿射变换
上下文场景：遮挡、填充
… …

参考资料

深度之眼训练营——Pytorch课程

数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
Spring AI与机器学习：智能应用开发新范式 tmjpz04412 人工智能 spring 机器学习
SpringAI与机器学习的整合SpringAI是一个基于Spring生态的AI开发框架，旨在简化智能应用的开发流程。通过SpringAI，开发者可以快速集成机器学习模型，构建高效的智能应用。SpringAI支持多种机器学习库和框架，如TensorFlow、PyTorch和Scikit-learn，提供统一的API接口。SpringAI的核心优势在于其模块化设计和自动化配置。开发者无需关心复杂的依
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
学苑教育杂志《学苑教育》杂志社学苑教育编辑部2025年第21期目录 QQ296078736 人工智能
专题研究推进“教-学-评”一体化，打造小学语文高效课堂刘月兰;4-6教育管理新高考制度下普通高中生涯教育课程设计的研究霍亚贞;马玲;7-9课堂教学核心素养下小学数学深度学习课堂的构建策略康贵景;10-12“双减”背景下初中英语教学的课堂模式高燕;13-15小学低年级数学说理课堂构建策略玉洁;16-18基于法治观念培育的道法课项目式教学策略许静;19-21“双师课堂”在初中语文写作教学中的实践孙巧玲
使用 PyTorch 和 Pandas 进行 Kaggle 房价预测 Clang's Blog AI pytorch pandas 人工智能
文章目录1、环境设置2、数据下载3、数据预处理4、模型构建5、训练和验证6、训练模型并生成预测结果7、完整代码在本篇博文中，我们将探索如何使用PyTorch和Pandas库，构建一个用于Kaggle房价预测的模型。我们将详细讨论数据加载、预处理、模型构建、训练、验证及最终预测的全过程。1、环境设置我们首先需要导入所需的库，包括用于数据处理的pandas和numpy，以及用于深度学习的torch。i
PyTorch 使用指南
PyTorch是一个功能强大且灵活的Python开源机器学习库，以其动态计算图和直观的Pythonic接口而闻名。本指南将带您了解PyTorch的基础操作，包括张量创建、自动求导，以及如何构建、训练和优化神经网络模型。我们还将深入探讨其在图像分类（以CIFAR-10为例）和自然语言处理（以灾难推文分类为例）等特定领域的应用，并概述其在图像分割和强化学习等其他领域的应用。PyTorch使用指南1.P
PyTorch武侠演义第一卷：初入江湖第7章：矿洞中的计算禁制空中湖 pytorch武侠演绎 pytorch 人工智能 python
第一卷：初入江湖第7章：矿洞中的计算禁制矿洞深处罗盘残件在接近矿洞时突然发热，指针疯狂旋转。"就是这里，"欧阳长老抚摸着洞壁上的计算图刻痕，“TensorFlow帮用静态图封印了矿脉。”林小码看到：幽蓝矿脉构成巨大的计算图结构水晶矿簇随呼吸节奏明灭（CUDA核心）矿道中流淌着数据光流（内存带宽）"小心！"大师突然拉回林小码。他刚才踩中的矿砖下陷，触发岩壁上的机关——数十道计算图锁链从四面八方射来！
使用中转API在Python中调用大型语言模型 (LLM) 的实践** qq_37836323 python 语言模型开发语言
**在人工智能技术中，大型语言模型(LLM)已成为自然语言处理(NLP)和生成任务的重要工具。然而，由于网络限制，直接访问OpenAI的API在中国可能面临挑战。因此，本文将介绍如何使用中转API地址http://api.wlai.vip来调用LLM，并提供相关的demo代码。什么是大型语言模型(LLM)？大型语言模型是一种深度学习模型，训练于大量文本数据上，能够生成、总结、翻译和回答问题等。Op
【免费下载】探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破
探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破在这个数字化时代，人工智能正逐步改变我们的生活，其中深度学习在农业领域的应用尤其引人注目。PlantVillage-Dataset是一个开放源代码的项目，它提供了一个庞大的植物病害识别数据集，旨在帮助开发人员和研究者利用机器学习技术改善农作物健康状况的监测。本文将深入探讨该项目的技术细节、应用价值及其独特之处。项目简
Python爬虫【五十八章】Python数据清洗与分析全攻略：从Pandas到深度学习的异常检测进阶程序员_CLUB Python入门到进阶 python 爬虫 pandas
目录背景与需求分析第一章：结构化数据清洗实战（Pandas核心技法）1.1数据去重策略矩阵1.2智能缺失值处理体系第二章：深度学习异常检测进阶2.1自动编码器异常检测（时序数据）2.2图神经网络异常检测（关系型数据）第三章：综合案例实战案例1：金融交易反欺诈系统案例2：工业传感器异常检测第四章：性能优化与工程实践4.1大数据处理加速技巧4.2模型部署方案第五章：方法论总结与展望5.1方法论框架5.
大模型【进阶】（一）MoE（mixture of experts）混合专家结构 ReinaXue 人工智能笔记语言模型神经网络
什么是MoE结构？MoE（MixtureofExperts，专家混合模型）是一种深度学习模型架构，通常用于处理大规模模型和计算资源效率的挑战。在MoE结构中，模型由多个“专家”组成，每个专家处理不同的任务或输入数据的不同部分，而不是让所有专家都参与每次计算。这种方式提高了计算效率，并在某些情况下有助于增强模型的表现。MoE结构的核心思想专家：在MoE模型中，专家通常指的是网络中的子模型，每个专家具
【三维目标检测】Complex-Yolov4详解（二）：模型结构 Coding的叶子 Python三维点云实战宝典 Complex-Yolo Complex-Yolov4 三维目标检测目标检测 python
本文为博主原创文章，未经博主允许不得转载。本文为专栏《python三维点云从基础到深度学习》系列文章，地址为“https://blog.csdn.net/suiyingy/article/details/124017716”。Complex-Yolo网络模型的核心思想是用鸟瞰图BEV替换Yolo网络输入的RGB图像。因此，在完成BEV处理之后，模型的训练和推理过程基本和Yolo完全一致。Yolov
基于深度学习的图像分类：使用ShuffleNet实现高效分类 Blossom.118 机器学习与人工智能深度学习分类人工智能机器学习数据挖掘 python 目标检测
前言图像分类是计算机视觉领域中的一个基础任务，其目标是将输入的图像分配到预定义的类别中。近年来，深度学习技术，尤其是卷积神经网络（CNN），在图像分类任务中取得了显著的进展。ShuffleNet是一种轻量级的深度学习架构，专为移动和嵌入式设备设计，能够在保持较高分类精度的同时，显著减少计算量和模型大小。本文将详细介绍如何使用ShuffleNet实现高效的图像分类，从理论基础到代码实现，带你一步步掌
AI人工智能领域深度学习的在线学习方法 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习学习方法 ai
AI人工智能领域深度学习的在线学习方法关键词：深度学习、在线学习、AI教育、实战项目、知识体系摘要：本文为想系统学习深度学习的初学者/转行者量身打造，通过拆解深度学习的核心概念、梳理在线学习的科学路径、提供可落地的实战案例与资源清单，帮你用“游戏通关”的思路高效掌握这门技术。无论你是学生、程序员还是跨行者，都能找到适合自己的学习节奏，避免“看视频就会，动手就废”的陷阱。背景介绍目的和范围深度学习是
AI人工智能深度学习的模型评估与选择 AI大模型应用之禅人工智能深度学习 ai
AI人工智能深度学习的模型评估与选择关键词：AI、人工智能、深度学习、模型评估、模型选择摘要：本文聚焦于AI人工智能深度学习中的模型评估与选择。在深度学习迅猛发展的当下，构建一个有效的模型并非易事，而准确评估和恰当选择模型对于模型性能的发挥和应用效果至关重要。文章将详细介绍模型评估与选择的相关背景知识，深入剖析核心概念与联系，阐述核心算法原理及具体操作步骤，运用数学模型和公式进行详细讲解并举例说明
深度学习中，定量分析和定性分析是什么？要体现什么？ seasonsyy 深度学习小知识深度学习人工智能定量分析定性分析
深度学习中，定量分析和定性分析是什么？要体现什么？在深度学习和一般的数据分析中，定量分析（QuantitativeAnalysis）和定性分析（QualitativeAnalysis）是两种主要的研究方法，它们分别关注数据的数量特征和质的特征。定量分析（QuantitativeAnalysis）定性分析（QualitativeAnalysis）关注方面定量分析涉及可量化的数据，即那些可以通过数字来
Python金融分析：情感分析在量化价值投资中的完整实现 AI量化价值投资入门到精通 python 金融开发语言 ai
Python金融分析：情感分析在量化价值投资中的完整实现关键词：Python金融分析、情感分析、量化投资、价值投资、自然语言处理、机器学习、金融文本挖掘摘要：本文系统解析如何将情感分析技术深度整合到量化价值投资体系中，通过Python实现从金融文本数据采集、预处理、情感建模到策略回测的完整流程。详细阐述基于规则引擎、机器学习和深度学习的多维度情感分析方法，结合财务指标构建复合投资模型，并通过实战案
开源深度学习新宠：Burn框架助您无忧高效建模
在日新月异的人工智能世界里，各类深度学习框架如雨后春笋般涌现，而Burn，作为新一代的深度学习框架，以其不妥协的灵活性、高效性和可移植性崭露头角。本文将深入探讨Burn的核心功能、应用场景及具体使用方法，帮助您更好地了解这款值得关注的开源项目。性能和优化：超越速度的追求Burn框架将高效性作为其核心支柱之一，通过一系列优化技术确保模型能够快速可靠地运行。以下是Burn在性能方面的几个显著特色：自动
数字人克隆中SyncTalk算法介绍与部署过程优秘智能UMI 人工智能 ubuntu
SyncTalk算法介绍SyncTalk合成同步的头部说话视频，采用三平面哈希表示来保持主体身份。它可以生成同步的嘴唇动作、面部表情和稳定的头部姿势，并恢复头发细节以创建高分辨率视频。部署在Linux中部署该项目，在Ubuntu18.04、Pytorch1.12.1和CUDA11.3上测试。gitclonehttps://github.com/ZiqiaoPeng/SyncTalk.gitcdSy
风格迁移（Style Transfer）
1.什么是风格迁移（StyleTransfer）：简单介绍风格迁移的概念，指的是将一张图像的内容与另一张图像的艺术风格结合起来，从而生成一个新的图像。例如，将一张风景图像的内容与一幅著名艺术作品（如梵高的《星夜》）的风格结合。应用场景：风格迁移常用于图像生成、艺术创作和增强现实等领域。目标：本文将讲解如何使用PyTorch和VGG19模型实现风格迁移，并展示其核心代码。2.风格迁移的原理在这一部分
标签助手：基于LabelImg和YOLOv5的图像半自动标注工具伏容一Julia
标签助手：基于LabelImg和YOLOv5的图像半自动标注工具项目基础介绍标签助手（labelGo-Yolov5AutoLabelImg）是一个图形化的半自动图像注解工具，它结合了广受欢迎的图像标注工具LabelImg的力量与先进的目标检测框架YOLOv5。这个开源项目旨在简化数据集的标注过程，利用现有YOLOv5PyTorch模型实现快速的半自动化标注，极大地提高了标注效率。项目主要采用Pyt
【MMCV】MMCV安装与踩坑 Elendill Pyhton pytorch python mmcv
确认MMCV版本首先确认项目所需MMCV的版本是多少mmcv2.0版本的代码相比较于=2.0.0安装方法新创建一个conda环境安装pytorch：condainstallpytorchtorchvisiontorchaudiopytorch-cuda=11.8-cpytorch-cnvidia安装mim，这是openmm官方推出的用于安装他们旗下mm系列产品的安装器：pipinstall-Uop
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少