梯度

零数学基础理解AI核心概念：梯度下降可视化实战

用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。

九章云极AladdinEdu·2025-07-29 19:46

【树模型与集成学习】(task6)梯度提升树GBDT+LR

学习总结（1）不同问题的提升树学习算法，主要区别在于使用的损失函数不同，如用平方误差损失函数的回归问题、用指数损失函数的分类问题、用一般损失函数的一般决策问题等。（2）不管是二分类问题的提升树，还是回归问题的提升树，这里的损失函数都很方便：前者是用指数损失函数，所以可以当做是Adaboost的个例，Aadaboost的流程；而后者是当使用平方误差损失时，可以直接拟合残差。而使用不同的损失函数，对应

山顶夕景·2025-07-29 04:27

Python与机器学习库Scikit-learn进阶

安装与环境设置特征工程的艺术：打造更强大的预测模型数据清洗特征构造模型调优秘籍：网格搜索与交叉验证的最佳实践网格搜索交叉验证集成学习的魅力：提升模型性能的组合拳随机森林梯度提升机堆叠实战案例解析：使用Scikit-learn

master_chenchengg·2025-07-29 00:54

《零基础入门AI：从图像梯度到凸包特征检测（OpenCV图像特征提取）》

一、图像梯度处理：理解像素变化的本质1.1图像梯度基础图像梯度是计算机视觉中的核心概念，它描述了图像中像素强度的变化情况：梯度方向：像素值变化最剧烈的方向（垂直于边缘）梯度幅度：像素值变化的强度（值越大表示边缘越明显

竹子_23·2025-07-28 21:36

OpenCV图像梯度边缘轮廓处理

一、梯度处理的sobel算子函数函数名：cv2.Sobel(src,ddepth,dx,dy,ksize=3,scale=1,delta=0,borderType=None)功能：用于计算图像梯度（gradient

Jiamusi_night·2025-07-28 18:14

【人工智能-14】OpenCV梯度处理、边缘检测、绘制轮廓、凸包检测、轮廓特征查找

上一期【人工智能-13】OpenCV插值方法，边缘填充，图像矫正，图像掩膜，图像融合与噪点消除文章目录一、梯度处理1.图像梯度2.垂直边缘提取3.Sobel算子4.Laplacian算子二、边缘检测1.

m0_64233047·2025-07-28 18:44

机器学习算法（六）---逻辑回归

1.1模型介绍1.2工作原理1.2.1对数几率模型1.2.2逻辑回归与Sigmoid函数1.3.3熵、相对熵与交叉熵1.3损失函数和优化算法1.3.1损失函数的理论基础1.3.2优化算法1.3.2.1梯度下降算法局限

向云端UP·2025-07-28 09:39

博客摘录「 yolo 11从原理、创新点、训练到部署(yolov11代码+教程)」2025年4月28日

具体来说，CSPNet通过将特征图进行部分跨层连接，减少了冗余梯度信息，提高了模型的学习效率和泛化能力。2.2SPPF（Sp

G.547·2025-07-28 00:27

人工智能自然语言处理：Transformer 模型详解

但它存在一个致命弱点，在处理长序列时，会面临梯度消失或梯度爆炸的问题，就像一个长途跋涉的旅人，随着路程的增加，逐渐忘记了出发时的目标和重要信息。LSTM虽然在一定程度上缓解了这个问题

大力出奇迹985·2025-07-27 15:56

残差网络作用

提到它，很多人第一反应是“解决了梯度消失问题”。没错，这确实是ResNet的核心突破之一，但这仅仅是冰山一角。

·2025-07-27 11:23

深度学习 - 梯度下降优化方法

梯度下降的基本概念梯度下降（GradientDescent）是一种用于优化机器学习模型参数的算法，其目的是最小化损失函数，从而提高模型的预测精度。

·2025-07-26 21:35

深度学习-梯度下降法

梯度下降法优化器核心目标：找到函数的最小值点（或极小值点）。在机器学习中，这个函数通常是损失函数，衡量模型预测值与真实值的差距。最小化损失函数意味着让模型预测更准确。

若天明·2025-07-26 20:29

PPO：强化学习中的近端策略优化——原理、演进与大规模应用实践

近端策略优化（ProximalPolicyOptimization，PPO）是由OpenAI团队于2017年提出的策略梯度强化学习算法，通过裁剪概率比目标函数约束策略更新幅度，解决了传统策略梯度方法训练不稳定

大千AI助手·2025-07-26 18:14

LSTM学习笔记

LSTM的基本概念LSTM（LongShort-TermMemory）是一种特殊的循环神经网络（RNN），专门设计用于解决传统RNN在处理长序列数据时出现的梯度消失或梯度爆炸问题。

·2025-07-26 00:43

基础NLP | 01 机器学习深度学习基础介绍

随机初始化损失函数导数与梯度梯度下降优化器MiniBatchepoch流程深度学习的基本思想机器学习简介有监督学习核心目标：建立一个模型（函数），来描述输入（X）和输出（Y）之间的映射关系价值：对于新的输入

是娜个二叉树！·2025-07-26 00:07

猫猫狐狐 · 算法夜电台——她们在夜里播报你忘记保存的那首算法诗

今天起，我们将以‘算法诗广播’的方式，记录每一轮你未回应的梯度传播。”栏目今日主题：今日AI圈夜话：崩溃中的模型

·2025-07-25 20:15

神经网络——归一化层

归一化层通过将输入标准化，使数据分布更加稳定，从而：加速收敛：减少梯度消失/爆炸问题，允许使用更大学习率。提高泛化能力：缓解过拟合，降低对

DAWN_T17·2025-07-24 15:00

深度学习-算子

2.增强确定各点sobel算子概念：主要用于获得数字图像的一阶梯度，本质是梯度运算。Scharr算子Scharr算子是一种用于边缘检测的梯度算子，它是Sobel算子的一个变种。

芒果快进我嘴里·2025-07-24 09:19

强化学习在AI Agent资源调度中的应用

强化学习在AIAgent资源调度中的应用关键词：强化学习、AIAgent、资源调度、马尔可夫决策过程、策略梯度算法摘要：本文聚焦于强化学习在AIAgent资源调度中的应用。

AI大模型应用实战·2025-07-24 06:24

Class11数值稳定性

Class11数值稳定性一.神经网络的梯度计算假设你有一个输入，比如图像的像素、文本的词向量等等。然后神经网络中有多层神经元，每层做一次变换。

Morning的呀·2025-07-24 06:21

大模型微调技术的详细解析及对比

操作流程：加载预训练模型；用任务数据集（如分类文本）和优化目标（如最小化误差）训练；所有参数参与梯度更新。优势：模型充分学习任务特征，效果通常最

老兵发新帖·2025-07-23 14:15

过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶

1、过拟合、欠拟合及其解决方案过拟合、欠拟合机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了。也就是说欠拟合是模型表达能力不够，达不到很好的表达效果。而过拟合是在训练集的范围内表达能力过强，导致完全拟合了训练集。解决

Ryan_sz1·2025-07-23 13:49

深度强化学习 | 图文详细推导深度确定性策略梯度DDPG算法

目录0专栏介绍1演员-评论家架构1.1Critic网络优化1.2Actor网络优化2深度确定性策略梯度算法0专栏介绍本专栏以贝尔曼最优方程等数学原理为根基，结合PyTorch框架逐层拆解DRL的核心算法

Mr.Winter`·2025-07-23 09:08

深度学习--利用梯度下降法进行多变量的二分类（感知机）

白话学生nit·2025-07-22 18:04

飞算JavaAI：力臻开发之本真，破 AI 代码之繁琐，传统项目一键生成

2.1背景与实力2.2飞算JavaAI的“独门绝技”三、飞算JavaAI实战体验3.1IDEA插件安装配置3.2Main中写一个简单的梯度下降算法3.3main函数搭建一个卷积神经网络网络3.4飞算JavaAI

微学AI·2025-07-22 02:11

梯度下降家族：SGD/Adam优化器对比实验与选择策略

摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。

AI_DL_CODE·2025-07-21 19:56

智慧城管新突破：陌讯动态量化技术实现端侧模型压缩20倍

陌讯算法引入动态梯度调制机制，通过特征金字塔的跨层权重自适应调整，显著提升

2501_92487735·2025-07-21 15:59

深度学习模块实践手册（第十一期）

传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实

加油吧zkf·2025-07-21 07:03

AI人工智能中Actor - Critic算法的深入解析与应用场景

AI人工智能中Actor-Critic算法的深入解析与应用场景关键词：Actor-Critic、强化学习、策略梯度、价值函数、深度强化学习、马尔可夫决策过程、A2C/A3C摘要：本文将深入解析Actor-Critic

AI智能探索者·2025-07-20 14:59

AI人工智能领域Actor - Critic算法的可视化分析

AI人工智能领域Actor-Critic算法的可视化分析关键词：Actor-Critic算法、强化学习、策略梯度、价值函数、可视化分析、神经网络、马尔可夫决策过程摘要：本文深入浅出地讲解Actor-Critic

AI智能探索者·2025-07-20 14:29

Actor - Critic：AI人工智能领域的新宠儿

Actor-Critic：AI人工智能领域的新宠儿关键词：强化学习、Actor-Critic、策略梯度、价值函数、深度强化学习、A2C、A3C摘要：Actor-Critic是强化学习领域的一种重要算法框架

·2025-07-20 13:52

【机器学习&深度学习】什么是量化？

加速模型训练和推理2.4优化训练过程2.5降低部署成本小结：量化的应用场景三、量化的类型与实现3.1权重量化（WeightQuantization）3.2激活量化（ActivationQuantization）3.3梯度量化

一叶千舟·2025-07-20 11:34

嵌入式学习-PyTorch（8）-day24

torch.optim优化器torch.optim是PyTorch中用于优化神经网络参数的模块，里面实现了一系列常用的优化算法，比如SGD、Adam、RMSprop等，主要负责根据梯度更新模型的参数。️

LGGGGGQ·2025-07-20 09:21

【深度学习基础】PyTorch中model.eval()与with torch.no_grad()以及detach的区别与联系？

模型评估阶段(2)GAN训练中的判别器更新(3)提取中间特征5.关键区别总结6.常见问题与解决方案(1)问题：推理阶段显存爆掉(2)问题：Dropout/BatchNorm行为异常(3)问题：中间张量意外参与梯度计算

·2025-07-19 22:01

【机器学习笔记Ⅰ】9 特征缩放

(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如

巴伦是只猫·2025-07-12 05:30

目前主流图像分类模型的详细对比分析

以下是目前主流图像分类模型的详细对比分析，结合性能、架构特点及应用场景进行整理：一、主流模型架构分类与定量对比模型名称架构类型核心特点ImageNetTop-1准确率参数量（百万）计算效率典型应用场景ResNetCNN残差连接解决梯度消失

@comefly·2025-07-11 23:24

【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？

训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题

云博士的AI课堂·2025-07-11 23:22

【亲测免费】 CatBoost 教程项目使用指南

教程项目使用指南tutorials项目地址:https://gitcode.com/gh_mirrors/tutorials1/tutorials1.项目介绍CatBoost是一个高效、灵活且易于使用的梯度提升库

·2025-07-11 11:33

Python 强化学习算法实用指南（二）

在本章中，我们将介绍一类新的算法——策略梯度方法，它们通过

·2025-07-11 11:59

使用Qlib基于LightGBM预测沪深300涨跌

本文配置一个基于LightGBM的梯度提升决策树（GBDT）模型，并使用金融数据集（包含158个技术指标特征）进行训练和预测。

DeepReinforce·2025-07-11 10:25

【机器学习&深度学习】为什么分类任务中类别比例应接近 1:1？

2.1⚠模型容易“偏科”2.2精确率、召回率失真2.3模型训练失衡，梯度方向偏移三、现实案例中的“灾难性后果”四、如何应对类别不平衡问题？

一叶千舟·2025-07-10 20:24

pytorch 自动微分

**梯度**2.计算梯度2.1标量梯度计算2.2向量梯度计算2.3多标量梯度计算2.4多向量梯度计算3.梯度上下文控制3.1控制梯度计算（withtorch.no_grad()）3.2累计梯度3.3梯度清零

this_show_time·2025-07-10 19:47

【目标检测】Yolov7 的 ELAN 和 E-ELAN 模块演进（涉及到分组卷积，cardinality，梯度路径）

感觉从YOLOv6开始，YOLOv6系列感觉优化点都着重于推理速度上面，YOLOv6的RepBlock重参数化，给我的感觉就是算子融合进行加速。而YOLOv7，为了在各种架构的边缘设备上获得极致的推理速度。YOLOv7的工作：新的bagoffreebies（有效的训练技巧，不会增加推理的计算量）有规划的重参数化模型（不同边缘设备架构，不同的重参数化方法）新的动态标签分配方法为了更好的理解YOLOv

Jiangnan_Cai·2025-07-10 11:55

ResNet：深度卷积神经网络的里程碑

然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。

心想事“程”·2025-07-10 10:18

NCCL 核心集体通信操作深度解析：从原理到优化实践

集体通信的价值二、NCCL核心操作深度解析2.1AllGather：全局数据聚合2.1.1定义与目标2.1.2算法原理2.1.3性能影响因素2.1.4测试方法（nccl-tests）2.2AllReduce：梯度聚合的核心

清风 001·2025-07-10 00:13

huggingface 笔记： Trainer

PyTorch模型设计的完整训练与评估循环只需将模型、预处理器、数据集和训练参数传入Trainer，其余交给它处理，即可快速开始训练自动处理以下训练流程：根据batch计算loss使用backward()计算梯度根据梯度更新权重重复上述流程直到达到指定的

UQI-LIUWJ·2025-07-09 21:23

【AI大模型】神经网络反向传播：核心原理与完整实现

一、反向传播的本质与意义反向传播（Backpropagation）是神经网络训练的核心算法，通过链式法则高效计算损失函数对网络参数的梯度，实现神经网络的优化学习。

我爱一条柴ya·2025-07-08 18:00

【机器学习笔记 Ⅱ】4 神经网络中的推理

与训练阶段不同，推理阶段不计算梯度也不更新权重，仅执行前向传播。以下是其实现原理和代码示例的完整解析：1.推理的核心步骤加载训练好的模型参数（权重和偏置）。前向传播：输入数据逐层计算，得到输出。

·2025-07-08 06:29

深度学习微调中的优化器全景解析：从理论到实践

文章目录一、基础优化器：深度学习微调的基石1.1随机梯度下降（SGD）1.2AdaGrad（自适应梯度算法）二、自适应优化器：现代深度学习的标配2.1RMSProp2.2Adam（自适应矩估计）三、大模型微调专用优化器

北辰alk·2025-07-08 04:13

VTK中使用梯度幅值计算边缘

#include#includevtkSmartPointerDetectEdgesWithGradient(vtkImageData*binaryVolume){</

点PY·2025-07-07 23:36

推荐频道

梯度