nicolas_chang

深度学习 --- 改善深度神经网络 1

文章目录

1. 如何划分Train/Dev/Test Sets（训练集，开发集，测试集）
2. 如何分析High Bias/High Variance（高偏差，高方差）

2.1 High Bias和High Variance图示
2.2 High Bias和High Variance分析
2.3 High Bias和High Variance处理原则

3.如何解决High Bias和High Variance---Regularization（正则化）

3.1 逻辑回归中的Regularization
3.2 神经网络中的Regularization
3.3 为什么Regularization能够防止overfitting
3.4 Dropout Regularization
3.5 Other Regularization Methods

4. 如何加快训练速度

4.1 训练数据归一化
4.2 避免梯度爆炸和梯度消失（Vanishing/Exploding gradients）

1. 如何划分Train/Dev/Test Sets（训练集，开发集，测试集）

数据集很小时，比如1万或者10万个样本
机器学习中有很多种划分Train，Dev，Test Sets的方法，在数据集比较小的时候，这些传统的方法同样适用于深度学习。最为常见的分配比例为7:3（Train vs Test）和6:2:2（Train vs Dev vs Test），这在机器学习中被认为是最佳的分配的比例。
数据集很大时，比如100万
那么此时的Dev和Test完全不需要20%，1%也许就可以了，因为1万个数据也足以评估处模型的性能了。所以在大数据时代，这些比例的分配需要按照实际情况而定。

在大数据时代，还存在的以为问题就是数据分配的不匹配。比如，一个图片分类的模型，训练集可能采用的都是web上面下载的高清的图片，而模型应用的场景可能各式各样，比如很多用户提供的可能是使用手机拍摄的分辨率很低的图片。为此，一条有效的经验法则：是在选取Dev和Test sets时，一定要确保这两个sets里面的样本分配是匹配的。

总之，合理地分配好Train，Dev，Test Set，会使训练迭代得更快，而且还能更高效地测量算法存在的偏差和方差，然后就能更高效的选用适当的方法来改进算法。

2. 如何分析High Bias/High Variance（高偏差，高方差）

2.1 High Bias和High Variance图示

造成High Bias的原因可能是feature简单，数量少，阶次低等

造成Hight Variance的原因则可能是feature过于复杂，阶次高。

这两种情况下，模型的泛化能力都比较差。一个好的模型应该达到下面这种‘刚刚好’的状态

2.2 High Bias和High Variance分析

对于下面表格里面的数据，我们分析一下其原因：

	Case 1	Case 2	Case 3	Case 4
Train Error	1%	15%	15%	0.5%
Dev Error	10%	16%	30%	1%

Case 1
模型在Train Set上的拟合非常好，但是在Dev Set上面错误率却比较大，泛化能力差。此为High Variance。
Case 2
模型在Train Set上错误率较高，如果此时人工的错误率为0%，那么说明模型并未把Train Set数据处理的比较好，但是它在Dev Set上的表现和Train Set差不多，处于可以接受的范围。属于High Bias。
Case 3
模型在Train Set上面的错误率高，在Dev Set上更高，说明这是一个非常糟糕的模型。既有Hight Variance，也有High Bias。
这个比较难理解，举一个图例：
Case 4
模型在Train上错误率很低，说明拟合地很好，在Dev Set上的错误率也才1%，说明泛化能力也很好。这是一个好的模型，属于Low Variance，Low Bias。

Bayes Error（贝叶斯误差）
简单来说，在理想情况下的误差也被称为贝叶斯误差。比如人工分类图片的误差为0%，那么贝叶斯误差也接近于0%。比如Case 2中，Bayes error为15%，那么它就不再是一个High Bias的问题了，它应该说是一个非常好的模型。

总结

通过观察训练集的误差，至少可以知道你的算法是否可以很好的拟合训练集数据，然后总结出是否属于高偏差问题。
然后通过观察同一个算法在开发集上的误差为多少，可以知道这个算法是否有高方差问题。这样你就能判断训练集上的算法是否在开发集上同样适用。这会让你意识到方差问题，上述结果都基于贝叶斯误差非常低并且你的训练集和开发集都来自与同一个分布，如果不满足这些假设那么你需要做一个更复杂的分析。

另外，通过学习曲线，也能够很好的分析High Bias和High Variance的问题

High Bias的学习曲线的特点是，Train Set和Dev Set的错误率都很高，而且两者的错误率比较接近

High Variance的学习曲线的特点是，Train Set的错误率比较低，而Dev Set的比较高，而且两者的gap比较大

2.3 High Bias和High Variance处理原则

在深度学习中对于High Bias和High Variance的处理原则如下：

首先判断是否为High Bias，如果是，那么可以采用更大的深度神经网络，比如更多的层数，更多的单元数，或者更长的训练时间
然后判断是否为High Variance，如果是，则可以增大训练数据或者采用正规化，比如Dropout，L1/L2正规化

在传统的机器学习中，减少Bias可能引起增加variance，但是这个问题在DNN中可以避免，通过更多的训练数据或者更复杂的神经网络，并辅以正规化，完全可单方消减bias或者variance

3.如何解决High Bias和High Variance—Regularization（正则化）

对于High Bias问题的解决，主要是通过调整网络结构或者训练时间。
对于High Variance的问题，如果获取更多数据的代价太大，我们应该采用Regularization，它能有效地防止过拟合。

3.1 逻辑回归中的Regularization

为什么Regularization能够防止过拟合，请参考机器学习之Regularization
逻辑回归中添加了Regularization的Cost函数为：
$\frac{1}{m}\sum_{i=1}^{m}L(\hat y^(i), y^{(i)}) + \frac{\lambda}{2m}||w||^2$ ，其中
$||w||^2 = \sum_{j=1}^{n_x}w_j^2 = w^Tw$ ，即向量w的欧几里得范数的平方，也称为L2正则化。
$\sum_{j=1}^{n_x}|w_j|$ ，即向量w的欧几里得范数，也称为L1正则化。

L1和L2正则化的差别在于：L1正则化会使得w变得稀疏，即w中有很多的0，因为有一部分0，会占用较少的内存，有些人认为它有助于压缩模型（但效果并不好）。但是在实际应用中，L2使用的更频繁。

注意：在Regularization过程中，并没有对参数b正则化，主要因为b只是单个数字，几乎所有的参数都集中在w中，它实际上起不到太大的作用，所以可以忽略。

3.2 神经网络中的Regularization

$J(w^{[l]},b^{[l]}) = \frac{1}{m}\sum_{i=1}^{m}L(\hat y^(i), y^{(i)}) + \frac{\lambda}{2m}\sum_{l=1}^{L}||W^{[l]}||_F^2$ ，其中
$||W^{[l]}||_F^2 = \sum_{i=1}^{l}\sum_{j=1}^{l-1}(W_{ij}^{[l]})^2$ ，因为在神经网络中W为一个 $n^{[l]}$ x $n^{[l-1]}$ 的矩阵，所以这里的Regularization需要计算每一层W矩阵的元素平方和。

注意：在这里 $W^{[l]}||_F^2||$ 被称为Frobenius norm而不是L2 norm。

由于 $J$ 多添加了一项Regularization，那么它对于反向传播会有什么影响呢？如下：
$dW^{[l]} = [from backprop] + \frac{\lambda}{m}W^{[l]}$
$W^{[l]} := W^{[l]} - \alpha dW^{[l]} = (1 - \alpha\frac{\lambda}{m})W^{[l]} - \alpha [from backprop]$

和没有Regularization时相比， $W^{[l]}$ 比之前更小了，因此该L2正则化也被称为weight decay（权重衰减）

3.3 为什么Regularization能够防止overfitting

$J(w^{[l]},b^{[l]}) = \frac{1}{m}\sum_{i=1}^{m}L(\hat y^(i), y^{(i)}) + \frac{\lambda}{2m}\sum_{l=1}^{L}||W^{[l]}||_F^2$

以上述的神经网络为例，当 $\lambda \to \infty \Rightarrow W^{[l]}\to 0$ ，那么这就意味着神经网络中很多的隐藏单元都将处于disabled状态，那么这将使得神经网络变得非常非常简单，趋于一个简单的线性逻辑回归模型，避免了过拟合的问题。

还可以从另一个方面来解释，如下图的激活函数 $a = t a n h (z)$ 所示：当z趋于0时，a是趋于线性的，当z趋于正负无穷大时，a是非线性的。

当 $\lambda \uparrow$ 时， $W^{[l]} \downarrow$ ， $z = W^{[l]}a^{[l-1]} + b^{[l]}$ 也会变小趋于0，那么 $a^{[l]}$ 也将趋于线性。这就意味着整个神经网络都是趋于线性的，由此很好的避免了过拟合问题

3.4 Dropout Regularization

除了L2正则化，Dropout是在神经网络中另一个非常强大的正则化方法。
该方法即在每一层以一定的概率随机删除掉神经元，所谓的删除实际上是将 $a^{[l]}$ 层中被删除的神经元位置的 $a_{i}^{[l]}$ 赋值为0， $a_{i}^{[l]} = 0$ ，如下图所示：

由此可以简化神经网络结构，达到防止过拟合的目的。

以下为Inverted Dropout的实现原理：

以上图第3层为例，设置保留率keep.prop = 0.8，即删除率为0.2
按照保留率生成矩阵d3,通过下面的方法可以使得d3 80%的元素为1或者True，20%的元素为0或者False
```
 d3 = np.random.rand(a3.shape[0], a3.shape[1]) < keep.prop
```
执行Dropout
```
 a3 = np.multiply(a3, d3)    # a3 = a3 * d3
```
矩阵相乘后，a3中20%的单元被赋值为0，达到了删除的目的
补偿a3的值
```
 a3 /= keep.prop
```
在 $Z^{[4]} = W^{[4]}a^{[3]} + b^{[4]}$ 中，由于 $a^{[3]}$ 有20%的元素被置为0，为了不改变 $a^{[3]}$ 的整体输出期望值，所以要采用上述的方式提供大约20%的校正值

Inverted Dropout是最常用的dropout方法，由于是随机的删除，所以每一轮的训练中，丢弃的单元是不同的。

上面只描述了前向传播过程中的Dropout，其实在反向传播过程中也需要同样的操作，将a3换成da3即可

    da3 = np.multiply(da3, d3)

注意：

Dropout只应用在训练过程中，在测试时不会使用
不同的层可以配置不同的保留率。如果某一层的参数很多，可以通过设置较小的保留率防止过拟合。Dropout也可以用于输入层，但很少使用，一般保存率为1或者0.9
Dropout多用于计算机视觉领域，其他领域用的比较少，除非确定发生了过拟合时
Dropout的一个缺点就是很难确定Cost function是否定义好，因为 $J$ 曲线会随机振动。因此，在这个时候通常先关闭Dropout，确保 $J$ 单调递减后再打开

3.5 Other Regularization Methods

上面已经讲过，对于过拟合问题，是可以通过增大样本数量解决的，但是如果收集新样本代价比较大时，Data augmentation的方法同样可以达到增大样本数量的目的。它是基于现有的样本，产生新的样本。该方法常见于计算机视觉领域，比如图片分类，可以基于原样本图片进行旋转，裁剪，扭曲，色变等方式增加样本量。

另外一种防止过拟合的方法：Early Stopping，它是通过绘制Train Set和Dev Set的 $J$ 和迭代次数的曲线图，然后在Dev Error升高前停止训练，从而避免过拟合。但这种方法的缺点就是把最小化 $J$ 和防止过拟合并在一起解决，可能导致2个方面都不能达到最有的状态。本着同一时刻只解决一件事情的原则，更好的正则化方法还是L2。

4. 如何加快训练速度

4.1 训练数据归一化

归一化分为两个步骤：

均值归零(zero mean)，目的是使各个样本的平均值为零。操作步骤如下：
$\mu = \frac{1}{m}\sum_{i=1}^{m}x^{(i)}$
$x^{(i)} = x^{(i)} - \mu$

意思就是将训练集进行平移直到它的均值变为零，如下图所示：

方差归一化(feature scaling)，目的是使各个feature的值能够落在[0,1]或者[-1,1]之间，这样可以加快梯度下降的速度，快速最小化 $J$ 。如上图所示，横轴方向的feature比例大于纵轴方向，那么feature scaling的目的就是要让他们的比例在同样的范围内，达到下图的要求：

计算步骤如下：
$\sigma ^2 = \frac{1}{m}\sum_{i=1}^{m}(x^{(i)})^2$
$x^{(i)} = \frac{x^{(i)}}{\sigma ^ 2}$

未归一化：

归一化：

如果未进行归一化，那么就需要更小的 $a l p h a$ ，然后经过很多次迭代和振荡才能到达 $J$ 的最小值。
如果进行了归一化，那么就可以使用较大的 $\alpha$ ，梯度下降快，经过很少次的迭代和较少的振荡便可以找到最小值。
上图是2D的示意图，对于多维也是一样的，只不过无法用图来表示。
总之，建议对于输入的训练集数据都要经过归一化处理，同时归一化也要应用在开发集和测试集上面。

4.2 避免梯度爆炸和梯度消失（Vanishing/Exploding gradients）

当训练层数非常多的神经网络时经常会遇到的问题就是梯度的爆炸和消失。它的意思是当你在训练一个深度神经网络的时候损失函数的导数或者说斜率有时会变得非常大或者非常小甚至是呈指数级减小，这使训练变得很困难。所以，另外一个加快训练速度的方法就是避免梯度爆炸或者梯度下降。

为什么会发生梯度爆炸或者梯度消失，可以参考梯度爆炸和梯度消失

一种解决梯度爆炸的方法是梯度裁剪（Gradient Clipping）：

首先假设某层的梯度组成的向量g，然后计算出g的范数 $||g||_2 = \sqrt{\sum_{i=1}^{n}g_i^2}$
然后设定一个阈值C，如果 $g||_2 > c$ 时， $\frac{c}{||g||_2}g$ ，否则不裁剪。
即 $min(\frac{c}{||g||_2}, 1)g$

梯度消失的问题在深度学习中更加常见，比如如果激活函数是sigmoid或者tanh，那么当z越大或者越小时，a的变化越小导致梯度变化非常小，进而学习数量严重变慢。解决该问题的方法是选择ReLU激活函数。

对于缓解梯度爆炸和梯度消失，还有其他改进方法，比如选择合适的初始化参数的方法，batch normalization等，将在下一讲介绍，谢谢!

数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
学苑教育杂志《学苑教育》杂志社学苑教育编辑部2025年第21期目录 QQ296078736 人工智能
专题研究推进“教-学-评”一体化，打造小学语文高效课堂刘月兰;4-6教育管理新高考制度下普通高中生涯教育课程设计的研究霍亚贞;马玲;7-9课堂教学核心素养下小学数学深度学习课堂的构建策略康贵景;10-12“双减”背景下初中英语教学的课堂模式高燕;13-15小学低年级数学说理课堂构建策略玉洁;16-18基于法治观念培育的道法课项目式教学策略许静;19-21“双师课堂”在初中语文写作教学中的实践孙巧玲
使用 PyTorch 和 Pandas 进行 Kaggle 房价预测 Clang's Blog AI pytorch pandas 人工智能
文章目录1、环境设置2、数据下载3、数据预处理4、模型构建5、训练和验证6、训练模型并生成预测结果7、完整代码在本篇博文中，我们将探索如何使用PyTorch和Pandas库，构建一个用于Kaggle房价预测的模型。我们将详细讨论数据加载、预处理、模型构建、训练、验证及最终预测的全过程。1、环境设置我们首先需要导入所需的库，包括用于数据处理的pandas和numpy，以及用于深度学习的torch。i
使用中转API在Python中调用大型语言模型 (LLM) 的实践** qq_37836323 python 语言模型开发语言
**在人工智能技术中，大型语言模型(LLM)已成为自然语言处理(NLP)和生成任务的重要工具。然而，由于网络限制，直接访问OpenAI的API在中国可能面临挑战。因此，本文将介绍如何使用中转API地址http://api.wlai.vip来调用LLM，并提供相关的demo代码。什么是大型语言模型(LLM)？大型语言模型是一种深度学习模型，训练于大量文本数据上，能够生成、总结、翻译和回答问题等。Op
【免费下载】探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破
探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破在这个数字化时代，人工智能正逐步改变我们的生活，其中深度学习在农业领域的应用尤其引人注目。PlantVillage-Dataset是一个开放源代码的项目，它提供了一个庞大的植物病害识别数据集，旨在帮助开发人员和研究者利用机器学习技术改善农作物健康状况的监测。本文将深入探讨该项目的技术细节、应用价值及其独特之处。项目简
Python爬虫【五十八章】Python数据清洗与分析全攻略：从Pandas到深度学习的异常检测进阶程序员_CLUB Python入门到进阶 python 爬虫 pandas
目录背景与需求分析第一章：结构化数据清洗实战（Pandas核心技法）1.1数据去重策略矩阵1.2智能缺失值处理体系第二章：深度学习异常检测进阶2.1自动编码器异常检测（时序数据）2.2图神经网络异常检测（关系型数据）第三章：综合案例实战案例1：金融交易反欺诈系统案例2：工业传感器异常检测第四章：性能优化与工程实践4.1大数据处理加速技巧4.2模型部署方案第五章：方法论总结与展望5.1方法论框架5.
大模型【进阶】（一）MoE（mixture of experts）混合专家结构 ReinaXue 人工智能笔记语言模型神经网络
什么是MoE结构？MoE（MixtureofExperts，专家混合模型）是一种深度学习模型架构，通常用于处理大规模模型和计算资源效率的挑战。在MoE结构中，模型由多个“专家”组成，每个专家处理不同的任务或输入数据的不同部分，而不是让所有专家都参与每次计算。这种方式提高了计算效率，并在某些情况下有助于增强模型的表现。MoE结构的核心思想专家：在MoE模型中，专家通常指的是网络中的子模型，每个专家具
【三维目标检测】Complex-Yolov4详解（二）：模型结构 Coding的叶子 Python三维点云实战宝典 Complex-Yolo Complex-Yolov4 三维目标检测目标检测 python
本文为博主原创文章，未经博主允许不得转载。本文为专栏《python三维点云从基础到深度学习》系列文章，地址为“https://blog.csdn.net/suiyingy/article/details/124017716”。Complex-Yolo网络模型的核心思想是用鸟瞰图BEV替换Yolo网络输入的RGB图像。因此，在完成BEV处理之后，模型的训练和推理过程基本和Yolo完全一致。Yolov
基于深度学习的图像分类：使用ShuffleNet实现高效分类 Blossom.118 机器学习与人工智能深度学习分类人工智能机器学习数据挖掘 python 目标检测
前言图像分类是计算机视觉领域中的一个基础任务，其目标是将输入的图像分配到预定义的类别中。近年来，深度学习技术，尤其是卷积神经网络（CNN），在图像分类任务中取得了显著的进展。ShuffleNet是一种轻量级的深度学习架构，专为移动和嵌入式设备设计，能够在保持较高分类精度的同时，显著减少计算量和模型大小。本文将详细介绍如何使用ShuffleNet实现高效的图像分类，从理论基础到代码实现，带你一步步掌
AI人工智能领域深度学习的在线学习方法 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习学习方法 ai
AI人工智能领域深度学习的在线学习方法关键词：深度学习、在线学习、AI教育、实战项目、知识体系摘要：本文为想系统学习深度学习的初学者/转行者量身打造，通过拆解深度学习的核心概念、梳理在线学习的科学路径、提供可落地的实战案例与资源清单，帮你用“游戏通关”的思路高效掌握这门技术。无论你是学生、程序员还是跨行者，都能找到适合自己的学习节奏，避免“看视频就会，动手就废”的陷阱。背景介绍目的和范围深度学习是
AI人工智能深度学习的模型评估与选择 AI大模型应用之禅人工智能深度学习 ai
AI人工智能深度学习的模型评估与选择关键词：AI、人工智能、深度学习、模型评估、模型选择摘要：本文聚焦于AI人工智能深度学习中的模型评估与选择。在深度学习迅猛发展的当下，构建一个有效的模型并非易事，而准确评估和恰当选择模型对于模型性能的发挥和应用效果至关重要。文章将详细介绍模型评估与选择的相关背景知识，深入剖析核心概念与联系，阐述核心算法原理及具体操作步骤，运用数学模型和公式进行详细讲解并举例说明
深度学习中，定量分析和定性分析是什么？要体现什么？ seasonsyy 深度学习小知识深度学习人工智能定量分析定性分析
深度学习中，定量分析和定性分析是什么？要体现什么？在深度学习和一般的数据分析中，定量分析（QuantitativeAnalysis）和定性分析（QualitativeAnalysis）是两种主要的研究方法，它们分别关注数据的数量特征和质的特征。定量分析（QuantitativeAnalysis）定性分析（QualitativeAnalysis）关注方面定量分析涉及可量化的数据，即那些可以通过数字来
Python金融分析：情感分析在量化价值投资中的完整实现 AI量化价值投资入门到精通 python 金融开发语言 ai
Python金融分析：情感分析在量化价值投资中的完整实现关键词：Python金融分析、情感分析、量化投资、价值投资、自然语言处理、机器学习、金融文本挖掘摘要：本文系统解析如何将情感分析技术深度整合到量化价值投资体系中，通过Python实现从金融文本数据采集、预处理、情感建模到策略回测的完整流程。详细阐述基于规则引擎、机器学习和深度学习的多维度情感分析方法，结合财务指标构建复合投资模型，并通过实战案
开源深度学习新宠：Burn框架助您无忧高效建模
在日新月异的人工智能世界里，各类深度学习框架如雨后春笋般涌现，而Burn，作为新一代的深度学习框架，以其不妥协的灵活性、高效性和可移植性崭露头角。本文将深入探讨Burn的核心功能、应用场景及具体使用方法，帮助您更好地了解这款值得关注的开源项目。性能和优化：超越速度的追求Burn框架将高效性作为其核心支柱之一，通过一系列优化技术确保模型能够快速可靠地运行。以下是Burn在性能方面的几个显著特色：自动
使用 Dart 库轻松进行时间序列预测 - 立即执行多元预测 krishnaik06 深度学习 AI写作 python AI作画神经网络
这个视频介绍了名为Darts的Python库，它可以简化时间序列数据处理和预测。主要内容：解决时间序列预测难题：Darts库提供了多种模型，包括经典的ARIMA、SARIMAX，以及深度学习模型，可以轻松处理单变量和多变量时间序列预测。简化操作：Darts库使用统一的fit和predict函数，类似于scikit-learn，让用户可以轻松地使用各种模型。支持多种模型：Darts库包含ARIMA、
图像处理全栈指南：从传统算法到深度学习，再到FPGA移植阿牛的药铺图像算法区图像处理算法深度学习
图像处理全栈指南：从传统算法到深度学习，再到FPGA移植一、引言：图像处理是光学类产品的“大脑”光学类产品（可见光摄像头、红外热成像、光谱仪）的核心价值，在于将光信号转化为可理解的图像信息。而图像处理算法，就是解读这些信息的“大脑”——从传统的边缘检测到深度学习的目标识别，从实时降噪到高维光谱分割，每一步都决定了产品的性能（如分辨率、帧率、功耗）。对于算法移植工程师（科研助理1）岗位而言，需要掌握
基于Jetson Nano与PyTorch的无人机实时目标跟踪系统搭建指南
引言：边缘计算赋能智能监控在AIoT时代，将深度学习模型部署到嵌入式设备已成为行业刚需。本文将手把手指导读者在NVIDIAJetsonNano（4GB版本）开发板上，构建基于YOLOv5+SORT算法的实时目标跟踪系统，集成无人机控制与地面站监控界面，最终打造低功耗智能监控设备。通过本项目，读者将掌握：嵌入式端模型优化与部署技巧；多目标跟踪算法工程化实现；无人机-地面站协同控制架构；边缘计算场景下
gis怎么提取水系_深度学习在GIS中的应用 weixin_36214932 gis怎么提取水系
近年来，人工智能（AI）飞速发展，在诸如图像识别，图像分割和目标智能提取等任务上，达到甚至在某些方面超过了人工的准确度。人工智能在图像识别方面的优势，为AI和GIS的结合提供了前所未有的契机。人工智能，机器学习和深度学习正在帮助我们认识世界、改善世界。AI是计算机科学的一个重要分支，在某种程度上具有类似人类工作的执行能力，能以一种新的与人类相似的方式做出智能的反应，机器学习利用数据驱动算法从数据中
每天五分钟深度学习：数学中常见函数中的导数每天五分钟玩转人工智能每天五分钟玩转深度学习算法深度学习人工智能导数机器学习
本文重点导数是微积分学中的一个核心概念，它描述了函数在某一点附近的变化率。在物理学、工程学、经济学等众多领域中，导数都发挥着极其重要的作用。本文旨在详细介绍数学中常见函数的导数，以期为读者提供一个全面而深入的理解。数学中常见的导数常数函数的导数对于常数函数f(x)=C（C为常数），其导数为f'(x)=0。这是因为常数函数在任何点的切线斜率都是0，即函数值不随x的变化而变化。多项式函数的导数多项式函
无人机正摄影像自动识别与矢量提取系统 pk_xz123456 算法 python 无人机算法数据挖掘深度学习网络媒体
无人机正摄影像自动识别与矢量提取系统1.项目概述本项目旨在开发一个基于Python的自动化系统，能够从TIFF格式的无人机正摄影像中识别并提取多种地物要素，包括水边线、道路、桥梁、植被图斑、房屋、趸船和护岸。系统将采用深度学习与计算机视觉技术相结合的方法，实现高精度（95%以上）的自动识别，并将结果以带有相同坐标信息的矢量DWG/DXF格式保存。2.系统架构设计2.1总体架构系统采用模块化设计，主
玩转 Milvus（一）：解锁向量数据库的秘密，拥抱Milvus 不学无术の码农玩转 Milvus：向量搜索与 AI 实践 milvus 向量数据库
引言：向量数据库，AI时代的“超级引擎”想象一下，你上传一张猫咪照片，系统瞬间从百万张图片中挑出最相似的几张；或者在购物APP中点开一件T恤，推荐栏立刻展示你心动的搭配。这些智能体验的背后，藏着一个秘密武器——高维向量。通过深度学习模型，文本、图像、音频被转化为一串数字，捕捉它们的“灵魂”。但如何在海量向量中快速找到“最像”的那一个？传统数据库如MySQL或MongoDB束手无策，而向量数据库横空
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1