yueguizhilin

“一天搞懂深度学习”笔记

“一天搞懂深度学习”笔记

1. A brief Introduction of Deep Learning

1.1 Introduction of Deep Learning

Neuron

![在这里插入图片描述](https://img-blog.csdnimg.cn/20190109113921652.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3l1ZWd1aXpoaWxpbg==,size_16,color_FFFFFF,t_70)

权重和偏置称为神经元的参数，区别于神经网络结构参数，如神经元个数，隐含层层数，网络连接方式等，网络结构参数是超参之一, 需要人为根据经验设置。

全连接前馈神经网络

深度意味神经网络具有多个隐含层。

神经网络结构确定了一个函数集（函数空间），特定的神经元参数确定了函数集中一个函数。

soft max 输出层

softmax 输出层将网络输出值归一化到[0,1), softmax 层的输出可解释成输入vector 属于不同类的概率值。

loss function

loss 可以衡量网络输出和期望输出的距离。在网络结构超参确定的情况下，我们的目标就是寻找一个使loss最小的函数，最终目标转化为：通过训练数据，以最小化 loss 函数为目标，寻找最佳神经元参数。

网络优化算法：寻找最佳神经元参数

基于梯度下降法的BP算法

1.2 why deep ?

实验证明，网络参数的增多，网络性能提升。

任何复杂函数均能由单隐含层的网络拟合出来。

网络参数的增多可以通过“广度学习”和“深度学习”的方式实现，哪一种方式更好呢？

在编程中，我门通过定义子函数，实现复杂函数模块化，模块化的好处是子模块实现简单、子模块可以共用、高层调度实现复杂功能且形式简洁高效（main 函数形式通常是elegant的）.类似的，我们说深度学习实现了模块化Modularization

假设我们有一个图像分类任务，若按照上图方式训练各个分类器，则因为长发男数据较少，则 Classifier 2 的性能就较为 weak.

若我们先训练两个基分类器，则两个基分类器因为有足够数据，可以训练得相当好。然后将它们视作module，第二层的每个分类器只需去 call 第一层的两个共用 modules 的 output ,就可以实现每个分类器的任务。所以虽然长头发男生的数据依然较少，此时 Classifier 2 的性能却比较 strong.

在 Deep learnin 中，第一层的每个神经元是最 basic 的 classifier ，第二层将第一层的 classifier 当做 module 去实现复杂的 classifier ,以此类推。
故 deep learning 的好处是： 实现模组化后，每个模块会变得简单，所需训练数据较少。(这与人们津津乐谈的 AI = 深度学习+人工智能的说法不同)

关于why deep 的直观实例，可以参看油管上一个很好的视频：
But what is a Neural Network? | Chapter 1, deep learning

2.Tips for Training Deep Neural Network

当我们训练两个分别为56层和20层的网络时，在测试集上的表现如右图所示，我门无法根据 20-layer 的损失曲线在 56-layer 的下方，就得出56-layer 的网络已经过拟合了。因为观察左图两者在训练集上的损失曲线，我们发现，56 layer 的网络性能居然弱于 20-layer, 这是不合理的，因为我们只要将56- layer 的网络前20 层参数与 20-layer保持一致，则损失曲线便与20-layer identity . 所以根据在训练集上的损失曲线表现看，我们对56-layer 的网络训练得还不够好，可能落入了局部最优。

所以我们得根据网络在训练集上的表现和在测试集上的表现，对症下药。例如drop out 就是针对网络在测试集上的表现较差使用的技术。

2.1 train set: choosing proper loss

当我们使用softmax输出层时，我们倾向于使用交叉熵损失函数。原因是：相较平方损失函数，交叉熵损失函数的地貌更加陡峭，梯度更大，更不容易陷入局部最优。

[图片上传中...(image.png-60b999-1518163976905-0)]

2.2 train set: Mini-batch

若batchsize 为1，就成为了随机梯度下降。
但我们一般不将batchsize 设为1.从上面PPT 可以看出，在使用GPU 进行并行运算后，在相同时间内，batchsize = 1和batchsize =10，参数的更新总次数是相近的，但是batchsize = 10 时更稳定，收敛地更快。
当batchsize 过大时，则一方面超出了GPU硬件并行能力，另一方面，此时去train 网络时会经常进入鞍点或局部极小值而无法逃离，训练过程中止，performance 下降，所以引入随机性是必要的，有助于逃离局部最优和鞍点。

2.3 train set: New activation function

ReLU

使用ReLU的好处是：
计算快速，激活机制与生理类似，相当于无穷多个加权sigmoid函数加权，可以防止梯度消失。

使用ReLU后，网络变成轻量的线性网络，并且这个线性网络随着输入input的不同而不同，相当于用多个线性网络去逼近一个复杂网络

Maxout
Maxout 方法认为每个神经元的激活函数是可以学习的

在maxout 的隐层中的一个神经元（图中的红色框）需要比普通网络的神经元多学习一倍参数，或者多倍（取决于在一个group 中的元素个数，一个group 中的元素个数人为指定）

上图指出，ReLU是maxout学习到的激活函数中的一个特例, 即在Maxout 中学习到的参数为w,b,0,0时，则此时神经元的激活函数就等于ReLU。

学习到一个神经元的参数都非零时，则激活函数为上图形式。

maxout 可以学习到的激活函数为任意的分段线性凸函数，分段数目取决于一个group中的elementshumu

与ReLU一样，给定一个input，网络将变成一个线性网络，并且这个线性网络随着input的不同而改变。给定一个input，我们可以对这个线性网络进行训练，更新部分参数，再给定一个input，我们可以对产生的另一个线性网络进行训练，更新部分参数。所以虽然max操作不好求导，但是采用maxout的网络仍然是可以train 的。

2.4 train set: Adaptive Learning Rate

Adagrad

RMSprop

与Adagrad 只有略微的不同，RMSprop对过去梯度平方和做了加权衰减。

Momentum

Adam

2.6 test set: early stopping

early stopping其实是在控制epochs的大小

2.7 test set : Regularization

在神经网络优化中，正则项技术其实与early stopping 的功能是近似重叠的。考虑网络参数初始化为接近零的值，随着更新次数的增加，参数会越来越偏离0。所以如果参数更新次数较小，参数偏离0的程度下降，而early stopping 就是为了控制epochs 的大小。正则化技术目的也是希望参数越接近零越好。所以说两者的功能是近似的。

2.8 test set: Dropout

dripout 有效性的解释：

3.Variants of Neural Network

3.1 Convolutional Neural Network (CNN)

3.2 Recurrent Neural Network (RNN)

4.Next Wave

4.1Supervised Learning

4.1.1 Ultra Deep Network

4.1.2 Attention Model

4.2 Reinforcement Learning

4.3 Unsupervised Learning

4.3.1 Image: Realizing what the World Looks Like

4.3.2 Text: Understanding the Meaning of Words

4.3.3 Audio: Learning human language without supervision

参考资料

一天搞懂深度学习

你可能感兴趣的:(神经网络)

机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
神经形态计算如何突破冯·诺依曼架构限制？ AI算力网络与通信 AI人工智能与大数据技术 AI算力网络与通信原理 AI人工智能大数据架构架构 ai
神经形态计算如何突破冯·诺依曼架构限制？关键词：神经形态计算、冯·诺依曼架构、内存墙、存算一体、脉冲神经网络、类脑芯片、低功耗计算摘要：本文将从“冯·诺依曼架构的前世今生”讲起，用“图书馆管理员搬书”的生活案例类比其核心矛盾，再通过“人脑神经元工作模式”的比喻引入神经形态计算的核心原理。我们将一步步拆解冯·诺依曼架构的三大限制（内存墙、高功耗、非结构化数据处理弱），并对应解析神经形态计算的三大突破
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
基于AlexNet架构的卷积神经网络模型用于对胸部X光图像进行二分类（例如，诊断肺炎）
1.肺炎正常的胸部X线片描绘了清晰的肺部，图像中没有任何异常混浊的区域。正常的胸部X线片1.1细菌性肺炎临床表现细菌性肺炎通常由细菌引起，如肺炎链球菌、流感嗜血杆菌、肺炎克雷伯菌等。患者可能出现高热、寒战、咳嗽、咳痰（痰液可能呈脓性）、胸痛、呼吸困难等症状。影像学特征局灶性肺叶实变细菌性肺炎在影像学上常表现为肺叶或肺段的局灶性实变，即某一区域的肺组织因炎症而失去气体交换功能，呈现为高密度影。胸腔积
视觉Transformer还有哪些点可以研究？怎么应用？计算机视觉工坊 3D视觉从入门到精通学习算法开源
0.这篇文章干了啥？今天笔者为大家推荐一篇最新的综述，详细总结了Transformer的网络架构、优化策略、发展方向，还会定期更新Github，研究注意力机制的小伙伴一定不要错过。注意机制有助于人类视觉系统有效地分析和理解复杂场景，它能够聚焦于图像的关键区域，同时忽略无关紧要的部分。受此概念启发，注意机制已经被引入到计算机视觉（CV）中，以动态地为图像中的不同区域分配权重。这使得神经网络能够专注于
PyTorch 使用指南
PyTorch是一个功能强大且灵活的Python开源机器学习库，以其动态计算图和直观的Pythonic接口而闻名。本指南将带您了解PyTorch的基础操作，包括张量创建、自动求导，以及如何构建、训练和优化神经网络模型。我们还将深入探讨其在图像分类（以CIFAR-10为例）和自然语言处理（以灾难推文分类为例）等特定领域的应用，并概述其在图像分割和强化学习等其他领域的应用。PyTorch使用指南1.P
Python_day54Inception网络及其思考且慢.589 Python_60 python 开发语言
一、inception网络介绍今天我们介绍inception，也就是GoogleNet传统计算机视觉的发展史从上面的链接，可以看到其实inceptionnet是在resnet之前的，那为什么我今天才说呢？因为他要引出我们后面的特征融合和特征并行处理这些思想。Inception网络，也被称为GoogLeNet，是Google团队在2014年提出的经典卷积神经网络架构。它的核心设计理念是“并行的多尺度
Python爬虫【五十八章】Python数据清洗与分析全攻略：从Pandas到深度学习的异常检测进阶程序员_CLUB Python入门到进阶 python 爬虫 pandas
目录背景与需求分析第一章：结构化数据清洗实战（Pandas核心技法）1.1数据去重策略矩阵1.2智能缺失值处理体系第二章：深度学习异常检测进阶2.1自动编码器异常检测（时序数据）2.2图神经网络异常检测（关系型数据）第三章：综合案例实战案例1：金融交易反欺诈系统案例2：工业传感器异常检测第四章：性能优化与工程实践4.1大数据处理加速技巧4.2模型部署方案第五章：方法论总结与展望5.1方法论框架5.
基于深度学习的图像分类：使用ShuffleNet实现高效分类 Blossom.118 机器学习与人工智能深度学习分类人工智能机器学习数据挖掘 python 目标检测
前言图像分类是计算机视觉领域中的一个基础任务，其目标是将输入的图像分配到预定义的类别中。近年来，深度学习技术，尤其是卷积神经网络（CNN），在图像分类任务中取得了显著的进展。ShuffleNet是一种轻量级的深度学习架构，专为移动和嵌入式设备设计，能够在保持较高分类精度的同时，显著减少计算量和模型大小。本文将详细介绍如何使用ShuffleNet实现高效的图像分类，从理论基础到代码实现，带你一步步掌
YOLOv5激活函数替换与模型变体实验实战教程机＿长 YOLO极致优化实战 YOLO 深度学习算法
YOLOv5激活函数替换与模型变体实验实战教程本教程面向已具备YOLOv5训练经验的开发者，系统讲解如何在YOLOv5中替换激活函数、构建模型变体，并结合本项目实际文件和命令，突出实用性和可操作性。内容涵盖激活函数原理、替换方法、配置文件讲解、训练实操、源码解读、实验对比与常见问题排查。完整代码见文末1.激活函数原理简介激活函数是深度神经网络中非线性建模的关键组件。常见激活函数包括：ReLU：简单
基于白鲸算法优化的混合核极限学习机(HKELM)的回归预测智能算法研学社（Jack旭） #混合核极限学习机HKELM 智能优化算法应用算法回归
基于白鲸算法优化的混合核极限学习机(HKELM)的回归预测文章目录基于白鲸算法优化的混合核极限学习机(HKELM)的回归预测1.HKELM原理2.预测问题求解3.基于白鲸算法优化的HKELM4.实验结果5.Matlab代码1.HKELM原理核极限学习机（KELM）是一种单隐含层前馈神经网络，通过引入核函数改善极限学习机（ELM）性能，其输出可表示为：f(x)=h(x)HU(ZC+HHU)−1U=[
基于食肉植物算法优化的混合核极限学习机(HKELM)的回归预测智能算法研学社（Jack旭） #混合核极限学习机HKELM 智能优化算法应用算法回归数据挖掘
基于食肉植物算法优化的混合核极限学习机(HKELM)的回归预测文章目录基于食肉植物算法优化的混合核极限学习机(HKELM)的回归预测1.HKELM原理2.预测问题求解3.基于食肉植物算法优化的HKELM4.实验结果5.Matlab代码1.HKELM原理核极限学习机（KELM）是一种单隐含层前馈神经网络，通过引入核函数改善极限学习机（ELM）性能，其输出可表示为：f(x)=h(x)HU(ZC+HHU
基于蛇优化算法优化的混合核极限学习机(HKELM)的回归预测
基于蛇优化算法优化的混合核极限学习机(HKELM)的回归预测文章目录基于蛇优化算法优化的混合核极限学习机(HKELM)的回归预测1.HKELM原理2.预测问题求解3.基于蛇优化算法优化的HKELM4.实验结果5.Matlab代码1.HKELM原理核极限学习机（KELM）是一种单隐含层前馈神经网络，通过引入核函数改善极限学习机（ELM）性能，其输出可表示为：f(x)=h(x)HU(ZC+HHU)−1
MATLAB实现基于GA-CNN-BiLSTM-Attention遗传算法（GA）优化卷积双向长短期记忆神经网络融合注意力机制进行多变量时序预测的详细项目实例（含模型描述及示例代码） nantangyuxi MATLAB 含模型描述及示例代码神经网络 matlab cnn 支持向量机人工智能大数据深度学习
目录MATLAB实现基于GA-CNN-BiLSTM-Attention遗传算法（GA）优化卷积双向长短期记忆神经网络融合注意力机制进行多变量时序预测的详细项目实例...2项目背景介绍...2项目目标与意义...31.提高多变量时序预测的准确性...32.弥补传统方法的局限性...33.提高模型训练效率...3
神经网络和机器学习的一些基本概念荼渔机器学习神经网络
记录一些基本概念，不涉及公式推导，因为数学不好，记了也没啥用，但是知道一些基本术语以及其中的关系，对神经网络训练有很大帮助。可能有些概念不会讲得很详细，但是当你有了这个概念，你就知道往这个方向去获取更详细的信息，不至于连往哪走都不知道。下面以多元线性回归模型为例1.模型模型训练过程就是利用已知的x和y,求解b的过程，b也称为权重。虽然没有那么简单，但是训练完成的模型本质上就是一组权重值，如[b1,
多维时序 | Matlab实现GA-LSTM-Attention遗传算法优化长短期记忆神经网络融合注意力机制多变量时间序列预测天天Matlab代码科研顾问预测模型神经网络 matlab lstm
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍风力发电是一种清洁能源，越来越受到人们的关注和重视。然而，由于风力发电的不稳定性和不可控性，风电预测成为了一个至关重要的问题。为了更精准地预测风电发电量，许多研究者开始尝试利
GWO-CNN-BiLSTM-Attention多变量多步时间序列预测 | Matlab实现灰狼算法优化卷积双向长短期记忆融合注意力机制
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍摘要:时间序列预测在各个领域具有广泛的应用，而多变量多步时间序列预测由于其复杂性和挑战性，一直是研究热点。本文提出了一种基于灰狼算法(GreyWolfOptimizer,GWO)优化的卷积神经网络(Conv
14、基于无人机与CNN技术的森林研究：原木识别与冠层空隙分析 Sunny 计算科学前沿：ICCSA 2021精选无人机 CNN 原木识别
基于无人机与CNN技术的森林研究：原木识别与冠层空隙分析基于CNN的原木识别研究近年来，基于单根原木追踪圆木的方法备受关注。此前的研究提出了一种基于原木端面图像的物理自由方法，借鉴了指纹和虹膜识别的技术，在使用真实分割数据时取得了不错的效果。但在实际应用中，需要一个完全自动化的系统。为了填补这一空白，研究采用了基于卷积神经网络（CNN）的分割方法与原木识别方法相结合的方式，并与传统原木识别方法在自
讨论神经网络中的卷积与数学中的卷积有何不同陶大明
1.当提到神经网络中的卷积时，我们通常是指由多个并行卷积组成的运算。（因为单个核只能特区一种类型的特征，我们usually希望可以在多个位置提取多个特征）2.输入也不仅仅是实值的网格，而是由一系列观测数据的向量构成的网格。我们有的时候会希望跳出核中的一些位置来降低计算的开销（相应的代价是提取特征没有先前那么好了）我们就把这个过程看作对全卷积函数输出的下采样(downsampling).如果只是在输
AI人工智能加持，人脸识别精准度飙升 AI大模型应用工坊人工智能 ai
AI人工智能加持，人脸识别精准度飙升：从模糊到清晰的技术革命关键词人脸识别、深度学习、神经网络、精准度优化、计算机视觉、特征提取、面部识别算法摘要想象一下，在一个拥挤的火车站，系统能在瞬间从数千人中准确识别出需要关注的个体；或者你的手机仅通过一瞥就能认出你，甚至在你戴着口罩时也能做到。这不是科幻电影的场景，而是当下AI驱动的人脸识别技术的真实能力。本文将深入探讨人工智能如何彻底改变人脸识别领域，从
【无人机】基于强化学习的多无人机移动边缘计算与路径规划研究Matlab代码 Matlab科研工作室无人机边缘计算 matlab
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理
双塔模型（Two-Tower Model）推荐系统实践
双塔模型双塔模型（Two-TowerModel）是一种常用的推荐系统或搜索排序模型架构，由两个独立的神经网络（即“双塔”）组成，分别处理用户和物品的特征，最后通过相似度计算（如点积、余弦相似度）得到匹配分数。Rust因其高性能和安全性，适合实现此类模型。双塔模型的定义双塔模型（Dual-TowerModel）是一种深度学习架构，由两个独立的神经网络塔（Tower）组成，分别处理不同的输入数据，最后
零基础-动手学深度学习-6.5 汇聚层（pooling）池化层
通常当我们处理图像时，我们希望逐渐降低隐藏表示的空间分辨率、聚集信息，这样随着我们在神经网络中层叠的上升，每个神经元对其敏感的感受野（输入）就越大。WHY？因为我们的机器学习任务通常会跟全局图像的问题有关（例如，“图像是否包含一只猫呢？”），所以我们最后一层的神经元应该对整个输入的全局敏感！此外，当检测较底层的特征时（例如6.2节中所讨论的边缘），我们通常希望这些特征保持某种程度上的平移不变性。例
零基础-动手学深度学习-6.6 卷积神经网络（LeNet）生医转码，四海为家深度学习 cnn 人工智能
通过之前几节，我们学习了构建一个完整卷积神经网络的所需组件。回想一下现在我们已经掌握了卷积层的处理方法，我们可以在图像中保留空间结构。同时，用卷积层代替全连接层的另一个好处是：模型更简洁、所需的参数更少。本节将介绍LeNet,它是最早发布的卷积神经网络之一，于80年代发明的为了识别手写数字，LeCun发表了第一篇通过反向传播成功训练卷积神经网络的研究！6.6.1.LeNet我这里改了一下28-32
人工智能自然语言处理：Transformer 模型详解大力出奇迹985 人工智能自然语言处理 transformer
一、Transformer模型的诞生背景在自然语言处理的漫长征程中，早期的传统模型，如循环神经网络（RNN）及其变体长短时记忆网络（LSTM），曾占据主导地位。RNN试图通过依次处理序列中的每个元素，来捕捉上下文信息。但它存在一个致命弱点，在处理长序列时，会面临梯度消失或梯度爆炸的问题，就像一个长途跋涉的旅人，随着路程的增加，逐渐忘记了出发时的目标和重要信息。LSTM虽然在一定程度上缓解了这个问题
【创新无忧】蚁狮算法ALO优化广义神经网络GRNN数据回归预测【含Matlab源码 10433期】 Matlab武动乾坤 matlab
Matlab武动乾坤博客之家博主简介：985研究生，Matlab领域科研开发者；座右铭：行百里者，半于九十。代码获取方式：CSDNMatlab武动乾坤—代码获取方式更多Matlab智能算法优化神经网络分类预测仿真内容点击①付费专栏智能算法优化神经网络分类预测⛳️关注CSDNMatlab武动乾坤，更多资源等你来！！⛄一、智能优化算法优化广义神经网络GRNN数据回归预测1智能优化算法优化广义回归神经网
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他