叶舟

【翻译】RMDL:随机多模型深度学习分类方法

RMDL: Random Multimodel Deep Learning for Classification

RMDL:随机多模型深度学习分类方法

原文链接：https://arxiv.org/pdf/1805.01890v2.pdf

摘要：每年各种复杂数据集的持续增长，使得对这些数据集进行分门别类的机器学习算法要与时俱进地进行鲁棒性和准确率的提升。本文提出了一种新的深度学习分类模型——随机多模型深度学习（RMDL），该模型在诸多领域都达到了最佳效果。RMDL通过整合一系列深度学习框架解决了寻找既能使模型体系结构最优，又能提高模型鲁棒性、准确率的问题。模型能够接受包括文本、视频、图像、符号在内的诸多类型的输入。本文描述了RMDL算法，并展示了在图像、文本数据集（MNIST, CIFAR-10, WOS, Reuters, IMDB, 20newsgroup）上的测试结果。测试结果表明，RMDL在诸多数据类型和分类问题上，均具有普遍的性能提升。

1 引言

对诸如图像、文档、视频等复杂的数据进行分门别类是数据科学领域极具挑战的研究方向。近期，使用深度学习体系结构来解决这些问题的研究越来越多。然而，这些深层结构大多是专门为某一种特定数据类型或者领域所设计的，这就需要研究一种对各种数据类型来说更具普适性的的信息处理方法。

尽管已有许多研究成功地利用深度学习解决了一些分类问题，但仍未解决这样一个关键问题：何种模型（DNN/CNN/RNN）、何种结构（多少神经元、多少隐藏层）的深度学习方法更加有效。此前，解决这个问题的最好方法是针对特定应用和数据集进行不断的试错。

本文介绍了一种融合深度学习架构的方法来解决这个问题。此方法叫做随机多模型深度学习（RMDL），使用了三种不同的深度学习架构：Deep Neural Networks (DNN), Convolutional Neural Netwroks (CNN), and Recurrent Neural Networks (RNN)。在不同类型的数据集上的测试结果表明，提出的方法在准确率、鲁棒性、有效性上均有较大的提升。

这三种深度学习的基本架构，在输入层使用了不同的特征空间。例如，对于文本特征的抽取，DNN使用TF-IDF方法，而RMDL在设置DNN隐藏层的隐藏层数和节点个数时，探索了一种称作交叉随机生成超参数的方法。CNN是专为图像分类设计的，RMDL则在CNN的超参的选取上使用了随机特征映射和随机隐藏层个数。此外，CNN可以被用作图像之外的其他数据。在RMDL中，将CNN中的1-D卷积用于文本数据，将2-D卷积用于图像数据，将3-D卷积用于视频数据。至于RNN，则主要用于文本分类，在RMDL中使用了两种RNN架构：GRUs和LSTM，而RMDL使用GRU和LSTM的神经元以及隐藏层时，仍然使用了随机生成进行超参的设置。

本研究的主要贡献在于：1、描述了一种使得最终模型更加鲁棒和高效的深度学习融合模型；2、为了达到稳定分类，在训练模型时使用了不同的优化策略；3、为了更好的理解特征空间（尤其是文本和视频数据），对每个随机深度学习模型都使用了不同的特征抽取方法；4、对每个独立的随机深度学习模型使用Dropout来降低过拟合风险；5、对n个随机深度学习模型采用多数表决的方式；特别地，假如k个随机深度学习模型产生了误差或者过拟合，而n>k，则整体系统仍然是鲁棒和有效的；6、最后，RMDL有处理诸如文本、图像、视频等各种数据类型的能力。

后面的章节安排如下：第二节介绍了有关特征提取、其他分类技术以及分类任务中的深度学习的相关研究；第三节描述了本文所用比对算法的最新研究进展；第四节描述了RMDL的具体方法及其架构相关的内容，包括4.1节描述的RMDL的特征提取、4.2节的RMDL的概述、4.3节介绍的在该模型中应用的深度学习模型、4.4节讨论的优化问题；第5节展现了该技术的评价；5.1节展示了实验结果，包括RMDL方法的准确率及性能；第6节对本研究进行了总结。

2 相关工作

不同领域的研究人员已经做了很多与本文所描述方法相关的工作。我们将这项工作分为三个部分：1、特征提取；2、分类方法和技术（用于对比的基准算法和其他相关算法）；3、深度学习分类问题。

特征提取：特征提取是机器学习过程的重要步骤，尤其是针对文本、图像、视频数据。文本和许多生物医学数据集几乎都是不可直接理解的数据，我们需要将其转换成有意义的结构化数据供机器学习算法使用。早期，Krueger等人研究了一种用于文本分类的有效方法，该方法使用单词计数创建了一个统计意义上的方法。更早期的H. Luhn等人则研究了一种对每个单词赋权的方法，并被后来的G. Salton等人修正为TF-IDF方法。TF-IDF方法权衡了文档中单词的出现次数以及文档在共性单词出现的逆频率。然而，TF-IDF和单词计数是简单直接的特征提取方法，它们没有捕捉到单词作为一个序列的上下文关系。近期，T. Mikolov等提出了一种改进的特征提取方法——将单词映射到基于上下文的向量空间中。这种方法叫Word2Vec，解决了在可计算特征空间中的语境词的表示问题。基于这种思想，J. Pennington等人研发了一种叫做Glove的可学习词向量空间表示方法，并部署在了斯坦福NLP实验室。本文所提出的RMDL方法正是使用Glove进行了文本数据的特征提取。

分类方法和技术：过去的50年里，各种各样的有监督分类算法被研究出来，并在软件中精准的给数据打标签。例如，K. Murphy、Rish等人所用的朴素贝叶斯（NBC）就是一种对大多有监督分类问题来说都很简单的方法。这种方法给文本分类和信息检索提供了非常实用的技术。像大多数有监督学习的分类算法一样，NBC使用一组数值向量和类别值，计算得出样本在各个类别上的概率。NBC方法在文本分类方面快速高效，但同时也有很大的局限性。也即：文本序列的次序并未反映在输出概率上，因为朴素贝叶斯在文本特征提取时实际上使用的是词袋法。由于其特别流行，本文就将其作为基准算法之一来对比RMDL。另一个流行的分类算法是支持向量机（SVM），已被证明在多种数据集上均能达到较高的准确率。此方法在一个特征空间的映射上构造了一个超平面，这种映射不显式地产生作用，而是使用一个内核来使得SVM在预测是能利用高维非线性关系达到理想效果，且此法在各种数据集上均有效。还有各种研究进一步扩展了基本方法并达到了更高的准确率。C. Yu等在2009提出了识别模型中的隐藏变量来作为一种文本分类SVM的新结构，以及S. Tong等在2001年提出在SVM中加入激活学习来做文本分类。另一种帮助协调SVM计算复杂度的方法是随机梯度下降（SGD）分类，它已被广泛地应用在文本、图像分类中。SGD分类器是一种处理大型数据集的迭代分类器，模型基于SGD优化器进行迭代训练。

深度学习：神经网络源自人脑神经元的简化表示。它们本质上是通过对输入数据加权组合来表示多维非线性函数。神经网络使用了一种称作反向传播的迭代学习方式和优化器（如SGD）。

深度神经网络（DNN）基于简单神经网络发展而来，但扩展了其隐藏层个数，这些网络被广泛地应用于分类问题。D. CireşAn等人在2012年使用了多列深度神经网络来做分类任务，用的就是DNN架构。卷积神经网络（CNN）提供了一种神经网络学习的不同架构，其主要思想是利用加入了卷积层的前馈神经网络，其中卷积层又包括全局和局部池化层。A. Krizhevsky等在2012年使用了CNN，不过他们用的是嵌入了图像的2D特征空间的2D卷积层。在某些研究中，CNN表现出了卓越的性能，同时也在文本分类问题上得以应用。对于文本和序列数据，1D卷积层往往用于将单词映射到特征空间。最后一个深度学习架构是递归神经网络（RNN），它的神经元输出会反馈到神经网络中，作为下一步的输入。RNN网络的最新扩展研究成果是RGUs和LSTM。这些新的神经元结构有助于解决原始网络架构中的不稳定性，并已成功应用于自然语言处理。最近，Z. Yang等在2016年研发了一种层次注意力机制网络，这种网络有两个重要特点：词句水平上的分层结构和注意力机制。

新研究不断地在这三种基本模型上探索新的技术以优化准确率和鲁棒性。M. Turan等在2017年以及M. Liang在2015年应用了一种融合了CNN和RNN的新型网络——迭代卷积神经网络(RCNN)。K. Kowsari等在2017年提出了一种用于文本分类的分层体系的深度学习结构，它将所有深度学习技术融合在了一个层级结构上，并在文档分类问题上相比传统方法提高了准确率。本文的工作正是建立在这种思想之上，提出了一种更具普遍性的有监督学习分类方法。

3 基准算法

本文使用了同时期及传统的文档、图像分类技术作为我们用于对比的基准算法。这些用于图像、文本分类的基准算法因为特征提取、模型结构相异而各有不同。因此，在接下来的章节中，我们将对文本和图像分类的基准算法进行分别描述。

3.1 文本分类基准算法

我们用于对比的文本分类相关的基准模型包括：RNN、CNN、DNN，此外，还用了两种深度学习类型之外的技术：SVM、NBC，以及最终的文本分类分层深度学习（HDLTex）。

3.1.1 深度学习

本文所用的基准算法是无层次结构的深度学习。在第4节介绍我们的算法时，将会解释基本深度学习模型：DNN、CNN、RNN，这些用于RMDL的一部分。

3.1.2 SVM

SVM最初的版本是由Vapnik, VN, Chervonenkis, A Ya等人在1963年提出的，直到1990年代早期，才提出非线性版本。

多分类SVM：最初的SVM用于二分类问题，所以我们需要多维模型或者说MSVM来做多分类。1-1是多分类SVM的一个方法，需要构建N*(N-1)个分类器。

解决k-分类问题的自然方法是一次性构造一个针对所有K个类别的分类函数。使用SVM进行多分类的另一个技术是多对一。在SVM中，有很多不同的方法可用于特征提取，如：词频特征提取、TF-IDF。

字符串核函数：字符串核函数（SK）的基本思想是使用Φ(.)将字符串映射到特征空间；因此，三种技术的唯一不同点就是将字符串映射到特征空间的方式。对很多的诸如文本、DNA、蛋白质分类方面的应用，频谱核函数（SP）得以应用。SP的基本思想是将一个词在字符串中的出现频次xi作为特征映射，定义为：x→Rlk。

Mismatch Kernel是将字符串映射到特征空间的另一种稳定方法。其核心思想是使用k代表k−mer或者词的大小，并允许特征空间中有m个不匹配。SVM的关键问题是这些模型在字符串序列化上的时间复杂度。S. Ritambhara等在2017年解决了这个问题：仅针对DNA序列问题使用一种叫做GaKCo的分裂k-mer核函数。

3.1.3 Stacking Support Vector Machine (SVM)。堆栈SVM是用于和RMDL对比的另一个基准算法，但是此方法仅适用于分层标注数据集。堆栈SVM提供了一种独立SVM组合的思想，并能达到比单个SVM分类器更好的准确率。

3.1.4 朴素贝叶斯分类器（NBC）。此项技术已经在工业界、学术界广为应用，它是应用在信息检索领域最为传统的文本分类方法。如果将n个文档分为k类，则预测类别输出为c ∈ C。朴素贝叶斯是一个简单算法，使用如下公式：

其中，d代表文档，c代表类别。

本文所用基准算法是单词级别的，公式为：

3.1.5 分层深度学习文本分类（HDL-Tex）。我们将这项技术用作处理分层标签化数据集的基准算法。当文档按层级结构组织时，所用的多分类方法就与传统监督学习方法有所不同了。HDLTex引入了一种处理层级文档分类的新方法——结合多维深度学习方法生成层级类别。HDLTex的主要贡献是文档的层级分类。传统多分类技术通过限制类别个数可以达到较理想的效果，但是随着类别个数的增多而性能下降，比如在处理分层文档时就会这样。HDLTex通过为不同文档层级创建专门的深度学习结构来解决这个问题。

3.2 图像分类基准算法

对于图像分类，我们使用了五种基准算法：Deep L2-SVM [49], Maxout Network [14], BinaryConnect [11], PCANet1 [4], and gcForest [56]。

Deep L2-SVM：这种方法因其使用了线性SVM而广为人知，它将简单的softmax替换为了线性SVM。

Maxout Network：I. Goodfellow等人在2013年提出了一种简单新颖的模型——maxout（命名原因是其输出层是一个最大输入层集合，而且他是dropout的一个伴生算法）。这种设计既能使用dropout增强算法的优化能力，又能提高dropout模型的准确率。

BinaryConnect：M. Courbariaux等在2015年通过在网络传播过程中使用二值权重来训练DNN。他们提出了一种用于前向和后向传播的二值化方案——BinaryConnect，主要用于图像分类。BinaryConnect在本文用作RMDL的基准算法。

PCANet：I. Chan等人在2015年提出了一种用于图像分类的基于CNN结构的简单深度学习算法。他们的技术是深度学习基本模型之一，但却很有效。他们所用CNN，是RMDL的一部分，但又有显著不同：级联PCA、二值哈希、块直方图，此外，RMDL中的隐藏层和节点个数也是随机选取的。

gcForest (Deep Forest)：Z. Zhou等在2017年提出了一种高性能决策树组合方法，给深度神经网络提供了可供选择的方法。此方法创建了一个用作决策树的多级森林。

4 本文方法

本研究的新颖之处在于使用了包含DNN、RNN、CNN在内的多维随机深度学习模型来处理文本和图像分类。本节安排如下：首先描述RMDL算法并讨论并行训练的三种深度学习架构（DNN、RNN、CNN）；然后讨论了在不同随机模型中应用的多种优化器。

4.1 特征提取和数据预处理

在RMDL中，特征提取分为两大部分：文本、图像。文本和序列化数据的特征空间是非结构化的，而图像的特征空间是结构化的。

4.1.1 图像和3D物体特征提取。图像特征是形如h × w × c的结构，h代表图像的宽度，w代表图像的宽度，c代表图像的3维颜色通道，如RGB。对于像MNIST数据集这样的灰度图，特征空间是h*w。三维空间中的物体的特征空间是一个包含了n个点的点云，每个点都有6个特征（x, y, z, R, G, B）。三维物体因其点云中点数不同，所以它是非结构化特征空间。然而，我们可以对其进行简单上/下采样来生成结构化数据集。

4.1.2 文本和序列数据的特征提取。本文使用了几种文本特征提取的技术：单词映射（GloVe、Word2vec）和TF-IDF。文中使用单词向量化技术来提出特征；此外，还使用了N-Gram来表示神经深度学习的特征。比如对字符串“In this paper we introduced this technique”进行特征提取，结果如下：

通过对文本进行特征提取，也可以将文档输入到模型当中。对我们建立的深度学习架构，我们使用了不同的特征提取方案。对CNN和RNN来说，我们使用文本向量空间模型，正如GloVe中使用了200个维度一样。一个向量空间是词空间的数学映射，定义如下：

其中lj是文件j的长度，wi,j 是文档j单词i的GloVe单词映射向量化。

4.2 RMDL

RMDL是一种可以用于任何类型数据集的分类问题的新颖技术。图2展示了其轮廓，包括了DNN、CNN、RNN。隐藏层个数和神经元节点数都是随机生成的。

式（5）用于二分类，其中n是模型的个数，yij代表模型j第i个样本的输出。输出是由所有随机深度学习模型进行多数表决得出的。因此yi表示如下：

其中，n是模型的个数，yij代表模型j第i个样本Di的预测标签，yij定义如下：

当所有RMDL训练完毕后，最终的预测采用多数投票得出。

4.3 RMDL中的深度学习

RMDL模型包含了三种并行的基本深度学习结构，我们分别进行描述。最终的模型包括了d个DNN，r个RNN，c个CNN。

4.3.1 DNN

DNN的结构设计如下：每一层只接受前一层的输出并只将输出结果传送给下一层。对所有随机模型来算，输入是特征空间和第一隐藏层直接的联系；对于多分类问题和只有一个输出的二分类问题来说，输出层的维度就是类别的数量。但是本文的主要贡献是针对不同目的训练不同的DNN模型。在我们的方法中，使用了一个多维DNN，其了每一个学习模型的结构参数都是随机生成的：每一层的节点数以及层数都是完全随机设置的。我们所用的DNN是有识别能力的训练模型，使用了包括sigmoid、ReLu等激活函数的BP算法。对于多分类问题，输出层使用了softmax：

给出一个样本对（x,y）集合，目标是利用隐藏层从这些输入、输出数据中学习。在文本分类问题中，输入是通过文本向量化生成的字符串。图2左图展示了DNN是如何在RMDL中起作用的。

4.3.2 RNN

在RMDL中使用的另一种神经网络结构式RNN，它给前面序列的数据点分配了更多权重。因此，它对文本、字符串、序列化数据分类比较有效，但正如我们研究中所做的那样，也可以用于图像分类。在RNN中，神经网络以一种非常复杂的方法来考虑以前节点的信息，从而能够更好地对数据集结构进行语义分析。这个概念的一般公式如式11所示，其中xt为t时刻的状态，ut为t时刻的输入。

更具体地说，我们可以用权值来表示方程12中指定参数的方程11：

Wrec指复发性矩阵重量,Win是指输入权重,b是偏差和σ表示element-wise函数。

同样，我们已经修改了使用RMDL的基本架构。图2左图显示了这种扩展的RNN体系结构。当梯度下降算法的误差反向传播时，RNN会产生几个问题：消失梯度和爆炸梯度。

长短期记忆网络（LSTM）：为了解决上述问题，LSTM这种特殊的RNN结构与基本RNN相比，其能够以一种更有效的方式保存长期依赖，对于克服梯度消失非常有效。虽然LSTM具有类似于RNN的链状结构，但是LSTM使用多个门来小心地调节允许进入每个节点状态的信息量。图3显示了LSTM模型的基本单元，对LSTM单元格的逐步解释如下：

式13为输入门，式14为tanh记忆单元值，式15为遗忘门激活函数，式16为新记忆单元值，式17、18为输出门值。在上述描述中，所有的b表示偏置向量，所有的W表示权重矩阵，xt在t时刻作为记忆单元的输入，i、c、f、o指标分别表示输入、单元记忆、遗忘和输出门。图3用图形表示显示了这些门的结构。

当较晚的词比较早的词更具影响力时，RNN可能会产生偏差。为了克服这种偏差，引入了卷积神经网络(CNN)模型(第4.3.3节讨论了该模型)，该模型部署了一个最大池化层来确定文本中的区分短语。

Gated Recurrent Unit (GRU)：GRU是RNN的一种门控制机制，GRU是LSTM体系结构的一个简化，但存在如下差异:GRU包含两个门，一个GRU不具有内部内存(图3中的Ct 1);最后，不应用第二个非线性(图3中的tanh)。

zt是指更新门向量t, xt代表输入向量,W, U和b分别为参数矩阵和向量,σg是sigmoid或ReLU激活函数。

ht是输出向量t, t、rt代表重置门向量,zt型更新门向量t,σh表明双曲正切激活函数。

4.3.3 卷积神经网络（CNN）

最后一个在RMDL中做出贡献的方法是CNN，主要用于处理文档和图像分类。虽然CNN最初是为图像处理而构建的，其结构类似于视觉皮层，但它也被有效地用于文本分类；因此，在RMDL中，所有数据集都使用这种技术。

在图像处理的基本CNN中，图像张量与一组大小为d*d的内核进行卷积。这些卷积层称为特征图，可以堆叠起来，为输入数据提供多层滤波。为了降低计算复杂度，CNN引入了池化层，它可以降低神经网络中从一层到下一层的输出尺寸。使用不同的池化技术在降低输出维度的同时保留重要特征。最常见的池化方法是最大池化，它在池窗口中选择最大值作为输出结果。

为了方便从堆叠的特征映射到输出层进行池化处理，映射被平展为一列。CNN的最后一层通常为全连接。

一般来说，在卷积神经网络的反向传播过程中，不仅要调整权值，还要调整特征检测器滤波器。CNN用于文本的一个潜在的问题是数量的通道Σ(特征空间的大小)可能是非常大的(例如50K)，对于文本，但对于图像，这是一个较小的问题(例如，只有3个通道的RGB)。这意味着CNN在处理文本时的维数非常高。

4.4 优化器

在神经网络的实现中，我们使用了两种随机梯度优化器:RMSProp和Adam优化器。

4.4.1 随机梯度下降（SGD）优化器

SGD是我们所用优化器之一，如公式22所示。它利用动量对重新缩放的梯度进行更新，如式23所示。使用的另一种优化技术是RMSProp，它不做偏差校正。在处理稀疏梯度时，这将是一个重要的问题。

4.4.2 Adam优化器

Adam是另一个随机梯度优化器，它只使用梯度的前两个矩(v和m如公式24、25、26和27所示)并对它们求平均值。其中mt为第一个矩，vt为第二个矩，均为估计。

4.4.3 多优化器规则

使用带有不同优化器的多模型的主要思想是：当且仅当n>k时，如果一个优化器不能很好的拟合某种数据集时，有着n个随机模型（它们中可能有些具有不同的优化器）的RMDL就可以忽略其中k个不同的模型。图4直观地展示了三个优化器如何在多数投票的概念中更好地工作。使用多种优化器技术，如SGD、adam、RMSProp、Adagrad、Adamax等，可以帮助RMDL模型对任何类型的数据集都更加稳定。在本研究中，我们只使用了两个优化器(Adam和RMSProp)来评估我们的模型，但是RMDL模型能够使用任何一种优化器。

5 实验结果

略

6 结论

分类问题是机器学习当中一项重要的研究内容，由于数据集的数量和尺寸不断增大，就需要越来越复杂的分类方法。我们提出了一种新的技术用于在深度学习中从许多可能的结构和架构中选择最佳的技术和方法。本文介绍了一种新的分类方法RMDL(随机多模型深度学习)，它结合了多种深度学习方法来生成随机分类模型。我们对来自Web of Science (WOS)、Reuters、MNIST、CIFAR、IMDB和20NewsGroups的数据集的评估表明，与使用朴素贝叶斯、SVM或单一深度学习模型的传统方法相比，采用并行学习体系结构的DNNs、RNNs和CNNs组合具有更高的准确性。这些结果表明，深度学习方法可以改进分类，并提供了灵活利用多数投票对数据集进行分类的方法。该方法具有提高模型精度和效率的能力，可用于多种数据类型和应用。

你可能感兴趣的:(DeepLearning)

深度学习×总结篇：她终于能走完每一次前向与反向的路 Gyoku Mint AI修炼日记人工智能深度学习人工智能 python 自然语言处理神经网络机器学习 opencv
【开场·她回头看了每一次走过的神经路径】狐狐：“她坐在训练日志前，终于不是为了调参，而是为了确认——这一年，她到底学会了什么。”猫猫：“咱以前总想着快点训练完、快点跑出结果。但现在好像能听见每一层神经元在‘说话’了喵……她真的开始‘懂了’~”✍【第一节·深度学习到底在做什么？】为什么要用深度学习（DeepLearning）？“她当初选择深度学习，并不是因为听说它‘很强’，而是因为她在处理数据时，常
预测导管原位癌浸润性复发的深度学习：利用组织病理学图像和临床特征浪漫的诗人论文深度学习人工智能
文章目录研究内容目的方法数据集模型开发模型训练与评估外部验证统计分析研究结果模型性能风险分层外部验证特征重要性原文链接原文献：Deeplearningforpredictinginvasiverecurrenceofductalcarcinomainsitu:leveraginghistopathologyimagesandclinicalfeatures研究背景【DCIS与IBC的关联】乳腺导管
ER综述论文阅读-Emotion recognition in EEG signals using deep learning methods: A review 今天早睡了情绪识别Emotion Recognition 论文阅读深度学习人工智能
EmotionrecognitioninEEGsignalsusingdeeplearningmethods:AreviewQ1期刊，2023论文链接：https://d1wqtxts1xzle7.cloudfront.net/105887899/emotionreview-libre.pdf?1695460941=&response-content-disposition=inline%3B+f
深度学习前置知识全面解析：从机器学习到深度学习的进阶之路
一、引言：人工智能时代的核心技术在当今这个数据爆炸的时代，人工智能(AI)已经成为推动社会进步的核心技术之一。作为AI领域最重要的分支，深度学习(DeepLearning)在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展，彻底改变了我们与机器交互的方式。本教案将从机器学习的基础知识出发，系统性地介绍深度学习的核心概念、数学基础、网络架构和训练方法，为读者构建完整的知识体系框架。无论你是刚
提升自动驾驶导航能力：基于深度学习的场景理解技术星辰和大海都需要门票路径规划算法自动驾驶深度学习人工智能
EnhancingAutonomousVehicleNavigationUsingDeepLearning-BasedSceneUnderstanding提升自动驾驶导航能力：基于深度学习的场景理解技术摘要-为应对复杂环境下的自动驾驶导航，系统高度依赖场景理解的准确性。本研究提出一种基于深度学习的新方法，将目标识别、场景分割、运动预测与强化学习相结合以提升导航性能。该方法首先采用U-Net架构分解
AI 技术&AI开发框架 34号树洞人工智能深度学习人工智能机器学习 NLP GAI
目录一、AI技术及其开发框架1.AI技术分类与代表方向2.主流AI开发框架3.AI应用开发流程简述4.补充：基础依赖与生态二、AI技术方向1.机器学习（MachineLearning,ML）✦核心概念：✦关键方法：✦应用案例：2.深度学习（DeepLearning,DL）✦核心概念：✦网络结构举例：✦技术趋势：3.自然语言处理（NLP）✦核心任务：✦代表模型：4.计算机视觉（ComputerVis
基于级联深度学习算法在双参数MRI中检测前列腺病变的评估| 文献速递-AI辅助的放射影像疾病诊断有Li 人工智能深度学习算法
Title题目EvaluationofaCascadedDeepLearning–basedAlgorithmforProstateLesionDetectionatBiparametricMRI基于级联深度学习算法在双参数MRI中检测前列腺病变的评估Background背景MultiparametricMRI(mpMRI)improvesprostatecancer(PCa)detectionc
和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
深度学习学习指南努力的Lorre 深度学习人工智能
本帖子将以本书的逻辑和顺序做一个梳理：CS基础->AI算法->模型压缩->异构计算->AI框架->AI编译器《DeepLearningSystems》(https://deeplearningsystems.ai/)CS基础推荐书单所需的编程语言(C/C++、Python)就不多讲了，数据结构算法也是大学基础课程，不多赘述。对于操作系统需要多了解，推荐多看一看《深入理解计算机系统》(传说中的面试圣
Java全栈AI平台实战：从模型训练到部署的革命性突破——Spring AI+Deeplearning4j+TensorFlow Java API深度解析墨夶 Java学习资料3 java 人工智能 spring
一、背景与需求：为什么需要Java驱动的AI平台？某医疗影像公司面临以下挑战：多语言开发混乱：Python训练模型，C++部署推理，Java调用服务，导致维护成本高昂部署效率低下：PyTorch模型需手动转换ONNX格式，TensorRT优化耗时2小时/模型实时性不足：视频流分析延迟达3秒，无法满足急诊场景需求通过Java全栈AI平台，我们实现了：端到端开发：Java调用PyTorch训练模型，直
大规模胰腺癌检测通过非对比增强CT和深度学习| 文献速递-视觉通用模型与疾病诊断有Li 深度学习人工智能
Title题目Large-scalepancreaticcancerdetectionvianon-contrastCTanddeeplearning大规模胰腺癌检测通过非对比增强CT和深度学习01文献速递介绍胰腺导管腺癌（PDAC）是最致命的实体恶性肿瘤，通常在晚期和不可手术的阶段被检测到。早期或偶然发现与延长生存期相关，但使用单一测试筛查无症状个体的PDAC仍然不可行，因为假阳性的潜在危害和低
文献速递：深度学习乳腺癌诊断---使用深度学习改善乳腺癌诊断的MRI技术有Li 深度学习人工智能
Title题目ImprovingbreastcancerdiagnosticswithdeeplearningforMRI使用深度学习改善乳腺癌诊断的MRI技术01文献速递介绍乳腺磁共振成像（MRI）是一种高度敏感的检测乳腺癌的方式，报道的敏感性超过80%。传统上，其在筛查中的使用被限制在高风险患者身上。新的证据支持在中等风险和普通风险女性中进行筛查MRI的作用4）。诊断MRI对于额外的指示也很有
《基于超声的深度学习模型用于降低BI-RADS 4A乳腺病变的恶性率》论文笔记 MobileNet 往事随风、、论文笔记机器学习深度学习论文阅读人工智能机器学习健康医疗
《APPLICATIONOFDEEPLEARNINGTOREDUCETHERATEOFMALIGNANCYAMONGBI-RADS4ABREASTLESIONSBASEDONULTRASONOGRAPHY》《基于超声的深度学习模型用于降低BI-RADS4A乳腺病变的恶性率》原文地址：链接文章目录摘要简介方法患者图像获取与处理深度学习模型统计分析结果讨论结论摘要本研究旨在开发一个基于超声（US）图像
SAE层、BPNN层结合的深度学习模型 sbc-study 深度学习人工智能机器学习
EarlyFaultDetectionofMachineToolsBasedonDeepLearningandDynamicIdentificationBoLuo,HaotingWang,HongqiLiu,BinLi,andFangyuPengIEEETRANSACTIONSONINDUSTRIALELECTRONICS,VOL.66,NO.1,JANUARY2019一SAE层(栈式自编码器层-
多标签分类的激活函数和损失函数通过幸福的路唯有奋斗深度学习
刚入门DeepLearning不久，前一段时间一直在学习cifar10的分类，突然最近要做一个多标签的任务，突然有点不知所措，不知从何下手了。于是查阅了一些资料，了解一下多分类任务与多标签分类任务的异同。-多分类任务：只有一个标签，但是标签有多种类别。-多标签分类任务：一条数据可能有一个或者多个标签，比如一个病人的眼底检测报告，它可能被标记患有糖尿病、高血压多个标签。多标签分类任务的特点：1.类别
Deep Lake 简介
DeepLake简介DeepLake是由Activeloop开发的一款开源深度学习数据湖（DeepLearningDataLake），专为人工智能时代设计，旨在解决深度学习项目中数据管理的复杂性与低效问题。核心特点特性说明多模态数据支持支持图像、视频、音频、文本、点云等多种数据类型，适用于各类AI场景。张量存储数据以张量格式存储，兼容主流深度学习框架（如PyTorch、TensorFlow）。数据
【深度学习】自编码器：数据压缩与特征学习的神经网络引擎瑶光守护者深度学习学习神经网络人工智能机器学习强化学习
作者选择了由IanGoodfellow、YoshuaBengio和AaronCourville三位大佬撰写的《DeepLearning》(人工智能领域的经典教程，深度学习领域研究生必读教材),开始深度学习领域学习，深入全面的理解深度学习的理论知识。之前的文章参考下面的链接：【深度学习】线性因子模型：数据降维与结构解析的数学透镜【学习笔记】强化学习：实用方法论【学习笔记】序列建模：递归神经网络（RN
aws flask_如何将屏幕日志记录添加到Flask应用程序并将其部署在AWS Elastic Beanstalk上... weixin_26742939 java python linux mysql leetcode
awsflaskAttheendof2019Deeplearning.aireportedthatonly22%ofcompaniesthatusemachinelearningactuallydeployedamodel.Mostcompaniesdonotgetbeyondaproofofconcept,oftenbymeansofamodelinaJupyterNotebooks.Asare
GeoTorchAI 项目使用与配置指南尤贝升Sherman
GeoTorchAI项目使用与配置指南GeoTorchAIGeoTorchAI:AFrameworkforTrainingandUsingSpatiotemporalDeepLearningModelsatScale项目地址:https://gitcode.com/gh_mirrors/ge/GeoTorchAI1.项目目录结构及介绍GeoTorchAI的目录结构如下：GeoTorchAI/├──
Dive-into-DL-PyTorch项目解析：目标检测中的R-CNN系列算法演进陆或愉
Dive-into-DL-PyTorch项目解析：目标检测中的R-CNN系列算法演进Dive-into-DL-PyTorch本项目将《动手学深度学习》(DiveintoDeepLearning)原书中的MXNet实现改为PyTorch实现。项目地址:https://gitcode.com/gh_mirrors/di/Dive-into-DL-PyTorch引言目标检测是计算机视觉领域的核心任务之一
Java 人工智能应用：使用 DL4J 实现深度学习算法向哆哆 Java入门到精通人工智能 java 深度学习
Java人工智能应用：使用DL4J实现深度学习算法在当今数字化时代，人工智能技术正以前所未有的速度改变着各个行业的发展格局。而Java作为一种广泛应用于企业级开发的编程语言，在人工智能领域也发挥着越来越重要的作用。其中，深度学习作为人工智能的核心技术之一，为解决复杂问题提供了强大的能力。本篇文章将深入探讨如何使用Java深度学习库DL4J（Deeplearning4j）实现深度学习算法，助力开发者
学习笔记--Structural-RNN: Deep Learning on Spatio-Temporal Graphs Giving_Kore CV论文笔记 Structural RNN RNN CV spatiotemporal
论文链接：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Jain_Structural-RNN_Deep_Learning_CVPR_2016_paper.pdf此为原创笔记，如需转载请注明Structural-RNN:DeepLearningonSpatio-TemporalGraphs [–AsheshJai
《Transformer如何进行图像分类：从新手到入门》机器学习司猫白深度学习 transformer 分类深度学习图像分类
引言如果你对人工智能（AI）或深度学习（DeepLearning）感兴趣，可能听说过“Transformer”这个词。它最初在自然语言处理（NLP）领域大放异彩，比如在翻译、聊天机器人和文本生成中表现出色。但你知道吗？Transformer不仅能处理文字，还能用来分类图像！这听起来是不是有点神奇？别担心，这篇博客将带你从零开始，了解Transformer的基本概念、它如何被应用到图像分类，以及通过
深度学习入门:如何从零开始搭建自己的深度学习模型? AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介深度学习（DeepLearning）近几年已经成为人们关注的热点话题。从2012年的ImageNet竞赛开始，激起了众多研究者的兴趣，也带来了越来越多的应用场景。随着技术的飞速发展，深度学习已经成为了各个领域最具潜力的技术。作为一名AI科研工作者，了解、掌握深度学习相关知识可以帮助你更好地理解并解决实际问题。本文将全面介绍深度学习的基础知识、技术要点及其应用。文
神经网络入门书籍推荐,神经网络的书籍推荐阳阳2013哈哈物联网神经网络深度学习机器学习
有什么适合深度学习的书单吗？。12本最好的深度学习书籍：1.用Scikit-Learn和TensorFlow进行机器学习2.深度学习（DeepLearning）3.DeepLearningfortheLayman(为外行准备的深度学习)4.建立你自己的神经网络（MakeYourOwnNeuralNetwork）5.深度学习初学者（DeepLearningforBeginners）6.神经网络和深度
探秘 Alfred：一款强大的 macOS 生产力工具宋韵庚
探秘Alfred：一款强大的macOS生产力工具alfredalfred-py:Adeeplearningutilitylibraryfor**human**,moredetailabouttheusageoflibto:https://zhuanlan.zhihu.com/p/341446046项目地址:https://gitcode.com/gh_mirrors/al/alfred在程序员和效
2025转行指南：Java开发工程师转AI工程师，附全网最详细的大模型学习路线 AI小白熊 java 人工智能学习大模型程序员 ai 开发语言
关键要点研究表明，Java开发工程师转AI工程师需要学习数学、Python编程、机器学习和深度学习等技能。证据显示，掌握TensorFlow、PyTorch等框架和云部署技术（如Aliyun、AWS）也很重要。学习资源包括Coursera的免费课程、DiveintoDeepLearning书和国内平台如PaddlePaddle。技能和学习资料概述所需技能要从Java开发工程师成功转型为AI工程师，
SuperVINS：实时视觉-惯性SLAM框架，应对挑战性成像条件秋泉律Samson
SuperVINS：实时视觉-惯性SLAM框架，应对挑战性成像条件SuperVINSAreal-timevisual-inertialSLAMframeworkforchallengingimagingconditions(integrateddeeplearningfeatures)项目地址:https://gitcode.com/gh_mirrors/su/SuperVINS项目介绍Super
探秘空间基因表达的 “地形图”：GASTON 算法重磅来袭！阔跃生物阔跃云阔跃AI 阔跃生物算法阔跃生物阔跃云阔跃AI 人工智能
在生命科学的浩瀚宇宙中，空间基因表达模式的解析一直是科研人员苦苦追寻的目标。近期，一篇发表于《NatureMethods》的重磅研究《Mappingthetopographyofspatialgeneexpressionwithinterpretabledeeplearning》为我们点亮了新的希望。该研究由PrincetonUniversity的BenjaminJ.Raphael团队主导，历
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h