溢流眼泪

【机器学习与自然语言处理】预训练 Pre-Training 各种经典方法的概念汇总

【NLP概念合集：一】预训练 Pre-Training，微调 Fine-Tuning 及其方法的概念区别

前言请看此
正文
预训练 Pre-Training
- 无监督学习 unsupervised learning
- - 概念：标签
  - PCA 主成分分析（Principal Component Analysis）降维算法
  - LSA 潜在语义分析（Latent Semantic Analysis）降维算法
  - LDA 隐含狄利克雷分布（Latent Dirichlet Allocation）降维算法
  - 概念：词袋模型（Bag of Words Model / BOW）
  - 概念：n-gram 模型
  - K均值（K-Means）聚类算法
  - 概念：词嵌入（Word Embedding）
  - Word2Vec 预测模型，词嵌入算法
  - GloVe (Global Vectors for Word Representation) 词嵌入算法
  - ELMo（Embeddings from Language Models）词嵌入模型
  - BERT （Bidirectional Encoder Representations from Transformers）语言模型，词嵌入模型
  - AE 自动编码器（AutoEncoder）人工神经网络
  - 概念：NLP中的编码器（Encoder）和解码器（Decoder）
  - 概念：分词器（Tokenizer），词嵌入（Word Embedding）和编码器（Encoder）的区别
  - 概念：Transformer架构
  - 概念：Encoder 模型，Decoder 模型，Seq2Seq 模型
  - 概念：预训练任务
  - MLM 遮蔽语言模型（Masked Language Model）预训练任务
  - NSP 下句预测（Next Sentence Prediction）预训练任务
  - 其他一些经典的预训练任务
  - 概念：NLU，NLG，NLI
- 自监督学习 Self-Supervised Learning

前言请看此

（1）一些概念源自LLM（Chatgpt）和网络（百度/知乎等），笔者进行了初步检查。
（2）由于其中的各种知识比较琐碎，为了形成较为结构化的知识体系，且使用最简单的、几乎无公式的介绍，故作此博客。
（3）着重为机器学习ML与自然语言处理领域NLP的，CV领域的不是很详细讲述了

正文

在深度学习中，一般流程包括预训练和微调两个主要阶段：
预训练阶段：这个阶段包括在大规模无标签数据上进行训练，以学习模型的初始参数，用以学习通用的语言表示。无监督学习和自监督学习是常用的预训练方法，通过让模型在无标签数据上学习语言的结构和特征。
微调阶段：预训练完成后，微调阶段会改变部分参数或全部参数，并在有标签数据上进行微调，以适应特定的任务。微调的目标是调整模型的参数，使其在特定任务上表现良好。
下面，按照预训练和微调为两个大类，其中有不同小类进行介绍。（微调貌似只能放到下一篇了捏）

预训练 Pre-Training

无监督学习 unsupervised learning

现实生活中常常会有这样的问题：缺乏足够的先验知识，因此难以人工标注类别或进行人工类别标注的成本太高。很自然地，我们希望计算机能代我们完成这些工作，或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题，称之为无监督学习。
【机器学习】几种常见的无监督学习算法

概念：标签

在机器学习中，训练样本的标签指的是与每个输入样本相关联的输出或目标值。训练样本通常包括两个部分：输入特征（特征向量）和相应的标签。
输入特征：描述样本的属性或特征，是模型用来进行学习和预测的信息。
标签：对于监督学习任务，标签是与每个输入样本关联的真实输出值或类别。在监督学习中，模型的目标是学习从输入到标签的映射，以便在未见过的数据上进行准确的预测。
标签的形式可以是多样化的，具体取决于任务的性质和问题的定义。

分类任务：
单一类别标签：通常用于分类任务，标签表示样本属于哪个类别。例如，图像分类任务中，标签可以是“猫”、“狗”等。
多类别标签：如果一个样本可以属于多个类别，标签可以是一个包含多个类别的集合。
回归任务：
数值标签：在回归任务中，标签是一个实数或浮点数值，表示目标变量的具体数值。例如，房价预测任务中，标签可以是房价的具体价格。
序列标注任务：
句子或文本标签：用于自然语言处理中的一些任务，标签可以是一个句子或文本序列。例如，命名实体识别任务中，标签是标注每个词语的实体类型。
图像生成任务：
图像标签：在图像生成任务中，标签可以是一张图像，表示模型生成的目标图像。
向量标签：
多维向量：在一些任务中，标签可以是一个多维的向量，表示样本的多个属性或特征。例如，人脸识别任务中，标签可以是包含人脸特征的向量。

那么问题来了，大量的数据，没有标签，我们怎么拿它们进行作为训练语料进行训练呢？
答案是使用一些算法进行标注呗。

PCA 主成分分析（Principal Component Analysis）降维算法

降维是指在保留数据特征的前提下，以少量的变量表示有许多变量的数据，这有助于降低多变量数据分析的复杂度。减少数据变量的方法有两种：一种是只选择重要的变量，不使用其余变量；另一种是基于原来的变量构造新的变量。
通过降维算法后变成低维向量，作为标签。
PCA 采用以下步骤来寻找主成分：
（1）计算协方差矩阵。
（2）对协方差矩阵求解特征值问题，求出特征向量和特征值。
（3）以数据表示各主成分方向。

LSA 潜在语义分析（Latent Semantic Analysis）降维算法

LSA 是一种用于处理和分析文本数据的无监督学习方法，主要用于文本挖掘和信息检索任务。其目标是通过降维技术，将文本数据从高维的词语空间映射到低维的语义空间，以捕捉文本数据的潜在语义结构。
潜在语义分析(LSA)解析 | 统计学习方法 | 数据分析，机器学习，学习历程全记录
LSA 的主要步骤：
（1）构建文档-词矩阵
（2）奇异值分解
（3）选择主题数量
（4）降维
（5）文档相速度和检索
LSA的优点包括对大规模文本数据的有效处理、对词语之间的语义关系进行建模以及对噪声和冗余信息的抵抗力。然而，它也有一些限制，如对词语的词序和上下文的敏感性较低。且分解变换后的矩阵难以解释，计算代价高。

LDA 隐含狄利克雷分布（Latent Dirichlet Allocation）降维算法

LDA 是一种用于主题建模的概率图模型，主要用于分析大规模文本语料库中的主题结构。LDA 假设每个文档是由多个主题的混合生成的，而每个主题则是由一组词语的分布所定义的。该模型的目标是通过观察文档中的词语分布，推断文档和主题之间的潜在关系。
LDA 通过以下步骤计算主题分布和单词分布。
（1）为各文本的单词随机分配主题。
（2）基于为单词分配的主题，计算每个文本的主题概率。
（3）基于为单词分配的主题，计算每个主题的单词概率。
（4）计算步骤 2 和步骤 3 中的概率的乘积，基于得到的概率，再次为各文本的单词分配主题。
（5）重复步骤 2 到步骤 4 的计算，直到收敛。

概念：词袋模型（Bag of Words Model / BOW）

所谓词袋模型，是将一篇文档，我们仅考虑一个词汇是否出现（或者出现频率），而不考虑其出现的顺序。在词袋模型中，"我喜欢你"和"你喜欢我"是等价的。
在词袋模型中，文本被表示为一个向量，其中每个维度对应一个词语，而向量的值表示相应词语在文本中的出现次数或其他权重。
我们发现，在上述LSA，LDA中通常使用的是BOW模型。但上述降维方法不单单局限于BOW。

概念：n-gram 模型

与BOW相反的是 n-gram模型
N-gram 是自然语言处理中一种基于词序列的模型表示方法，它捕捉了文本中相邻词语之间的关系。N-gram 模型将文本分割成连续的 n 个词语组成的片段，并基于这些片段来建模文本的结构。
以一个简单的例子说明，对于句子 “I love natural language processing.”，各个 N-gram 如下：
Unigram: {“I”, “love”, “natural”, “language”, “processing”}
Bigram: {“I love”, “love natural”, “natural language”, “language processing”}
Trigram: {“I love natural”, “love natural language”, “natural language processing”}
Four-gram: {“I love natural language”, “love natural language processing”}
N-gram 模型的基本假设是当前词的出现只与前面的 n-1 个词相关，而与其他词无关。这种模型可以用于语言建模、文本生成、机器翻译等任务。一般来说，N 越大，模型捕捉的上下文信息越丰富，但也需要更多的数据来估计模型参数。
N-gram 模型的局限性在于它无法捕捉长距离的依赖关系，因为它仅考虑相邻的 n 个词。更复杂的模型，如神经网络的语言模型，通常被用来处理更大范围的语境依赖。

K均值（K-Means）聚类算法

当然，聚类算法也可以作为无监督学习的一种学习算法。
K-Means 算法是一种聚类算法。其典型计算步骤如下：
（1）从数据点中随机选择数量与簇的数量相同的数据点，作为这些簇的重心。
（2）计算数据点与各重心之间的距离，并将最近的重心所在的簇作为该数据点所属的簇。
（3）计算每个簇的数据点的平均值，并将其作为新的重心。
（4）重复步骤 2 和步骤 3，直到所有数据点不改变所属的簇，或者达到最大计算步数。

概念：词嵌入（Word Embedding）

词嵌入是一种将词语映射到实数向量空间的技术，通过这种表示，词语之间的语义关系可以在向量空间中更好地体现。
【学习词嵌入一般都是无监督学习的。但词嵌入可以作为一个底层工具，为后续的比如其他预训练和微调学习提供帮助。】
独热编码 One-Hot Encoding
一个单词对应一个n维向量，n为词汇表大小，向量只在某个位置为1，比如 Love 可能对应 (0,0,1,0, ……,0,0)
词向量 Word Vector
一般来说，一个单词对应一个n维向量，n一般为固定超参数，每个位置的值都是实数，比如 Love 可能对应 (0.0384, 0.1235, ……, 0.8997)
NLP(一)Word Embeding词嵌入
引申：句子嵌入（Sentence Embedding）
要为一个句子生成句子嵌入，最基本的方法是对该句子中出现的所有单词进行平均词嵌入。

Word2Vec 预测模型，词嵌入算法

Word2Vec，主要包含连续词袋模型（CBOW）和SG（SkipGram）模型。
（1）CBOW模型通过上下文中的周围词语来预测目标词语。模型的目标是最大化给定上下文条件下目标词语的条件概率。
（2）SG模型与CBOW相反，它通过目标词语来预测上下文中的周围词语。Skip-Gram旨在最大化给定目标词语条件下周围词语的条件概率。
注意，BOW词袋模型和CBOW连续词袋模型不是同一个概念，一个是文本的向量表示作用，一个是词嵌入的方法
但是可能有人问，这个不是预测模型嘛，但它同时也是强大而经典的词嵌入工具
更详细的词嵌入学习过程，可以查看如下知乎2.2和2.3节
Graph Embedding之从word2vec到node2vec

GloVe (Global Vectors for Word Representation) 词嵌入算法

GloVe 是一种基于全局词-词共现统计的方法，即共同利用了全局信息和局部信息。它通过对整个语料库中词语的共现信息进行建模，使用奇异值分解（SVD）来学习词向量。GloVe生成的词向量在语义上捕捉了词语之间的关系。Glove的计算效率很高、效果也很好。
总体来看，Glove可以被看作是更换了目标函数和权重函数的全局Word2Vec。

ELMo（Embeddings from Language Models）词嵌入模型

ELMo 使用双向LSTM（Long Short-Term Memory）模型，通过学习上下文中的信息来生成词向量。ELMo的独特之处在于，它将词语表示为多个不同层次的语境敏感表示，使其能够更好地捕捉词语的语义变化
虽然经典，但貌似现在用的流行方向都转变为GPT系列，BERT系列去了

BERT （Bidirectional Encoder Representations from Transformers）语言模型，词嵌入模型

使用 BERT 词嵌入的优点：
（1）上下文敏感性： BERT 通过预训练阶段，使用大规模的无标签语料库，学习了深层次的上下文表示。这使得生成的词嵌入能够更好地捕捉词语在不同上下文中的语义变化和依赖关系。
（2）双向性：与传统的单向语言模型不同，BERT 是一个双向模型，它考虑了输入序列中每个位置的上下文信息。这有助于更好地理解文本中的语境和关系，使得生成的词嵌入更加全面。
（3）适应不同任务： BERT 的预训练模型可以被微调用于各种下游任务，如文本分类、命名实体识别、问答等。这种通用性使得 BERT 在多个自然语言处理任务中都能够表现出色。
（4）Transformer 架构： BERT 基于 Transformer 模型架构，这种架构在处理长距离依赖和捕捉上下文信息方面表现出色。Transformer 的自注意力机制允许 BERT 考虑输入序列中的所有位置，而不受限于固定的窗口大小。
（5）大规模预训练： BERT 的预训练模型使用了庞大的语料库进行训练，这使得模型能够学到更丰富的语言知识和表示。预训练阶段中的掩码语言模型任务和下一句预测任务帮助模型学到了深层次的语言理解。
（6）开源和预训练模型： BERT 的预训练模型已经在开源平台上发布，研究者和从业者可以直接使用这些预训练模型，从而避免了从头开始训练庞大的语言模型的复杂性。
BERT 词嵌入的方法：神经网络算法 - 一文搞懂BERT（基于Transformer的双向编码器）
（1）Tokenization: 输入文本首先通过分词器（Tokenizer）被分割成Token。这一步通常包括将文本转换为小写、去除标点符号、分词等。BERT使用WordPiece分词方法，将单词进一步拆分成子词（subwords），以优化词汇表的大小和模型的泛化能力。
（2）Token Embeddings: 分词后的Token被映射到一个高维空间，形成Token Embeddings。这是通过查找一个预训练的嵌入矩阵来实现的，该矩阵为每个Token提供一个固定大小的向量表示。
（3）Segment Embeddings: 由于BERT能够处理两个句子作为输入（例如，在句子对分类任务中），因此需要一种方法来区分两个句子。Segment Embeddings用于此目的，为每个Token添加一个额外的嵌入，以指示它属于哪个句子（通常是“A”或“B”）。
（4）Position Embeddings: 由于Transformer模型本身不具有处理序列中Token位置信息的能力，因此需要位置嵌入来提供这一信息。每个位置都有一个独特的嵌入向量，这些向量在训练过程中学习得到。
（5）Token Embeddings、Segment Embeddings和Position Embeddings三者相加，得到每个Token的最终输入嵌入。

AE 自动编码器（AutoEncoder）人工神经网络

Autoencoder 是一种无监督学习的神经网络模型，其目标是学习数据的紧凑表示（编码）以及用于重建原始数据的解码器。
在NLP中，AE可以做如下任务：
词嵌入，降维和特征选取，去噪，文本生成和重建，异常检测等
AE 的步骤：
（1）接受一组输入数据（即输入）；
（2）在内部将输入数据压缩为潜在空间表示（即压缩和量化输入的单个向量）；
（3）从这个潜在表示（即输出）重建输入数据。
自动编码器（AutoEncoder）简介
比较火的有CAE卷积自编码，DAE降噪自编码，VAE变分自编码
但是大多在CV比较火

概念：NLP中的编码器（Encoder）和解码器（Decoder）

在自然语言处理（NLP）中，Encoder 和 Decoder 是神经网络中常用的两个组件，尤其在序列到序列（seq2seq）模型中广泛应用。这种结构通常用于机器翻译、文本生成等任务。
Encoder（编码器）
作用：编码器负责将输入序列（例如源语言句子）映射为一个中间的表示（通常是固定维度的向量），该表示捕捉了输入序列的语义信息。
结构：编码器通常由循环神经网络（RNN）、长短时记忆网络（LSTM）、门控循环单元（GRU）或更现代的 Transformer 架构组成。这些模型能够逐步处理输入序列并捕捉其上下文信息。
Decoder（解码器）
作用：解码器接受编码器生成的中间表示，并将其转换为目标序列（例如目标语言翻译的句子）。
结构：解码器也可以使用 RNN、LSTM、GRU 或 Transformer 架构。解码器的设计允许它逐步生成目标序列，考虑到上下文信息和之前生成的部分。

概念：分词器（Tokenizer），词嵌入（Word Embedding）和编码器（Encoder）的区别

从词到数：Tokenizer与Embedding串讲

【Tokenizer 】用于文本预处理，将文本转化为离散表示的词语序列，也就是tokens序列。
huggingface的一些模型使用中，在使用模型前，都需要过一遍tokenizer
输入为一个句子（str）
输出为一个id数组（List[int]）
事实上，tokenizer总体上做三件事情：
（1）分词。tokenizer将字符串分为一些sub-word token string，再将token string映射到id，并保留来回映射的mapping。从string映射到id为tokenizer encode过程，从id映射回token为tokenizer decode过程。映射方法有多种，例如BERT用的是WordPiece，GPT-2和RoBERTa用的是BPE等等，后面会详细介绍。
（2）扩展词汇表。部分tokenizer会用一种统一的方法将训练语料出现的且词汇表中本来没有的token加入词汇表。对于不支持的tokenizer，用户也可以手动添加。
（3）识别并处理特殊token。特殊token包括 [MASK], <|im_start|>, , 等
注：一般，BERT族用的为 WORD-PIECE，GPT族用的是 BPE，更详细介绍请看后文知乎链接。

【Word Embedding】用于将词语映射为实数向量，捕捉词语的语义信息。
通过分词器之后得到的tokens序列作为输入，经过词嵌入转换成密度更高的词向量，也叫embedding编码。

现在Huggingface（后文简称HF）的很多模型会一起把词嵌入矩阵（Embedding Matrix）也训练好。
这样，根据我们输入的tokens序列，直接按照表格就可以查找好我们要的词嵌入向量。

但这样我们发现，这样只有词的语义信息，并没有上下文信息。所以这只是词嵌入的一种比较基础的方法，或者需要经过后续加工。上文也提到了其他的一些方法。下文也会介绍更先进的方法，包含上下文语义的信息。

【Encoder 】接收经过 Tokenizer 处理和经过 Word Embedding 映射的输入序列，生成一个表示，传递给模型的下一层。
Encoder 或者 Decoder，是人工神经网络中的一层结构。提到这俩，就不得不提到 Transformer 架构了

概念：Transformer架构

The Illustrated Transformer
这篇以比较简单易懂的方式阐述了 Transformer 架构的一些内容
如何最简单、通俗地理解Transformer？
也参考了一些知乎回答

Transformer是一种架构，它使用注意力来显著提高深度学习 NLP 翻译模型的性能，其首次在论文《Attention is all you need》中出现，并很快被确立为大多数文本数据应用的领先架构。

比如一个二层堆叠的编码器和解码器的 Transformer 架构就如下图所示

在编码器堆栈和解码器堆栈之前，都有对应的嵌入层。而在解码器堆栈后，有一个输出层来生成最终的输出。

编码器一般有两个子层：包含自注意力层 self-attention，用于计算序列中不同词之间的关系；同时包含一个前馈层 feed-forward。

解码器一般有三个子层：包含自注意力层self-attention，前馈层 feed-forward，编码器-解码器注意力层 Decoder-Encoder self attention。

每个编码器和解码器都有独属于本层的一组权重。

需要注意的是，编码器的自注意力层及前馈层均有残差连接以及正则化层。（就是图中的残差链接Add & 正则化Normalize）

Transformer 的突破性表现关键在于其对注意力的使用。
可以详细去看一下里面的自注意力机制，多头注意力机制。

概念：Encoder 模型，Decoder 模型，Seq2Seq 模型

机器学习中的encoder,decoder和embedding都有什么区别?

按照是否使用 Transformer 架构中的 Encoder 和 Decoder，我们把模型分成如下三类

Encoder 模型仅使用 Transformer 中的 encoder。在每个阶段，注意力层都可以访问原始句子中的每个单词。这种模型通常拥有“双向注意力”的特点，常被称作自编码模型（auto-encoding models），简称AE。

Decoder 模型仅使用 Transformre 中的 decoder。在每个阶段，注意力层仅能访问给定单词在句子中之前位置的单词。这种模型常被称作自回归模型（auto-regressive models），简称AR。

Encoder-decoder 模型（也称 Seq2seq (sequence-to-sequence) 模型）同时使用 Transformer 的两个部分。在每个阶段，encoder 的注意力层都可以访问原始句子中的每个单词，而 decoder 的注意力层只能注意力层仅能访问给定单词在输入句子中之前位置的单词。

概念：预训练任务

预训练任务是指在大规模无标签数据上训练语言模型时使用的任务。通过这些任务，语言模型能够学到文本中的深层次表示，捕捉语言的语法、语义和上下文关系。

MLM 遮蔽语言模型（Masked Language Model）预训练任务

BERT预训练的任务MLM和NSP
详细可以看这篇介绍MLM和NSP

MLM是很多LLM最经典的预训练任务了
在一个句子中，随机选中一定百分比（实际是15%）的token，将这些token用"[MASK]“替换。然后用分类模型预测”[MASK]"实际上是什么词

NSP 下句预测（Next Sentence Prediction）预训练任务

对于很多重要的下游任务比如问答（Question Answering，QA）和自然语言推理（Natural Language Inference，NLI），都需要理解两个句子之间的关系。为了训练一个理解句子关系的模型，作者提出了Next Sentence Prediction（NSP）任务。即每个样本都是由A和B两句话构成，分为两种情况：①、句子B确实是句子A的下一句话，样本标签为IsNext；②、句子B不是句子A的下一句，句子B为语料中的其他随机句子，样本标签为NotNext。在样本集合中，两种情况的样本占比均为50%。

在刚开始发现NSP对模型的提升性能不是很大。但是也有论文指出有一些作用。

其他一些经典的预训练任务

BERT的预训练任务为MLM和NSP，但是GPT它是自回归模型，注意力只关注目前位置及其左边的单词，所以预训练任务不能使用MLM，而选择 Autoregressive Language Modeling 预训练，即训练模型来预测给定上下文中的下一个词

因果语言建模（Causal Language Modeling），与 Autoregressive Language Modeling 呼应，也是只关注上文的tokens，预测下一个词。
（笔者感觉这俩个差不多是一个东西？有待存疑）

对比学习（Contrastive Learning），学习将正例（相似的样本）与负例（不相似的样本）区分开。在CV使用比较多。

概念：NLU，NLG，NLI

NLG 自然语言生成（Natural Language Generating）， NLI 自然语言推理（Natural Language Inference）和 NLU 自然语言理解（Natural Language Understanding）是自然语言处理中不同但相关的任务。

NLG：在大规模无标签语料库上预测下一个词语或一段文本。关注的是如何将计算机生成的信息转化为可读的、自然的文本。NLG的任务包括文本摘要、对话系统的回复生成、文本创作等。

NLI：预测一个文本是否蕴含在另一个文本中，即判断两个文本之间的关系（蕴含、矛盾、中立）

NLU：关注的是理解和解释人类语言的能力。它涉及从文本中提取有关语言结构和语义的信息，使计算机能够理解文本的含义。NLU的任务包括实体识别、关系抽取、情感分析等。

所以可以发现，NSP是NLI的任务，而MLM/CLM 则关注 NLU+NLG

自监督学习 Self-Supervised Learning

自监督学习是一种机器学习的范式，其中模型从输入数据中自动生成标签或目标，而不需要人工标注的真实标签。在自监督学习中，模型通过设计一些任务来自己生成训练目标，然后通过最小化预测和生成目标之间的差异来学习有用的表示。

然后我们发现，在预训练阶段，我们给定的是无标注的文本，但是在训练过程中或多或少都需要该数据的标签呀！只不过我们是使用比如算法，或者模型，或者人工神经网络之类的进行自动计算了。

即在很多情况下，无监督学习作为预训练的方式就是自监督学习的一种形式。

下一篇就讲讲微调和监督学习吧。

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
数据中台中的数据科学工作台：Jupyter集成方案 AI大数据智能洞察大数据与AI人工智能 jupyter 信息可视化 ide ai
数据中台中的数据科学工作台：Jupyter集成方案关键词：数据中台、数据科学工作台、JupyterNotebook、数据科学、机器学习、数据可视化、协作开发摘要：本文深入探讨了在数据中台架构中集成JupyterNotebook作为数据科学工作台的完整解决方案。我们将从数据中台的基本概念出发，详细分析Jupyter在数据科学工作流中的核心作用，介绍多种集成方案和技术实现细节，并通过实际案例展示如何构
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
基于随机森林的白酒风味智能分类系统：从数据到洞察的完整实践笙囧同学 python
作者：笙囧同学|中科院计算机大模型方向硕士|全栈开发爱好者座右铭：偷懒是人生进步的阶梯联系方式：[email protected]各大平台账号/公众号：笙囧同学前言大家好，我是笙囧同学！今天给大家分享一个超级有趣且技术含量爆表的项目——白酒风味智能分类系统。作为一个既爱技术又爱美酒的程序员，我花了大量时间研究如何用机器学习的方法来"品酒"，让AI帮我们识别白酒的风味特征。这个项目融合了机器学习、数
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
Spring AI与机器学习：智能应用开发新范式 tmjpz04412 人工智能 spring 机器学习
SpringAI与机器学习的整合SpringAI是一个基于Spring生态的AI开发框架，旨在简化智能应用的开发流程。通过SpringAI，开发者可以快速集成机器学习模型，构建高效的智能应用。SpringAI支持多种机器学习库和框架，如TensorFlow、PyTorch和Scikit-learn，提供统一的API接口。SpringAI的核心优势在于其模块化设计和自动化配置。开发者无需关心复杂的依
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
3步搞定群晖NAS Synology Drive远程同步Obsidian笔记
文章目录1.简介1.1软件特色演示：2.使用免费群晖虚拟机搭建群晖SynologyDrive服务，实现局域网同步2.1安装并设置SynologyDrive套件2.1局域网内同步文件测试3.内网穿透群晖SynologyDrive，实现异地多端同步3.1安装Cpolar步骤4.实现固定TCP地址同步1.简介之前我们介绍过如何免费多端同步Zotero科研文献管理软件，使用了群晖NAS虚拟机和WebDav
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
相机ROI 参数 ZPC8210 视觉数码相机
相机的ROI（RegionofInterest，感兴趣区域）参数，是指通过设置图像传感器上特定区域作为有效成像区域，从而只采集该区域的图像数据，而忽略其他部分。这一功能常用于工业相机、科研相机、高速相机等场景，以提升帧率、降低数据量或实现特定区域的精细分析。ROI参数的核心要点作用提高帧率：减少处理的像素数量，降低数据带宽，使相机能以更高速度采集图像（例如：从30fps提升到100fps）。减少数
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

【机器学习与自然语言处理】预训练 Pre-Training 各种经典方法的概念汇总

【NLP概念合集：一】预训练 Pre-Training，微调 Fine-Tuning 及其方法的概念区别

前言请看此

正文

预训练 Pre-Training

无监督学习 unsupervised learning

概念：标签

PCA 主成分分析（Principal Component Analysis）降维算法

LSA 潜在语义分析（Latent Semantic Analysis）降维算法

LDA 隐含狄利克雷分布（Latent Dirichlet Allocation）降维算法

概念：词袋模型（Bag of Words Model / BOW）

概念：n-gram 模型

K均值（K-Means） 聚类算法

概念：词嵌入（Word Embedding）

Word2Vec 预测模型，词嵌入算法

GloVe (Global Vectors for Word Representation) 词嵌入算法

ELMo（Embeddings from Language Models） 词嵌入模型

BERT （Bidirectional Encoder Representations from Transformers）语言模型，词嵌入模型

AE 自动编码器（AutoEncoder）人工神经网络

概念：NLP中的编码器（Encoder）和解码器（Decoder）

概念：分词器（Tokenizer），词嵌入（Word Embedding）和编码器（Encoder）的区别

概念：Transformer架构

概念：Encoder 模型，Decoder 模型，Seq2Seq 模型

概念：预训练任务

MLM 遮蔽语言模型（Masked Language Model）预训练任务

NSP 下句预测（Next Sentence Prediction）预训练任务

其他一些经典的预训练任务

概念：NLU，NLG，NLI

自监督学习 Self-Supervised Learning

你可能感兴趣的:(【科研】,机器学习,自然语言处理,人工智能)

K均值（K-Means）聚类算法

ELMo（Embeddings from Language Models）词嵌入模型