AI小白熊

大语言模型(LLM)入门学习路线图，附资源汇总，收藏这篇就够了

Github项目上有一个[大语言模型学习路线笔记]“大语言模型学习路线笔记”)，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。

大语言模型（Large Language Model，LLM）入门学习路线包括了三个方面：

大语言模型基础: 这涵盖了学习LLM所需的基本知识，包括数学、Python编程语言以及神经网络的原理。
大语言模型前沿算法和框架: 在这一部分，重点是利用最新的技术构建LLM。这包括研究和应用先进的算法和模型架构，以提高模型的性能和效率。
大语言模型工程化: 这一部分专注于创建基于LLM的应用程序，并将这些应用部署到实际环境中。这包括学习如何将LLM集成到各种平台和系统中，以及如何确保这些系统的稳定性和可扩展性。

1. 大语言模型基础

包括了数学基础知识、python基础、神经网络和NLP自然语言四个方面的学习。

1.1 机器学习的数学

线性代数：理解算法的关键。主要概念包括向量、矩阵、行列式、特征值和特征向量、向量空间和线性变换。
微积分：许多机器学习算法涉及连续函数的优化，这需要理解导数、积分、极限和级数。多变量微积分和梯度的概念也很重要。
概率与统计：对于理解模型如何从数据中学习也同样重要。主要概念包括概率论、随机变量、概率分布、期望、方差、协方差、相关性、假设检验、置信区间、最大似然估计和贝叶斯推断。

资源：（可能需要科学上网，国内可访问版本在这里也给出一些链接）

[3Blue1Brown - 线性代数的本质]：教学视频，以生动直观的方式介绍了线性代数的相关概念。
[StatQuest with Josh Starmer - 统计基础]：为许多统计概念提供简单清晰的解释。
[AP Statistics Intuition by Ms Aerin]：博文，比较详细和基础，它是Medium文章，需要科学上网才能访问。
[沉浸式线性代数]：线性代数的另一种视觉解释。
[Khan Academy - 线性代数]：可汗学院的线性代数课程，适合初学者（[B站有中文字幕版]
[Khan Academy - 微积分]：涵盖了所有的基础的微积分知识。
[Khan Academy - 概率与统计]：以易于理解的方式讲授。

1.2 机器学习的Python

Python一直是机器学习和深度学习的首选语言，这得益于其可读性、一致性和鲁棒的数据科学库生态系统。

Python基础：理解基本语法、数据类型、错误处理和面向对象编程。
数据科学库：包括熟悉NumPy进行数值操作，Pandas进行数据操作和分析，Matplotlib和Seaborn进行数据可视化。
数据预处理：涉及特征缩放和规范化、处理缺失数据、异常值检测、分类数据编码以及将数据分割成训练、验证和测试集。
机器学习库：熟练掌握Scikit-learn，这是一个提供了许多监督和非监督学习算法的库。重点需要了解如何实现线性回归、逻辑回归、决策树、随机森林、最近邻(K-NN)和K均值聚类等算法。

资源：

[Real Python]
[freeCodeCamp - 学习Python]：Python中所有核心概念的详细介绍视频。该[官网]的可以访问，但是视频资源需要通过科学上网观看。
[Python数据科学手册]：学习pandas、NumPy、Matplotlib和Seaborn的免费书籍。
[freeCodeCamp - 机器学习入门]：机器学习算法学习。
[Udacity - 机器学习入门]：免费课程，涵盖了PCA和其他几个机器学习概念。

1.3. 神经网络

基础知识：这包括理解神经网络的结构，如层、权重、偏置和激活函数（sigmoid、tanh、ReLU等）。
训练和优化：熟悉反向传播和不同类型的损失函数，如均方误差（MSE）和交叉熵。理解各种优化算法，如梯度下降、随机梯度下降、RMSprop和Adam。
过拟合：理解过拟合的概念（模型在训练数据上表现良好但在未见数据上表现差）并学习各种正则化技术（dropout、L1/L2正则化、早停、数据增强）以防止它。
实现多层感知器（MLP）：使用PyTorch构建一个MLP，也称为全连接网络。

资源：

[3Blue1Brown - 但什么是神经网络？]：直观地解释了神经网络及其内部工作原理。
[吴恩达深度学习]
[lfreeCodeCamp - 深度学习速成课]：深度学习中所有最重要的概念的视频
[Fast.ai - 实用深度学习] ：为想学习深度学习的有编程经验的人设计的免费课程
推荐书籍《一起动手学习深度学习》
[李宏毅深度学习：]更适合中国宝宝的深度学习视频

1.4. 自然语言处理（NLP）

NLP在许多应用中扮演着关键角色，如翻译、情感分析、聊天机器人等。

文本预处理：学习各种文本预处理步骤，如分词（将文本分割成单词或句子）、词干提取（将单词还原为其根形式）、词形还原（类似于词干提取但考虑上下文）、停用词去除等。
特征提取技术：熟悉将文本数据转换为机器学习算法能理解的格式的技术。关键方法包括词袋模型（BoW）、词频-逆文档频率（TF-IDF）和n-gram。
词嵌入：词嵌入是一种单词表示，允许具有相似含义的单词具有相似的表示。关键方法包括Word2Vec、GloVe和FastText。
循环神经网络（RNNs）：理解RNNs的工作原理，这是一种为序列数据设计的神经网络类型。探索LSTMs和GRUs，两种RNN变体，它们能够学习长期依赖关系。

资源：

[RealPython - 使用spaCy进行Python自然语言处理]
[Kaggle - NLP指南]
[Jay Alammar - Word2Vec的插图解释]
[Jake Tae - 从头开始的PyTorch RNN]
[colah的博客 - 理解LSTM网络]：关于LSTM网络的理论性文章。

2. 大语言模型前沿算法和框架

2.1. 大语言模型（LLM）架构

需要清楚地了解模型的输入（token）和输出（logits），而原始的注意力机制（ attention mechanism）是另一个必须掌握的关键部分，因为它是很多改进算法的基础，具体来说需要包括以下技术。

高层视角（High-level view:）：编码器encoder-解码器decoder的Transformer架构，特别是仅有解码器的GPT架构，几乎所有流行LLM都应用了该架构。
令牌化（Tokenization）：如何将原始文本数据转换成模型能理解的格式，这包括将文本拆分成Token（通常是单词或子词）。
注意力机制（Attention mechanisms）：掌握注意力机制的理论，包括自注意力和缩放点积注意力，这使得模型能够在产生输出时关注输入的不同部分。
文本生成（Text generation）：模型生成输出序列的多种方式。常见方法包括了贪婪解码（greedy decoding）、束搜索（beam search）、top-k采样（top-k sampling,）和核心采样（nucleus sampling）。

资源：

Jay Alammar[《揭秘Transformer》]：对Transformer模型进行了直观和形象的解释。
Jay Alammar[《揭秘GPT-2》]：重点讨论了与Llama非常相似的GPT架构。
Brendan Bycroft[《LLM可视化》]：对LLM内部发生情况的进行3D可视化。
Andrej Karpathy[《nanoGPT》]：一个2小时长的YouTube视频，从头开始重新实现GPT（面向程序员）。
Lilian Weng[《注意力？注意力！》]：以更正式的方式介绍注意力机制的需求。
[《LLM中的解码策略》]：提供代码和对生成文本不同解码策略的视觉介绍。

2.2. 构建指令数据集

虽然从维基百科和其他网站可以轻松地找到原始数据，但何如将数据转换为问题和答案的配对配对却很难。而数据集的质量将直接影响模型的质量，它们是大模型微调（finetune）过程中最重要的组成部分。

[Alpaca]“Alpaca”)-样式数据集：使用OpenAI API（GPT）从头开始生成合成数据。你可以指定种子和系统提示以创建多样化的数据集。
高级技术：学习如何通过[Evol-Instruct]改进现有数据集，如何像在[Orca]论文中那样生成高质量的合成数据。
数据过滤：使用正则表达式、移除近似重复项、关注令牌数较多的答案等传统技术。
提示模板：在没有真正标准的问题和答案的情况下，了解不同的聊天模板很重要，比如[ChatML][Alpaca]等。

参考资料:

由Thomas Capelle撰写的[《为指令调优准备数据集》]：探索Alpaca和Alpaca-GPT4数据集及其格式化方法。
由Solano Todeschini撰写的[《生成葡萄牙语临床指令数据集》]：教程，介绍如何使用GPT-4创建合成指令数据集。
由Kshitiz Sahay撰写的[《使用GPT 3.5为新闻分类创建指令数据集》]：使用GPT 3.5创建指令数据集以微调Llama 2进行新闻分类。
[《为LLM微调创建数据集》]：包含一些过滤数据集和上传结果的技术的笔记本。
由Matthew Carrigan撰写的[《聊天模板》]：Hugging Face关于提示模板的页面。

2.3. 模型预训练

是指从大量的无监督数据集中进行模型预训练，模型预训练是一个非常漫长和消费资源的过程，因此它不是本学习路线教程的重点。但是我们可以了解它，以方便后续的学习。它主要包括以下几个部分：

数据管道：预训练需要巨大的数据集（例如，[Llama 2]是在2万亿令牌上训练的），这些数据集需要被过滤、令牌化，并与预定义的词汇表进行整合。
因果语言模型：了解因果和掩码语言模型的区别，以及在这种情况下使用的损失函数。为了有效的预训练，了解更多关于[Megatron-LM]或[gpt-neox]。
规模化定律：[规模化定律]描述了基于模型大小、数据集大小和用于训练的计算量的预期模型性能。
高性能计算：这里不讨论，但如果你计划从头开始创建自己的LLM（硬件、分布式工作负载等），则需要更多关于HPC的知识是基础。

参考资料:

Junhao Zhao[《LLMDataHub》]：为预训练、微调和RLHF策划的数据集列表。
Hugging Face[《从头开始训练因果语言模型》]：使用transformers库从头开始预训练GPT-2模型。
Zhang等人创建的[《TinyLlama》]：检查此项目以了解如何从头开始训练Llama模型。
Hugging Face提供的[《因果语言模型》]：解释因果和掩码语言模型的区别，以及如何快速微调DistilGPT-2模型。
nostalgebraist撰写的[《Chinchilla的狂野含义》]：讨论规模化定律并解释它们对LLM通常意味着什么。
BigScience提供的[《BLOOM》]：Notion页面，描述了如何构建BLOOM模型，包括大量有关工程部分和遇到的问题的有用信息。
Meta提供的[《OPT-175日志》]：研究日志显示了什么出了问题，什么做得对。如果你计划预训练一个非常大的语言模型（在这种情况下，是175B参数），这将非常有用。
[《LLM 360》]：一个开源LLM框架，提供训练和数据准备代码、数据、指标和模型。

2.4. 监督式微调（Supervised Fine-Tuning）

监督式微调就是让我们在已经标注的数据集上对已经预训练好的模型进行再次训练，以符合任务需求，它是一个非常重要的过程。

完全微调（Full fine-tuning）：完全微调指的是训练模型中的所有参数。这不是一种高效的技术，但它产生稍好的结果。
[LoRA]：一种基于低秩适配器的参数高效技术（PEFT）。我们只训练这些适配器，而不是所有参数。
[QLoRA]：另一种基于LoRA的PEFT，它还将模型的权重量化为4位，并引入分页优化器来管理内存峰值。将其与[Unsloth]结合使用，可以在免费的Colab笔记本上有效运行。
[Axolotl]：一个用户友好且强大的微调工具，被用于许多最先进的开源模型。
[DeepSpeed]：高效的预训练和微调LLM，适用于多GPU和多节点设置（在Axolotl中实现）。

参考资料:

由Alpin撰写的[《LLM训练新手指南》]：概述微调LLM时要考虑的主要概念和参数。
由Sebastian Raschka提供的[《LoRA洞察》]：关于LoRA的实际洞察和如何选择最佳参数。
[《自己微调Llama 2模型》]：关于如何使用Hugging Face库微调Llama 2模型的动手教程。
由Benjamin Marie撰写的[《为因果LLM填充训练示例》]：因果LLM填充训练示例的最佳实践。
[《LLM微调初学者指南》]：关于如何使用Axolotl微调CodeLlama模型的教程。

2.5. 通过人类反馈进行强化学习（Reinforcement Learning from Human Feedback）

在监督式微调之后，RLHF是一个用来将LLM产生的答案达到和人类回答差不多的重要步骤。其思想是从人工反馈中学习偏好。它比SFT更复杂，但是该步骤通常被视为可选的。

偏好数据集（Preference datasets）：这些数据集通常包含几个答案，并有某种排名，但是这种数据集更难产生。
[近端策略优化]：这个算法利用一个奖励模型来预测给定文本是否被人类高度评价。然后使用这个预测来优化SFT模型，一般使用基于KL散度加上惩罚的方式来执行。
[直接偏好优化]：DPO简化将其重新构架为一个分类问题。它使用参考模型而不是奖励模型（无需训练），只需要一个超参数，使其更稳定和高效。

参考资料:

由Ayush Thakur撰写的[《使用RLHF训练LLM简介》]：解释为什么使用RLHF减少偏见并提高LLM性能是可取的。
由Hugging Face提供的[《RLHF插图》]：介绍了奖励模型训练和通过强化学习进行微调的RLHF。
由Hugging Face提供的[《StackLLaMA》]：使用transformers库高效对齐LLaMA模型与RLHF的教程。
由Sebastian Rashcka撰写的[《LLM训练：RLHF及其替代方案》]：概述RLHF过程和替代方案，如RLAIF。
[《使用DPO微调Mistral-7b》]：使用DPO微调Mistral-7b模型的教程，并复现[NeuralHermes-2.5]

2.6. 评估（Evaluation）

评估LLM是一个被低估的部分，它既耗时但是又相对可靠。你的下游任务应该决定你想评估什么，但始终记住Goodhart法则：“当一个指标成为目标时，它就不再是一个好的指标。”

传统指标：困惑度和BLEU分数这样的指标不再像以前那样受欢迎，因为在大多数情况下它们是有缺陷的。了解它们以及何时可以应用它们很重要。
通用基准：基于[语言模型评估工具]，[Open LLM排行榜]是通用LLM（如ChatGPT）的主要基准。还有其他流行的基准，如[BigBench]、[MT-Bench等。
特定任务基准：如摘要、翻译和问答等任务有专门的基准、指标甚至子领域（医疗、金融等），如[PubMedQA]用于生物医学问答。
人类评估：最可靠的评估是用户的接受率或人类做出的比较。如果你想知道模型是否表现良好，最简单但最可靠的方式是自己使用它。

参考资料:

由Hugging Face提供的[《固定长度模型的困惑度》]：困惑度概述，包括用transformers库实现它的代码。
由Rachael Tatman撰写的[《自担风险使用BLEU》]：BLEU分数及其许多问题的概述，附有示例。
由Chang等人撰写的[《评估LLM的调查》]：关于评估什么、在哪里评估以及如何评估的综合论文。
由lmsys提供的[《聊天机器人竞技场排行榜》]：基于人类比较的通用LLM的Elo评分。

2.7. 量化

量化是将模型的权重（和激活）使用更低精度进行转换的过程。例如，使用16位存储的权重可以转换为4位表示。这项技术已经越来越重要，因为它可以减少与LLM相关的计算和内存成本，以使其在计算资源更低的设备上运行。

基础技术：了解不同的精度水平（FP32, FP16, INT8等）以及如何使用absmax和零点技术进行朴素量化。
GGUF和llama.cpp：最初设计用于在CPU上运行，[llama.cpp]和GGUF格式已成为在消费级硬件上运行LLM的最受欢迎的工具。
GPTQ和EXL2：[GPTQ]特别是[EXL2]格式提供了惊人的速度，但只能在GPU上运行。模型也需要很长时间才能被量化。
AWQ：这种新格式比GPTQ更准确（困惑度更低），但使用的VRAM更多，不一定更快。

参考资料:

[《量化简介》]：量化概述，absmax和零点量化以及LLM.int8()的代码。
[《使用llama.cpp量化Llama模型》]：关于如何使用llama.cpp和GGUF格式量化Llama 2模型的教程。
[《使用GPTQ进行LLM的4位量化》]：使用GPTQ算法量化LLM的教程，附有AutoGPTQ。
[《ExLlamaV2：运行LLM的最快库》]：关于如何使用EXL2格式量化Mistral模型并使用ExLlamaV2库运行它的指南。
[《理解激活感知权重量化》]由FriendliAI提供：AWQ技术及其优势的概述。

2.8. 新趋势

位置嵌入（Positional embeddings**）**：了解LLM如何编码位置，尤其是[RoPE]这样的相对位置编码方案。实现[YaRN]（通过温度因子乘以注意力矩阵）或[ALiBi]（基于token距离的注意力惩罚）以延长上下文长度。
模型合并（Model merging）：合并训练好的模型已成为创建性能模型而无需任何微调的流行方式。流行的[mergekit]库实现了最受欢迎的合并方法，如SLERP、[DARE]和[TIES]。
专家混合：[Mixtral]因其出色的性能而重新流行化MoE架构。与此同时，OSS社区出现了一种通过合并模型（如[Phixtral]）的frankenMoE，这是一个更便宜且性能良好的选项。
多模态模型：这些模型（如[CLIP]、[Stable Diffusion]或[LLaVA]）处理多种类型的输入（文本、图像、音频等），具有统一的嵌入空间，解锁了强大的应用，如文本到图像。

参考资料:

[《扩展RoPE》]由EleutherAI提供：总结不同位置编码技术的文章。
[《理解YaRN》]由Rajat Chawla提供：YaRN介绍。
[《使用mergekit合并LLM》]：关于使用mergekit合并模型的教程。
[《专家混合解释》]由Hugging Face提供：关于MoEs及其工作原理的详尽指南。
[《大型多模态模型》]由Chip Huyen提供：多模态系统及其近期历史的概述。

3. LLM工程化

在这阶段集中于如何构建和部署基于大语言模型（LLM）的应用程序，以便在生产环境中使用。它分为几个部分，每部分都聚集于LLM应用开发的不同方面：

3.1 运行大型语言模型 (LLMs)

运行LLMs可能会因为硬件要求而变得困难。而我们可以通过Api的方式（如GPT-4）来简单的使用大模型。当然也可以进行本地运行。无论哪种方式，都需要额外的提示和引导技巧（也叫做提示工程， prompting engineer）来提升模型的输出质量。

LLM APIs: API是部署LLMs的一种比较简单的方式，它不要求设备拥有显卡资源，但是这种一般需要付费得到API。这个领域分为私有LLMs([OpenAI], [Google], [Anthropic], [Cohere], 等.) 和开源LLMs ([OpenRouter], [Hugging Face], [Together AI], 等.).
开源LLMs:[Hugging Face Hub]开源了大量的LLMs。你可以直接在[Hugging Face Spaces]中运行其中一些，或者下载并在像[LM Studio]这样的应用程序中或通过CLI与[llama.cpp]或[Ollama]在本地运行它们。
提示工程（Prompt engineering）：常见技术包括零次提示、少数提示、思维链和ReAct。它们在更大的模型上效果更好，也可以适应更小的模型。
结构化输出（Structuring outputs）：大部分任务需要结构化输出，如严格的模板或JSON格式。可以使用[LMQL]、[Outlines]、[Guidance]等库来指导生成并遵循给定的结构。

参考资料:

由Nisha Arya撰写的[使用LM Studio在本地运行LLM]：如何使用LM Studio的简短指南。
由DAIR.AI撰写的[提示工程指南]：提示工程学习
[Outlines - 快速开始]：由Outlines启动的指导生成技术。
[LMQL - 概述]：LMQL语言的介绍。

3.2. 构建向量存储（Building a Vector Storage）

有时候我们想要在特定知识库下让LLMs搜索答案，而检索增强生成（RAG）结合了信息检索（IR）方法的能力，提高文本生成任务的质量和相关性。这种方法在处理需要广泛背景知识或特定信息的任务时特别有用，例如问答、文章撰写、摘要生成等。构建向量存储是构建检索增强生成（RAG）管道的第一步。它涉及文档加载，拆分，生成向量表示（嵌入），并存储等步骤：

文档加载：文档加载器可以处理多种格式：PDF、JSON、HTML、Markdown等。它们还可以直接从一些数据库和API（GitHub、Reddit、Google Drive等）检索数据。
文档拆分：文本拆分器将文档拆分成更小、有语义信息的块。与其在_n_个字符后拆分文本，不如更好地按标题或递归拆分，附加一些额外的元数据。
嵌入模型：嵌入模型将文本转换为向量表示。这对于执行语义搜索至关重要，可以深入并更细致地理解语言。
向量数据库：向量数据库（如[Chroma]、[Pinecone]、[Milvus]、[FAISS]、[Annoy]旨在存储嵌入向量。它们能够根据向量相似度高效检索与查询“最相似”的数据。

参考资料:

[LangChain - 文本拆分器]：LangChain实现的不同文本拆分器列表。
[Sentence Transformers库]：流行的嵌入模型库。
[MTEB排行榜]：嵌入模型的排行榜。
由Moez Ali撰写的[前5大向量数据库]：最好和最流行的向量数据库的比较。

3.3. 检索增强生成 (Retrieval Augmented Generation, RAG)

RAG技术可以使LLMs从数据库检索上下文文档以提高其答案的准确性。RAG是一种流行的增强模型知识的方式，无需任何微调。

协调器（Orchestrators）：协调器（如[LangChain]、[LlamaIndex]、[FastRAG]等）是将LLMs与工具、数据库、记忆等连接并增强其能力的流行框架。
检索器（Retrievers）：用户指令并不是为检索优化的。可以应用不同技术（例如，多查询检索器、[HyDE]来重述/扩展它们并提高性能。
记忆（Memory）：为了记住以前的指令和答案，LLMs和聊天机器人（如ChatGPT）将这个历史添加到它们的上下文窗口中。这个缓冲区可以通过摘要（例如，使用一个较小的LLM）、向量存储+RAG等来改进。
评估：我们需要评估文档检索（上下文的精度和召回率）和生成阶段（保真度和答案相关性）。可以使用工具[Ragas]和[DeepEval]来简化这一过程。

参考资料:

[Llamaindex - 高级概念]：构建RAG管道时需要了解的主要概念。
[Pinecone - 检索增强]：检索增强过程的概述。
[LangChain - 使用RAG的Q&A]：构建典型RAG管道的分步教程。
[LangChain - 记忆类型]：不同类型记忆的列表及其相关用途。
[RAG管道 - 指标]：用于评估RAG管道的主要指标概述。

3.4. 高级RAG

现实生活中的应用可能需要复杂的管道，包括SQL或图数据库，以及自动选择相关工具和API。这些高级技术可以改进基线解决方案并提供额外功能。

查询构造（Query construction）：存储在传统数据库中的结构化数据需要特定的查询语言，如SQL、Cypher、元数据等。我们可以直接将用户指令翻译成查询以访问数据。
代理和工具（Agents and tools）：代理通过自动选择最相关的工具来增强LLMs，以提供答案。这些工具可以简单到使用Google或Wikipedia，或更复杂，如Python解释器或Jira。
后处理（Post-processing:）：向LLM提供输入的最终步骤。它通过重新排列、[RAG-fusion]和分类等方式增强检索到的文档的相关性和多样性。

参考资料:

[LangChain - 查询构造]：关于不同类型查询构造的博客文章。
[LangChain - SQL]：如何使用LLMs与SQL数据库交互的教程，涉及Text-to-SQL和一个可选的SQL代理。
[Pinecone - LLM代理]：介绍不同类型代理和工具。
由Lilian Weng撰写的[LLM驱动的自主代理]：更多关于LLM代理的理论文章。
[LangChain - OpenAI的RAG]：OpenAI采用的RAG策略概述，包括后处理。

3.5. 推理优化（ Inference optimization）

文本生成是一个成本高昂的过程，需要昂贵的硬件资源。除了量化，还提出了各种技术来最大化吞吐量并降低推理成本。

Flash Attention：优化注意力机制，将其复杂度从二次方降低到线性，加速训练和推理。
键值缓存：了解键值缓存以及[多查询注意力]（MQA）和[分组查询注意力]（GQA）中引入的改进。
推测解码：使用小型模型生成草稿，然后由更大的模型审查，以加速文本生成。

参考资料:

[GPU推理]由Hugging Face提供：解释如何在GPUs上优化推理。
[LLM推理]由Databricks提供：如何在生产中优化LLM推理的最佳实践。
[为速度和内存优化LLMs]由Hugging Face提供：解释优化速度和内存的三种主要技术，即量化、Flash Attention和架构创新。
[辅助生成]由Hugging Face提供：HF版本的推测解码，是一篇详细介绍其如何工作的博客，包括实现它的代码。

3.6. 部署LLMs

部署LLMs是一项工程壮举，可能需要多个GPU集群。

本地部署：与私有LLMs相比，开源LLMs可以保护用户隐私，是它的一大优势。本地LLM服务器（[LM Studio]、[Ollama]、[oobabooga]、[kobold.cpp]等）利用这一优势为本地应用提供动力。
demo部署：[Gradio]等框架有助于原型化应用程序并分享demo。你也可以轻松地在线托管它们，例如使用[Hugging Face Spaces]。
服务器部署：在规模上部署LLMs需要云（参见[SkyPilot]）或本地基础设施，并常常利用优化的文本生成框架，如[TGI]、[vLLM]等。
边缘部署：在受限环境中，高性能框架如[MLC LLM]和[mnn-llm]可以在网页浏览器、Android和iOS中部署LLM。

参考资料:

[Streamlit - 构建基础LLM应用]：使用Streamlit制作基础ChatGPT-like应用的教程。
[HF LLM推理容器]：使用Hugging Face的推理容器在Amazon SageMaker上部署LLMs。
[Philschmid博客]由Philipp Schmid撰写：关于使用Amazon SageMaker部署LLM的高质量文章集。
[优化延迟]由Hamel Husain提供：关于TGI、vLLM、CTranslate2和mlc在吞吐量和延迟方面的比较。

7. 保护LLMs

除了与软件相关的传统安全问题外，由于LLMs的训练和提示方式，它们还有独特的弱点。

提示黑客攻击：与提示工程相关的不同技术，包括提示注入（额外指令以劫持模型的答案）、数据/提示泄露（检索其原始数据/提示）和越狱（制作提示以绕过安全功能）。
后门：攻击向量可以针对训练数据本身，通过在训练数据中下毒（例如，使用错误信息）或创建后门（秘密触发器以在推理期间改变模型的行为）。
防御措施：保护你的LLM应用程序的最佳方式是针对这些漏洞测试它们（例如，使用红队测试和像[garak]这样的检查）并在生产中观察它们（使用框架，如[langfuse]）。

参考资料:

[OWASP LLM前10名]由HEGO Wiki提供：LLM应用程序中看到的10个最关键漏洞的列表。
[提示注入入门]由Joseph Thacker提供：专门针对工程师的提示注入的简短指南。
[LLM安全]由[@llm_sec]提供：与LLM安全相关的广泛资源列表。
[LLMs的红队测试]“LLMs的红队测试”)由Microsoft提供：如何使用LLMs进行红队测试的指南。

零基础如何学习AI大模型

领取方式在文末

为什么要学习大模型？

学习大模型课程的重要性在于它能够极大地促进个人在人工智能领域的专业发展。大模型技术，如自然语言处理和图像识别，正在推动着人工智能的新发展阶段。通过学习大模型课程，可以掌握设计和实现基于大模型的应用系统所需的基本原理和技术，从而提升自己在数据处理、分析和决策制定方面的能力。此外，大模型技术在多个行业中的应用日益增加，掌握这一技术将有助于提高就业竞争力，并为未来的创新创业提供坚实的基础。

大模型典型应用场景

①AI+教育：智能教学助手和自动评分系统使个性化教育成为可能。通过AI分析学生的学习数据，提供量身定制的学习方案，提高学习效果。
②AI+医疗：智能诊断系统和个性化医疗方案让医疗服务更加精准高效。AI可以分析医学影像，辅助医生进行早期诊断，同时根据患者数据制定个性化治疗方案。
③AI+金融：智能投顾和风险管理系统帮助投资者做出更明智的决策，并实时监控金融市场，识别潜在风险。
④AI+制造：智能制造和自动化工厂提高了生产效率和质量。通过AI技术，工厂可以实现设备预测性维护，减少停机时间。
…
这些案例表明，学习大模型课程不仅能够提升个人技能，还能为企业带来实际效益，推动行业创新发展。

学习资料领取

如果你对大模型感兴趣，可以看看我整合并且整理成了一份AI大模型资料包，需要的小伙伴文末免费领取哦，无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发

部分资料展示

一、 AI大模型学习路线图

整个学习分为7个阶段

二、AI大模型实战案例

涵盖AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，皆可用。

三、视频和书籍PDF合集

从入门到进阶这里都有，跟着老师学习事半功倍。

四、LLM面试题

五、AI产品经理面试题

如果二维码失效，可以点击下方链接，一样的哦
【CSDN大礼包】最新AI大模型资源包，这里全都有！无偿分享！！！

朋友们如果有需要的话，可以V扫描下方二维码联系领取~

你可能感兴趣的:(语言模型,学习,人工智能,ai,transformer,深度学习)

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
2019-06-05 第十七把巴鲁克
今天去实验田里实习，见到了福寿螺真的可怕且牛皮，六级也快来了，说实话还是害怕。我昨天考了环工原理，真的太难了，太烦了，理工科真的难，烦。实验报告还是没写，要抓紧速度抓紧时间，还是应该学会努力学习，远离一些不上进的事物。
MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
为什么焦虑、抑郁、自残的青少年越来越多？精神健康
很多家长觉得没缺孩子吃的穿的，他们有安稳的生活，他们有什么可焦虑、抑郁的，但现在的孩子，学习压力越来越大，每天休息的时间越来越少，出现焦虑抑郁是很正常的。从发展的角度看，青少年时期，人的身体、情绪，智力、人格都急剧发展，正从未成熟走向成熟，情绪起伏不定，易冲动，再者，由于缺乏生活经验，以及来自于家长、学校、社会的各种要求和压力，从而不知所措，心中的焦虑、恐惧、彷徨得不到及时的排解，从而导致心理上的
读书打卡《别想太多啦》 chenchen_68ed
第一，世间之事，不去尝试永远不知道其中的奥秘，在尝试中有失败是必然的。如果担心失败，那什么都学不会。第二，经历的失败越多，越会对失败者抱有宽容的态度，“原来如此，我也经历过类似的失败啦，那只是暂时的”。经历越多失败的长者，越能包容别人，这也就是所谓的“越年长越宽容”。成熟的人，就是在众多失败经历中不断学习，并接纳别人的失败。对于他人的小小过失不吹毛求疵，自己的心态会更加平和。在不断失败中学习，让自
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
平静得接受自己的笨拙 20190118 晨间日记吴伯符
图片发自App最近做了一个关于微习惯的分享，这里有八个字：微量开始，超额完成。这里的言下之意其实是要你在一开始的时候，平静地接受自己的笨拙。接受自己的笨拙，理解自己的笨拙，放慢速度尝试，观察哪里可以改进，再反复练习，观察自己哪里可以再进一步改进，再反复…这是学习一切技能的必须的过程。这里的两个关键点是：1.尽快的开始这个过程，这就能够用到微习惯的微量开始。2.尽快的度过这个过程，这就需要用到超额完
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
二十四节气组诗谷雨离陌_6639
图片来源网络，若侵犯了你的权益，请联系我删除6.谷雨文/离陌背上行囊背上如行囊的我从此任行程马不停蹄今天家乡的田野春雨快马加鞭播下希望的种子观音不语目送着我和夏天一道在观音山出关图片来源网络，若侵犯了你的权益，请联系我删除你好啊，我是离陌，已然在懵懂中走过了16年的岁月，为了珍惜当下的每一秒，所以立志做一名终身学习者。文学对于我来说是一种信仰，诗歌是我的生命。人生之道，四通八达，即入文学，自当持之
你好，2020年瑄瑄妍妍的妈咪
早上好，今天是2020年的第一天，也就是元旦，新年新的一天开始了。新的开始，重新规划未来的一年。从今天开始，用了一个新的记账软件，之前的随手记软件，也没有删除，只是重新下载了一个别的软件，开始一个新的记账旅程，对于理财开支，有个新的规划。通过小红书视频软件，学习了不少育儿知识，和各种不同的美食，以后动手制作，给宝宝做健康美味的营养餐。学习方面，继续学英语吧！虽然是抽出时间学的，进度也比较慢，但是积
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
《云襄传》：云襄做的局是浑水摸鱼吗？书生号贺
云襄入南都是要浑水摸鱼吗？他是云台的高材生吗？他为啥笃定师父一定会让他留在南都？他为啥觉得他能够做局成功？他是在经商吗？还是在经营人心与欲望？云襄是云台弟子，云台属千门的一支，另一支叫凌渊，云台教人经商之道，重智慧，凌渊以武力取胜，但倍受打压。云襄学习十五年，下高山奔越州，途经南洋，因恩人闻聪被害，囚于白驹镇，念于情分，被卷入这样一个局面里，结识了舒亚南与金十两，于是，复仇小组成立，目标是南都漕帮
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
闭组进行时... 李亚青_强化班
今天是2019年12月1号距离开始三月学习的日子:2019年10月07,已经过去将近两个月，回顾这一阶段的学习，收获了什么?又学会了什么呢?图片发自App我想，收获最大的就是身边这一群人吧,有和蔼可亲的学姐，贴心的学长，嬉戏打闹，玩的不亦乐乎，但也同样认真踏实学习小伙伴图片发自App本以为在这样的时刻，有太多太多话，太多太多想法想要表达，可言到此处，又觉得似乎没有什么想要说的了还是那句话，幸运遇到
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

大语言模型(LLM)入门学习路线图，附资源汇总，收藏这篇就够了

1. 大语言模型基础

1.1 机器学习的数学

1.2 机器学习的Python

1.3. 神经网络

1.4. 自然语言处理（NLP）

2. 大语言模型前沿算法和框架

2.1. 大语言模型（LLM）架构

2.2. 构建指令数据集

2.3. 模型预训练

2.4. 监督式微调（Supervised Fine-Tuning）

2.5. 通过人类反馈进行强化学习（Reinforcement Learning from Human Feedback）

2.6. 评估（Evaluation）

2.7. 量化

2.8. 新趋势

3. LLM工程化

3.1 运行大型语言模型 (LLMs)

3.2. 构建向量存储（Building a Vector Storage）

3.3. 检索增强生成 (Retrieval Augmented Generation, RAG)

3.4. 高级RAG

3.5. 推理优化 （ Inference optimization）

3.6. 部署LLMs

7. 保护LLMs

零基础如何学习AI大模型

为什么要学习大模型？

大模型典型应用场景

学习资料领取

部分资料展示

一、 AI大模型学习路线图

二、AI大模型实战案例

三、视频和书籍PDF合集

四、LLM面试题

五、AI产品经理面试题

你可能感兴趣的:(语言模型,学习,人工智能,ai,transformer,深度学习)

3.5. 推理优化（ Inference optimization）