AI拉呱_

为什么RAG，如何RAG和怎么做RAG?

*大家好，我是AI拉呱，一个专注于人工智领域与网络安全方面的博主，现任资深算法研究员一职，热爱机器学习和深度学习算法应用，拥有丰富的AI项目经验，希望和你一起成长交流。关注AI拉呱一起学习更多AI知识。

文章目录

什么是 RAG？

RAG 应用

RAG 是如何工作的？

索引

检索

增强

生成

RAG 的优势与挑战

RAG 的优势

RAG 的挑战

RAG 必知术语

RAG 学习路线图

RAG 开发者栈

什么是 RAG？

检索增强生成（RAG）是一种流行的技术，通过在生成答案之前从知识库中检索相关的外部知识来增强 LLM 的响应。RAG 提高了准确性，减少了幻觉，并使模型能够提供更符合上下文和更新的信息。

RAG 包括三个步骤：检索、增强和生成。

检索 - 在此步骤中，系统会在外部知识源（例如向量数据库）中搜索相关信息，以基于用户查询找到相关的信息。

增强 - 检索到的信息随后与原始用户查询结合，形成 LLM 的提示。

生成 - LLM 处理提示并生成响应，整合其预训练知识和检索到的信息。这使得响应更加准确且符合上下文。

让我们通过一个简单的例子来理解 RAG。

1 - 用户提出查询

示例：2025年ICC冠军奖杯的获胜者是谁？

2 - 检索器在知识源（例如维基百科或互联网）中搜索，并返回相关上下文。

示例检索上下文："2025年ICC冠军奖杯于2月19日至3月9日在巴基斯坦和阿拉伯联合酋长国举行，最终印度成为胜利的冠军，赢得了该赛事历史上的第三个冠军。主要由巴基斯坦主办——这是自1996年以来他们的首次全球板球赛事——该赛事实施了混合模式，由于地缘政治考虑，印度的所有比赛都在迪拜进行。决赛在迪拜国际板球场上演了一场紧张的比赛，印度以四个门柱的优势击败新西兰，追平了252分的目标，并且还剩下一局。 "

3 - 查询、相关上下文和指令被组合成一个提示。

示例提示：

"仅根据上下文回答查询。如果在上下文中找不到查询的答案，请回复 - 我无法回答该查询。

查询：2025年ICC冠军奖杯的获胜者是谁？

*上下文：*2025年ICC冠军奖杯于2月19日至3月9日在巴基斯坦和阿拉伯联合酋长国举行，最终印度成为胜利的冠军，赢得了该赛事历史上的第三个冠军。主要由巴基斯坦主办——这是自1996年以来他们的首次全球板球赛事——该赛事实施了混合模式，由于地缘政治考虑，印度的所有比赛都在迪拜进行。决赛在迪拜国际板球场上演了一场紧张的比赛，印度以四个门柱的优势击败新西兰，追平了252分的目标，并且还剩下一局。"

4 - 提示被输入到大型语言模型 (LLM) 中，LLM 根据提供的上下文为用户查询生成答案。

示例输出：“印度在迪拜国际板球场举行的决赛中以四个门柱的优势击败新西兰，赢得了2025年ICC冠军奖杯。”

RAG 应用

AI 搜索引擎

AI 搜索引擎使用 RAG 通过将大型语言模型与实时数据检索相结合来增强搜索结果，提供准确且符合上下文的答案。它们擅长理解自然语言查询并从海量数据集中提取信息，使搜索更加直观和高效。

客户服务聊天机器人

客户服务聊天机器人利用 RAG 通过检索公司特定数据（如常见问题或产品手册）并生成类似人类的回复，提供个性化和准确的响应。这缩短了响应时间，提高了客户满意度，并处理了超出简单脚本答案的复杂查询。

法律文件分析

法律文件分析采用 RAG 筛选大量的法律文本、合同或判例法，检索相关的条款或先例，并用通俗易懂的语言总结它们。它通过加速研究、确保准确性并从密集的文档中识别关键见解来帮助律师。

科学研究辅助

科学研究辅助使用 RAG 通过检索和综合来自科学论文、数据集或实验的信息，为研究人员提供简洁的摘要或假设。它简化了文献综述、事实核查和跨大量研究存储库探索复杂主题的过程。

医疗决策支持

医疗决策支持将 RAG 集成到患者数据、医学文献或治疗指南中，协助医生做出基于证据的建议或诊断。它通过提供最新的、特定上下文的见解来增强决策过程，同时优先考虑患者隐私和准确性。

个性化教育

个性化教育应用 RAG 定制学习体验，检索相关的教育资源并生成适合学生学习进度和理解水平的解释。它通过适应个人需求并有效填补知识空白来支持导师或自学者。

技术文档搜索

技术文档搜索利用 RAG 导航复杂的手册、代码库或故障排除指南，检索精确的解决方案并清晰地解释它们。它通过快速解决技术查询并提供具有上下文感知的详细响应，为开发人员和工程师节省时间。

RAG 是如何工作的？

RAG 包括四个步骤，即索引、检索、增强和生成。索引步骤仅执行一次，而检索、增强和生成步骤会针对每个用户查询重复执行。

索引

RAG 中的索引涉及处理原始文档，首先提取其内容（解析），然后将它们拆分为更小且有意义的块。这些块随后使用嵌入模型转换为向量嵌入，并存储在向量数据库中，以便在查询时进行高效检索。

解析：从文档（PDF、网页等）中提取原始文本。
分块：将文本拆分为更小且有意义的段落以供检索。
编码：使用嵌入模型将块转换为密集向量嵌入。
存储：将嵌入保存在向量数据库中，以实现快速相似性搜索。

检索

用户提出一个查询，该查询使用索引步骤中使用的相同嵌入模型转换为密集向量（嵌入）。然后使用此向量表示进行 语义搜索，以从向量数据库中找到最相关的块信息。

查询：用户输入一个问题或提示。
编码：使用嵌入模型将查询转换为密集向量表示。
语义搜索：将编码后的查询与向量数据库中的嵌入进行比较，以找到最相关的嵌入。
相关块：检索到的文本块作为生成响应的上下文返回。

增强

在此步骤中，检索到的相关块被组合形成上下文。然后将查询与该上下文合并，以构建 LLM 的提示。

组合：相关块被组合以形成上下文。
增强：查询与上下文合并以创建 LLM 的提示。

生成

在此步骤中，提示被传递给 LLM。LLM 处理提示并根据查询和上下文生成响应。

传递：包含查询和上下文以及指令的提示被传递给 LLM。
生成：LLM 处理提示并根据查询和提供的上下文生成响应。

RAG 的优势与挑战

RAG 的优势

提高准确性

检索增强生成（RAG）通过从外部来源提取相关数据来提升响应的精确性。这减少了对预训练知识的依赖，确保答案更加真实和及时。

支持实时更新

RAG 可以通过查询实时或频繁更新的来源来整合最新信息。这使得响应能够与当前事件或发展保持一致。

上下文相关性

RAG 通过检索与用户查询相关的特定信息来定制响应。这导致了更有意义且更符合上下文的响应，从而提高了用户满意度。

减少幻觉

通过将响应基于检索到的上下文，RAG 最小化了虚构或不正确的输出。这在处理复杂或专业主题时尤其提升了可靠性。

成本效益

RAG 通过利用外部检索避免了持续的模型重新训练需求。这节省了计算资源，同时保持高性能。

提高用户信任

RAG 对可验证、检索到的信息的依赖增强了对其输出的信心。用户认为响应更具可信度和权威性。

更好地处理专业主题

RAG 通过访问目标数据，在解决专业化或罕见主题方面表现出色。即使对于较少见的询问，这也确保了详细和知情的响应。

RAG 的挑战

检索增强生成（RAG）是一种结合大型语言模型与外部知识检索的技术，用于提升响应的准确性和相关性。尽管功能强大，但它面临一些挑战：

检索准确性

检索块的质量至关重要。如果检索系统获取了无关、过时或低质量的信息，生成的输出可能具有误导性或不正确。

上下文相关性

确保检索到的内容与查询意图一致可能会很棘手。匹配不佳的块可能会混淆模型或稀释响应。

可扩展性

从大型、动态的知识库中高效搜索和检索需要大量的计算资源和优化索引，这可能代价高昂或速度较慢。

延迟

两步过程（检索然后生成）可能会引入延迟，这在没有仔细优化的情况下使其不太适合实时应用。

幻觉风险

即使有检索，如果检索到的数据模棱两可或不足，模型可能会生成看似合理但无根据的细节。

偏差和噪声

检索到的内容可能携带来自网络或其他来源的偏差、错误或无关噪声，这些可能会传播到输出中。

RAG 必知术语

以下是必须了解的 RAG 术语：

查询 (Query) - 用户提供的输入文本或问题，用于检索相关信息。它指导 RAG 系统中的检索和生成过程。
块 (Chunk) - 较大文档的小段，通常是段落或句子。分块有助于提高 RAG 中的检索效率和相关性。
分块 (Chunking) - 将大文本分解为更小、有意义的段的过程。这确保了高效的存储、检索和上下文相关性。
嵌入 (Embedding) - 捕捉语义意义的文本数值表示。它在向量空间中实现高效的相似性比较。
索引 (Indexing) - 以结构化方式组织和存储嵌入，以便快速检索。它帮助在大型数据集中高效定位相关信息。
向量存储 (Vector Store) - 一种专门的数据库，将文本嵌入存储为向量。它支持基于相似性的快速准确检索。
检索 (Retrieval) - 基于查询获取相关信息块的过程。这是通过外部知识增强 LLM 的关键步骤。
语义搜索 (Semantic Search) - 一种根据意义而非确切词语查找结果的搜索技术。它使用嵌入来捕捉上下文相似性。
关键词搜索 (Keyword Search) - 一种传统的搜索方法，匹配确切的单词或短语。它不考虑语义意义，只考虑文本出现情况。
混合搜索 (Hybrid Search) - 关键词搜索和语义搜索的结合。它通过利用两种技术平衡精确度和召回率。
增强 (Augmentation) - 在将查询传递给 LLM 之前，用检索到的信息增强输入查询。它提供额外的上下文以提高响应质量。
上下文 (Context) - 帮助 LLM 生成相关响应的周围信息。在 RAG 中，它是通过合并检索到的相关块获得的。
上下文窗口 (Context Window) - LLM 一次可以处理的最大标记数。
提示 (Prompt) - 提供给 LLM 以生成响应的格式化输入。它包括用户查询、检索到的上下文和指令。
提示工程 (Prompt Engineering) - 设计有效提示以引导 LLM 响应的实践。它优化清晰度、结构和意图以获得更好的输出。
生成 (Generation) - LLM 根据给定提示生成文本的过程。它综合信息以生成连贯且相关的响应。
大型语言模型 (LLM) - 在大量文本数据上训练的神经网络，能够理解和生成类似人类的语言。它通过解释查询和生成响应为 RAG 系统提供动力。
温度 (Temperature) - 控制 LLM 输出随机性的参数。较高的值产生更多样化的响应，而较低的值使它们更具确定性。
响应 (Response) - LLM 针对查询生成的输出。它受到检索、上下文和指令的影响。

RAG 学习路线图

Python 编程语言

Python 是 RAG 开发的主要语言，因为它拥有丰富的 AI 生态系统。它提供了如 LangChain、LlamaIndex 和 sentence-transformers 等库，用于无缝实现。

生成式 AI 基础

了解生成式 AI 模型的工作原理，包括文本生成、图像生成和多模态 AI，对于构建 RAG 应用程序至关重要。

LLM 基础

大型语言模型（LLMs）在大规模数据集上进行训练，以生成类似人类的文本。RAG 系统使用 LLM 来解释用户查询并根据检索到的上下文生成响应。

LLM 框架（LangChain 或 LlamaIndex）

这些框架提供了内置功能来开发 RAG 应用程序。

分块

分块意味着将文档拆分为小块，以便可以将相关块提供给 LLM。不同的分块策略包括固定大小分块、递归分块、代理分块、语义分块等。

数据提取

从非结构化文档（PDF、HTML、文本等）中提取结构化数据是构建 RAG 中的知识库所必需的。

嵌入

嵌入将文本转换为高维数值向量，捕捉语义意义。它们用于 RAG 系统中的相似性搜索、检索和文档聚类。

向量数据库

像 FAISS、ChromaDB 和 Weaviate 这样的向量数据库能够高效地存储和检索嵌入。它们支持快速语义搜索，以找到适用于 LLM 的相关块。

RAG 基础

检索增强生成（RAG）通过在生成之前检索相关知识来增强 LLM。这提高了准确性，减少了幻觉，并实现了实时更新。

从零开始实现 RAG

从零构建 RAG 系统涉及设计检索、分块、索引、嵌入存储和查询机制，而不依赖于预建框架。

使用 LangChain 或 LlamaIndex 实现 RAG

这些框架通过提供用于文档加载、嵌入、检索和 LLM 集成的内置工具简化了 RAG 实现。

代理基础

代理使用推理、记忆和工具使用与外部系统交互并自动化复杂工作流。由 LLM 驱动的代理可以动态检索和处理数据。

代理 RAG

代理 RAG 将基于检索的知识与自主代理能力相结合。它使 LLM 能够进行迭代查询、优化答案并根据检索到的信息采取行动。

高级 RAG 技术

高级技术包括混合检索（语义+关键词搜索）、查询重写、重新排序等。

构建 RAG 应用

构建现实世界的 RAG 应用涉及集成 UI、后端逻辑和数据库。使用 Streamlit、FastAPI 或 Flask 创建交互式的基于 RAG 的系统。

RAG 评估与监控

评估 RAG 模型需要诸如检索精度、幻觉率和响应相关性等指标。像 LangSmith 这样的监控工具有助于分析系统性能。

部署 RAG 应用

部署 RAG 应用涉及在 AWS、Azure 或 Google Cloud 等云平台上托管模型、向量数据库和检索管道，以实现可扩展访问。

RAG 开发者栈

RAG 开发者的栈包括大型语言模型（LLMs）、LLM 框架、向量数据库、数据提取库、开源 LLM 访问平台、文本嵌入和评估库。

LLMs（大型语言模型）

强大的 AI 模型，基于大量文本数据训练生成类似人类的响应。LLMs 是 RAG 的核心，支持自然语言理解和生成。

LLM 框架

像 LangChain、Llama Index 等 LLM 框架通过提供内置工具简化了使用 LLM 构建应用程序的过程。这些框架避免了从零开始编写代码，并加速了 LLM 应用程序的开发。

向量数据库

一种专门的数据库，将文本嵌入存储和索引为高维向量。它能够快速高效地检索语义相似的内容，适用于 RAG 应用程序。

数据提取库

数据提取库帮助从各种文档中提取数据，例如网页、PDF、Word 文档、图像、PowerPoint 演示文稿等。一旦数据被提取，数据会被分块、编码，然后作为嵌入存储在向量数据库中。

开源 LLM 访问

开源 LLM 访问平台提供了对开源 LLM 的访问，使其能够在本地或自定义设置上运行。这些平台使开发者能够为 RAG 应用程序使用成本效益高且可定制的模型。

文本嵌入

这些技术将文本转换为数值向量，捕捉用于相似性比较的语义意义。它们在 RAG 的检索步骤中检索相关文档或块时至关重要。

评估

评估 RAG 应用程序的性能以了解其优缺点至关重要。为此，我们有如 RAGAS、Giskard、Trulens 等库。

关注“AI拉呱公众号”一起学习更多AI知识！

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
【备孕故事】她一直想做个大差不离的人，没想到在这件事上拔了尖儿宜嘉阿姨
图片发自App杨婷说从小到大自己就是个中规中矩的人，不出格，不落单，一直随着大流。学业上从未出类拔萃，却也跟着大部队一起考上了一本；做事从不冒尖，搞个大差不离就行，因此，这么多年以来，差不多就行成了她对自己人生的要求。22岁大学毕业进了一家国企，外型不出挑但文静可人的她也遇上了两位追求者，简单的观察和交往后，她从中选了李广作为自己的婚恋对象。25岁那年，在父母亲朋的祝福声中杨婷和李广步入了婚姻。婚
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
今天的彭格列依然被世界游戏吓得瑟瑟发抖呢云染舒倦
前言有一天，有一个白兰的大魔王想要毁灭世界，创世者非常不高兴，于是，创始者用吞噬一切，包容一切的大空（泽田纲吉）、捉摸不定的雾（六道骸）、孤高的浮云（云雀恭弥）、愤怒的忠岚（狱寺隼人）、晕染一切的雨（山本武）、守护之雷（蓝波）、热血之晴（晴川了平）创造了七位拯救世界的勇士（用属性制造勇士），让他们跟白兰对抗。。。［白兰的力量是游戏，于是要打败他，只要同样在世界布置的游戏中，赢过白兰就行了~］图片发
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
大模型量化终极对决：FP8 vs AWQ INT4，谁才是性能与精度的王者？曦紫沐大模型人工智能大模型量化 FP8 AWQ_INT4
摘要在大模型部署与优化中，量化技术是突破性能瓶颈的关键。FP8量化与AWQINT4量化作为当前主流方案，分别以“高精度”和“极致压缩”为核心优势。本文通过表格对比二者的数据格式、精度损失、硬件依赖及适用场景，助您在不同需求下精准选择最优方案。一、数据格式：浮点与整数的底层差异FP8量化采用浮点数（FP8），包含E4M3（4位阶码+3位尾数）和E5M2（5位阶码+2位尾数）两种格式，保留动态范围；而
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
2019-04-05 诚信装饰祝希信
2019年4月5日星期五天气晴(451)六年级七班祝全文今天是清明节，都放假了，好多人外出游玩踏青。一大早醒来去提水浇菜园子，全文还在呼呼睡大觉，浇完菜园子，简单吃了点饭就去干活了。中午回到家，厨房里乱七八糟，全文自己的脏衣服也没有洗，心里感觉真不是滋味，怎么会这样？优秀的孩子不是这样的，是我不该发脾气吗？还是回家继续忙碌，他人爱怎么怎么？家庭是共同的家庭，应该都有责任去承担，不要整天说来说去。全
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
打油旧作一首三闲居士a
又是一个春天，找出去年的一首打油，发在这里，温故而知新。沁园春晨练即景东风送暖，大地春回，无限妖娆。看仓圣公园，百花争艳，湖波荡漾，景色美妙。周末假日，游人如织，欢声笑语人如潮。一大早，更聚众晨练，男女老少。公园如此美好，引晨练人众呈英豪。有你吹铜管，我拉丝弦，这厢羊叫，那边驴嚎；电子音响，高音喇叭，锣鼓铙钹使劲敲。耳欲聋，看闹闹哄哄，乱七八糟。
朝前看，别向后看嘿嘉睿1996
人是应该向前看，不要向后看的。虽然有的时候生母亲的气，觉得她之前做过种种不正确的教育方式，之前她的心态和情绪都不太好，可能是因为更年期，也可能是因为生活压力大，不顺心的事情很多，不过现在好很多了，打电话的时候听到话语里她积极向上的语气，瞬间就不生气了。何必那么过分纠结过去的事情呢，非要争个你对我错，你死我活，你赔礼个道歉我补偿个心里安慰。想起过去的事情，叹口气，吐吐舌头，笑一下，吸取个经验教训，然
免费编程课程大汇总：从入门到精通的一站式资源大力出奇迹985 人工智能大数据
在数字化时代，编程已成为一项至关重要的技能，无论是为了职业发展还是个人兴趣，学习编程都极具价值。本文精心汇总了丰富的免费编程课程资源，涵盖从基础入门到精通的各个阶段。通过全面介绍如Coursera、edX等在线学习平台，Codecademy、freeCodeCamp等交互式学习网站，以及B站、网易云课堂等视频课程平台的免费课程，为编程学习者提供了一站式的资源指南，帮助读者轻松开启编程学习之旅，逐步
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
神经形态计算如何突破冯·诺依曼架构限制？ AI算力网络与通信 AI人工智能与大数据技术 AI算力网络与通信原理 AI人工智能大数据架构架构 ai
神经形态计算如何突破冯·诺依曼架构限制？关键词：神经形态计算、冯·诺依曼架构、内存墙、存算一体、脉冲神经网络、类脑芯片、低功耗计算摘要：本文将从“冯·诺依曼架构的前世今生”讲起，用“图书馆管理员搬书”的生活案例类比其核心矛盾，再通过“人脑神经元工作模式”的比喻引入神经形态计算的核心原理。我们将一步步拆解冯·诺依曼架构的三大限制（内存墙、高功耗、非结构化数据处理弱），并对应解析神经形态计算的三大突破
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f