AGI大模型与大数据研究院

AI原生应用实战：使用Python实现检索增强生成(RAG)系统

关键词：检索增强生成(RAG)、大语言模型(LLM)、向量数据库、文本嵌入、知识增强

摘要：本文将带您从零开始构建一个「检索增强生成（RAG）系统」，解决大语言模型（LLM）「知识过时」「事实错误」「无法访问私有数据」的核心痛点。我们将通过生活案例类比、Python代码实战、关键原理拆解三个维度，用「给小学生讲故事」的语言风格，帮您彻底掌握RAG系统的底层逻辑与实现方法。

背景介绍

目的和范围

当您问ChatGPT「2024年最新的iPhone16参数」或「公司内部的客户投诉处理流程」时，它可能会「一本正经地胡说八道」——这就是大语言模型（LLM）的两大硬伤：知识截止到训练日期（如GPT-4截止2024年4月）、无法访问私有数据。
检索增强生成（Retrieval-Augmented Generation，简称RAG）正是解决这两个问题的「特效药」：通过「先检索后生成」的流程，让LLM能动态调用最新/私有知识库，生成更可靠的回答。本文将覆盖RAG系统的核心组件、实现步骤与实战案例。

预期读者

有基础Python编程能力（会用pip安装库、写函数）
对大语言模型（如GPT、Llama）有初步了解
想开发「能调用外部知识」的AI应用（如企业智能客服、行业知识库助手）

文档结构概述

本文将按照「概念→原理→实战」的顺序展开：

用「写论文」的故事类比RAG核心流程
拆解「检索模块」「生成模块」「知识拼接」三大核心组件
用Python代码实现从「知识库构建→向量检索→LLM生成」的完整流程
分析实际应用场景与未来优化方向

术语表

术语	通俗解释
文本嵌入（Embedding）	把一段文字变成「数字指纹」（比如把「苹果」变成[0.1, 0.3, -0.2]这样的向量）
向量数据库	专门存「数字指纹」的「智能图书馆」，能快速找到相似内容
余弦相似度	衡量两个「数字指纹」有多像的「尺子」（值越接近1越像）
Prompt工程	教LLM「如何用知识」的「话术设计」（比如：「根据以下资料回答问题：…」）

核心概念与联系

故事引入：写论文的「人类版RAG」

假设你要写一篇《2024年新能源汽车电池技术进展》的论文，你的流程会是：

检索：去图书馆/知网查2024年的最新论文、行业报告（找相关知识）
生成：把查到的资料读明白，结合自己的理解写成论文（用知识输出内容）

这其实就是人类版的RAG系统！

你的大脑是「生成模型」（LLM），但记不住所有最新知识；
图书馆/知网是「外部知识库」，帮你补充最新信息；
查资料的过程是「检索模块」，写论文的过程是「生成模块」。

RAG系统做的，就是让AI像人写论文一样：先找可靠资料，再用资料生成答案。

核心概念解释（像给小学生讲故事）

核心概念一：检索模块——AI的「资料查找员」

检索模块的任务是：从海量知识库中，快速找到和用户问题「最相关」的内容。
比如你问「如何种植苹果树」，检索模块需要从知识库中挑出「苹果树种植步骤」「常见病虫害防治」等资料，而不是「梨树种植」或「手机维修」的内容。

它的关键是「如何判断相关性」？这里用的是「文本嵌入+向量检索」：

文本嵌入：把每段知识（比如「苹果树需要每天浇水」）变成一个「数字指纹」（向量），就像给每个知识贴一个「数学标签」。
向量检索：把用户问题也变成「数字指纹」，然后在向量数据库里找「指纹最像」的知识（用余弦相似度计算）。

核心概念二：生成模块——AI的「答案作家」

生成模块的任务是：把检索到的知识和用户问题结合，生成通顺、准确的回答。
比如检索到「苹果树需要每天浇水，雨季需排水」，用户问「苹果树怎么浇水？」，生成模块需要输出：「苹果树建议每天浇水，遇到雨季要注意及时排水防涝。」

它的关键是「如何让LLM用好知识」？这里用的是「Prompt工程」：设计一个「话术模板」，告诉LLM「这是用户的问题，这是找到的资料，你需要根据资料回答」。

核心概念三：知识拼接——AI的「资料整理员」

知识拼接的任务是：把检索到的多条知识「理清楚」，用LLM能理解的方式传给它。
比如检索到3段资料，可能需要合并重复内容、控制总长度（避免超过LLM输入限制）、标注资料来源（提高可信度）。

核心概念之间的关系（用小学生能理解的比喻）

三个模块就像「外卖三兄弟」：

检索模块是「骑手」：负责从「知识库餐厅」里快速取到「用户最想吃的菜」（相关知识）；
知识拼接是「打包员」：把骑手取来的菜（知识）整理好，装进餐盒（格式化为LLM能读的输入）；
生成模块是「厨师」：根据餐盒里的菜（知识）和用户订单（问题），炒出一盘好吃的菜（答案）。

核心概念原理和架构的文本示意图

用户问题 → [检索模块] → 找到相关知识 → [知识拼接] → 整理成「问题+知识」输入 → [生成模块] → 输出答案

Mermaid 流程图

graph TD
    A[用户提问] --> B[文本嵌入]
    B --> C[向量数据库检索]
    C --> D[获取前K条相关知识]
    D --> E[知识拼接（整理/截断）]
    E --> F[构造Prompt（问题+知识）]
    F --> G[大语言模型生成]
    G --> H[输出答案]

核心算法原理 & 具体操作步骤

RAG系统的核心是「检索→生成」的闭环，我们分三步拆解：

步骤1：文本嵌入——把文字变成「数字指纹」

要让计算机「理解」文字的相关性，必须把文字转成向量（数学上的点）。这个过程叫「文本嵌入」，常用模型有：

Sentence-BERT（开源，免费）：适合处理中文，对短文本效果好；
OpenAI Embeddings（需API，付费）：对长文本和复杂语义效果更好；
Llama Embeddings（开源，需本地部署）：适合私有化部署场景。

数学原理：文本嵌入模型本质是一个「语义编码器」，输入文本，输出一个固定长度的向量（如1536维）。两个文本的向量越接近（余弦相似度越高），语义越相关。

余弦相似度公式：
$\text{相似度} = \frac{\mathbf{A} \cdot \mathbf{B}}{||\mathbf{A}|| \times ||\mathbf{B}||}$
其中 $\mathbf{A}$ 和 $\mathbf{B}$ 是两个文本的向量， $\cdot$ 是点积， $||\cdot||$ 是向量的模长。

步骤2：向量检索——在「数字指纹库」里找最像的

向量数据库（如FAISS、Pinecone）能高效存储和检索向量。它的核心是「近似最近邻（ANN）算法」，比暴力搜索快1000倍以上。

举个例子：假设知识库有100万条知识，每条存成1536维的向量。用户问题转成向量后，向量数据库能在0.01秒内找到「最像」的5条知识（而暴力计算100万次相似度需要几十秒）。

步骤3：生成回答——用知识「教」LLM说话

LLM本身不知道「如何用知识」，需要通过Prompt明确指令。常见的Prompt模板：

用户问题：{问题}  
已知信息：{检索到的知识}  
请根据已知信息，用口语化的中文回答用户问题。如果已知信息中没有相关内容，请回答「我需要更多信息来回答这个问题」。

数学模型和公式 & 详细讲解 & 举例说明

文本嵌入的向量空间

假设我们有两段文本：

文本1：「苹果是一种水果」
文本2：「香蕉是一种水果」

用Sentence-BERT编码后，得到两个向量：
$\mathbf{V1} = [0.2, 0.5, -0.1, ...]$ （1536维）
$\mathbf{V2} = [0.3, 0.4, -0.2, ...]$ （1536维）

计算它们的余弦相似度：
$\text{相似度} = \frac{(0.2×0.3)+(0.5×0.4)+(-0.1×-0.2)+...}{\sqrt{0.2²+0.5²+(-0.1)²+...} × \sqrt{0.3²+0.4²+(-0.2)²+...}} ≈ 0.85$
这个值接近1，说明两段文本语义相似（都在讲「水果」）。

向量检索的「最近邻」逻辑

假设用户问题是「哪些水果富含维生素C」，编码后的向量是 $\mathbf{V_q}$ 。向量数据库中存储了：

知识1（苹果）： $\mathbf{V1}$ （相似度0.75）
知识2（橙子）： $\mathbf{V2}$ （相似度0.92）
知识3（土豆）： $\mathbf{V3}$ （相似度0.30）

检索模块会返回相似度最高的「橙子」相关知识，因为它和用户问题最相关。

项目实战：代码实际案例和详细解释说明

开发环境搭建

需要的库：

langchain（简化RAG流程）
faiss-cpu（向量数据库）
sentence-transformers（文本嵌入模型）
openai（如果用GPT生成）

安装命令：

pip install langchain faiss-cpu sentence-transformers openai

源代码详细实现和代码解读

我们以「企业产品知识库」为例，实现一个「能回答产品问题」的RAG系统。假设知识库有以下内容：

产品A：充电5分钟，使用2小时，支持Type-C接口。  
产品B：防水等级IP67，适合户外使用，电池容量5000mAh。  
产品C：支持无线充电，重量仅80g，适合学生群体。

步骤1：构建知识库（加载数据）

# 1. 定义知识库内容
knowledge_base = [
    "产品A：充电5分钟，使用2小时，支持Type-C接口。",
    "产品B：防水等级IP67，适合户外使用，电池容量5000mAh。",
    "产品C：支持无线充电，重量仅80g，适合学生群体。"
]

步骤2：文本嵌入（用Sentence-BERT）

# 2. 初始化文本嵌入模型（Sentence-BERT中文模型）
from sentence_transformers import SentenceTransformer
embedding_model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')

# 3. 对知识库内容生成嵌入向量
embeddings = embedding_model.encode(knowledge_base)

步骤3：构建向量数据库（FAISS）

# 4. 初始化FAISS向量数据库（维度=模型输出维度）
import faiss
dimension = embeddings.shape[1]  # 获取向量维度（这里是384维）
index = faiss.IndexFlatL2(dimension)  # 使用L2距离（也可以用余弦相似度）
index.add(embeddings)  # 将知识库向量存入数据库

步骤4：实现检索函数（根据问题找知识）

def retrieve_knowledge(question, top_k=2):
    # 1. 对问题生成嵌入向量
    question_embedding = embedding_model.encode([question])
    # 2. 在FAISS中检索最相似的top_k条知识
    distances, indices = index.search(question_embedding, top_k)
    # 3. 提取知识内容（注意：indices是知识库的索引）
    retrieved_knowledge = [knowledge_base[i] for i in indices[0]]
    return retrieved_knowledge

步骤5：生成回答（用LLM结合知识）

这里用OpenAI的GPT-3.5-turbo作为生成模型（需要API Key）：

import openai
openai.api_key = "你的API Key"

def generate_answer(question, knowledge):
    # 构造Prompt（告诉LLM用知识回答）
    prompt = f"""
    用户问题：{question}
    已知信息：{knowledge}
    请根据已知信息，用口语化的中文回答用户问题。如果已知信息中没有相关内容，请回答「我需要更多信息来回答这个问题」。
    """
    # 调用GPT生成回答
    response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": prompt}]
    )
    return response.choices[0].message.content.strip()

步骤6：整合全流程（用户提问→检索→生成）

def rag_pipeline(question):
    # 1. 检索相关知识
    knowledge = retrieve_knowledge(question)
    # 2. 生成回答
    answer = generate_answer(question, knowledge)
    return answer

代码解读与分析

文本嵌入：使用paraphrase-multilingual-MiniLM-L12-v2模型，支持中文且速度快，适合中小规模知识库；
向量数据库：FAISS的IndexFlatL2是最基础的暴力检索索引（适合演示），实际生产中可以用IndexIVFFlat提升速度；
Prompt设计：明确要求LLM「根据已知信息回答」，避免它「编造知识」；
可扩展性：可以替换嵌入模型（如换成OpenAI Embeddings）、向量数据库（如Pinecone）、生成模型（如Llama-2）。

实际应用场景

场景1：企业智能客服

企业私有知识库（如产品手册、常见问题）通过RAG系统接入客服，AI能准确回答「产品A的充电时间」「产品B的防水等级」等问题，替代70%的人工客服。

场景2：行业知识助手

律师/医生/教师等专业人士可以上传行业报告、案例库，RAG系统能快速检索「类似法律案例」「最新医疗指南」「教学方法」，辅助决策。

场景3：个性化内容生成

电商平台可以将「用户历史购买记录」「商品详情」作为知识库，RAG系统生成「针对该用户的商品推荐理由」，提升转化率。

工具和资源推荐

类型	工具/资源	特点
文本嵌入模型	Sentence-BERT（开源）	免费、中文支持好，适合中小项目
	OpenAI Embeddings（API）	效果好、支持长文本，需付费
向量数据库	FAISS（开源）	本地部署、适合演示/小项目
	Pinecone（云服务）	托管服务、高并发支持，适合生产环境
生成模型	GPT-3.5/4（API）	效果最优、需付费
	Llama-2（开源）	可本地部署、适合私有化场景
开发框架	LangChain	简化RAG流程，支持模块化组装（嵌入→检索→生成）
	LlamaIndex	专注知识库场景，内置多种检索策略（如关键词检索、语义检索）

未来发展趋势与挑战

趋势1：多模态RAG

当前RAG主要处理文本，未来会支持「文本+图片+视频」的多模态检索（比如用户问「这个产品长什么样？」，RAG能检索产品图片并生成描述）。

趋势2：实时知识更新

现在知识库需要手动更新，未来可能通过「网络爬虫+实时嵌入」实现知识自动同步（比如自动抓取新闻，更新到向量数据库）。

挑战1：延迟优化

检索和生成步骤可能导致响应变慢（比如用户等2秒才能得到答案），需要优化嵌入速度、向量检索效率、LLM推理速度。

挑战2：知识冲突处理

如果检索到多条矛盾的知识（比如「产品A充电5分钟」和「产品A充电10分钟」），如何让LLM判断可信度？可能需要引入「知识来源评分」或「专家规则」。

挑战3：成本控制

使用OpenAI Embeddings和GPT-4的API费用较高（100万次调用可能上万元），需要探索「低成本嵌入模型」+「轻量级LLM」的替代方案。

总结：学到了什么？

核心概念回顾

检索模块：把知识和问题转成「数字指纹」（向量），用向量数据库快速找相关知识；
生成模块：用LLM结合检索到的知识，生成准确回答；
知识拼接：整理检索结果，构造LLM能理解的输入。

概念关系回顾

检索模块是「找资料的人」，生成模块是「写答案的人」，知识拼接是「整理资料的人」——三者协作，让AI从「胡编乱造」变成「有凭有据」。

思考题：动动小脑筋

如果你要构建一个「红楼梦知识助手」，知识库是《红楼梦》全文，你会如何优化检索模块？（提示：考虑长文本分割、自定义嵌入模型）
当检索到的知识和LLM的「固有知识」冲突时（比如知识库说「林黛玉活了30岁」，但LLM知道原著是18岁），如何让系统优先相信知识库？
如何评估RAG系统的效果？可以从「答案准确性」「响应速度」「用户满意度」等维度思考。

附录：常见问题与解答

Q：向量数据库和传统数据库（如MySQL）有什么区别？
A：传统数据库存「文字」，按关键词搜索（比如找包含「充电」的句子）；向量数据库存「数字指纹」，按「语义相似性」搜索（比如找和「充电时间」语义最像的句子）。

Q：必须用OpenAI的模型吗？可以用国产模型吗？
A：完全可以！比如用「智谱AI」的嵌入模型和生成模型，或「通义千问」的API，只需替换代码中的嵌入和生成部分即可。

Q：知识库多大时需要用向量数据库？
A：如果知识库只有100条知识，暴力计算相似度也很快；但超过1万条，必须用向量数据库（FAISS等），否则检索会变慢。

扩展阅读 & 参考资料

论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》（RAG原始论文）
LangChain官方文档：https://python.langchain.com
FAISS官方教程：https://faiss.ai
Sentence-BERT模型库：https://www.sbert.net

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

AI原生应用实战：使用Python实现检索增强生成(RAG)系统