佑瞻

Milvus 构建高效 RAG 全攻略：从基础实现到全链路RAG性能优化技术解析

在构建智能问答、知识驱动生成等应用时，我们常常会遇到这样的挑战：如何让机器高效检索海量知识并生成准确回答？RAG（检索增强生成）架构正是解决这一问题的关键。作为专业的向量数据库，Milvus 在 RAG 中扮演着核心角色。今天，咱们就来一步步拆解如何用 Milvus 构建高性能 RAG 管道，并深入探讨优化策略。

一、RAG 核心架构与 Milvus 定位

RAG 系统的核心逻辑是 “检索 - 生成”：先通过向量数据库找到与问题最相关的知识片段，再由大模型基于这些片段生成回答。Milvus 作为高性能向量存储引擎，负责高效存储和检索向量数据，是 RAG 管道的 “知识库大脑”。

二、从 0 到 1 搭建 Milvus RAG 管道

1. 环境准备与依赖安装

首先安装必要的库：

python

运行

# 安装Milvus客户端、OpenAI工具包及辅助库
!pip install --upgrade pymilvus openai requests tqdm

如果使用 Google Colab，需要重启运行时确保依赖生效。接着配置 OpenAI API 密钥（注意敏感信息需脱敏处理）：

python

运行

import os
os.environ["OPENAI_API_KEY"] = "sk-***********"  # 替换为你的API密钥

2. 数据准备与预处理

我们以 Milvus 官方文档作为知识源，下载并解析 Markdown 文件：

python

运行

from glob import glob

# 加载所有FAQ文档并按标题分割内容
text_lines = []
for file_path in glob("milvus_docs/en/faq/*.md", recursive=True):
    with open(file_path, "r") as file:
        file_text = file.read()
    # 按标题分割文档段落，生成独立知识片段
    text_lines += file_text.split("# ")

3. 嵌入模型初始化

使用 OpenAI 的文本嵌入模型将文本转换为向量：

python

运行

from openai import OpenAI

openai_client = OpenAI()

def emb_text(text):
    """将输入文本转换为向量嵌入"""
    return (
        openai_client.embeddings.create(input=text, model="text-embedding-3-small")
        .data[0]
        .embedding
    )

# 测试嵌入生成
test_embedding = emb_text("This is a test")
embedding_dim = len(test_embedding)
print(f"嵌入维度：{embedding_dim}，前10维值：{test_embedding[:10]}")

4. 创建 Milvus 集合并导入数据

初始化 Milvus 客户端并创建存储向量的集合：

python

运行

from pymilvus import MilvusClient

# 使用Milvus Lite本地存储（大规模数据建议使用服务器版本）
milvus_client = MilvusClient(uri="./milvus_demo.db")
collection_name = "my_rag_collection"

# 删除已存在集合（避免重复）
if milvus_client.has_collection(collection_name):
    milvus_client.drop_collection(collection_name)

# 创建集合：指定向量维度、度量类型和一致性级别
milvus_client.create_collection(
    collection_name=collection_name,
    dimension=embedding_dim,
    metric_type="IP",  # 内积度量，适合文本相似性检索
    consistency_level="Strong"  # 强一致性保证数据可见性
)

5. 批量插入数据到 Milvus

将预处理好的知识片段生成嵌入并插入集合：

python

运行

from tqdm import tqdm

data = []
for i, line in enumerate(tqdm(text_lines, desc="创建嵌入")):
    data.append({
        "id": i,  # 自定义ID
        "vector": emb_text(line),  # 文本嵌入
        "text": line  # 原始文本数据，作为动态字段存储
    })

# 批量插入数据
insert_result = milvus_client.insert(
    collection_name=collection_name,
    data=data
)
print(f"插入成功，插入数量：{insert_result.insert_count}")

6. 构建检索模块

定义查询函数，实现从 Milvus 中检索相关知识片段：

python

运行

def retrieve_knowledge(question, top_k=3):
    """根据问题检索相关知识片段"""
    # 生成问题嵌入
    query_emb = emb_text(question)
    # 执行向量搜索
    search_res = milvus_client.search(
        collection_name=collection_name,
        data=[query_emb],
        limit=top_k,
        search_params={"metric_type": "IP"},
        output_fields=["text"]  # 返回存储的原始文本字段
    )
    # 解析结果，提取文本和相似度得分
    retrieved = [
        (hit.entity["text"], hit.distance) 
        for hit in search_res[0]
    ]
    return retrieved

7. 整合 LLM 生成回答

将检索结果与大模型结合，生成最终回答：

python

运行

def generate_answer(question):
    """结合检索结果和LLM生成回答"""
    # 第一步：检索相关知识
    retrieved = retrieve_knowledge(question)
    context = "\n".join([line[0] for line in retrieved])
    
    # 第二步：构建提示词
    SYSTEM_PROMPT = "你是一个知识助手，需根据提供的上下文回答问题。"
    USER_PROMPT = f"""
    
    {context}
    
    
    {question}
    
    """
    
    # 第三步：调用OpenAI生成回答
    response = openai_client.chat.completions.create(
        model="gpt-3.5-turbo",
        messages=[
            {"role": "system", "content": SYSTEM_PROMPT},
            {"role": "user", "content": USER_PROMPT}
        ]
    )
    return response.choices[0].message.content

三、RAG 性能优化策略：从检索到生成的全链路调优

在实际应用中，基础 RAG 管道往往面临 “检索不准”“生成模糊” 等问题。别担心，我们可以通过一系列针对性优化，让 RAG 系统的性能实现质的飞跃。下面从四个关键环节展开，看看如何让你的 RAG 管道更聪明、更高效。

1. 查询增强：让机器更懂你的问题

当用户提问与知识库表述存在语义偏差时，直接检索可能会 “答非所问”。这时候，我们需要先 “翻译” 问题，让机器更好地理解真实意图。

① 假设文档嵌入（HyDE）：用 “假答案” 钓出真知识

传统向量检索依赖 “问题 - 文档” 直接匹配，但用户问题与文档表述可能存在跨域差异（比如口语化 vs 专业化）。HyDE 技术巧妙解决了这个问题：

原理：先用 LLM 根据问题生成一个 “假设答案”（比如用户问 “Milvus 怎么存数据”，生成 “Milvus 可能将数据存储在分布式存储系统中”），再将这个假答案嵌入后检索。
优势：通过 “问题→假答案→文档” 的间接匹配，缩小语义鸿沟，提升检索相关性。实测显示，在长文本场景中，HyDE 可使召回率提升 15%-20%。

② 子查询分解：拆解复杂问题为 “填空题”

遇到 “Milvus 和 Zilliz Cloud 有什么区别” 这类复杂问题时，直接检索可能找不到完整答案。我们可以：

操作步骤：用 LLM 将原问题拆分为多个子查询（如 “Milvus 的核心功能有哪些？”“Zilliz Cloud 的服务优势是什么？”）。
技术要点：确保子查询覆盖原问题的所有关键维度，且每个子查询能在知识库中找到对应答案。例如通过正则匹配或关键词抽取识别复杂问题中的实体和关系。

③ 回溯提示：从 “模糊提问” 到 “精准搜索”

当用户问题过于宽泛（如 “怎么优化 Milvus 性能？”），我们需要引导检索更聚焦：

实现方法：用 LLM 生成更具体的 “回溯问题”（如 “Milvus 的索引类型如何选择？”“数据分区对查询性能的影响？”），再用这些问题检索。
适用场景：尤其适合知识库内容结构清晰但用户提问模糊的场景，能将无效检索减少 30% 以上。

④ 假设性问题生成：提前预演用户可能的提问

在预处理阶段，我们可以主动为每个文档块生成 “假设性问题”，构建 “问题 - 文档” 的双向索引，解决传统检索中 “用户问题→文档” 的单向匹配局限：

实现步骤：
1. 批量生成问题：对每个文档块，使用 LLM 生成 3-5 个可能相关的问题（例如文档块内容为 “Milvus 数据存储架构”，生成 “Milvus 如何存储海量向量数据？”“Milvus 支持哪些存储后端？” 等）。
2. 存储双向索引：将每个假设性问题嵌入后，与对应的文档块 ID 关联存储，形成 “问题向量→文档” 的映射关系。
查询应用：当用户实际提问时，除了检索原问题，还会匹配这些预先生成的假设性问题，扩大检索范围。例如用户问 “Milvus 的存储方案”，即使知识库中无直接表述，也能通过 “Milvus 如何存储数据？” 的假设问题找到相关文档。
优势与挑战：
- 优势：覆盖用户可能的多样化提问方式，尤其适合知识库文档结构固定但用户提问灵活的场景，可使长尾问题的检索成功率提升 20% 以上。
- 挑战：生成假设性问题需消耗额外算力（约增加 15% 的预处理时间），需通过批量处理和模型优化（如使用轻量 LLM）控制成本。

2. 索引增强：让知识库 “条理更清晰”

如果把知识库比作图书馆，索引就是书架上的标签。合理设计索引结构，能让检索效率大幅提升。

① 自动合并文档块：拒绝 “碎片化” 检索

当文档被拆分为过小的段落（如一句话一个块），检索结果可能零散无序。我们可以：

合并策略：检索后检查 Top-K 结果中是否有多个块属于同一父文档（通过元数据标记文档 ID），若同一文档的块数超过阈值（如 2 个），则合并该文档的完整章节。
工具支持：LlamaIndex 等框架已内置类似策略，通过文档 ID 聚合逻辑，确保 LLM 获得完整上下文，避免 “断章取义”。

② 分层索引：先 “粗筛” 再 “细找”

面对百万级以上文档，单层索引可能力不从心。分层索引分两步走：

第一层（摘要索引）：为每个文档生成摘要嵌入，快速过滤出最相关的 100 个文档。
第二层（段落索引）：仅在这 100 个文档的段落中精细检索，将计算量从 “全库扫描” 压缩到 “局部搜索”。
典型应用：学术论文检索场景，先通过摘要判断研究领域匹配度，再深入具体章节，检索速度提升 5 倍以上。

③ 混合检索与重排：让 “精准” 与 “全面” 兼得

单一向量检索可能漏掉关键词匹配的结果，我们可以结合多种检索方式：

组合策略：同时执行向量检索（语义匹配）和 BM25 检索（关键词匹配），再用 RRF 算法重排结果。
参数调优：通过调节向量检索权重（如 0.7）和 BM25 权重（如 0.3），在 “语义泛化” 和 “关键词精准” 之间找到平衡，尤其适合法律、医疗等对术语准确性要求高的场景。

3. 检索器优化：让搜索更 “聪明”

检索器是 RAG 的 “眼睛”，优化它能直接提升 “找对知识” 的能力。

① 元数据过滤：给搜索加 “筛选器”

如果知识库包含时间、类别等元数据，别忘了善用它们：

实战技巧：在搜索时添加过滤条件，如"create_time > 2023-01-01 AND category = '技术文档'"，将搜索范围缩小到近一年的技术类文档。
性能影响：实测显示，合理的元数据过滤可减少 60% 的无效检索，尤其适合多租户场景（如不同部门知识库隔离）。

② 句子窗口扩展：给 LLM 更完整的上下文

基础 RAG 中，每个文档块可能只有 200 字，导致上下文不足。我们可以：

扩展策略：在检索到的核心段落前后各扩展 5 句话，形成 500 字左右的完整语境。
注意事项：避免过度扩展引入噪声，可通过相似度阈值（如仅扩展距离 < 0.6 的相邻段落）保证相关性。

4. 生成器优化：让回答更 “靠谱”

即使检索准确，生成环节若处理不当，仍可能输出 “幻觉” 答案。这三步能提升生成质量：

① 提示压缩：砍掉噪声，保留干货

当检索结果包含大量无关信息时：

压缩方法：用 T5 等摘要模型对上下文进行压缩，保留核心观点。例如将 2000 字的检索内容浓缩为 500 字，既节省 LLM 窗口，又突出重点。
实现细节：设置压缩比例（如保留 40% 内容），并通过关键词匹配确保关键术语不丢失。

② 块顺序调整：把重点放在 “显眼位置”

研究发现，LLM 对提示中的首尾内容更敏感。我们可以：

排序策略：按相似度从高到低排序，同时将包含问题关键词的段落置顶。
进阶技巧：对多文档场景，先放跨文档的共性段落，再放个性化内容，帮助 LLM 更快抓住核心逻辑。

③ 自我反思机制：让机器 “检查答案”

如果首次生成的答案可信度低（如包含 “可能”“不确定” 等词），可以：

二次验证：用 LLM 对答案进行逻辑校验（如 “这个结论是否有检索文档支持？”），若不通过，则扩大检索范围或调整提示词。
工程实现：通过置信度评分模型（如计算答案中不确定词的比例）触发反思流程，减少 “幻觉” 发生率 30% 以上。

5. 全流程增强：让管道更 “智能”

除了单点优化，我们还可以在整体流程上做文章：

① 代理路由：让合适的工具做合适的事

不是所有问题都需要走完整 RAG 流程：

判断逻辑：用轻量分类模型先判断问题类型，简单事实类问题（如 “Milvus 是否开源？”）直接调用知识库 API，复杂推理类问题再触发 RAG 流程。
收益：减少不必要的向量检索和 LLM 调用，响应速度提升 40%，成本降低 25%。

② 增量更新策略：让知识库 “与时俱进”

当新增文档时，避免全量重建索引：

更新方式：对新文档单独建立临时索引，定期（如每天）与主索引合并，同时删除过时文档的索引条目。
技术要点：通过时间戳元数据标记文档新旧，检索时优先返回近期更新的内容，确保答案时效性。

四、关键问题解答

1. 如何选择合适的嵌入模型？

优先选择与业务场景匹配的模型：文本类场景可用 OpenAI text-embedding 系列、BERT 变种；多模态场景可考虑 CLIP 模型。
关注模型维度与 Milvus 索引兼容性：高维向量（如 1536 维）适合 HNSW 索引，低维向量可尝试 IVF 系列索引。

2. 大规模数据如何部署 Milvus？

中小规模数据（亿级以下）：使用 Milvus Lite 本地部署，或 Docker 单机版。
大规模分布式场景：采用 Kubernetes 集群部署，搭配 MinIO 等对象存储，利用 Milvus 的分布式索引能力（如 DiskANN）处理百亿级向量。

3. 如何评估 RAG 系统效果？

检索层：检查召回率（Recall@K），确保相关文档被正确检索。
生成层：使用 BLEU、ROUGE 等指标评估回答与标准答案的相似度。
端到端：通过用户调研、A/B 测试验证系统实用性。

五、总结

通过 Milvus 构建 RAG 管道，我们实现了从 “数据存储” 到 “智能生成” 的全流程优化。从基础的向量检索到高级的性能调优，每个环节都需要根据业务需求精细设计。随着 RAG 应用的普及，如何在检索效率与生成质量间找到平衡，将成为持续优化的核心课题。

如果你在搭建过程中遇到问题，欢迎在评论区交流！觉得本文有用的话，别忘了点赞收藏，后续我们会带来更多 Milvus 实战技巧和 RAG 优化策略～

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
别再讲道理啦，对方听不进去的方所
我之前写过一篇叫做《你总妄想改变他人》，然后就有朋友跟我说，有一些方法可以改变他人之类的。嗯，是这样，但是任何具体的问题，都要限定好语境，描述清楚前提条件，然后再表达观点，我的这位朋友的说法就犯了一刀切的错误，这样并不能让讨论正常展开（这篇我得先给她看看，不然可能会挨揍）。好了，hhhh，谁让她不能写文章呢，我就来再说一说吧。我前面说过，我们在学到一个道理、学会一种方法之后，总是迫不及待地想要去与
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
ARM 和 AMD 架构的区别 m0_69576880 arm开发 windows 架构
ARM架构和AMD架构是两种不同的计算机处理器架构，它们有以下几个主要区别：设计出发点、兼容性、性能特点、市场定价。设计出发点：①ARM构架：ARM架构最初是为嵌入式系统设计的，旨在提供低功耗和高效能的解决方案。它主要应用于移动设备、嵌入式系统和物联网设备②AMD架构：AMD架构是基于x86架构的扩展，旨在提供与Intel架构兼容的处理器。它主要用于台式机、服务器和工作站等计算机系统。兼容性：AR
Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
氧惠官方邀请码333777，氧惠邀请码怎么获得？氧惠邀请码有什么套路？知行导师
问：氧惠邀请码怎么获得？答：氧惠官方邀请码333777返点高佣金高真的高。问：氧惠邀请码有什么套路？答：氧惠官方邀请码333777返点高佣金高真的高。氧惠APP汇聚各大主流电商和生活服务平台优惠，展示全网全品类商品，满足网购爱好者对品质好货与极致性价比的追求，并同时享受大平台购物权益保障。满足用户日常吃喝玩乐衣食住行的聚合APP，独特的商业模式，响应国家号召，为实现全民共富而努力奋斗。氧惠邀请码3
深入理解汇编语言子程序设计与系统调用网安spinage 汇编语言开发语言汇编算法
本文将全面解析汇编语言中子程序设计的核心技术以及系统调用的实现方法，涵盖参数传递的多种方式、堆栈管理、API调用等关键知识点，并提供实际案例演示。一、子程序设计：参数传递的艺术1.寄存器传参：高效简洁.386.modelflat,stdcalloptioncasemap:none.dataxdd5;定义变量ydd6sumdd?.code;函数定义：addxy1addxy1procpushebpmo
【老房翻新】92平轻奢简约风，将和谐之美融入空间！没人比我更懂装修
在客厅空间中，设计师于冷静的空间基调中选用了层次感丰富的黄蓝色作为主要跳色，搭配黑白纹理的地毯与单椅，为空间增加了时尚摩登的气息。艺术感的单品突出点亮了空间，绿植的点缀、留白的软饰则增强了空间的呼吸性。点击此处添加图片说明文字点击此处添加图片说明文字设计师力求使每一处的设立都在空间中达到相互间的呼应与制衡，将艺术的跃动之美赋于空间之上，也将空间的和谐之美融于生活之中。点击此处添加图片说明文字点击此
京东家电年销售额是去年的1300%，主要来自于他.... Shanshan小课堂
经过大半个月角逐纠缠，时间终于来到6月18日，618全球年中购物节迎来最高潮。作为国内最大的家电零售平台，京东家电从18日0点开始，便开启了飞速狂奔的模式，仅8分钟销售额就突破20亿元!展现出强劲的增长势头与家电主场的王者霸气的同时，也让各家电品牌实现了爆发式增长，美的、海尔、格力、奥克斯均在3分钟内突破1亿元大关。在今年的618中，除了消费者已经熟悉的网购形式外，线上线下联动的融合模式、社交电商
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
D2早课与活力链接亲爱的lingling
宇宙法则是：关注什么，什么就会变大。所以时刻关注自己在想什么，听什么，看什么！感恩今天早晨醒来的第一个意识是，真好，美好的一天开始了，我要越来越漂亮。起床做感恩冥想，呼吸法，喝一杯白开水，贴牛奶面膜。谢谢真我，感觉真好！感恩今天芳哥哥做的爱心早餐，给我煎了鸡蛋，谢谢芳哥的付出。谢谢！感恩我能够越来越清晰自己要做什么，越来越清楚知道自己想要的是什么，更加宁静与喜悦。今天早晨我听到我的高级智慧的声音，
Java 队列 tryxr java 开发语言队列
队列一般用什么哪种结构实现队列的特性数据入队列时一定是从尾部插入吗数据出队列时一定是从头部删除吗队列的基本运算有什么队列支持随机访问吗队列的英文表示什么是队列队列从哪进、从哪出队列的进出顺序队列是用哪种结构实现的Queue和Deque有什么区别Queue接口的方法Queue中的add与offer的区别offer、poll、peek的模拟实现如何利用链表实现队列如何利用顺序表实现队列什么叫做双端队列
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

Milvus 构建高效 RAG 全攻略：从基础实现到全链路RAG性能优化技术解析

一、RAG 核心架构与 Milvus 定位

二、从 0 到 1 搭建 Milvus RAG 管道

1. 环境准备与依赖安装

2. 数据准备与预处理

3. 嵌入模型初始化

4. 创建 Milvus 集合并导入数据

5. 批量插入数据到 Milvus

6. 构建检索模块

7. 整合 LLM 生成回答

三、RAG 性能优化策略：从检索到生成的全链路调优

1. 查询增强：让机器更懂你的问题

① 假设文档嵌入（HyDE）：用 “假答案” 钓出真知识

② 子查询分解：拆解复杂问题为 “填空题”

③ 回溯提示：从 “模糊提问” 到 “精准搜索”

④ 假设性问题生成：提前预演用户可能的提问

2. 索引增强：让知识库 “条理更清晰”

① 自动合并文档块：拒绝 “碎片化” 检索

② 分层索引：先 “粗筛” 再 “细找”

③ 混合检索与重排：让 “精准” 与 “全面” 兼得

3. 检索器优化：让搜索更 “聪明”

① 元数据过滤：给搜索加 “筛选器”

② 句子窗口扩展：给 LLM 更完整的上下文

4. 生成器优化：让回答更 “靠谱”

① 提示压缩：砍掉噪声，保留干货

② 块顺序调整：把重点放在 “显眼位置”

③ 自我反思机制：让机器 “检查答案”

5. 全流程增强：让管道更 “智能”

① 代理路由：让合适的工具做合适的事

② 增量更新策略：让知识库 “与时俱进”

四、关键问题解答

1. 如何选择合适的嵌入模型？

2. 大规模数据如何部署 Milvus？

3. 如何评估 RAG 系统效果？

五、总结

你可能感兴趣的:(RAG,数据库与知识图谱,milvus,RAG)