彬彬侠

【LangChain】langchain_milvus.Milvus 中常用的方法列举和解释说明

在 LangChain 中，langchain_milvus.Milvus 是用于与 Milvus 向量数据库交互的向量存储类，适用于存储高维嵌入向量并进行高效相似性搜索，广泛用于检索增强生成（RAG）系统、文档检索等场景。本文将详细介绍 langchain_milvus.Milvus 类的核心方法、功能及其在 RAG 系统中的典型应用。

本回答基于 LangChain 0.3.x，重点说明 Milvus 的常用方法，包括方法签名、参数、返回值及使用场景，并提供一个独立示例，展示如何使用这些方法构建 RAG 系统。示例将包含文本加载、分割、嵌入生成和查询。

`langchain_milvus.Milvus` 简介

langchain_milvus.Milvus 是 LangChain 提供的 Milvus 向量存储包装器，连接 Milvus 数据库（一个开源向量数据库），支持存储嵌入向量和元数据，执行高效的向量搜索（如 ANN）。它继承自 LangChain 的 VectorStore 基类，提供了标准化的向量存储接口。

核心功能：

存储文档的嵌入向量（由嵌入模型如 OpenAIEmbeddings 生成）。
支持快速相似性搜索，返回与查询最相关的文档。
集成 LangChain 检索器接口，适合 RAG 管道。
支持元数据过滤和集合管理。

初始化参数：

embedding_function（必填）：嵌入模型（如 OpenAIEmbeddings）。
connection_args（默认 {"uri": "http://localhost:19530"}）：Milvus 连接参数。
collection_name（默认 "LangChainCollection"）：集合名称。
vector_field（默认 "vector"）：存储向量的字段。
text_field（默认 "text"）：存储文本的字段。
drop_old（默认 False）：是否删除旧集合。

`Milvus` 常用方法

以下是 langchain_milvus.Milvus 类的常用方法，基于源码（langchain_milvus/vectorstores/milvus.py）和官方文档（Milvus Vector Store）。列出方法签名、参数、返回值、功能描述及使用场景。

1. `add_documents(documents: List[Document], **kwargs) -> List[str]`

功能：将文档列表添加到 Milvus 集合，生成嵌入向量并存储。
参数：
- documents：List[Document]，包含 page_content 和 metadata 的文档列表。
- **kwargs：附加参数，如 batch_size（批量插入大小）。
返回值：List[str]，插入文档的 ID 列表。
使用场景：
- 初始化向量存储，批量导入文档。
- 更新集合，添加新文档。

示例：

from langchain_core.documents import Document
documents = [Document(page_content="示例文本", metadata={"source": "test"})]
vectorstore.add_documents(documents)

2. `add_texts(texts: Iterable[str], metadatas: Optional[List[dict]] = None, **kwargs) -> List[str]`

功能：将文本列表添加到 Milvus 集合，生成嵌入并存储。
参数：
- texts：文本字符串迭代器。
- metadatas：可选的元数据列表，与文本对应。
- **kwargs：附加参数，如 batch_size。
返回值：List[str]，插入文本的 ID 列表。
使用场景：
- 直接添加原始文本（无 Document 对象）。
- 适合轻量级数据导入。

示例：

texts = ["自然语言处理是 AI 的分支"]
metadatas = [{"source": "nlp"}]
vectorstore.add_texts(texts, metadatas)

3. `as_retriever(**kwargs) -> VectorStoreRetriever`

功能：将 Milvus 向量存储转换为 LangChain 检索器，用于 RAG 管道。
参数：
- search_type（默认 "similarity"）：搜索类型（"similarity", "mmr"）。
- search_kwargs：搜索参数，如 k（返回文档数）、expr（元数据过滤表达式）。
返回值：VectorStoreRetriever，可用于检索相关文档。
使用场景：
- 在 RAG 系统中检索与查询最相关的文档。
- 支持元数据过滤（如 expr="source == 'nlp'"）。

示例：

retriever = vectorstore.as_retriever(search_kwargs={"k": 2, "expr": "source == 'nlp'"})
docs = retriever.invoke("什么是 NLP？")

4. `similarity_search(query: str, k: int = 4, **kwargs) -> List[Document]`

功能：根据查询文本执行相似性搜索，返回最相关的文档。
参数：
- query：查询字符串。
- k：返回文档数量。
- **kwargs：附加参数，如 expr（元数据过滤）、param（搜索参数，如 metric_type）。
返回值：List[Document]，包含匹配的文档。
使用场景：
- 手动测试向量搜索效果。
- 调试或小规模检索。

示例：

docs = vectorstore.similarity_search("什么是 NLP？", k=2, expr="source == 'nlp'")
for doc in docs:
    print(doc.page_content)

5. `similarity_search_with_score(query: str, k: int = 4, **kwargs) -> List[Tuple[Document, float]]`

功能：执行相似性搜索，返回文档及其相似度得分。
参数：
- query：查询字符串。
- k：返回文档数量。
- **kwargs：如 expr、param。
返回值：List[Tuple[Document, float]]，文档和得分（0-1，1 表示最相似）。
使用场景：
- 需要评估搜索结果的置信度。
- 调试或优化检索阈值。

示例：

results = vectorstore.similarity_search_with_score("什么是 NLP？", k=2)
for doc, score in results:
    print(f"Content: {doc.page_content}, Score: {score}")

6. `delete(ids: Optional[List[str]] = None, **kwargs) -> None`

功能：从 Milvus 集合中删除指定 ID 的文档。
参数：
- ids：要删除的文档 ID 列表。
- **kwargs：附加参数，如 expr（删除条件）。
返回值：无。
使用场景：
- 清理过时或错误的文档。
- 动态更新集合。

示例：

vectorstore.delete(ids=["doc_id_1", "doc_id_2"])

7. `from_documents(cls, documents: List[Document], embedding: Embeddings, **kwargs) -> Milvus`

功能：类方法，从文档列表创建 Milvus 向量存储实例并添加文档。
参数：
- documents：List[Document]，文档列表。
- embedding：嵌入模型。
- **kwargs：如 connection_args、collection_name。
返回值：Milvus 实例。
使用场景：
- 一次性创建并填充向量存储。
- 简化初始化流程。

示例：

from langchain_openai import OpenAIEmbeddings
vectorstore = Milvus.from_documents(documents, OpenAIEmbeddings(), collection_name="test")

8. `from_texts(cls, texts: List[str], embedding: Embeddings, metadatas: Optional[List[dict]] = None, **kwargs) -> Milvus`

功能：类方法，从文本列表创建 Milvus 向量存储并添加文本。
参数：
- texts：文本列表。
- embedding：嵌入模型。
- metadatas：可选的元数据列表。
- **kwargs：如 connection_args。
返回值：Milvus 实例。
使用场景：
- 快速导入原始文本。
- 测试或小规模数据处理。

示例：

vectorstore = Milvus.from_texts(["测试文本"], OpenAIEmbeddings(), collection_name="test")

其他辅助方法

max_marginal_relevance_search(query: str, k: int = 4, fetch_k: int = 20, **kwargs) -> List[Document]：
- 使用最大边际相关性（MMR）搜索，优化结果多样性。
- 场景：避免检索过于相似的文档。
similarity_search_by_vector(embedding: List[float], k: int = 4, **kwargs) -> List[Document]：
- 直接使用嵌入向量搜索（不需查询文本）。
- 场景：已有嵌入向量时直接检索。

方法使用场景总结

方法	主要用途	典型场景
`add_documents`	批量添加文档	初始化 RAG 知识库
`add_texts`	添加原始文本	轻量级数据导入
`as_retriever`	转换为 RAG 检索器	构建 RAG 管道
`similarity_search`	手动相似性搜索	测试检索效果
`similarity_search_with_score`	带得分搜索	评估检索质量
`delete`	删除文档	清理或更新集合
`from_documents`	创建并填充存储	快速初始化
`from_texts`	从文本创建存储	小规模测试

推荐方法：

as_retriever：RAG 系统中用于检索。
add_documents / from_documents：初始化或更新知识库。
similarity_search：调试和验证。

RAG 示例：使用 `Milvus` 常用方法

以下示例展示如何使用 langchain_milvus.Milvus 的常用方法（from_documents, as_retriever, similarity_search），构建一个 RAG 系统，加载 NLP 相关文档，回答查询。

准备文件：
创建 nlp_knowledge.txt：

自然语言处理（NLP）是人工智能的一个分支，专注于计算机与人类语言的交互。
词嵌入是 NLP 的技术，将单词映射到高维向量空间。
Transformers 是 NLP 的先进模型，基于注意力机制。

代码：

import os
os.environ["OPENAI_API_KEY"] = "Your OpenAI API Key"

from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain_milvus import Milvus
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import TextLoader

# 加载文档
loader = TextLoader(file_path="nlp_knowledge.txt", encoding="utf-8")
documents = loader.load()

# 分割文档
splitter = RecursiveCharacterTextSplitter(
    chunk_size=100,
    chunk_overlap=20,
    separators=["\n\n", "\n", " ", ""]
)
split_documents = splitter.split_documents(documents)

# 使用 from_documents 创建 Milvus 向量存储
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
vectorstore = Milvus.from_documents(
    documents=split_documents,
    embedding=embeddings,
    connection_args={"uri": "http://localhost:19530"},
    collection_name="nlp_knowledge",
    drop_old=True,
    auto_id = True
)

# 测试 similarity_search
print("测试 similarity_search:")
results = vectorstore.similarity_search("什么是 NLP？", k=2)
for doc in results:
    print(f"Content: {doc.page_content}")

# 初始化 LLM
llm = ChatOpenAI(temperature=0, model="gpt-4")

# 提示模板
prompt = ChatPromptTemplate.from_template(
    """根据以下上下文回答问题：
上下文：{context}
问题：{question}
回答："""
)

# 使用 as_retriever 创建 RAG 链
retriever = vectorstore.as_retriever(search_kwargs={"k": 2})
rag_chain = (
    {
        "context": retriever,
        "question": RunnablePassthrough()
    }
    | prompt
    | llm
    | StrOutputParser()
)

# 调用链
print("\nRAG 链输出：")
response = rag_chain.invoke("什么是自然语言处理？")
print(response)
response = rag_chain.invoke("它包含哪些技术？")
print(response)

输出示例：

测试 similarity_search:
Content: 自然语言处理（NLP）是人工智能的一个分支，专注于计算机与人类语言的交互。
Content: 词嵌入是 NLP 的技术，将单词映射到高维向量空间。

RAG 链输出：
自然语言处理（NLP）是人工智能的一个分支，专注于计算机与人类语言的交互。
自然语言处理包含技术，如词嵌入和 Transformers。

代码说明

文档加载与分割：
- TextLoader 加载 nlp_knowledge.txt。
- RecursiveCharacterTextSplitter 分割为 100 字符块，chunk_overlap=20。
向量存储：
- Milvus.from_documents 创建并填充 nlp_knowledge 集合。
- 使用 OpenAIEmbeddings 生成嵌入。
方法使用：
- similarity_search：手动测试检索效果。
- as_retriever：集成到 RAG 链，检索相关文档。
RAG 链：
- retriever 返回 2 个最相关文档。
- prompt 和 llm（gpt-4）生成答案。
独立性：
- 示例聚焦 NLP 主题，独立于之前上下文。

运行要求：

Milvus 服务运行（localhost:19530）。
nlp_knowledge.txt 存在，编码为 utf-8。
OpenAI API 密钥有效。

注意事项

API 密钥：
- 使用 .env 文件：
```
from dotenv import load_dotenv
load_dotenv()
```
- 确保密钥支持 text-embedding-3-small 和 gpt-4。

依赖：

安装：

pip install --upgrade langchain langchain-milvus langchain-openai pymilvus

Milvus 配置：

验证服务：
```
docker ps  # 检查 Milvus 容器
```

非本地部署：

connection_args={"uri": "http://your-milvus-host:your-port"}

性能优化：

调整 chunk_size（500-1000）、search_kwargs={"k": 3}。

添加索引：

vectorstore = Milvus(..., index_params={"metric_type": "L2", "index_type": "IVF_FLAT"})

错误调试：
- 检查 Milvus 连接：from pymilvus import connections; connections.connect(uri = "http://localhost:19530")。
- 打印 vectorstore._client 验证集合。

常见问题

Q1：as_retriever 和 similarity_search 的区别？
A：as_retriever 返回可集成到 RAG 链的检索器，适合管道；similarity_search 是手动查询方法，适合调试。

Q2：如何过滤元数据？
A：使用 expr 参数，如 vectorstore.as_retriever(search_kwargs={"expr": "source == 'nlp'"})。

Q3：如何批量删除文档？
A：使用 delete 方法，提供 ID 列表或 expr 条件，如 vectorstore.delete(expr="source == 'old'")。

Q4：支持哪些索引类型？
A：支持 Milvus 的索引（如 IVF_FLAT, HNSW），通过 index_params 设置。

总结

langchain_milvus.Milvus 的常用方法包括：

添加数据：add_documents, add_texts, from_documents, from_texts。
检索：as_retriever, similarity_search, similarity_search_with_score。
管理：delete。

这些方法支持构建高效的 RAG 系统。示例代码展示了 from_documents 创建存储、similarity_search 测试检索、as_retriever 集成 RAG 链，处理 NLP 主题查询。

你可能感兴趣的:(LangChain,langchain,milvus,langchain_milvu)

在Ubuntu24.04搭建VLLM， SGLang 和 LangChain环境小熊冲！冲！冲！ AI ubuntu langchain ai 毕业设计
在Ubuntu24.04搭建VLLM，SGLang和LangChain环境[!NOTE]概述整片文章是笔者的回忆(白天忙碌了一天，晚上进行的总结)，所以有些地方的描述可能有误差，本文更多的是大体方向问题，细节步骤不是本文的重点，见谅!!!如何安装Ubuntu24.04制作启动U盘，作者使用的是rufus.exe工具下载Ubuntu24.04的ISO镜像使用rufus.exe工具刷入Ubuntu22
如何从模型返回结构化数据努力学习agent langchain 人工智能
with_structured_output()方法支持此方法的模型ProviderToolcallingStructuredoutputJSONmodeLocalMultimodalPackageChatAnthropic✅✅❌❌✅langchain-anthropicChatMistralAI✅✅❌❌❌langchain-mistralaiChatFireworks✅✅✅❌❌langchain
Langchain学习笔记(十)：文档加载与处理详解
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建基于大语言模型的应用时，文档处理是一个至关重要的环节。无论是构建RAG（检索增强生成）系统，还是进行知识库问答，我们都需要将各种格式的文档转换为模型可以理解和处理的形式。Langchain提供了强大的文档加载和处理功能，支持多种文件格式，并提
Langchain学习笔记(十二)：Memory机制与对话管理 zhangsan0933 LangChain langchain 学习笔记
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建智能对话系统时，记忆功能是至关重要的。想象一下，如果每次与AI对话都像第一次见面一样，无法记住之前的交流内容，这样的体验将是多么糟糕。LangChain的Memory机制正是为了解决这个问题而设计的，它让AI能够"记住"对话历史，从而提供更加
BGE-M3模型结合Milvus向量数据库强强联合实现混合检索
在基于生成式人工智能的应用开发中，通过关键词或语义匹配的方式对用户提问意图进行识别是一个很重要的步骤，因为识别的精准与否会影响后续大语言模型能否检索出合适的内容作为推理的上下文信息（或选择合适的工具）以给出用户最符合预期的回答。在本篇文章中，我将尽可能详细地介绍想达成准确识别用户提问意图的解决方案之一，即基于功能强大的BGE-M3模型和Milvus向量数据库实现混合检索（稠密向量densevect
Milvus 实战全流程
学习路径总览1.Milvus基础知识什么是向量数据库？Milvus的核心概念（collection、field、index、partition、segment）Milvus和Faiss、Annoy、HNSW的区别2.安装与部署Docker快速部署Milvus（推荐）本地开发环境安装使用MilvusLite本地测试3.数据建模与管理创建Collection与Schema定义（包含向量字段和元数据字段
手把手教你搭建AI搜图系统：基于BGE-VL+Milvus的完整实现指南
引言图像搜索有何价值？•帮你找身份证：在海量相册里搜索身份证•电商神器：淘宝"拍立淘"让你拍照变订单•设计师救星：3秒找到可商用的高清素材图老搜索vs新搜索的区别老搜索：像查字典，必须输入正确关键词新搜索：像跟人聊天，图片/语音都能搜，还能理解表情包为什么选BGE-VL+Milvus这个王炸组合？•就像给搜索引擎装了"人脑"（BGE-VL理解图片内涵）•加上"闪电手"Milvus（毫秒级匹配海量图
基于Milvus和BGE-VL模型实现以图搜图时间的痕迹01 milvus
背景最近再做项目的时候，里面有个AI检索的功能，其中一个点就是要实现以图搜图，也就是用户上传一张图，要找出相似度比较高的图，比如下面这样，第一张是原图，第二张是图中的一部分，用户上传第二张图，要能检索到第一张完整的图实现思路整个实现的核心就是用向量检索，也就是在运营端上传第一张图片的时候，先把整个图片转换为向量，存储到向量数据库中，然后用户在检索的时候，把第二张图再转换为向量，与第一张图的向量进行
LangChain specific default response 营赢盈英 AI langchain python openai api
题意：LangChain特定的默认响应问题背景：usingLangChainandOpenAI,howcanIhavethemodelreturnaspecificdefaultresponse?forinstance,let'ssayIhavethesestatement/responses使用LangChain和OpenAI时，如何让模型返回特定的默认响应？例如，假设我有如下的陈述/响应：St
赋能未来数学课堂——基于Qwen3、LangChain与Agent架构的个性化教辅系统研究微学AI langchain 架构
文章目录摘要引言：技术融合催生的教育新范式第一章：Qwen3+LangChain+Agent架构的核心能力与优势1.1Qwen3模型：专为复杂推理打造的“智能大脑”1.2LangChain框架：构建智能体的“灵活骨架”1.3Agent智能体：自主解决问题的“执行中枢”1.4部署与成本优势第二章：在数学教育中解决的关键问题2.1从“答案”到“过程”：深度解析与分步式辅导2.2千人千面：实现高度个性化
！LangChain代理决策架构与源码深度剖析(75)
LangChain代理决策架构与源码深度剖析一、LangChain代理决策架构概述1.1代理决策架构的核心组件LangChain代理的决策架构是其智能交互的核心，主要由大语言模型（LLM）、工具集（Tools）、提示模板（PromptTemplate）、规划器（Planner）、执行器（Executor）和反馈机制六大组件构成。这些组件通过协同工作，实现从用户输入解析到最终结果输出的完整决策流程。
！LangChain文档加载器的接口设计与多种格式解析源码深度解析(77)
LangChain文档加载器的接口设计与多种格式解析源码深度解析一、文档加载器概述1.1文档加载器的作用与定位LangChain文档加载器（DocumentLoaders）是整个框架中负责数据输入的核心组件，其主要作用是从不同来源（本地文件、网络资源、数据库等）读取原始文档，并将其转换为LangChain可处理的Document对象格式。在实际应用中，无论是构建问答系统、知识图谱，还是进行文本摘要
Python面向对象编程入门：从类与对象到方法与属性吴师兄大模型 python 人工智能面向对象编程开发语言类对象 PYTHON
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【大模型LLM学习】function call/agent学习记录威化饼的一隅大模型LLM学习 agent langchain 意图识别 function call 工具调用
【大模型LLM学习】functioncall/agent学习记录0前言1langchain实现functioncall2调用本地模型3微调本地模型3.1few-shot调用Claude生成Q-A对3.2tools格式3.3agent微调格式3.4swift微调p.s.0前言记录一下使用langchain做简单的functioncall/agent(或者说意图识别，如果函数有返回值再进行summ
LangChain：大模型时代的开发利器 tanak Python大模型应用全栈实战 langchain 人工智能 python
文章目录什么是LangChain？深入解析其核心理念与组件1.模型（Models）2.提示（Prompts）3.链（Chains）4.索引（Indexes）5.记忆（Memory）6.工具（Tools）7.代理（Agents）LangChain在大模型应用中的核心地位与典型场景核心地位：连接、抽象、赋能典型应用场景：LangChain如何赋能实际业务结语：拥抱LangChain，构建大模型应用的未
玩转 Milvus（一）：解锁向量数据库的秘密，拥抱Milvus 不学无术の码农玩转 Milvus：向量搜索与 AI 实践 milvus 向量数据库
引言：向量数据库，AI时代的“超级引擎”想象一下，你上传一张猫咪照片，系统瞬间从百万张图片中挑出最相似的几张；或者在购物APP中点开一件T恤，推荐栏立刻展示你心动的搭配。这些智能体验的背后，藏着一个秘密武器——高维向量。通过深度学习模型，文本、图像、音频被转化为一串数字，捕捉它们的“灵魂”。但如何在海量向量中快速找到“最像”的那一个？传统数据库如MySQL或MongoDB束手无策，而向量数据库横空
玩转 Milvus（二）：在 Ubuntu 22.04（WSL2）上安装 Milvus 不学无术の码农玩转 Milvus：向量搜索与 AI 实践 milvus 向量数据库
玩转Milvus（二）：在Ubuntu22.04（WSL2）上安装Milvus引言：让Milvus在你的笔记本上“起飞”在《玩转Milvus（一）》中，我们揭开了向量数据库的神秘面纱，认识了Milvus作为AI时代的“超级引擎”，如何驱动智能搜索、推荐系统和多模态应用。现在，是时候让Milvus在你的电脑上“落地生根”了！本篇博客将带你在Ubuntu22.04（WSL2）环境下安装Milvus，聚
【ChatOpenAI】常用方法详解满怀1015 大模型应用人工智能 AIGC
ChatOpenAI常用方法详解ChatOpenAI是LangChain中用于与OpenAI聊天模型交互的核心类，提供了多种方法来调用和管理对话。以下是其主要方法的详细介绍：核心方法1.invoke()-同步调用模型最常用的方法，用于同步调用模型并获取完整响应。fromlangchain_openaiimportChatOpenAIfromlangchain_core.messagesimport
【Python-Day 35】深入理解多态：代码更灵活的“鸭子类型”魔法
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【深度学习-Day 39】玩转迁移学习与模型微调：站在巨人的肩膀上吴师兄大模型深度学习入门到精通深度学习迁移学习人工智能 python 大模型机器学习模型微调
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
RAG面试内容整理-3. 向量检索原理与常用库（ANN、FAISS、Milvus 等）不务正业的猿面试 LangChain AI 面试职场和发展大模型 RAG AI 人工智能算法
向量检索利用向量空间的相似度来查找相关内容，是近年来兴起的检索技术核心。其基础是在语义嵌入（embedding）模型的支持下，将文本、图像等数据表示为高维向量，以便通过向量相似度（如余弦相似度或欧氏距离）找到内容上的邻近项。由于直接精确计算所有向量之间的距离在大规模下计算开销巨大，实际系统通常采用近似最近邻搜索（ApproximateNearestNeighbor,ANN）算法，在保证结果精度接近
图片查重从设计到实现（2）Milvus安装准备etcd介绍、应用场景及Docker安装配置超龄超能程序猿 milvus etcd docker
etcd作用、应用场景及Docker安装配置在分布式向量数据库Milvus的架构中，etcd扮演着至关重要的角色。Milvus用于存储和管理海量向量数据，支持高效的相似性搜索等操作，而其分布式集群的正常运行高度依赖元数据的一致性和可靠性，etcd正是承担这一关键任务的组件，负责存储Milvus集群的元数据，如集合信息、索引配置、分区详情等，确保Milvus各节点能协同工作。下面详细介绍etcd的相
LangChain：大语言模型的“乐高工厂” 科技林总 DeepSeek学AI 人工智能
想象一下：你想让AI聊天机器人回答公司内部文件的问题，但它只会背诵过时的百科知识；你想让AI分析实时股票数据，它却连计算器都不会用——这正是大语言模型（LLM）的痛点。而今天介绍的**LangChain**，就是解决这些难题的“万能工具箱”。它诞生于2022年，短短一年成为GitHub增长最快的开源项目，如今已是开发AI应用的首选框架。---###**一、为什么需要LangChain？**####
langchain四种内置链的使用努力学习agent langchain langchain
#四种基础内置链的介绍与使用#LLMChain最常用的链式fromlangchain.chainsimportLLMChainfromlangchain.llmsimportOpenAIfromlangchain.promptsimportPromptTemplatellm=OpenAI(temperature=0)prompt_template="帮我给{product}想三个可以注册的域名"l
Milvus 2.5.14 使用 milvus-backup v0.5.7 的备份实践 gs80140 基础知识科谱 milvus
目录Milvus2.5.14使用milvus-backupv0.5.7的备份实践背景部署环境1.安装milvus-backup工具2.确认Milvus服务信息3.编写backup.yaml配置4.执行备份5.遇到的问题及解决方案(1)invalidkey:log.file.rootpath(2)invalidkey:milvus.port或milvus.address(3)备份只有meta文件(4
用LangChain重构客服系统：腾讯云向量数据库+GPT-4o实战
人们眼中的天才之所以卓越非凡，并非天资超人一等而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件。————马尔科姆·格拉德威尔目录一、传统客服系统痛点与重构价值1.1传统方案瓶颈分析1.2新方案技术突破点二、系统架构设计：三层解耦与组件协同2.1整体架构图编辑2.2核心组件选型对比三、核心模块实现与代码解析3.1知识库实时同步模块3.2多轮对话Agent引擎四、性能优化与压测
Python----大模型（ langchain部署简单rag应用）蹦蹦跳跳真可爱589 大模型 Python langchain 人工智能 python
一、RetrievalQA链实现加载本地文本文件并分割处理使用嵌入模型将文本转换为向量表示构建向量数据库(FAISS)实现高效相似性检索结合检索结果和大语言模型生成回答特点说明优势体现模块化封装LangChain提供标准化组件快速搭建原型系统自动化流程内置文档处理、检索、生成流水线减少开发工作量中文优化使用bge-zh嵌入模型中文语义理解更准确本地化部署模型和API均在本地运行数据隐私有保障导入依
【Go语言-Day 24】从混乱到有序：Go 语言包 (Package) 管理实战指南吴师兄大模型 Go 语言从入门到精通 golang 开发语言后端 go语言人工智能 python 大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【JavaScript-Day 7】全面解析 Number 与 String：JS 数据核心操作指南吴师兄大模型 javascript 开发语言 java 前端后端人工智能 LLM
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【深度学习-Day 10】机器学习基石：从零入门线性回归与逻辑回归
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

【LangChain】langchain_milvus.Milvus 中常用的方法 列举 和 解释说明

langchain_milvus.Milvus 简介

Milvus 常用方法

1. add_documents(documents: List[Document], **kwargs) -> List[str]

2. add_texts(texts: Iterable[str], metadatas: Optional[List[dict]] = None, **kwargs) -> List[str]

3. as_retriever(**kwargs) -> VectorStoreRetriever

4. similarity_search(query: str, k: int = 4, **kwargs) -> List[Document]

5. similarity_search_with_score(query: str, k: int = 4, **kwargs) -> List[Tuple[Document, float]]

6. delete(ids: Optional[List[str]] = None, **kwargs) -> None

7. from_documents(cls, documents: List[Document], embedding: Embeddings, **kwargs) -> Milvus

8. from_texts(cls, texts: List[str], embedding: Embeddings, metadatas: Optional[List[dict]] = None, **kwargs) -> Milvus