彬彬侠

【LangChain】LangChain 中支持的嵌入（embedding）模型

LangChain 中支持的嵌入（embedding）模型，这些模型用于将文本转换为向量表示，以便在向量存储（如 langchain_milvus.Milvus 或 langchain_chroma.Chroma）中进行存储和检索。

本文基于 LangChain 0.3.x，详细介绍 LangChain 支持的嵌入模型（包括内置和第三方集成），并提供一个独立示例，展示如何使用其中一种嵌入模型（OpenAIEmbeddings）结合 langchain_milvus.Milvus 构建 RAG 系统。示例包含 PDF 加载（langchain_community.document_loaders.PyPDFLoader）、分割、嵌入生成和查询。

LangChain 支持的嵌入模型

LangChain 支持多种嵌入模型，通过 langchain.embeddings 模块及其子模块（如 langchain_openai, langchain_huggingface）提供。这些模型包括商业 API（如 OpenAI）、开源模型（如 HuggingFace）以及本地或专用模型。以下是 LangChain 支持的主要嵌入模型类别和具体实现，基于官方文档（Embeddings) 和源码分析。

1. 商业 API 嵌入模型

这些模型通过云服务提供高质量嵌入，适合快速开发，但需 API 密钥和网络连接。

OpenAIEmbeddings (langchain_openai)：
- 描述：OpenAI 提供的嵌入模型，如 text-embedding-3-small 和 text-embedding-3-large。
- 特点：
  - 高质量嵌入，广泛用于 RAG。
  - 支持批量嵌入，性能优化。
  - 需要 OpenAI API 密钥。
- 安装：
```
pip install langchain-openai
```
- 示例：
```
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
```
AzureOpenAIEmbeddings (langchain_openai)：
- 描述：Azure 托管的 OpenAI 嵌入模型。
- 特点：
  - 与 OpenAIEmbeddings 类似，但部署在 Azure 平台。
  - 支持企业级安全和合规性。
- 安装：
```
pip install langchain-openai
```
- 示例：
```
from langchain_openai import AzureOpenAIEmbeddings
embeddings = AzureOpenAIEmbeddings(azure_deployment="your-embedding-deployment")
```
GoogleGenerativeAIEmbeddings (langchain_google_genai)：
- 描述：Google 提供的嵌入模型，如 text-embedding-004。
- 特点：
  - 适合多语言任务。
  - 需要 Google Cloud API 密钥。
- 安装：
```
pip install langchain-google-genai
```
- 示例：
```
from langchain_google_genai import GoogleGenerativeAIEmbeddings
embeddings = GoogleGenerativeAIEmbeddings(model="text-embedding-004")
```
BedrockEmbeddings (langchain_aws)：
- 描述：AWS Bedrock 提供的嵌入模型，如 Amazon Titan Embeddings。
- 特点：
  - 集成 AWS 生态，适合云原生应用。
  - 支持多种嵌入模型。
- 安装：
```
pip install langchain-aws
```
- 示例：
```
from langchain_aws import BedrockEmbeddings
embeddings = BedrockEmbeddings(model_id="amazon.titan-embed-text-v1")
```
CohereEmbeddings (langchain_cohere)：
- 描述：Cohere 提供的嵌入模型，如 embed-english-v3.0。
- 特点：
  - 高效，支持多语言。
  - 需要 Cohere API 密钥。
- 安装：
```
pip install langchain-cohere
```
- 示例：
```
from langchain_cohere import CohereEmbeddings
embeddings = CohereEmbeddings(model="embed-english-v3.0")
```

2. 开源嵌入模型

这些模型通常基于 HuggingFace 或其他开源框架，可本地部署，适合隐私敏感或离线场景。

HuggingFaceEmbeddings (langchain_huggingface)：
- 描述：基于 HuggingFace 模型的嵌入，如 sentence-transformers/all-MiniLM-L6-v2。
- 特点：
  - 开源，可本地运行。
  - 支持多种预训练模型，适合多语言任务。
  - 需要 sentence-transformers 库。
- 安装：
```
pip install langchain-huggingface sentence-transformers
```
- 示例：
```
from langchain_huggingface import HuggingFaceEmbeddings
embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
```
HuggingFaceInstructEmbeddings (langchain_huggingface)：
- 描述：基于指令优化的 HuggingFace 嵌入模型，如 hkunlp/instructor-large。
- 特点：
  - 支持任务特定指令，增强嵌入质量。
  - 计算需求较高。
- 安装：
```
pip install langchain-huggingface InstructorEmbedding
```
- 示例：
```
from langchain_huggingface import HuggingFaceInstructEmbeddings
embeddings = HuggingFaceInstructEmbeddings(model_name="hkunlp/instructor-large")
```
OllamaEmbeddings (langchain_community)：
- 描述：Ollama 提供的本地嵌入模型，如 nomic-embed-text。
- 特点：
  - 完全本地运行，适合隐私敏感场景。
  - 需要运行 Ollama 服务。
- 安装：
```
pip install langchain-community
```
- 示例：
```
from langchain_community.embeddings import OllamaEmbeddings
embeddings = OllamaEmbeddings(model="nomic-embed-text")
```

LlamaCppEmbeddings (langchain_community)：

描述：基于 LLaMA.cpp 的嵌入模型。
特点：
- 高效本地运行，支持量化模型。
- 需要编译 LLaMA.cpp。

安装：

pip install langchain-community llama-cpp-python

示例：

from langchain_community.embeddings import LlamaCppEmbeddings
embeddings = LlamaCppEmbeddings(model_path="path/to/llama-model.gguf")

3. 其他嵌入模型

LangChain 还支持一些专用或实验性嵌入模型，适用于特定场景。

SentenceTransformerEmbeddings (langchain_community)：
- 描述：直接使用 sentence-transformers 库的嵌入模型。
- 特点：
  - 与 HuggingFaceEmbeddings 类似，但更直接调用 sentence-transformers。
  - 开源，易于定制。
- 安装：
```
pip install langchain-community sentence-transformers
```
- 示例：
```
from langchain_community.embeddings import SentenceTransformerEmbeddings
embeddings = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")
```
FastEmbedEmbeddings (langchain_community)：
- 描述：基于 Qdrant FastEmbed 的轻量级嵌入模型。
- 特点：
  - 优化速度和内存，适合资源受限环境。
  - 支持多种开源模型。
- 安装：
```
pip install langchain-community fastembed
```
- 示例：
```
from langchain_community.embeddings import FastEmbedEmbeddings
embeddings = FastEmbedEmbeddings(model_name="BAAI/bge-small-en-v1.5")
```
JinaEmbeddings (langchain_community)：
- 描述：Jina AI 提供的嵌入模型，如 jina-embeddings-v2-base-en。
- 特点：
  - 高性能，适合多模态任务。
  - 需要 Jina API 密钥或本地部署。
- 安装：
```
pip install langchain-community
```
- 示例：
```
from langchain_community.embeddings import JinaEmbeddings
embeddings = JinaEmbeddings(model_name="jina-embeddings-v2-base-en")
```
VoyageEmbeddings (langchain_community)：
- 描述：Voyage AI 提供的嵌入模型，如 voyage-2。
- 特点：
  - 优化语义搜索和分类任务。
  - 需要 Voyage API 密钥。
- 安装：
```
pip install langchain-community
```
- 示例：
```
from langchain_community.embeddings import VoyageEmbeddings
embeddings = VoyageEmbeddings(model="voyage-2")
```

4. 自定义嵌入模型

自定义实现：通过继承 langchain_core.embeddings.Embeddings 基类，实现 embed_query 和 embed_documents 方法。
场景：使用私有模型或特定领域的嵌入。

示例：

from langchain_core.embeddings import Embeddings
class CustomEmbeddings(Embeddings):
    def embed_query(self, text: str) -> List[float]:
        return [0.1] * 384  # 模拟嵌入
    def embed_documents(self, texts: List[str]) -> List[List[float]]:
        return [[0.1] * 384 for _ in texts]
embeddings = CustomEmbeddings()

嵌入模型总结

类别	模型	包	特点	使用场景
商业 API	`OpenAIEmbeddings`	`langchain-openai`	高质量，易用	RAG、语义搜索
商业 API	`AzureOpenAIEmbeddings`	`langchain-openai`	企业级，Azure 集成	企业应用
商业 API	`GoogleGenerativeAIEmbeddings`	`langchain-google-genai`	多语言支持	跨语言任务
商业 API	`BedrockEmbeddings`	`langchain-aws`	AWS 生态	云原生应用
商业 API	`CohereEmbeddings`	`langchain-cohere`	高效，多语言	快速原型
开源	`HuggingFaceEmbeddings`	`langchain-huggingface`	开源，本地运行	隐私敏感场景
开源	`OllamaEmbeddings`	`langchain-community`	完全本地	离线环境
开源	`LlamaCppEmbeddings`	`langchain-community`	高效量化	本地高性能
其他	`FastEmbedEmbeddings`	`langchain-community`	轻量快速	资源受限环境
其他	`JinaEmbeddings`	`langchain-community`	多模态支持	复杂任务

推荐模型：

开发/测试：OpenAIEmbeddings（简单、高质量）、HuggingFaceEmbeddings（开源、免费）。
生产环境：AzureOpenAIEmbeddings（企业级）、BedrockEmbeddings（AWS 集成）。
本地部署：OllamaEmbeddings、LlamaCppEmbeddings。

使用嵌入模型的 RAG 示例

以下是一个独立示例，展示如何使用 OpenAIEmbeddings（LangChain 中最常用的嵌入模型之一）结合 langchain_milvus.Milvus 构建 RAG 系统，加载 PDF 文档（关于云计算主题），回答查询。

准备文件：
创建一个 PDF 文件 cloud_computing_knowledge.pdf，内容如下（可使用 Word 保存为 PDF）：

云计算通过互联网提供按需计算资源，如服务器和存储。
IaaS（基础设施即服务）提供虚拟机和存储，如 AWS EC2。
SaaS（软件即服务）提供在线应用，如 Google Workspace。

代码：

import os
os.environ["OPENAI_API_KEY"] = "Your OpenAI API Key"

from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain_milvus import Milvus
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import PyPDFLoader

# 加载 PDF 文档
loader = PyPDFLoader(file_path="cloud_computing_knowledge.pdf")
documents = loader.load()

# 分割文档
splitter = RecursiveCharacterTextSplitter(
    chunk_size=100,
    chunk_overlap=20,
    separators=["\n\n", "\n", " ", ""]
)
split_documents = splitter.split_documents(documents)

# 初始化嵌入模型和 Milvus 向量存储
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
vectorstore = Milvus(
    embedding_function=embeddings,
    connection_args={"uri": "http://localhost:19530"},
    collection_name="cloud_computing_collection",
    drop_old=True,
    auto_id=True
)
vectorstore.add_documents(split_documents)

# 初始化 LLM
llm = ChatOpenAI(temperature=0, model="gpt-4")

# 提示模板
prompt = ChatPromptTemplate.from_template(
    """根据以下上下文回答问题：
上下文：{context}
问题：{question}
回答："""
)

# 格式化文档函数
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

# 创建 RAG 链
rag_chain = (
    {
        "context": vectorstore.as_retriever(search_kwargs={"k": 2}) | format_docs,
        "question": RunnablePassthrough()
    }
    | prompt
    | llm
    | StrOutputParser()
)

# 调用链
print("RAG 链输出：")
response = rag_chain.invoke("什么是云计算？")
print(response)
response = rag_chain.invoke("它有哪些服务模型？")
print(response)

输出示例：

RAG 链输出：
云计算通过互联网提供按需计算资源，如服务器和存储。
云计算的服务模型包括 IaaS（基础设施即服务）和 SaaS（软件即服务）。

代码说明

嵌入模型：
- OpenAIEmbeddings（text-embedding-3-small）生成文档和查询的嵌入向量。
文档加载与分割：
- PyPDFLoader 加载 cloud_computing_knowledge.pdf。
- RecursiveCharacterTextSplitter 分割为 100 字符块，chunk_overlap=20。
向量存储：
- Milvus 使用 connection_args={"uri": "http://localhost:19530"} 存储嵌入，集合名为 cloud_computing_collection。
RAG 链：
- retriever 检索 2 个相关文档。
- prompt 结合上下文和问题，llm（gpt-4）生成答案。

运行要求：

Milvus 服务运行（http://localhost:19530）。
cloud_computing_knowledge.pdf 存在且可读。
OpenAI API 密钥有效。

注意事项

API 密钥：
- 对于商业嵌入模型（如 OpenAIEmbeddings），使用 .env：
```
from dotenv import load_dotenv
load_dotenv()
```
- 确保密钥支持指定模型。

依赖：

安装示例所需：

pip install --upgrade langchain langchain-openai langchain-milvus pymilvus langchain-community pypdf

其他嵌入模型可能需要额外包（如 langchain-huggingface）。

嵌入模型选择：
- 维度兼容性：确保嵌入模型的输出维度与向量存储兼容（如 Milvus 默认支持任意维度）。
- 性能：商业模型（如 OpenAI）速度快但需网络；开源模型（如 HuggingFace）可本地运行但计算密集。
- 成本：开源模型免费，商业模型按 API 调用计费。

本地部署：

对于 HuggingFaceEmbeddings 或 OllamaEmbeddings，确保 GPU（若可用）加速：

embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2", model_kwargs={"device": "cuda"})

调试：

验证嵌入维度：

vector = embeddings.embed_query("测试")
print(len(vector))  # 输出维度，如 1536

检查 Milvus 连接：

from pymilvus import connections
connections.connect(uri="http://localhost:19530")

常见问题

Q1：如何选择合适的嵌入模型？
A：根据需求：

快速开发：OpenAIEmbeddings（高性能、简单）。
隐私敏感：HuggingFaceEmbeddings 或 OllamaEmbeddings（本地运行）。
多语言：GoogleGenerativeAIEmbeddings 或 CohereEmbeddings。
资源受限：FastEmbedEmbeddings（轻量）。

Q2：可以混合使用嵌入模型吗？
A：不推荐，同一向量存储应使用相同的嵌入模型，确保向量维度和语义一致。若需切换，重建集合：

vectorstore.drop_old = True
vectorstore.add_documents(documents)

Q3：如何处理嵌入模型的维度不匹配？
A：检查模型输出维度，调整向量存储配置：

vectorstore = Milvus(..., dimension=1536)  # 匹配 OpenAI 维度

Q4：支持多模态嵌入吗？
A：部分模型（如 JinaEmbeddings）支持多模态，但 LangChain 主要聚焦文本嵌入。多模态需自定义实现。

总结

LangChain 支持多种嵌入模型，包括：

商业 API：OpenAIEmbeddings, AzureOpenAIEmbeddings, GoogleGenerativeAIEmbeddings, BedrockEmbeddings, CohereEmbeddings。
开源模型：HuggingFaceEmbeddings, OllamaEmbeddings, LlamaCppEmbeddings。
其他：FastEmbedEmbeddings, JinaEmbeddings, VoyageEmbeddings。
自定义：继承 Embeddings 基类。

你可能感兴趣的:(LangChain,langchain,embedding)

在Ubuntu24.04搭建VLLM， SGLang 和 LangChain环境小熊冲！冲！冲！ AI ubuntu langchain ai 毕业设计
在Ubuntu24.04搭建VLLM，SGLang和LangChain环境[!NOTE]概述整片文章是笔者的回忆(白天忙碌了一天，晚上进行的总结)，所以有些地方的描述可能有误差，本文更多的是大体方向问题，细节步骤不是本文的重点，见谅!!!如何安装Ubuntu24.04制作启动U盘，作者使用的是rufus.exe工具下载Ubuntu24.04的ISO镜像使用rufus.exe工具刷入Ubuntu22
如何从模型返回结构化数据努力学习agent langchain 人工智能
with_structured_output()方法支持此方法的模型ProviderToolcallingStructuredoutputJSONmodeLocalMultimodalPackageChatAnthropic✅✅❌❌✅langchain-anthropicChatMistralAI✅✅❌❌❌langchain-mistralaiChatFireworks✅✅✅❌❌langchain
Langchain学习笔记(十)：文档加载与处理详解
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建基于大语言模型的应用时，文档处理是一个至关重要的环节。无论是构建RAG（检索增强生成）系统，还是进行知识库问答，我们都需要将各种格式的文档转换为模型可以理解和处理的形式。Langchain提供了强大的文档加载和处理功能，支持多种文件格式，并提
Langchain学习笔记(十二)：Memory机制与对话管理 zhangsan0933 LangChain langchain 学习笔记
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建智能对话系统时，记忆功能是至关重要的。想象一下，如果每次与AI对话都像第一次见面一样，无法记住之前的交流内容，这样的体验将是多么糟糕。LangChain的Memory机制正是为了解决这个问题而设计的，它让AI能够"记住"对话历史，从而提供更加
LangChain specific default response 营赢盈英 AI langchain python openai api
题意：LangChain特定的默认响应问题背景：usingLangChainandOpenAI,howcanIhavethemodelreturnaspecificdefaultresponse?forinstance,let'ssayIhavethesestatement/responses使用LangChain和OpenAI时，如何让模型返回特定的默认响应？例如，假设我有如下的陈述/响应：St
赋能未来数学课堂——基于Qwen3、LangChain与Agent架构的个性化教辅系统研究微学AI langchain 架构
文章目录摘要引言：技术融合催生的教育新范式第一章：Qwen3+LangChain+Agent架构的核心能力与优势1.1Qwen3模型：专为复杂推理打造的“智能大脑”1.2LangChain框架：构建智能体的“灵活骨架”1.3Agent智能体：自主解决问题的“执行中枢”1.4部署与成本优势第二章：在数学教育中解决的关键问题2.1从“答案”到“过程”：深度解析与分步式辅导2.2千人千面：实现高度个性化
！LangChain代理决策架构与源码深度剖析(75)
LangChain代理决策架构与源码深度剖析一、LangChain代理决策架构概述1.1代理决策架构的核心组件LangChain代理的决策架构是其智能交互的核心，主要由大语言模型（LLM）、工具集（Tools）、提示模板（PromptTemplate）、规划器（Planner）、执行器（Executor）和反馈机制六大组件构成。这些组件通过协同工作，实现从用户输入解析到最终结果输出的完整决策流程。
！LangChain文档加载器的接口设计与多种格式解析源码深度解析(77)
LangChain文档加载器的接口设计与多种格式解析源码深度解析一、文档加载器概述1.1文档加载器的作用与定位LangChain文档加载器（DocumentLoaders）是整个框架中负责数据输入的核心组件，其主要作用是从不同来源（本地文件、网络资源、数据库等）读取原始文档，并将其转换为LangChain可处理的Document对象格式。在实际应用中，无论是构建问答系统、知识图谱，还是进行文本摘要
Python面向对象编程入门：从类与对象到方法与属性吴师兄大模型 python 人工智能面向对象编程开发语言类对象 PYTHON
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【大模型LLM学习】function call/agent学习记录威化饼的一隅大模型LLM学习 agent langchain 意图识别 function call 工具调用
【大模型LLM学习】functioncall/agent学习记录0前言1langchain实现functioncall2调用本地模型3微调本地模型3.1few-shot调用Claude生成Q-A对3.2tools格式3.3agent微调格式3.4swift微调p.s.0前言记录一下使用langchain做简单的functioncall/agent(或者说意图识别，如果函数有返回值再进行summ
LangChain：大模型时代的开发利器 tanak Python大模型应用全栈实战 langchain 人工智能 python
文章目录什么是LangChain？深入解析其核心理念与组件1.模型（Models）2.提示（Prompts）3.链（Chains）4.索引（Indexes）5.记忆（Memory）6.工具（Tools）7.代理（Agents）LangChain在大模型应用中的核心地位与典型场景核心地位：连接、抽象、赋能典型应用场景：LangChain如何赋能实际业务结语：拥抱LangChain，构建大模型应用的未
【ChatOpenAI】常用方法详解满怀1015 大模型应用人工智能 AIGC
ChatOpenAI常用方法详解ChatOpenAI是LangChain中用于与OpenAI聊天模型交互的核心类，提供了多种方法来调用和管理对话。以下是其主要方法的详细介绍：核心方法1.invoke()-同步调用模型最常用的方法，用于同步调用模型并获取完整响应。fromlangchain_openaiimportChatOpenAIfromlangchain_core.messagesimport
【Python-Day 35】深入理解多态：代码更灵活的“鸭子类型”魔法
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【深度学习-Day 39】玩转迁移学习与模型微调：站在巨人的肩膀上吴师兄大模型深度学习入门到精通深度学习迁移学习人工智能 python 大模型机器学习模型微调
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
RoPE：相对位置编码的旋转革命——原理、演进与大模型应用全景大千AI助手人工智能 Python #OTHER 人工智能深度学习大模型算法 RoPE 位置编码相对位置
“以复数旋转解锁位置关系的本质表达，让Transformer突破长度藩篱”旋转位置编码（RotaryPositionEmbedding,RoPE）是由JianlinSu等研究者于2021年提出的突破性位置编码方法，通过复数空间中的旋转操作将相对位置信息融入Transformer的自注意力机制，解决了传统位置编码在长序列建模中的外推瓶颈。该方法是当前主流大模型（如LLaMA、GPT-NeoX）的核心
RAG、Function Call、MCP技术笔记大佐不会说日语～面试笔记篇笔记
核心概念理解这三种技术都是为了增强大模型能力的重要手段，但各有侧重点和应用场景。RAG（检索增强生成）RAG本质上是为大模型外接一个动态知识库。当模型需要回答问题时，先从知识库中检索相关信息，再结合检索结果生成答案。核心原理：将文档内容进行向量化存储（通常使用Embedding模型）用户提问时，将问题也向量化通过相似度计算（如欧氏距离、余弦相似度）找到最相关的文档片段将检索到的内容作为上下文传给大
RAG面试内容整理-3. 向量检索原理与常用库（ANN、FAISS、Milvus 等）不务正业的猿面试 LangChain AI 面试职场和发展大模型 RAG AI 人工智能算法
向量检索利用向量空间的相似度来查找相关内容，是近年来兴起的检索技术核心。其基础是在语义嵌入（embedding）模型的支持下，将文本、图像等数据表示为高维向量，以便通过向量相似度（如余弦相似度或欧氏距离）找到内容上的邻近项。由于直接精确计算所有向量之间的距离在大规模下计算开销巨大，实际系统通常采用近似最近邻搜索（ApproximateNearestNeighbor,ANN）算法，在保证结果精度接近
Pytorch实现细节解析：Transformer模型的Encoder与Decoder逐行代码讲解 lazycatlove pytorch transformer 人工智能
文章目录摘要一、Transformer1.1为什么要使用attention1.2Transformer的优点二、Transformer模型Encoder和Decoder原理讲解与其Pytorch逐行实现2.1wordembedding2.2单词索引构成源句子和目标句子2.3构建positionembedding2.4构造encoder的self-attentionmask2.5构造intra-at
PyTorch中的词嵌入层(nn.Embedding)详解与实践指南慕婉0307 自然语言处理 pytorch embedding 人工智能
一、词嵌入(WordEmbedding)简介词嵌入是自然语言处理(NLP)中的一项核心技术，它将离散的词语映射到连续的向量空间中。通过词嵌入，语义相似的词语在向量空间中的位置也会相近。为什么需要词嵌入？解决维度灾难：传统one-hot编码维度等于词汇表大小，而词嵌入维度可自定义捕捉语义关系：通过向量空间中的距离反映词语间的语义关系迁移学习：预训练的词嵌入可以在不同任务间共享二、PyTorch中的n
LangChain：大语言模型的“乐高工厂” 科技林总 DeepSeek学AI 人工智能
想象一下：你想让AI聊天机器人回答公司内部文件的问题，但它只会背诵过时的百科知识；你想让AI分析实时股票数据，它却连计算器都不会用——这正是大语言模型（LLM）的痛点。而今天介绍的**LangChain**，就是解决这些难题的“万能工具箱”。它诞生于2022年，短短一年成为GitHub增长最快的开源项目，如今已是开发AI应用的首选框架。---###**一、为什么需要LangChain？**####
langchain四种内置链的使用努力学习agent langchain langchain
#四种基础内置链的介绍与使用#LLMChain最常用的链式fromlangchain.chainsimportLLMChainfromlangchain.llmsimportOpenAIfromlangchain.promptsimportPromptTemplatellm=OpenAI(temperature=0)prompt_template="帮我给{product}想三个可以注册的域名"l
用LangChain重构客服系统：腾讯云向量数据库+GPT-4o实战
人们眼中的天才之所以卓越非凡，并非天资超人一等而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件。————马尔科姆·格拉德威尔目录一、传统客服系统痛点与重构价值1.1传统方案瓶颈分析1.2新方案技术突破点二、系统架构设计：三层解耦与组件协同2.1整体架构图编辑2.2核心组件选型对比三、核心模块实现与代码解析3.1知识库实时同步模块3.2多轮对话Agent引擎四、性能优化与压测
Python----大模型（ langchain部署简单rag应用）蹦蹦跳跳真可爱589 大模型 Python langchain 人工智能 python
一、RetrievalQA链实现加载本地文本文件并分割处理使用嵌入模型将文本转换为向量表示构建向量数据库(FAISS)实现高效相似性检索结合检索结果和大语言模型生成回答特点说明优势体现模块化封装LangChain提供标准化组件快速搭建原型系统自动化流程内置文档处理、检索、生成流水线减少开发工作量中文优化使用bge-zh嵌入模型中文语义理解更准确本地化部署模型和API均在本地运行数据隐私有保障导入依
Python----大模型（ RAG的向量化（embedding））蹦蹦跳跳真可爱589 Python 大模型 python embedding 开发语言人工智能
一、向量化向量化是将非结构化数据（如文本、图像等）转化为数字表示的一种过程。在RAG中，通常会使用预训练的Transformer模型（如BERT、RoBERTa等）将文本表示为高维的向量。这些向量能够捕捉到数据的语义信息，从而在向量空间中表示相似性。两段相似的文本在向量空间中将非常接近。快速检索：向量化将文本转换为向量后，可以通过向量相似度算法（如余弦相似度）快速检索与查询相关的信息。语义理解：通
【Go语言-Day 24】从混乱到有序：Go 语言包 (Package) 管理实战指南吴师兄大模型 Go 语言从入门到精通 golang 开发语言后端 go语言人工智能 python 大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【JavaScript-Day 7】全面解析 Number 与 String：JS 数据核心操作指南吴师兄大模型 javascript 开发语言 java 前端后端人工智能 LLM
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【深度学习-Day 10】机器学习基石：从零入门线性回归与逻辑回归
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
自定义你的 AI 项目文档系统——基于开源 LLM + LangChain + VSCode 插件构建 IT古董技术杂谈人工智能 langchain vscode
下面是一份关于如何自定义你的AI项目文档系统的完整实战指南，结合开源大语言模型、LangChain框架与VSCode插件技术，打造一个类DeepWiki的“智能项目文档专家”。项目目标构建一个本地化的AI文档助手，具备以下能力：自动解析项目代码结构使用开源大模型自动生成函数/类/模块级文档结合LangChain构建文档生成链集成VSCode插件，实现在编辑器中“选中代码➝自动生成注释或文档”支持私
智能Agent场景实战指南 Day 6：Agent框架对比与选型指南在未来等你智能Agent场景实战指南智能Agent Agent框架 LangChain AutoGen CrewAI LLM应用 AI开发
【智能Agent场景实战指南Day6】Agent框架对比与选型指南文章标签智能Agent,Agent框架,LangChain,AutoGen,CrewAI,LLM应用,AI开发文章简述在智能Agent开发中，框架选择直接影响系统能力和开发效率。本文深度对比三大主流Agent框架：1)LangChain的灵活流程编排能力；2)AutoGen的多Agent协作设计；3)CrewAI的团队协同机制。通过
BERT模型架构大多_C bert 人工智能深度学习
BertModel((embeddings):BertEmbeddings((word_embeddings):Embedding(30522,768,padding_idx=0)(position_embeddings):Embedding(512,768)(token_type_embeddings):Embedding(2,768)(LayerNorm):LayerNorm((768,),e
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc