LLM初识

从零到一：用 Python 和 LLM 构建你的专属本地知识库问答机器人

摘要：

随着大型语言模型（LLM）的兴起，构建智能问答系统变得前所未有的简单。本文将详细介绍如何使用 Python，结合开源的 LLM 和向量数据库技术，一步步搭建一个基于你本地文档的知识库问答机器人。你将学习到从环境准备、文档加载、文本切分、向量化、索引构建到最终实现问答交互的完整流程。本文包含详细的流程图描述、代码片段思路和关键注意事项，帮助你轻松上手。

引言：

在信息爆炸的今天，我们每天都会面对海量的文档和数据。无论是个人学习资料、企业内部规章，还是项目技术文档，如何从中快速、准确地提取所需信息，已成为一个普遍的痛点。传统的关键词搜索方式往往效率低下，难以理解用户的真实意图，尤其是在面对复杂的语义查询时更是捉襟见肘。幸运的是，大型语言模型（LLM）的出现，以其强大的自然语言理解和生成能力，为我们构建更智能、更高效的问答系统提供了全新的途径。本文旨在引导读者，利用 Python 编程语言和当前流行的 LLM 相关技术栈，从零开始构建一个完全基于本地文档的知识库问答机器人。这意味着您的数据无需上传到任何外部云服务，从而最大限度地保障了数据的隐私性和安全性。通过本文，您将掌握构建这样一个实用工具的核心技术和实践方法。

一、核心技术概览

在深入实践之前，我们先来了解一下构建本地知识库问答机器人所涉及的核心技术：

大型语言模型 (LLM): LLM 是基于海量文本数据训练出来的深度学习模型，能够理解和生成人类语言。在我们的问答机器人中，LLM 负责理解用户的问题，并根据从知识库中检索到的相关信息生成连贯、准确的答案。市面上有许多优秀的开源或可通过API访问的LLM，例如 Meta 的 Llama 系列、清华大学的 ChatGLM 系列，以及 OpenAI 的 GPT 系列（尽管GPT通常是API形式，但也有讨论如何在本地环境中更安全地使用其思路）。对于本地部署，选择合适的开源模型至关重要，需要考虑模型大小、性能以及硬件资源。
嵌入 (Embeddings): 计算机不直接理解文本，它们处理的是数字。文本向量化（Embeddings）技术就是将文本（单词、句子或整个文档片段）转换为固定长度的数值向量的过程。这些向量能够捕捉文本的语义信息，语义上相似的文本在向量空间中会更接近。这是实现语义检索的关键，使得我们可以根据问题的语义找到知识库中最相关的内容，而不仅仅是关键词匹配。常用的嵌入模型有 Sentence-Transformers、OpenAI Embeddings 等。
向量数据库 (Vector Database): 当我们拥有大量文本块的向量表示后，就需要一个高效的方式来存储这些向量，并能够快速检索出与给定查询向量最相似的向量。向量数据库专为此类任务设计，它们支持高效的相似性搜索（如余弦相似度、欧氏距离计算）。常见的开源向量数据库有 FAISS (Facebook AI Similarity Search)、ChromaDB、Milvus 和 Weaviate 等。对于小型项目或快速原型验证，FAISS 或 ChromaDB 通常是不错的选择，因为它们相对轻量且易于集成。
LangChain (可选但强烈推荐): LangChain 是一个开源框架，旨在简化基于 LLM 的应用程序的开发。它提供了一系列模块化的组件和链（Chains），可以帮助我们轻松地将 LLM、嵌入模型、向量数据库以及其他工具集成起来，构建复杂的应用流程，如文档加载、文本切分、问答链构建等。使用 LangChain 可以大大减少编码工作量，让我们更专注于应用逻辑本身。

二、准备工作

在开始编码之前，请确保您的开发环境已准备就绪：

Python 环境： 推荐使用 Python 3.8 或更高版本。您可以使用 virtualenv 或 conda 创建一个独立的虚拟环境，以避免库版本冲突。

必要的库安装： 打开您的终端或命令行工具，使用 pip 安装以下核心库。请注意，某些库（如 torch）的安装可能因您的操作系统和是否使用 GPU 而有所不同，建议参考其官方文档进行安装。

pip install langchain openai # openai库用于某些嵌入或LLM API，即使本地部署也可能用到其部分组件
pip install transformers torch # transformers用于加载本地LLM或嵌入模型，torch是其依赖
pip install sentence-transformers # 流行的嵌入模型库
pip install faiss-cpu # 或 faiss-gpu (如果你的机器有NVIDIA GPU并配置了CUDA)
# pip install chromadb # 如果你选择使用ChromaDB
pip install pypdf python-docx # 用于加载PDF和DOCX文档
# 根据你实际使用的LLM，可能还需要安装其他特定库，如 accelerate, bitsandbytes 等

Use code with caution.
Bash

本地 LLM 模型下载 (如果选择本地部署)： 如果您计划在本地运行 LLM（而不是使用 API），您需要预先下载模型的权重文件。例如，可以从 Hugging Face Hub (huggingface.co) 上找到许多开源模型。下载模型时要注意其大小和所需的硬件资源。确保您有足够的磁盘空间和内存（对于较大的模型，可能还需要一块性能不错的 GPU）。
准备你的知识库文档： 收集您希望机器人能够回答问题的相关文档。这些文档可以是 .txt, .pdf, .docx 等常见格式。建议将它们放在一个统一的文件夹内，方便后续程序加载。文档内容应清晰、结构化，以便于模型理解和提取信息。对于扫描版的PDF，需要先进行 OCR (Optical Character Recognition) 处理，将其转换为可选中文本。

三、实现流程详解（包含流程图描述）

构建本地知识库问答机器人的核心流程可以概括为以下几个步骤。我们将详细阐述每个步骤的实现思路。

整体流程图描述：

输入问题

无问题或退出

开始

加载本地文档

文档内容提取与切分

文本块向量化 - 生成Embeddings

构建向量索引并存入向量数据库

用户提问

用户问题向量化

在向量数据库中检索相似文本块

整合问题与检索到的上下文信息

调用LLM生成答案

向用户展示答案

结束

Use code with caution.
Mermaid

步骤 1：加载和切分文档

目的： 将原始文档加载到程序中，并将其切分成较小的、语义完整的文本块（chunks）。LLM 通常有输入长度限制，直接将整个长文档喂给模型效果不佳且成本高昂。切分也有助于后续更精确地定位与问题相关的上下文。

实现思路 (使用 LangChain):

使用 DirectoryLoader 可以方便地加载指定目录下所有支持类型的文档。可以配置 glob 参数来指定加载的文件类型（例如 "**/*.pdf" 表示加载所有子目录下的 PDF 文件）。
针对不同文件类型，DirectoryLoader 内部会调用相应的加载器，如 PyPDFLoader 处理 PDF，UnstructuredWordDocumentLoader 处理 DOCX 等。
加载后的文档内容需要进一步切分。RecursiveCharacterTextSplitter 是一个常用的文本分割器，它会尝试按段落、句子等层级进行切分，并可以指定 chunk_size (每个文本块的最大字符数) 和 chunk_overlap (相邻文本块之间的重叠字符数)。设置一定的重叠可以帮助保留文本块之间的上下文联系。

代码片段思路：

from langchain_community.document_loaders import DirectoryLoader, PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

# 加载文档
loader = DirectoryLoader('path/to/your/documents', glob="**/*.pdf", loader_cls=PyPDFLoader)
documents = loader.load()

# 初始化文本分割器
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
docs_chunks = text_splitter.split_documents(documents)
# docs_chunks 现在是一个包含多个 Document 对象的列表，每个对象代表一个文本块

Use code with caution.
Python

步骤 2：文本向量化和构建索引

目的： 将切分好的文本块转换为数值向量，并使用向量数据库构建索引，以便快速进行相似性检索。

实现思路 (使用 LangChain 和 FAISS):

选择一个嵌入模型。HuggingFaceEmbeddings 可以加载 Hugging Face Hub 上的各种开源嵌入模型（如 sentence-transformers/all-MiniLM-L6-v2）。
实例化嵌入模型。
使用向量数据库（如 FAISS）的 from_documents 方法，传入切分后的文本块 docs_chunks 和嵌入模型实例，LangChain 会自动完成文本向量化并将向量存入 FAISS 索引中。

代码片段思路：

from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS

# 初始化嵌入模型
model_name = "sentence-transformers/all-MiniLM-L6-v2" # 这是一个轻量级且效果不错的模型
model_kwargs = {'device': 'cpu'} # 如果有GPU可以设置为 'cuda'
encode_kwargs = {'normalize_embeddings': False}
embeddings_model = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs
)

# 使用FAISS从文档块创建向量存储
vector_store = FAISS.from_documents(docs_chunks, embeddings_model)
# 此时，vector_store 就绪，可以进行相似性搜索了
# 你也可以将索引保存到本地，以便后续加载，避免重复构建
# vector_store.save_local("faiss_index_knowledge_base")

Use code with caution.
Python

步骤 3：构建问答链 (QA Chain)

目的： 将 LLM、向量存储（作为检索器 Retriever）整合起来，形成一个可以接收问题、检索相关文档、并生成答案的链条。

实现思路 (使用 LangChain):

加载您选择的 LLM。如果是本地模型，可以使用 HuggingFacePipeline 或其他针对本地模型的加载器。如果是 API 形式，可以使用如 ChatOpenAI 等。这里以一个概念性的本地 LLM 加载为例。
从向量存储 vector_store 创建一个检索器 retriever。检索器负责根据问题从向量数据库中找出最相关的文本块。可以设置检索数量 k。
使用 LangChain 的 RetrievalQA 链。它封装了“检索-增强-生成”的逻辑。它会先用检索器获取相关文档，然后将这些文档和用户问题一起传递给 LLM 进行处理。
可以配置 chain_type，常见的有：
- "stuff": 将所有检索到的文本块直接塞入一个提示中（如果文本总量不超过 LLM 的上下文窗口限制，这是最简单直接的方式）。
- "map_reduce": 对每个检索到的文本块分别应用 LLM（map 步骤），然后将结果汇总处理（reduce 步骤）。适合处理大量文档或超出上下文窗口的情况。
- "refine": 依次处理检索到的文本块，逐步优化答案。
- "map_rerank": 对每个块生成答案并打分，选择最高分的答案。

代码片段思路：

from langchain.chains import RetrievalQA
# 假设你已经有了一个加载好的本地LLM实例，名为 llm
# from langchain_community.llms import CTransformers # 一个加载GGUF等格式本地模型的例子
# llm = CTransformers(model="path/to/your/local/llm.gguf", model_type="llama")

# 或者，为了演示，我们使用一个占位的假 LLM，实际中应替换为真实模型
from langchain_community.llms.fake import FakeListLLM
# responses = ["I'm sorry, I don't know the answer to that based on the provided context."] * 10
# llm = FakeListLLM(responses=responses) # 确保替换为真实的LLM

# 创建检索器
retriever = vector_store.as_retriever(search_kwargs={"k": 3}) # 检索最相关的3个文本块

# 创建RetrievalQA链
# qa_chain = RetrievalQA.from_chain_type(
#     llm=llm,
#     chain_type="stuff", # 或 "map_reduce", "refine" 等
#     retriever=retriever,
#     return_source_documents=True # 可选，是否返回源文档块
# )

# 注意：实际运行需要一个可用的llm实例。上述FakeListLLM仅为占位。
# 由于直接运行LLM的复杂性（模型下载、配置），这里只提供框架。
# 请确保你有一个配置正确的LLM实例。
print("提醒：请确保您已正确配置并加载了LLM实例，上述代码中llm部分需要替换为实际的LLM加载代码。")

Use code with caution.
Python

重要提示： 上述代码中 llm 的实例化是关键且依赖于具体环境。你需要根据你选择的本地 LLM 类型（如 GGUF, GGML 格式，或 Hugging Face Transformers 支持的模型）和 LangChain 提供的相应加载器（如 CTransformers, HuggingFacePipeline, LlamaCpp 等）来正确加载模型。这通常是整个流程中对硬件资源要求最高、配置也相对复杂的一步。

步骤 4：进行提问和获取答案

目的： 向构建好的 QA 链输入用户的问题，并获取 LLM 生成的答案。

实现思路：

直接调用 QA 链的 invoke (或旧版 __call__ 或 run) 方法，传入用户的问题字符串。
链会返回一个包含答案（通常在 'result' 键中）和可能的源文档（如果设置了 return_source_documents=True，通常在 'source_documents' 键中）的字典。

代码片段思路 (续上一步，假设qa_chain已成功创建)：

# user_question = "请介绍一下项目的主要风险点有哪些？"
# # 假设qa_chain已经成功初始化
# # response = qa_chain.invoke({"query": user_question})
# # print("答案:", response['result'])
# # if 'source_documents' in response:
# #     print("参考来源:")
# #     for doc in response['source_documents']:
# #         print(f"- {doc.metadata.get('source', 'N/A')}, page: {doc.metadata.get('page', 'N/A')}")

print("提醒：问答环节依赖于 qa_chain 的成功构建，其中包括有效的 LLM。")

Use code with caution.
Python

四、优化与进阶

基础的问答机器人搭建完成后，还有许多可以优化和进阶的方向：

选择合适的 LLM 和 Embedding 模型： 模型的选择对最终效果至关重要。大型模型通常效果更好，但资源消耗也更大。Embedding 模型也需要与 LLM 的特性相匹配。可以尝试不同的组合，并评估其在您的特定数据集上的表现。
优化文本切分策略： chunk_size 和 chunk_overlap 的设置会显著影响检索效果。需要根据文档的平均段落长度、句子结构等进行调整和实验。例如，对于代码或结构化较强的文本，可能需要不同的切分策略。
提示工程 (Prompt Engineering): 传递给 LLM 的提示词（Prompt）对生成答案的质量有巨大影响。可以优化 RetrievalQA 链中的默认提示模板，加入更具体的指令、角色扮演或输出格式要求，以引导 LLM 生成更符合期望的答案。
添加聊天历史记录： 为了支持多轮对话，机器人需要能够记住之前的交流内容。LangChain 提供了 ConversationBufferMemory 等记忆模块，可以集成到链中，实现上下文感知的对话。
Web UI 集成： 使用 Streamlit 或 Flask/Django 等 Web 框架，可以为您的问答机器人创建一个用户友好的图形界面，方便非技术人员使用。Streamlit 非常适合快速搭建数据应用原型。
评估与反馈： 建立一套评估机制，例如使用一些标准问答对来测试机器人的准确率和召回率。也可以收集用户反馈，持续优化模型和流程。
混合检索： 除了语义检索，还可以结合传统的关键词检索（如 BM25），有时混合检索的效果会更好。

五、注意事项

在开发和部署本地知识库问答机器人时，务必注意以下几点：

资源消耗： 在本地运行 LLM（尤其是较大的模型）对 CPU、内存（RAM）以及 GPU（显存）有非常高的要求。务必评估您的硬件是否满足所选模型的需求。嵌入模型的计算也可能消耗一定资源。
模型选择与许可： 不同的开源 LLM 和嵌入模型有不同的性能表现、大小和授权协议（License）。在商业应用中，务必仔细阅读并遵守模型的许可条款。
数据隐私与安全： 虽然数据保留在本地，但仍需注意原始文档的敏感性。确保运行环境的安全，防止未经授权的访问。
Embedding 模型的选择与一致性： 用于索引文档的 Embedding 模型必须与用于查询时向量化用户问题的 Embedding 模型是同一个，否则无法进行有效的相似性比较。
文本切分的粒度与上下文： 切分过细可能导致每个文本块缺乏足够的上下文信息，使得 LLM 难以理解；切分过粗则可能引入过多无关噪声，并且可能超出 LLM 的上下文窗口限制。这是一个需要仔细权衡和实验的参数。
索引的持久化与更新： 对于较大的知识库，每次启动都重新生成向量索引会非常耗时。向量数据库（如 FAISS, ChromaDB）通常支持将索引保存到磁盘并在需要时加载。同时，当知识库文档更新时，也需要考虑如何高效地更新向量索引（增量更新或重新构建）。
依赖库版本兼容性： Python 的深度学习和 LLM 相关生态系统发展迅速，库的版本迭代很快。在项目中固定主要依赖库的版本，并注意版本之间的兼容性问题，以避免不必要的麻烦。
错误处理与鲁棒性： 实际应用中，需要添加充分的错误捕获和处理机制，例如处理无法加载的文档、模型加载失败、API 调用超时等情况，以提高系统的鲁棒性。
答案的幻觉与准确性： LLM 有时会产生“幻觉”，即生成看似合理但实际上不正确或与原文不符的答案。不能完全信任 LLM 的输出，特别是对于关键决策。可以通过优化提示、引入事实校验机制或让用户方便地溯源到原始文档片段来缓解此问题。
处理速度： 从接收问题到返回答案的整个流程可能涉及多次模型推理和数据处理，响应速度可能成为瓶颈。需要考虑优化各个环节的性能，特别是 LLM 的推理速度和向量检索速度。

六、总结与展望

通过本文的指引，您应该对如何使用 Python 和 LLM 技术栈构建一个本地知识库问答机器人有了清晰的认识。我们从核心技术概览、环境准备，到详细的实现流程（包括文档加载、切分、向量化、索引构建、问答链集成），再到优化进阶和注意事项，力求为您提供一个全面的实践蓝图。

本地知识库问答机器人的潜力巨大。对于个人而言，它可以成为强大的学习和研究助手；对于企业而言，它可以用于构建内部知识库、智能客服、员工培训系统等，从而提升信息获取效率和知识管理水平。

未来，随着 LLM 技术的不断发展，我们可以期待更强大、更易用的模型和工具出现。例如，多模态能力（理解图像、音频等）的集成、更精细化的检索增强生成（RAG）策略、以及更自动化的模型微调和评估流程，都将为本地知识库问答机器人带来更广阔的应用前景和更智能的用户体验。现在，就开始动手构建属于您自己的知识管家吧！

【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
大学生入门：初识方法及其易踩坑的点
在java学习过程中，我们不难发现有很多重复使用的功能代码块，每次使用如果都要重新写一遍，岂不是很麻烦，就算是“cv”大法，感觉也不是很方便，那么，有什么办法可以解决这个问题呢？方法！java中，一段可重用的，用于执行特定功能的代码块叫做方法，它可以接收参数、返回结果，并且可以被多次使用。一、方法的基本结构[修饰符]返回值类型方法名([参数列表])[throws异常类型]{//方法体}[throw
初识白影小姐姐
两人各点了一份热狗跟超大杯的可乐后，便急急忙忙地跑到距城堡几百米远的地方。此时已经有一些人聚集在这边了。两人席地而坐，大口喝着可乐吃着热狗，还不忘热络地聊着天。吃完东西后，田挽把挎包往背后地上一放，躺下来头枕着挎包悠闲地仰望着天边的夕阳。今日的夕阳甚是好看。令她想起那天傍晚，在美国的西部一个偏远却热闹的小镇上，天空也是这么的美，她藏在心中多年的那个人却无情地与她道了别。他们甚至都没有面对面，隔着冰
《青年领袖演说集训营》林智敏感言：耐得住寂寞，才能守得住繁华！林智敏
大家好呀！我叫林智敏，双木林，智慧的智，敏感的敏。认识我智敏，人人变聪颖！认识我智敏，学习更上瘾！初识奋马在临近期末考试的时候，许久没有联系的高中同学—李静给我发了几条信息，问我对演讲有没有兴趣。她聊到她自己最近报了一个课程，让她收获很多，于是想推荐给我学习。我听到后兴奋不已也感动不已。两年没见的朋友，突然在某一天联系你，她愿意将自己收获到的东西分享给我，与我一同进步与成长。那一刻，我在心里默想，
我的ThinkPHP5框架开发22讲：从入门到实践的探索之旅 a1237567892 安全
我的ThinkPHP5框架开发22讲：从入门到实践的探索之旅在编程的世界里，框架就像是一座座灯塔，照亮着开发者前行的道路。而当我第一次接触到ThinkPHP5这个PHP框架时，它就像是我探索路上的那颗最亮的星。今天，我想和大家分享我的ThinkPHP5框架开发22讲，这是我从一个初学者到逐渐熟练的实践过程。第1讲：初识ThinkPHP5记得那是一个阳光明媚的周末，我在网上浏览PHP框架的资料时，偶
2023-10-16 来看看你们
初识他是在2002年的世界男篮世界赛中国队对阵德国队姚明的光芒被对方另一个大个子掩盖篮板行运一条龙暴扣三分…当时痴迷于篮球的我被他完全的迷住了我深深的记住了他的名字诺维斯基随后找寻一切他的资料看他所有的比赛模仿他打球的风格那是一个存在着科比艾佛森麦迪奥尼尔包括后来詹姆斯韦德等怪物的联盟他的球风并不耀眼弹跳普通速度一般因为总被对手横扫被嘲讽为软蛋他温和的性格不能在这个弱肉强食的原始森林里为自己留一点
万字解析：从 C 语言到初阶数据结构 Aurora-silas c语言数据结构开发语言
目录万字解析：从C语言到初阶数据结构前言第一章：C语言初识与环境搭建C语言的历史与影响开发工具介绍第一个程序HelloWorld第二章：变量、数据类型与运算符基本数据类型常量与变量命名规范运算符与表达式趣味小练习：BMI计算器第三章：输入输出与格式化printf输出格式详解scanf输入用法与常见问题小项目：自我介绍程序第四章：流程控制if/else条件判断switch语句循环结构小练习：乘法口诀
VideoChat：开源的数字人实时对话系统，支持自定义数字人的形象和音色蚝油菜花每日 AI 项目与应用实例人工智能开源 TTS 语音识别
❤️如果你也关注大模型与AI的发展现状，且对大模型应用开发非常感兴趣，我会快速跟你分享最新的感兴趣的AI应用和热点信息，也会不定期分享自己的想法和开源实例，欢迎关注我哦！微信公众号｜搜一搜：蚝油菜花快速阅读VideoChat是一款开源的实时数字人对话系统，支持语音输入和实时对话功能，首包延迟低至3秒。用户可以根据需要自定义数字人的形象和音色，实现个性化交互。VideoChat支持ASR-LLM-T
使用中转API在Python中调用大型语言模型 (LLM) 的实践** qq_37836323 python 语言模型开发语言
**在人工智能技术中，大型语言模型(LLM)已成为自然语言处理(NLP)和生成任务的重要工具。然而，由于网络限制，直接访问OpenAI的API在中国可能面临挑战。因此，本文将介绍如何使用中转API地址http://api.wlai.vip来调用LLM，并提供相关的demo代码。什么是大型语言模型(LLM)？大型语言模型是一种深度学习模型，训练于大量文本数据上，能够生成、总结、翻译和回答问题等。Op
大模型【进阶】（四）QWen模型架构的解读 ReinaXue 人工智能 transformer 语言模型迁移学习 AudioLM 语音识别神经网络
一、Qwen大模型的背景Qwen（通义千问）是阿里巴巴云开发的大型语言模型（LLM）和多模态模型系列，旨在提供强大的自然语言理解、文本生成、图像理解、音频处理及工具使用能力。Qwen系列包括Qwen、Qwen1.5、Qwen2、Qwen2.5和Qwen3等版本，涵盖了从小型（0.5B参数）到超大型（480B参数）的模型规模，支持多语言（119种语言）和多模态任务（文本、图像、音频、视频）。本文将重
AI+MCP智能研判系统架构
AI+MCP智能研判系统架构1.系统概述1.1核心理念AI+MCP智能研判系统是一个创新的网络安全分析平台，通过将大语言模型（LLM）的智能理解能力与MCP（ModelContextProtocol）协议的标准化工具调用能力相结合，实现了"自然语言提问→AI智能理解→MCP工具调用→AI深度研判→智能结果输出"的完整闭环。1.2技术创新点智能意图识别：基于LLM的自然语言理解，自动解析用户查询意图
优化提示内容生成技术框架：提示工程架构师的坚实后盾
优化提示内容生成技术框架：提示工程架构师的坚实后盾引言背景：大语言模型时代的“提示瓶颈”当GPT-4、Claude3、Gemini等大语言模型（LLM）的参数规模突破万亿、上下文窗口扩展至百万token时，一个矛盾逐渐凸显：模型能力的跃升与提示质量的滞后，正在成为制约AI应用落地的核心瓶颈。2023年斯坦福大学的研究显示，在企业级LLM应用中，70%的功能故障源于提示设计缺陷——或因指令模糊导致输
从0搭建到持续优化：提示工程架构师的评估体系迭代全流程
从0搭建到持续优化：提示工程架构师的评估体系迭代全流程引言：AI时代的关键角色与评估挑战在人工智能技术迅猛发展的今天，提示工程(PromptEngineering)已从一个小众技能演变为决定AI系统成败的核心能力。随着大语言模型(LLM)能力的不断增强，提示工程架构师(PromptEngineeringArchitect)作为一个新兴职业应运而生，成为连接业务需求与AI能力的关键桥梁。为什么提示工
！LangChain代理决策架构与源码深度剖析(75)
LangChain代理决策架构与源码深度剖析一、LangChain代理决策架构概述1.1代理决策架构的核心组件LangChain代理的决策架构是其智能交互的核心，主要由大语言模型（LLM）、工具集（Tools）、提示模板（PromptTemplate）、规划器（Planner）、执行器（Executor）和反馈机制六大组件构成。这些组件通过协同工作，实现从用户输入解析到最终结果输出的完整决策流程。
Crome：因果鲁棒奖励建模框架——破解LLM对齐中的奖励黑客难题大千AI助手人工智能 #OTHER Python 人工智能深度学习神经网络大模型因果推断奖励黑客 RewardHacking
Crome（CausalRobustRewardModeling）是由GoogleDeepMind联合麦吉尔大学和魁北克人工智能研究所（MILA）于2025年提出的创新框架，旨在解决大语言模型（LLM）对齐中奖励模型（RM）的奖励黑客（RewardHacking）问题。该框架通过因果数据增强与反事实训练机制，显著提升RM对真实质量属性（如事实性、安全性）的敏感性，同时抑制对虚假属性（如文本长度、格
初识星巴克小县城生活日记
图片发自App前2个月在珠海免税商场做兼职的时候，看到楼下的星巴克咖啡馆，总是有人进进出出，当时有点好奇，为什么有那么多人喜欢喝星巴克咖啡。还有我喜欢的出名作家，彭小六也经常在文章里说，他基本每天都会去家附近的星巴克咖啡馆写作。昨晚看到一则新闻，说星巴克的CEO正在竞选美国总统，而且读到了关于星巴克创始人的创业故事。读完之后觉得这个男人三观太正了，他对待员工的方式和他给员工的福利待遇，真的不是一般
【大模型LLM学习】function call/agent学习记录威化饼的一隅大模型LLM学习 agent langchain 意图识别 function call 工具调用
【大模型LLM学习】functioncall/agent学习记录0前言1langchain实现functioncall2调用本地模型3微调本地模型3.1few-shot调用Claude生成Q-A对3.2tools格式3.3agent微调格式3.4swift微调p.s.0前言记录一下使用langchain做简单的functioncall/agent(或者说意图识别，如果函数有返回值再进行summ
提示工程监控不到位：5个未做日志记录导致的排查困难
提示工程监控不到位：5个未做日志记录导致的排查困难关键词：提示工程,日志记录,LLM应用调试,AI监控,排查困难,提示模板,上下文追踪摘要：在大语言模型(LLM)应用爆发的时代，提示工程已成为连接人类需求与AI能力的核心桥梁。但多数开发者聚焦于"如何写好提示"，却忽视了"如何记录提示"——日志记录作为提示工程的"黑匣子"，直接决定了AI应用故障排查的效率与准确性。本文通过5个真实场景案例，深入浅出
提示工程中的上下文窗口优化：架构师提升模型记忆的关键 AI实战架构笔记 ai
提示工程中的上下文窗口优化：架构师提升模型记忆的关键元数据标题：提示工程中的上下文窗口优化：架构师提升模型记忆的关键策略与实践指南关键词：上下文窗口管理、提示工程架构、大型语言模型优化、注意力机制效率、长序列处理、记忆增强技术、动态上下文规划摘要：在大型语言模型(LLM)应用中，上下文窗口是连接模型能力与实际需求的关键桥梁。本文从架构师视角，系统探讨上下文窗口优化的理论基础、设计原则与实施策略。通
「实战指南」使用 Python 调用大模型（LLM）用什么都重名大模型相关 python LLM 大模型 api调用
目录前言1.原生HTTP请求方式1.1核心特点1.2关键代码分析1.3优势和适用场景1.4完整代码2.封装式API调用2.1核心特点2.2关键代码分析2.3优势和适用场景2.4完整代码3.OpenAISDK方式3.1核心特点3.2关键代码分析3.3优势和适用场景3.4完整代码4.传统OpenAI库方式4.1核心特点4.2关键代码分析4.3优势和适用场景4.4完整代码5.对比分析总结前言随着大语言模
实践篇：构建基于LLM与本地Pandas的混合式数据分析引擎超人阿亚 pandas 数据分析数据挖掘
公众号：dify实验室基于LLMOps平台-Dify的一站式学习平台。包含不限于：Dify工作流案例、DSL文件分享、模型接入、Dify交流讨论等各类资源分享。在上一篇《思路探索：当大型语言模型遇见数据分析的现实挑战》中，我们阐述了团队确立的技术路线：利用大型语言模型（LLM）作为自然语言到代码的“翻译器”，并结合PythonPandas库作为后端的高性能“计算核心”。本文将从工程实践的角度，详细
2024智能交通趋势：提示工程架构师用AI提示词引领技术变革 AIGC应用创新大全人工智能 ai
2024智能交通趋势：提示工程架构师用AI提示词引领技术变革副标题：从自动驾驶决策到城市交通大脑——大语言模型提示工程实战指南摘要/引言问题陈述：智能交通系统正面临前所未有的复杂性挑战——自动驾驶车辆需要实时处理多源异构数据，城市交通管理需平衡效率与安全，出行服务平台要满足个性化需求。传统AI开发模式依赖大量标注数据和专业领域知识，导致系统迭代缓慢、场景适应性差。当大语言模型(LLM)成为通用人工
那年初夏，我们正青春桃花岛蜜儿
“我应该付多少钱？”小曼心怀感谢的问到。“没有十万八万的我不要”小丫趾高气扬的回到。“再说谈钱有意思吗？”“没有，可是我……我可以分期付款吗？一天两毛，付到我们一千岁？”“那好吧，就按你说的办”思绪一下子被拉到多年前，那时她们都是小姑娘。带着梦想，带着闯劲来到江南城市打拼……初识小丫时，小曼还是一个20岁的丫头片子，天不怕地不怕。独身闯天涯。因为她背负的太多，天天不辞辛苦工作。总认为自己可以扛起一
Java中的模型API、RAG与向量数据库：构建智能应用的新范式张道宁人工智能
引言在当今人工智能迅猛发展的时代，Java开发者如何利用最新的AI技术构建智能应用？本文将深入探讨模型API、检索增强生成(RAG)和向量数据库这三种关键技术，以及它们如何协同工作来提升Java应用的智能化水平。一、模型API：Java中的AI能力接入1.1什么是模型API模型API是大型语言模型(LLM)提供的编程接口，允许开发者通过HTTP请求与AI模型交互。在Java生态中，我们可以通过多种
大模型 MCP：开启 AI 与现实世界的无缝交互革命 u013250861 LLM 人工智能交互 microsoft
前言MCP无疑是当前最受关注的前沿技术之一，无论是在公司内部还是外部，都引起了广泛的讨论与实践。作为一名互联网从业者，笔者自然不愿错过这一科技浪潮。本篇文章分享笔者最近的一些实践经验和心得，希望能抛砖引玉。WHAT：什么是MCP？MCP（ModelContextProtocol，模型上下文协议）是由Anthropic推出的开源协议，旨在实现大型语言模型（LLM）与外部数据源和工具的无缝集成，用来在
揭秘Transformer架构：残差流与隐藏层的关系 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python transformer 深度学习人工智能 linux 算法
在Transformer架构的LLM中，“残差流”（residualstream）和“隐藏层”（hiddenlayers）是密切相关但不同的概念，前者是层间流动的核心数据，后者是处理这些数据的结构单元。1.残差流（ResidualStream）：层间传递的“信息流”残差流指的是在Transformer层之间传递的核心张量，它是模型中“流动”的数据载体。其本质是通过“残差连接”（residualco
初识 docker [上] 这就是佬们吗 docker java 开发语言笔记容器
docker常用命令补充：docker和容器自启动演示命名别名数据卷挂载命令演示环节:查看挂载详情挂载本地目录或文件演示环节：演示一下MySQL的匿名数据卷docker常用命令命令说明中文文档地址dockerpull拉取镜像dockerpulldockerpush推送镜像到DockerRegistrydockerpushdockerimages查看本地镜像dockerimagesdockerrmi
c++（上）物源菌 c++开发语言
c++（上）1C++初识1.1第一个C++程序1.1.1工程文件#需求的最低cmake程序版本cmake_minimum_required(VERSION3.12)#本工程的名字project(cpp)#本工程支持的C++版本set(CMAKE_CXX_STANDARD17)#本工程主程序文件及输出程序名称add_executable(cppStudy"main.cpp")具体原理看cmake1.
算法入门：BFS与DFS详解（C++实现） Jay_515 算法算法
深度优先与广度优先是算法世界的两大基石，掌握它们如同获得探索算法宇宙的钥匙一、初识BFS与DFS什么是BFS和DFS？BFS（广度优先搜索）：逐层遍历数据结构，先访问离起点最近的节点DFS（深度优先搜索）：沿着分支深入到底部，再回溯探索其他分支核心应用场景算法典型应用场景BFS最短路径问题、社交网络好友推荐、连通块分析DFS路径存在性判断、拓扑排序、解决回溯问题、图连通性检测二、BFS算法详解算法
神经架构搜索革命：从动态搜索到高性能LLM的蜕变之路
本文将揭示如何通过神经架构搜索技术（NAS）自动发现最优网络结构，并将搜索结果转化为新一代高性能大型语言模型的核心技术。我们的实验证明，该方法在同等计算资源下可实现80%的性能飞跃！第一部分：神经架构搜索引擎的实现奥秘1.动态操作熔炉架构classMaxStateSuper(nn.Module):def__init__(self,dim_size,heads):#定义5种候选操作self.ops=
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n

LLM初识

从零到一：用 Python 和 LLM 构建你的专属本地知识库问答机器人

摘要：

引言：

一、核心技术概览

二、准备工作

三、实现流程详解（包含流程图描述）

步骤 1：加载和切分文档

步骤 2：文本向量化和构建索引

步骤 3：构建问答链 (QA Chain)

步骤 4：进行提问和获取答案

四、优化与进阶

五、注意事项

六、总结与展望

你可能感兴趣的:(LLM初识)