骆驼穿针眼

基于 InternLM 和 LangChain 搭建你的知识库(三)

基于 InternLM 和 LangChain 搭建你的知识库

大模型开发范式

Finetune

在大型语言模型中，Finetune（微调）是一种技术，用于调整预训练的模型以提高其在特定任务或数据集上的表现。这种方法通常涉及以下步骤：

预训练模型：首先，需要一个预训练的大型语言模型，如GPT、BERT或其他变体。这些模型通常在大型文本语料库上训练，以学习语言的广泛特征和结构。

特定任务的数据：接着，收集和准备针对特定任务的数据集。这个数据集应该包括输入和期望的输出，例如，用于情感分析的句子和它们的情感标签，或者用于翻译任务的句子对。

微调：然后，使用特定任务的数据集对预训练模型进行微调。这通常涉及在该数据集上继续训练模型一段时间，调整模型的权重以优化任务特定的性能。微调时，学习率通常设置得比预训练阶段低，以避免过快破坏预训练时学到的有用特征。

评估和调整：最后，评估微调后模型的性能，并根据需要调整微调过程（如调整学习率、训练更多的轮次或修改数据处理方式）以进一步提高性能。

微调的优势在于能够利用预训练模型在广泛数据上学习到的丰富知识，从而需要较少的标注数据就可以达到较高的性能。这对于数据稀缺的任务尤其有价值。然而，微调也有其挑战，例如过拟合（特别是在小数据集上）、调整过程中的超参数选择等。

Retrieval Augmented Generation (RAG)
RAG是一种自然语言处理技术，结合了信息检索和文本生成的能力，以提高模型在处理复杂查询时的性能和准确性。在RAG系统中，首先利用一个检索组件查询一个大型文档数据库，以找到与给定查询最相关的信息。然后，这些检索到的文档被送入一个生成模型，如序列到序列的转换模型，这个模型利用检索到的信息来生成回答或完成给定的文本任务。

RAG模型的关键在于它结合了检索的精确性和生成模型的灵活性。通过这种方式，RAG能够在需要具体信息或知识支持时提供更准确、更丰富的回答。例如，在回答特定的事实问题、撰写有关特定主题的文章或生成信息丰富的对话回复时，RAG模型可以展现出比传统的生成模型更优越的性能。

RAG技术的一个主要优势是它能够有效地处理那些对传统生成模型来说过于复杂或需要外部知识的查询。它通过检索相关文档来直接利用现有的知识库，然后将这些信息融入生成过程中，从而提高了生成文本的相关性和准确性。这使得RAG尤其适合于需要广泛背景知识的应用场景，如问答系统、内容创作和对话系统等。

RAG模型的实现通常涉及到两个主要组件的训练和优化：检索组件和生成组件。检索组件负责从大型文档集中快速有效地检索出与查询最相关的文档，而生成组件则负责处理这些文档，并基于它们生成连贯和相关的文本输出。这两个组件的协同工作使得RAG能够在许多自然语言处理任务中实现高性能。

LangChain是一个开源框架，旨在利用最新的自然语言处理（NLP）技术，尤其是大型语言模型（LLM），来构建和部署语言应用。它提供了一套工具和API，使开发者能够轻松集成复杂的语言理解和生成能力到他们的应用中。LangChain通过提供与检索增强生成（RAG）、链式推理、对话系统等高级功能的集成，促进了创新应用的开发。以下是几种结合LangChain可能的应用场景：

增强的问答系统：利用LangChain，可以构建更智能、更准确的问答系统，这些系统能够通过检索和引用大量的外部知识源来回答复杂的问题。结合RAG等技术，这些系统不仅能够生成准确的答案，还能提供答案的来源，增加透明度和可信度。
知识管理和信息检索：LangChain可以帮助企业和组织构建先进的知识管理系统，这些系统能够理解自然语言查询，并从大型文档库中检索和总结相关信息。这对于提高研究效率和支持决策过程特别有价值。
自动内容创作：利用LangChain，可以开发出能够自动生成文章、报告、摘要等内容的应用。结合RAG等技术，这些应用能够引用和整合来自多个来源的信息，创造出既丰富又准确的内容。
交互式对话系统和聊天机器人：LangChain提供的工具和API使得开发者能够构建高度互动的对话系统和聊天机器人，这些系统能够进行复杂的对话、解答问题、提供推荐，甚至执行特定的任务或服务。
教育和学习：通过LangChain，可以开发辅助学习和教学的应用，例如自动生成练习题、提供个性化的学习资料和反馈，以及构建能够解答学生问题的智能助手。
创意写作和娱乐：LangChain也可以用于支持创意写作，包括自动生成故事、诗歌、剧本等。此外，它还可以用于开发互动游戏和娱乐应用，其中包括复杂的故事情节和角色对话。

基于langChain搭建RAG

构建向量数据库

加载源文件 -》文档分块 -》文档向量

搭建知识库助手

构建一个检索问答链（Retrieval Question-Answering Chain, RQAC）涉及到创建一个系统，它可以通过检索相关信息并基于这些信息生成回答来处理复杂的查询。这个过程通常涉及到以下几个关键步骤：

需求分析：

确定系统的目标用户和用例。
确定需要检索的信息类型和来源。
选择或构建检索系统：

确定适合的检索技术（例如，Elasticsearch, Solr, 或自定义检索算法）。
构建或配置检索数据库，确保它包含足够的信息来回答用户的问题。
实现一个检索模块，它可以根据用户的查询从数据库中检索相关文档或信息。
选择或开发问答生成模型：

选择一个现有的语言模型（如GPT-4, BERT, T5等），这些模型可以用来理解查询和生成回答。
根据需要，训练或微调模型以提高对特定域或任务的回答质量。
集成检索和问答系统：

实现一个流程，其中用户的查询首先触发检索模块来查找相关信息。
将检索到的信息作为上下文输入到问答模型中，生成针对用户查询的回答。
用户界面设计：

设计一个用户界面，用户可以通过它提交查询并接收回答。
确保界面简洁易用，能够清楚地展示检索到的信息和生成的回答。
测试和优化：

对系统进行彻底测试，包括单元测试、集成测试和用户接受测试。
根据反馈优化检索准确性和回答质量。
部署和维护：

部署系统到生产环境。
定期更新数据库和模型，确保系统能够处理新出现的查询和信息。

web demo

有很多支持简易Web部署的框架，如Gradio，streamlit

环境搭配

conda activate InternLM

安装一些重要的包

# 升级pip
python -m pip install --upgrade pip

pip install modelscope==1.9.5
pip install transformers==4.35.2
pip install streamlit==1.24.0
pip install sentencepiece==0.1.99
pip install accelerate==0.24.1

模型下载

在目录下新建 download.py 文件并在其中输入以下内容，粘贴代码后记得保存文件，如下图所示。并运行 python download.py 执行下载，模型大小为 14 GB，下载模型大概需要 10~20 分钟

import torch
from modelscope import snapshot_download, AutoModel, AutoTokenizer
import os
model_dir = snapshot_download('Shanghai_AI_Laboratory/internlm-chat-7b', cache_dir='../model', revision='v1.0.3')

LangChain 相关环境配置

在已完成 InternLM 的部署基础上，还需要安装以下依赖包：

pip install langchain==0.0.292
pip install gradio==4.4.0
pip install chromadb==0.4.15
pip install sentence-transformers==2.2.2
pip install unstructured==0.10.30
pip install markdown==3.3.7

同时，需要使用到开源词向量模型 Sentence Transformer
首先需要使用 huggingface 官方提供的 huggingface-cli 命令行工具。安装依赖:

pip install -U huggingface_hub

目录下新建python文件 download_hf.py，填入以下代码：

resume-download：断点续下
local-dir：本地存储路径。（linux环境下需要填写绝对路径）

import os

# 下载模型

os.system('huggingface-cli download --resume-download sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 --local-dir ../model/sentence-transformer')

下载 NLTK 相关资源

cd /root
git clone https://gitee.com/yzy0612/nltk_data.git  --branch gh-pages
cd nltk_data
mv packages/*  ./
cd tokenizers
unzip punkt.zip
cd ../taggers
unzip averaged_perceptron_tagger.zip

下载项目代码

cd /root/data
git clone https://github.com/InternLM/tutorial

数据收集

我们选择由上海人工智能实验室开源的一系列大模型工具开源仓库作为语料库来源，包括：

OpenCompass：面向大模型评测的一站式平台
IMDeploy：涵盖了 LLM 任务的全套轻量化、部署和服务解决方案的高效推理工具箱
XTuner：轻量级微调大语言模型的工具库
InternLM-XComposer：浦语·灵笔，基于书生·浦语大语言模型研发的视觉-语言大模型
Lagent：一个轻量级、开源的基于大语言模型的智能体（agent）框架
InternLM：一个开源的轻量级训练框架，旨在支持大模型训练而无需大量的依赖

进入到数据库盘

cd /root/data

# clone 上述开源仓库
git clone https://gitee.com/open-compass/opencompass.git
git clone https://gitee.com/InternLM/lmdeploy.git
git clone https://gitee.com/InternLM/xtuner.git
git clone https://gitee.com/InternLM/InternLM-XComposer.git
git clone https://gitee.com/InternLM/lagent.git
git clone https://gitee.com/InternLM/InternLM.git

将数据整理出来的脚本

# 首先导入所需第三方库
from langchain.document_loaders import UnstructuredFileLoader
from langchain.document_loaders import UnstructuredMarkdownLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.vectorstores import Chroma
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from tqdm import tqdm
import os

# 获取文件路径函数
def get_files(dir_path):
    # args：dir_path，目标文件夹路径
    file_list = []
    for filepath, dirnames, filenames in os.walk(dir_path):
        # os.walk 函数将递归遍历指定文件夹
        for filename in filenames:
            # 通过后缀名判断文件类型是否满足要求
            if filename.endswith(".md"):
                # 如果满足要求，将其绝对路径加入到结果列表
                file_list.append(os.path.join(filepath, filename))
            elif filename.endswith(".txt"):
                file_list.append(os.path.join(filepath, filename))
    return file_list

# 加载文件函数
def get_text(dir_path):
    # args：dir_path，目标文件夹路径
    # 首先调用上文定义的函数得到目标文件路径列表
    file_lst = get_files(dir_path)
    # docs 存放加载之后的纯文本对象
    docs = []
    # 遍历所有目标文件
    for one_file in tqdm(file_lst):
        file_type = one_file.split('.')[-1]
        if file_type == 'md':
            loader = UnstructuredMarkdownLoader(one_file)
        elif file_type == 'txt':
            loader = UnstructuredFileLoader(one_file)
        else:
            # 如果是不符合条件的文件，直接跳过
            continue
        docs.extend(loader.load())
    return docs

# 目标文件夹
tar_dir = [
    "/root/data/InternLM",
    "/root/data/InternLM-XComposer",
    "/root/data/lagent",
    "/root/data/lmdeploy",
    "/root/data/opencompass",
    "/root/data/xtuner"
]

# 加载目标文件
docs = []
for dir_path in tar_dir:
    docs.extend(get_text(dir_path))

# 对文本进行分块
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500, chunk_overlap=150)
split_docs = text_splitter.split_documents(docs)

# 加载开源词向量模型
embeddings = HuggingFaceEmbeddings(model_name="/root/data/model/sentence-transformer")

# 构建向量数据库
# 定义持久化路径
persist_directory = 'data_base/vector_db/chroma'
# 加载数据库
vectordb = Chroma.from_documents(
    documents=split_docs,
    embedding=embeddings,
    persist_directory=persist_directory  # 允许我们将persist_directory目录保存到磁盘上
)
# 将加载的向量数据库持久化到磁盘上
vectordb.persist()

实行

DEMO

在Ubuntu24.04搭建VLLM， SGLang 和 LangChain环境小熊冲！冲！冲！ AI ubuntu langchain ai 毕业设计
在Ubuntu24.04搭建VLLM，SGLang和LangChain环境[!NOTE]概述整片文章是笔者的回忆(白天忙碌了一天，晚上进行的总结)，所以有些地方的描述可能有误差，本文更多的是大体方向问题，细节步骤不是本文的重点，见谅!!!如何安装Ubuntu24.04制作启动U盘，作者使用的是rufus.exe工具下载Ubuntu24.04的ISO镜像使用rufus.exe工具刷入Ubuntu22
如何从模型返回结构化数据努力学习agent langchain 人工智能
with_structured_output()方法支持此方法的模型ProviderToolcallingStructuredoutputJSONmodeLocalMultimodalPackageChatAnthropic✅✅❌❌✅langchain-anthropicChatMistralAI✅✅❌❌❌langchain-mistralaiChatFireworks✅✅✅❌❌langchain
Langchain学习笔记(十)：文档加载与处理详解
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建基于大语言模型的应用时，文档处理是一个至关重要的环节。无论是构建RAG（检索增强生成）系统，还是进行知识库问答，我们都需要将各种格式的文档转换为模型可以理解和处理的形式。Langchain提供了强大的文档加载和处理功能，支持多种文件格式，并提
Langchain学习笔记(十二)：Memory机制与对话管理 zhangsan0933 LangChain langchain 学习笔记
注：本文是Langchain框架的学习笔记；不是教程！不是教程！内容可能有所疏漏，欢迎交流指正。后续将持续更新学习笔记，分享我的学习心得和实践经验。前言在构建智能对话系统时，记忆功能是至关重要的。想象一下，如果每次与AI对话都像第一次见面一样，无法记住之前的交流内容，这样的体验将是多么糟糕。LangChain的Memory机制正是为了解决这个问题而设计的，它让AI能够"记住"对话历史，从而提供更加
LangChain specific default response 营赢盈英 AI langchain python openai api
题意：LangChain特定的默认响应问题背景：usingLangChainandOpenAI,howcanIhavethemodelreturnaspecificdefaultresponse?forinstance,let'ssayIhavethesestatement/responses使用LangChain和OpenAI时，如何让模型返回特定的默认响应？例如，假设我有如下的陈述/响应：St
赋能未来数学课堂——基于Qwen3、LangChain与Agent架构的个性化教辅系统研究微学AI langchain 架构
文章目录摘要引言：技术融合催生的教育新范式第一章：Qwen3+LangChain+Agent架构的核心能力与优势1.1Qwen3模型：专为复杂推理打造的“智能大脑”1.2LangChain框架：构建智能体的“灵活骨架”1.3Agent智能体：自主解决问题的“执行中枢”1.4部署与成本优势第二章：在数学教育中解决的关键问题2.1从“答案”到“过程”：深度解析与分步式辅导2.2千人千面：实现高度个性化
！LangChain代理决策架构与源码深度剖析(75)
LangChain代理决策架构与源码深度剖析一、LangChain代理决策架构概述1.1代理决策架构的核心组件LangChain代理的决策架构是其智能交互的核心，主要由大语言模型（LLM）、工具集（Tools）、提示模板（PromptTemplate）、规划器（Planner）、执行器（Executor）和反馈机制六大组件构成。这些组件通过协同工作，实现从用户输入解析到最终结果输出的完整决策流程。
！LangChain文档加载器的接口设计与多种格式解析源码深度解析(77)
LangChain文档加载器的接口设计与多种格式解析源码深度解析一、文档加载器概述1.1文档加载器的作用与定位LangChain文档加载器（DocumentLoaders）是整个框架中负责数据输入的核心组件，其主要作用是从不同来源（本地文件、网络资源、数据库等）读取原始文档，并将其转换为LangChain可处理的Document对象格式。在实际应用中，无论是构建问答系统、知识图谱，还是进行文本摘要
Python面向对象编程入门：从类与对象到方法与属性吴师兄大模型 python 人工智能面向对象编程开发语言类对象 PYTHON
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【大模型LLM学习】function call/agent学习记录威化饼的一隅大模型LLM学习 agent langchain 意图识别 function call 工具调用
【大模型LLM学习】functioncall/agent学习记录0前言1langchain实现functioncall2调用本地模型3微调本地模型3.1few-shot调用Claude生成Q-A对3.2tools格式3.3agent微调格式3.4swift微调p.s.0前言记录一下使用langchain做简单的functioncall/agent(或者说意图识别，如果函数有返回值再进行summ
LangChain：大模型时代的开发利器 tanak Python大模型应用全栈实战 langchain 人工智能 python
文章目录什么是LangChain？深入解析其核心理念与组件1.模型（Models）2.提示（Prompts）3.链（Chains）4.索引（Indexes）5.记忆（Memory）6.工具（Tools）7.代理（Agents）LangChain在大模型应用中的核心地位与典型场景核心地位：连接、抽象、赋能典型应用场景：LangChain如何赋能实际业务结语：拥抱LangChain，构建大模型应用的未
【ChatOpenAI】常用方法详解满怀1015 大模型应用人工智能 AIGC
ChatOpenAI常用方法详解ChatOpenAI是LangChain中用于与OpenAI聊天模型交互的核心类，提供了多种方法来调用和管理对话。以下是其主要方法的详细介绍：核心方法1.invoke()-同步调用模型最常用的方法，用于同步调用模型并获取完整响应。fromlangchain_openaiimportChatOpenAIfromlangchain_core.messagesimport
【Python-Day 35】深入理解多态：代码更灵活的“鸭子类型”魔法
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【深度学习-Day 39】玩转迁移学习与模型微调：站在巨人的肩膀上吴师兄大模型深度学习入门到精通深度学习迁移学习人工智能 python 大模型机器学习模型微调
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
LangChain：大语言模型的“乐高工厂” 科技林总 DeepSeek学AI 人工智能
想象一下：你想让AI聊天机器人回答公司内部文件的问题，但它只会背诵过时的百科知识；你想让AI分析实时股票数据，它却连计算器都不会用——这正是大语言模型（LLM）的痛点。而今天介绍的**LangChain**，就是解决这些难题的“万能工具箱”。它诞生于2022年，短短一年成为GitHub增长最快的开源项目，如今已是开发AI应用的首选框架。---###**一、为什么需要LangChain？**####
langchain四种内置链的使用努力学习agent langchain langchain
#四种基础内置链的介绍与使用#LLMChain最常用的链式fromlangchain.chainsimportLLMChainfromlangchain.llmsimportOpenAIfromlangchain.promptsimportPromptTemplatellm=OpenAI(temperature=0)prompt_template="帮我给{product}想三个可以注册的域名"l
用LangChain重构客服系统：腾讯云向量数据库+GPT-4o实战
人们眼中的天才之所以卓越非凡，并非天资超人一等而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件。————马尔科姆·格拉德威尔目录一、传统客服系统痛点与重构价值1.1传统方案瓶颈分析1.2新方案技术突破点二、系统架构设计：三层解耦与组件协同2.1整体架构图编辑2.2核心组件选型对比三、核心模块实现与代码解析3.1知识库实时同步模块3.2多轮对话Agent引擎四、性能优化与压测
Python----大模型（ langchain部署简单rag应用）蹦蹦跳跳真可爱589 大模型 Python langchain 人工智能 python
一、RetrievalQA链实现加载本地文本文件并分割处理使用嵌入模型将文本转换为向量表示构建向量数据库(FAISS)实现高效相似性检索结合检索结果和大语言模型生成回答特点说明优势体现模块化封装LangChain提供标准化组件快速搭建原型系统自动化流程内置文档处理、检索、生成流水线减少开发工作量中文优化使用bge-zh嵌入模型中文语义理解更准确本地化部署模型和API均在本地运行数据隐私有保障导入依
【Go语言-Day 24】从混乱到有序：Go 语言包 (Package) 管理实战指南吴师兄大模型 Go 语言从入门到精通 golang 开发语言后端 go语言人工智能 python 大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【JavaScript-Day 7】全面解析 Number 与 String：JS 数据核心操作指南吴师兄大模型 javascript 开发语言 java 前端后端人工智能 LLM
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【深度学习-Day 10】机器学习基石：从零入门线性回归与逻辑回归
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
自定义你的 AI 项目文档系统——基于开源 LLM + LangChain + VSCode 插件构建 IT古董技术杂谈人工智能 langchain vscode
下面是一份关于如何自定义你的AI项目文档系统的完整实战指南，结合开源大语言模型、LangChain框架与VSCode插件技术，打造一个类DeepWiki的“智能项目文档专家”。项目目标构建一个本地化的AI文档助手，具备以下能力：自动解析项目代码结构使用开源大模型自动生成函数/类/模块级文档结合LangChain构建文档生成链集成VSCode插件，实现在编辑器中“选中代码➝自动生成注释或文档”支持私
智能Agent场景实战指南 Day 6：Agent框架对比与选型指南在未来等你智能Agent场景实战指南智能Agent Agent框架 LangChain AutoGen CrewAI LLM应用 AI开发
【智能Agent场景实战指南Day6】Agent框架对比与选型指南文章标签智能Agent,Agent框架,LangChain,AutoGen,CrewAI,LLM应用,AI开发文章简述在智能Agent开发中，框架选择直接影响系统能力和开发效率。本文深度对比三大主流Agent框架：1)LangChain的灵活流程编排能力；2)AutoGen的多Agent协作设计；3)CrewAI的团队协同机制。通过
AI Agent开发学习系列 - langchain之示例选择器2：相关性与多样性兼得-MaxMarginalRelevanceExampleSelector在LangChain中的用法 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
MaxMarginalRelevanceExampleSelectorMaxMarginalRelevanceExampleSelector是LangChain中用于Few-ShotPrompt的一种智能示例选择器。它的作用是：在众多示例中，自动选择与当前输入最相关、同时彼此多样性最大的示例，插入到prompt里。主要特点相关性优先：优先选择与用户输入最相似的示例。多样性保证：避免选到内容高度重复
AI Agent开发学习系列 - langchain之memory(1)：内存中的短时记忆 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
内存中的短时记忆，在LangChain中通常指ConversationBufferMemory这类“对话缓冲记忆”工具。它的作用是：在内存中保存最近的对话历史，让大模型能理解上下文，实现连续对话。对话缓冲记忆”工具主要特点只保留最近的对话内容（如最近N轮），不会无限增长，节省内存和token。适合短对话、上下文关联不深的场景。支持多种变体，如窗口记忆（ConversationBufferWindo
家庭服务具身智能机器人体系架构
硬件方面：差速移动机器人+六轴协作机械臂，软件方面选择ROS系统：底盘控制move_group，机械臂操纵MoveIt，大模型方面采用VLM+LLM：（1）视觉语言模型（VLM），用来实现环境理解与指令解析，候选模型为LLaVA和Qwen-VL。微调VLM需要2~4周，工作量主要是准备环境数据和标注期望输出。（2）大语言模型（LLM），用来实现任务分解与技能调用，候选工具有LangChain（任务
从API到Agent：万字洞悉LangChain工程化设计 bpluo42657 langchain
——构建下一代AI应用的核心范式迁移一、传统API范式的局限性：为什么需要Agent？接口式AI的痛点python#传统NLPAPI调用示例response=openai.Completion.create(model="text-davinci-003",prompt="请翻译：Helloworld",max_tokens=50)单次请求/响应模式缺乏状态管理与上下文延续硬编码逻辑难以应对复杂场
LangChain4j入门：Java开发者的AI应用开发指南半夜偷你家裤衩子 LangChain4j java 人工智能开发语言 LangChain4j
在AI浪潮席卷全球的今天，Java开发者如何快速上手大语言模型应用开发？LangChain4j为我们提供了完美的解决方案！前言：为什么Java开发者需要LangChain4j？想象一下，你正在开发一个企业级应用，需要集成ChatGPT来提供智能客服功能。传统方式需要直接调用OpenAIAPI，处理复杂的HTTP请求、错误重试、上下文管理等问题。而使用LangChain4j，几行代码就能搞定：Cha
LangChain 源码剖析（二）：LangChain 流程编排的核心骨架——Chain 基类源码剖析 ATM006 人工智能 langchain 大模型 Agent
每一篇文章都短小精悍，不啰嗦。在LangChain框架中，Chain是连接各种组件（模型、工具、数据库等）的核心骨架，负责将多个步骤按逻辑串联成可执行的工作流。无论是简单的「提问-回答」流程，还是复杂的「检索-思考-工具调用」pipeline，都依赖Chain基类提供的基础能力。本文将从架构设计、核心功能到实现细节，全面解析这一基类的设计智慧。一、架构定位：为什么需要Chain基类？Chain基类
用 Trae AI Vibe Coding 写一个 AI 智能体太@阳#鸟 LangChain 人工智能状态模式
这里写自定义目录标题前言代码识别成果展示开发反思与洞见未来演进方向结语：新范式革命前言在初步学习了Langchain的基础知识后，我产生了一个大胆的想法：能否完全不写代码，仅靠AI直接生成一个完整的智能体系统？这个想法最终催生了Agent-Zero-一个完全由AI生成的智能体框架。万万没想到真的给我实现了，弄了一个Agent-Zero的简易版本，全程一个代码都没有写，准确的来说我可能还有很多代码不
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

基于 InternLM 和 LangChain 搭建你的知识库(三)