Python&LLM 第20页

L3-4、让 Prompt 更聪明：调试技巧与智能问答系统实战

让Prompt更聪明：调试技巧与智能问答系统实战在大语言模型（LLM）应用开发中，Prompt工程是核心技能。

何双新·2025-04-29 02:48

COT 思维链、TOT 思维树与 GOT 思维图：概念、代码与应用

在人工智能领域，尤其是自然语言处理（NLP）和大型语言模型（LLM）的研究中，推理能力的提升一直是研究的核心方向之一。

CarlowZJ·2025-04-29 00:31

2W8000字 LLM架构文章阅读指北

完整的专栏内容欢迎订阅：LLM架构专栏1、LLM大模型架构专栏||从NLP基础谈起2、LLM大模型架构专栏||自然语言处理（NLP）之建模3、LLM大模型架构之词嵌入（Part1）3、LLM大模型架构之词嵌入

柏企·2025-04-28 23:56

LLM并行计算的论文

LLM并行计算的论文基础并行计算方法相关《Gpipe:EfficientTrainingofGiantNeuralNetworksusingPipelineParallelism》：提出了Gpipe这种流水线并行方法

ZhangJiQun&MXP·2025-04-28 22:21

【LLM】llama.cpp：合并 GGUF 模型分片

GGUF（GPT-GeneratedUnifiedFormat）是一种专为大规模语言模型设计的二进制文件格式，支持将模型分割成多个分片（*-of-*.gguf）。当从开源社区（如HuggingFace或ModelScope）下载量化模型时，常会遇到分片存储的情况。本教程将引导你使用llama.cpp工具包中的llama-gguf-split，将这些分片合并为一个完整的GGUF模型文件。前言与适用场

T0uken·2025-04-28 21:11

AI大模型日报#0622：Claude 3.5 Sonnet超越GPT-4o、盘古大模型跳级发布、松鼠AI多模态教育大模型

导读：AI大模型日报，爬虫+LLM自动生成，一文览尽每日AI大模型要点资讯！目前采用“文心一言”（ERNIE-4.0-8K-latest）生成了今日要点以及每条资讯的摘要。欢迎阅读！

常政·2025-04-28 19:01

【LLM入门之 Gemini 】（一）获取API_KEY 以及本地运行

LLM入门教程系列最近就写点LLM入门的吧=。=本篇会介绍谷歌的GenminiAPI简单的调用。首先打开官网,然后登陆等一系列步骤后，点击创建API_KEY然后你会得到你的key，保存好他。

通过图灵测试的人类·2025-04-28 18:27

DeepSeek部署入门教程！一键本地推理，DeepSeek-R1 蒸馏模型 + llama.cpp 部署教程！

前言在当今快速发展的AI领域，本地运行大型语言模型（LLM）的需求日益增长。llama.cpp是一个高性能的C/C++库，专门用于运行LLM，支持多种硬件加速选项。

AI大模型入门·2025-04-28 16:40

大模型微调：技术迭代与实践指南

在人工智能领域，大模型（LLM）的微调是一个关键过程，它使模型能够适应特定的任务和数据集。微调是深度学习中用于改进预训练模型性能的重要技术。

人工智能培训咨询叶梓·2025-04-28 15:07

大模型外挂MCP教程(3):一图看懂Function Calling的工作流程-提示词与模型微调

注意:我们这个图中有两个LLM模型，其实实际使用中是一个，这里便于理解，只是不同场景下的两次调用。在大模型的各种应用领域中，Functioncalling（函数调用）作为

程序员寒山·2025-04-28 10:33

6、LangChain进阶：自定义组件专题

Callback处理回调概念LangChain提供了一个回调系统，允许您连接到LLM应用程序的各个阶段。这对于日志记录、监控、流式处理和其他任务非常有用。

Hugo_Hoo·2025-04-28 08:26

RAG基础

其核心作用是给LLM大模型外挂专门的知识库，指导大模型生成更准确的输出。为什么要给LLM大模型外挂知识库呢？因为虽然大模型的能力越来越强大，但其内在的缺点也非常明显。第一，存在幻觉问题。

sztu_aYu·2025-04-28 08:55

5、Rag基础：RAG 专题

大型语言模型（LLM）用海量数据进行训练，使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。

Hugo_Hoo·2025-04-28 08:23

LLM-Agent-MCP

生物学隐喻技术组件生物学隐喻核心逻辑LLM大脑负责高级认知（如语言理解、推理），是信息处理的核心Agent中枢神经系统（脊髓+脑干）协调动作与资源调度（如任务拆解、工具调用），连接高级认知与执行层MCP

userkang·2025-04-28 08:51

Dify中ChatFlow与WorkFlow的区别及使用场景详解

Dify中ChatFlow与WorkFlow的区别及使用场景详解一、Dify简介Dify是一个强大的LLM应用开发平台，旨在帮助开发者快速构建基于大型语言模型的应用。

lingding_cn·2025-04-28 05:32

《2025四大AI终极对决：如何用ChatGPT、DeepSeek、通义千问和文心一言提升项目管理效率？》

在当今快速发展的AI领域，大型语言模型（LLM）已经成为项目管理、智能助手和内容创作的重要工具。DooTask作为一款高效的项目管理软件，可以结合这些AI助手提升团队协作效率。

拾忆-eleven·2025-04-28 03:19

AI Agent: MCP和AI Agent的联系

MCP（ModelContextProtocol，模型上下文协议）是由Anthropic公司于2024年提出的开放标准协议，旨在解决大型语言模型（LLM）与外部工具、数据源之间的交互难题。

InnoLink_1024·2025-04-28 03:17

《解锁LLMs from scratch：开启大语言模型的探索之旅》

仅需Python基础，从0构建大语言模型；从0逐步构建GLM4\Llama3\RWKV6，深入理解大模型原理项目首页-LLMs-from-scratch:从零开始逐步指导开发者构建自己的大型语言模型（LLM

空云风语·2025-04-28 03:47

解析 Llama-Factory：从微调到推理的架构

轻松搞定大模型微调与推理的开源神器©作者|DWT来源|神州问学一、前言：Llama-Factory的背景与重要性在人工智能（AI）领域，尤其是自然语言处理（NLP）技术迅速发展的今天，如何高效地微调和部署大型语言模型（LLM

神州问学·2025-04-28 00:03

MCP的资源管理：如何向LLM暴露数据和内容

资源管理允许开发者将外部数据和内容暴露给LLM（大型语言模型），从而让LLM能够更好地理解和处理用户的请求。

CarlowZJ·2025-04-27 22:50

6.1 客户服务：智能客服与自动化支持系统的构建

基于大语言模型（LLM）和智能代理（Agent）的技术为构建智能客服与自动化支持系统提供了强大的支持，不仅提升了服务效率，还优化了用户体验。

MonkeyKing.sun·2025-04-27 16:10

智能赋能与精准评估：大语言模型在自动作文评分中的效度验证及改进路径

大语言模型（LLM）作为人工智能发展的前沿成果，凭借其强大的语义理解与生成能力，在自然语言处理任务中展现出卓越的性能，也为教育测评的革新带来了新的契机。

燕鹏01·2025-04-27 11:37

云主机轻松部署 DeepSeek

DeepSeek3安装Ollama3部署DeepSeek4安装ChatBox4CodeArtsIDE集成DeepSeek91概述案例介绍DeepSeek是一家创新型科技公司，长久以来专注于开发先进的大语言模型（LLM

陈天伟教授·2025-04-27 09:25

LangChain 实战：Agent思维_langchain的agent 多个参数怎么解决

AgentsAgent是一个抽象概念，当LLM无法根据自身数据回复用户即将不得不正儿八经说假话时，Agent帮我们找来一个外部工具，解决之。除了代理的概

AGI学习社·2025-04-27 06:06

Xinference 和 Ollama 的主要区别

Ollama：核心目标：专注于本地LLM的轻量化运行与调试。目标用户：个人开发者、快速实验LLM的小型团队。架构与功

chunmiao3032·2025-04-27 06:31

理想MindVLA学习解读

1）关键技术3D高斯混合专家模型MoE从头训练的LLM模型底座人类反馈强化学习基于扩散模型的自车+周车闭环轨迹2）框架3）引申的技术细分

SLAM必须dunk·2025-04-27 05:57

Ollama教程与大模型本地部署指南

教程与大模型本地部署指南目录Ollama简介安装与配置模型管理API使用本地部署步骤常见问题与解决方案性能优化应用案例1.Ollama简介1.1什么是OllamaOllama是一个开源的本地大语言模型(LLM

爱编程的王小美·2025-04-27 01:32

NLP高频面试题（五十五）——DeepSeek系列概览与发展背景

大型模型浪潮背景近年来，大型语言模型（LargeLanguageModel,LLM）领域发展迅猛，从GPT-3等超大规模模型的崛起到ChatGPT的横空出世，再到GPT-4的问世，模型参数规模和训练数据量呈指数级增长

Chaos_Wang_·2025-04-27 00:28

llm+rag本地化部署手册

llm+rag本地化部署手册1.linux环境搭建a.基础实验环境搭建官网安装dockerdesktop即可，详情见下方Docker一节b.使用WSL2进行搭建或者使用原生linux进行搭建在管理员模式下打开

CLAYo·2025-04-26 19:58

[论文阅读]ReAct: Synergizing Reasoning and Acting in Language Models

2210.03629]ReAct:SynergizingReasoningandActinginLanguageModelsICLR2023这是一篇在2022年挂出来的论文，不要以现在更加强大且性能综合的LLM

0x211·2025-04-26 18:48

DeepSeek与清华联合发布重磅论文：从 SPCT 到 Meta Reward Model，或预示DeepSeek R2将近

与清华大学研究团队联合发布题为《奖励模型的推理时Scaling方法及其在大规模语言模型中的应用》的重磅论文，提出自我原则点评调优（SPCT）与元奖励模型（MetaRewardModel）两大核心技术，为大语言模型（LLM

LinkTime_Cloud·2025-04-26 16:03

千问2.5-VL-7B的推理、微调、部署_笔记2

ms-swift是魔搭社区官方提供的LLM工具箱，支持300+大语言模型和80+多模态大模型的微调到部署。ms-swift开源地址：https://github.com/modelscope/

山山而川_R·2025-04-26 11:36

主流开源 LLM 应用开发平台详解

以下是关于开源的LLM（大语言模型）应用开发平台的详细解析，涵盖核心功能、技术特点、使用场景、优缺点对比及代码示例。

爱的叹息·2025-04-26 11:04

LangChain表达式LCEL(一）

例如，从LLM流式传输令牌到一个流式输出解析器，就可以以与LLM提供者输出原始

荧惑yh·2025-04-26 03:13

LangChain 表达式语言 (LCEL)

LCEL从第一天开始就设计为支持将原型直接投入生产环境，无需代码更改，从最简单的“提示+LLM”链条到最复杂的链条（我们已经看到有人在生产环境中成功运行了包含数百个步骤的LCEL链条）。

龙大.·2025-04-26 03:13

Transformer是什么，如何搭建LLM大语言模型

Transformer是什么，如何搭建LLM大语言模型一、什么是Transformer和LLMTransformer是一中深度学习模型框架，最初由Vaswani等人在2017年的论文“AttentionIsAllYouNeed

酒盏花枝贫者缘。·2025-04-26 03:36

结合AI客户端玩转go MCP项目开发

MCP的核心目标是让LLM应用程序能够轻松集成外部系统，这在当前AI驱动的应用开发中非常重要。

爱因诗贤·2025-04-26 02:04

如何用go语言搭MCP

2.官方MCP架构图MCPHosts:是指LLM启动连接的应用程序,如Cursor、ClaudeDesktop、IDE或AI工具

爱因诗贤·2025-04-26 02:34

LLM进阶——Transformer

文章目录一、前置知识1、（Encoder-Decoder）结构2、注意力机制二、Transformer结构1、介绍2、输入层1）BytePairEncoding2）位置编码——positionalEncoding3、核心架构三、Transformer库1、介绍2、demo一、前置知识1、（Encoder-Decoder）结构在深度学习中，编码器-解码器（Encoder-Decoder）结构是一种常

轩不丢·2025-04-26 02:04

001 LLM大模型之Transformer 模型

参考《大规模语言模型--从理论到实践》目录一、综述二、Transformer模型三、嵌入表示层（位置编码代码）一、综述语言模型目标是建模自然语言的概率分布，在自然语言处理研究中具有重要的作用，是自然语言处理基础任务之一。大量的研究从n元语言模型（n-gramLanguageModels）、神经语言模型（NeuralLanguageModels，NLM）以及预训练语言模型（Pre-trainedLa

黄家驹beyond·2025-04-26 02:04

一文详解训练LLM流程

1.摘要LLM训练是利用大规模数据对深度学习模型进行预训练的过程，旨在培养能够理解和生成自然语言文本的模型。这个过程通过处理海量文本数据，让模型学习语言的统计规律、语义信息和上下文关系。

莫杨94·2025-04-26 01:55

详解各种LLM系列｜（4）GLM（GPT国内最强开源平替）模型架构、预训练技术详解

一、引言论文地址:arXiv:https://arxiv.org/abs/2103.10360官网：https://chatglm.cn/blogGithub：https://github.com/THUDM/ChatGLM-6B在日益增多的开源大模型中，由清华大学研发的开源大模型GLM由于效果出众而受到大众关注，而且清华大学开源了基于GLM架构研发的基座模型：ChatGLM-6B以及GLM-13

m0_74825746·2025-04-26 01:54

开源模型应用落地-qwen2-7b-instruct-LoRA微调-Axolotl-单机单卡-V100（九）

二、术语介绍2.1.LoRA微调LoRA(Low-RankAdaptation)用于微调大型语言模型(LLM)。

开源技术探险家·2025-04-26 00:48

机器学习漏洞大汇总——利用机器学习服务

WANDBWeave目录遍历-CVE-2024-7340[Weave]是一个用于评估和跟踪大型语言模型(LLM)应用程序的工具包，由Weights&Biases(WANDB)构建

红云谈安全·2025-04-25 23:46

从零构建 AI Agent：LLM 大模型应用开发实践

从零构建AIAgent：LLM大模型应用开发实践Building-AI-Agent-from-Scratch-LLM-based-Application-Development-Practice文章目录从零构建

AI天才研究院·2025-04-25 20:51

一文秒懂AI核心：Agent、RAG、Function Call与MCP全解析

如今大语言模型（LLM）的风头一时无两，它们能写诗、能聊天、能编程，简直无所不能！但你有没有发现，有时候它们也挺“傻白甜”的？

我爱学大模型·2025-04-25 20:20

TestBrain开源程序是一款集使用AI(如deepseek)大模型自动生成测试用例、和测试用例评审、RAG知识库管理的web平台系统

一、软件介绍文末提供程序和源码下载TestBrain开源程序是一款集使用AI(如deepseek)大模型自动生成测试用例、和测试用例评审、RAG知识库管理的web平台系统一个基于LLM的智能测试用例生成平台

2301_78755287·2025-04-25 20:47

我们为什么要用本地大模型？如何搭建私有化大模型？

LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。前排提示，文末有大模型AGI-CSDN独家资料包哦！我

程序员二飞·2025-04-25 17:29

大模型RAG入门到实战基础教程（非常详细），保姆级教程！

写在前面大模型（LargeLanguageModel，LLM）的浪潮已经席卷了几乎各行业，但当涉及到专业场景或行业细分域时，通用大模型就会面临专业知识不足的问题。

程序员二飞·2025-04-25 17:28

【AIGC】大模型面试高频考点-LLM量化方法对比：GPTQ、GGUF、AWQ

LLM量化方法对比：GPTQ、GGUF、AWQ（一）模型加载（二）分片（三）量化（四）预量化(GPTQ、AWQ、GGUF)（1）GPTQ（2）GGUF（3）AWQ（五）总结（1）GPTQ：基于GPT的量化方法

LeeZhao@·2025-04-25 12:51

推荐频道

Python&LLM