(LLM) 第3页

Prompt：开启与AI高效对话的钥匙

简单来说，Prompt是你向AI（如大型语言模型LLM）发出的文本或问题，用以引导它生成特定的、高质量的

·2025-07-20 15:34

LLM模型贪婪、温度、Top-k、核采样方式的区别---附代码与示例

LLM模型贪婪、温度、Top-k、核采样方式的区别—附代码与示例在自然语言生成任务中，不同的采样技术用于从语言模型的输出中选择下一个生成的单词或词语。

繁星意未平·2025-07-20 12:46

LLM 的Top-P参数是在LLM中的每一层发挥作用，还是最后一层？

LLM的Top-P参数是在LLM中的每一层发挥作用，还是最后一层？

ZhangJiQun&MXP·2025-07-20 12:09

KAIST：LLM混合递归推理

标题：Mixture-of-Recursions:LearningDynamicRecursiveDepthsforAdaptiveToken-LevelComputation来源：arXiv,2507.10524摘要缩放语言模型解锁了令人印象深刻的能力，但伴随的计算和内存需求使训练和部署都很昂贵。现有的效率工作通常针对参数共享或自适应计算，留下了如何同时实现两者的问题。我们引入了混合递归(MoR

大模型任我行·2025-07-20 11:06

NUS：LLM表格数据建模综述

标题：LanguageModelingonTabularData:ASurveyofFoundations,TechniquesandEvolution来源：arXiv,2408.10548摘要表格数据是一种跨领域的流行数据类型，由于其异构性和复杂的结构关系，带来了独特的挑战。在表格数据分析中实现高预测性能和鲁棒性对许多应用程序具有重大前景。受自然语言处理，特别是转换器架构的最新进展的影响，出现了

·2025-07-20 11:36

大模型本地部署-dify私有化部署-教程

一、简介dify是一个开源的LLM应用开发平台。其直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等，可以让您快速从原型到生产。

·2025-07-20 11:05

AIGC革命：基于魔搭社区的LLM应用开发实战——从模型微调到系统部署

AIGC革命：基于魔搭社区的LLM应用开发实战——从模型微调到系统部署1.AIGC技术演进与魔搭社区生态解析人工智能生成内容（AIGC）正在重塑内容创作、软件开发和人机交互的边界。

Liudef06小白·2025-07-20 10:25

人工智能界的“黑话“大揭秘：AI新词汇速成指南

LLM（大型语言模型）：AI界的"大胃王"LLM是吞噬了互联网大部分文字的"数据饕餮"。特点：训练数据以TB（万亿字节）计算参数动辄上千亿计算能力堪比小

·2025-07-20 09:53

解密Claude系列：从原理到实践的全方位解析

引言：Claude系列模型的崛起在人工智能领域，大型语言模型(LLM)的发展日新月异。OpenAI的GPT系列和Anthropic的Claude系列无疑是这一领域的双子星。

软考和人工智能学堂·2025-07-20 08:49

智能体架构设计的五大核心原则：构建下一代AI系统的工程基石

传统LLM

一休哥助手·2025-07-20 07:37

入门大模型神器：开源项目Happy LLM保姆级教程！

Happy-LLMHappy-LLM——从零开始的大语言模型原理与实践教程。

·2025-07-20 05:27

【DeepSeek实战】10、模型上下文协议（MCP）全解析：从核心架构到实战应用，揭秘AI协作的“凤雏”之力

在人工智能技术飞速发展的今天，大型语言模型（LLM）的能力不断突破，但跨模型协作、上下文一致性维护等问题却成为制约AI系统向更智能、更协同方向发展的瓶颈。

无心水·2025-07-20 03:12

Spring AI 函数调用（Function Call）系统设计方案

1.2主要功能需求支持通过注解将普通Java方法标记为可被AI调用的函数自动生成符合LLM要求的函数描述和参数定义安全地解析和执行模型的函数调用请求处理并返回执行结果给模型提供扩展点以支持不同LLM提供商的特定实现

大树~~·2025-07-20 00:21

[特殊字符] LLM（大型语言模型）：智能时代的语言引擎与通用推理基座

从千亿参数到人类认知的AI革命一、核心定义与核心特征LLM（LargeLanguageModel）是基于海量文本数据训练的深度学习模型，通过神经网络架构（尤其是Transformer）模拟人类语言的复杂规律

大千AI助手·2025-07-20 00:48

LLM系统性学习完全指南（初学者必看系列）

前言这篇文章将系统性的讲解LLM（LargeLanguageModels,LLM）的知识和应用。

GA琥珀·2025-07-19 19:11

Synergizing RAG and Reasoning: A Systematic Review-RAG与推理能力深度结合-新方向

欢迎关v：数据分析能量站0论文小结一、研究背景与核心问题大语言模型（LLM）在处理复杂任务时面临两大瓶颈：知识局限性：纯LLM存在“知识幻觉”（编造事实）和“领域知识缺口”；推理浅度：传统检索增强生成（

数据分析能量站·2025-07-19 19:05

CPO：对比偏好优化—突破大型语言模型在机器翻译中的性能边界

然而，它们仍未能达到最先进的传统编码器-解码器翻译模型，或是如GPT-4（OpenAI,2023）等更大规模LLM的表现。在本研究中，我们致力于弥合这一性能差距。我们首先评估了在机器翻译任

AI专题精讲·2025-07-19 17:26

飞算JavaAI

通过大语言模型（LLM）实现自然语言到代码的转换，覆盖需求分析、接口设计、表结构设计、业务逻辑生成、代码生成与合并等全流程开发环节。

·2025-07-19 15:41

LLM - 通过案例轻松理解MCP、Tool Calling、Agent

文章目录一、MCP是什么？二、MCP解决了哪些痛点？三、什么是ToolCalling？四、对比案例一：ToolCallingvsMCP五、对比案例二：AgentvsAgent+MCP六：使用场景理解Agent→ToolCalling→MCP场景一：智能助手帮你整理工作安排（重构版）Agent的理解与规划ToolCalling的执行流程MCP的幕后支撑场景二：智能电商客服处理订单异常Agent的理解

小小工匠·2025-07-19 14:38

如何增强LLM（大语言模型）的“置信度”和“自信心” ：LLM的“自信”不是“什么都能答”，而是“该答的答得准，不该答的敢说不”。

如何增强LLM（大语言模型）的“置信度”和“自信心”Pleaseprovideafirmanswer,andforthosewhodon’tknow,pleasereply‘unknown’LLM（大语言模型

ZhangJiQun&MXP·2025-07-19 11:44

深入解析 vLLM 分布式推理与部署策略

在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。

·2025-07-19 11:13

AI应用服务

AI大模型--AI应用，该如何和前端交互，呈现llm模型答复内容呢？向LLM大模型提问后，系统得先识别问题，再从数据网络找信息，接着推理出正确结果，还得防止模型“胡编乱造”（控制模型幻想）。

SUPER5266·2025-07-19 10:35

LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？

LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？

ZhangJiQun&MXP·2025-07-12 15:44

LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的

LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的有个假设：就是最后一个词语融合了前面词语的信息减法操作主要用于提取模型内部表征中的"诚实性"概念向量。

ZhangJiQun&MXP·2025-07-12 14:40

LLM-生成器判别器的实现

总结首先，使用GPT模型获取每个词的生成概率pLLMp_{LLM}pLLM。

·2025-07-12 12:23

利用本地 LLM 、MCP、DeepSeek 集成构建您自己的 AI 驱动工具

在本指南中，我将引导您构建一个具有本地运行的大型语言模型(LLM)和MCP集成的AI工具-让您以类似的方式自动执行利用MCP的工具您喜欢的任务。

知识大胖·2025-07-12 11:51

使用 Ollama 、 DeepSeek和QWEN的模型上下文协议 (MCP) ，使用本地 LLM 教程的 MCP 服务器

MCP或模型上下文协议由Anthropic去年发布，它可以帮助LLM连接软件并对其进行控制。

知识大胖·2025-07-12 11:51

在 Obsidian 中本地使用 DeepSeek — 无需互联网！

简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！

知识大胖·2025-07-12 11:21

Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）

——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。

知识大胖·2025-07-12 11:50

OpenWebUI系列之如何通过docker自动将其更新到OpenWebUI最新版本

它支持各种LLM运行器，包括Ollama和OpenAI兼容API。如何通过docker自动将其更新到OpenWebUI最新版本？

知识大胖·2025-07-12 11:20

AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL

简介一款全栈应用程序，可让您将任何文档、资源或内容转换为上下文，任何LLM都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的LLM或矢量数据库，并支持多用户管理和权限。

知识大胖·2025-07-12 11:20

AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序

您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。

知识大胖·2025-07-12 11:50

AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）

您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。

知识大胖·2025-07-12 11:20

【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5

理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text

我爱一条柴ya·2025-07-12 10:10

LLM 大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战

LLM大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战1.环境准备GPU设备:A10,3090,V100,A100均可.

汀、人工智能·2025-07-12 10:09

【实战AI】macbook M1 本地ollama运行deepseek

请自行；2.设备macbookM132G下载ollamaOllama是一款跨平台推理框架客户端（MacOS、Windows、Linux），专为无缝部署大型语言模型（LLM）（如Llama2、Mistral

东方鲤鱼·2025-07-12 08:24

思维链革命：让大模型突破“机器思考”的边界

思维链技术深度解析文章（原文链接）的博客化重构，融合技术本质与应用实践：思维链革命：让大模型突破“机器思考”的边界——解析ChainofThought技术体系与下一代推理架构一、从黑箱到透明思考：CoT的核心突破传统LLM

John Song·2025-07-12 07:13

LLM Agent在多模态任务中的推理机制详解

文章目录一、引言二、多模态LLMAgent的基本架构2.1系统组成2.2工作流程图三、多模态表示与对齐3.1跨模态嵌入空间3.2模态对齐技术四、多模态推理策略4.1基于提示的推理(Prompt-basedReasoning)4.2多模态思维链(CoT)推理4.3多模态工具使用五、实现案例：多模态问答系统5.1系统架构5.2示例应用六、高级多模态推理技术6.1多模态递归推理6.2多模态记忆与检索6.

·2025-07-12 06:12

在mac m1基于llama.cpp运行deepseek

lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。

·2025-07-12 06:41

LLaMA-Omni 深度解析：打开通往无缝人机语音交互的大门

LLaMA-Omni不仅实现了低至226ms的惊人交互延迟，还能同时生成高质量的文本与语音回复，真正意义上让大语言模型（LLM）具备了“听说”的能力。

kakaZhui·2025-07-12 06:41

在LLM快速迭代时代构建持久AI应用：架构设计与实施策略

引言：技术浪潮下的开发困境大型语言模型(LLM)的发展速度令人瞠目：从GPT-3到GPT-4，从Claude1到Claude3，从Llama1到Llama3，迭代周期正在从"年"缩短到"月"。

·2025-07-12 02:44

大型语言模型（LLM, Large Language Models）基模和 Chat 模型之间的区别

·2025-07-12 01:37

SpringBoot集成LangChain4j：构建智能AI应用全解析

在企业级应用中融入大语言模型(LLM)能力已成为趋势，而LangChain4j作为专为Java设计的LLM集成框架，与SpringBoot的结合为开发者提供了强大而灵活的解决方案。

java干货仓库·2025-07-12 00:58

基于 esp32-s3，结合私有化大模型，集asr语音识别、llm大模型、tts语音合成，设计一个技术方案，要求用websocket保持长链接，

以下方案演示了如何基于ESP32-S3，通过私有化大模型组合ASR（语音识别）、LLM（语言大模型）和TTS（语音合成）来构建一个语音交互系统，并且通过WebSocket保持与服务器的长连接通讯。

·2025-07-11 20:03

详解LLMOps，将DevOps用于大语言模型开发

为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。

·2025-07-11 19:01

代码与 AI 的交响乐：探索 avante.nvim 的智能编程革命

本文将带你走进avante.nvim的世界，探索它如何通过大语言模型（LLM）和上下文感知机制，重新定义编程的艺术与科学。从灵感火花到代码现实：AI驱动的编程新时代想象一下，你正在编写一个复杂的P

步子哥·2025-07-11 18:48

零代码玩转大模型！LLaMA Factory：你的专属模型精修师

你是否曾对大语言模型（LLM）的强大能力心驰神往，却苦于以下难题？想定制专属模型？微调代码看不懂，环境配置太复杂…硬件资源有限？动辄需要数张A100，普通设备望而却步…中文任务不给力？

jane_xing·2025-07-11 17:41

掌握LLM工程课，让你的AI之旅充满惊喜

掌控AI时代的密码：深入LLM工程课程在人工智能迅猛发展的今天，对大语言模型（LLM）的深入理解和应用能力已经成为引领技术潮流的重要基石。

·2025-07-11 15:31

Dify小白入门指南：通过官方文档学习工作流编排和API调用

Dify小白入门指南：通过官方文档学习工作流编排和API调用一、Dify平台简介与核心功能Dify是一个开源的LLM应用开发平台，被设计为一个"生成式AI应用创新引擎"，它提供了从Agent构建到AI工作流编排

伟大无须多言·2025-07-11 12:39

大模型 Agent（智能体）技术简介

大模型Agent（智能体）技术是当前人工智能领域的前沿方向，它赋予大型语言模型（LLM）自主感知、规划、决策和行动的能力，使其不再局限于“被动应答”，而是能主动完成复杂任务。

北京地铁1号线·2025-07-11 11:35

推荐频道

(LLM)

Prompt：开启与AI高效对话的钥匙

LLM模型 贪婪、温度、Top-k、核采样方式的区别---附代码与示例

LLM 的Top-P参数 是在LLM中的每一层发挥作用，还是最后一层？

KAIST：LLM混合递归推理

NUS：LLM表格数据建模综述

大模型本地部署-dify私有化部署-教程

AIGC革命：基于魔搭社区的LLM应用开发实战——从模型微调到系统部署

人工智能界的“黑话“大揭秘：AI新词汇速成指南

解密Claude系列：从原理到实践的全方位解析

智能体架构设计的五大核心原则：构建下一代AI系统的工程基石

入门大模型神器：开源项目Happy LLM保姆级教程！

【DeepSeek实战】10、模型上下文协议（MCP）全解析：从核心架构到实战应用，揭秘AI协作的“凤雏”之力

Spring AI 函数调用（Function Call）系统设计方案

[特殊字符] LLM（大型语言模型）：智能时代的语言引擎与通用推理基座

LLM系统性学习完全指南（初学者必看系列）

Synergizing RAG and Reasoning: A Systematic Review-RAG与推理能力深度结合-新方向

CPO：对比偏好优化—突破大型语言模型在机器翻译中的性能边界

飞算JavaAI

LLM - 通过案例轻松理解MCP、Tool Calling、Agent

如何增强LLM（大语言模型）的“置信度”和“自信心” ：LLM的“自信”不是“什么都能答”，而是“该答的答得准，不该答的敢说不”。

深入解析 vLLM 分布式推理与部署策略

AI应用服务

LLM中 最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？

LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的

LLM-生成器判别器的实现

利用本地 LLM 、MCP、DeepSeek 集成构建您自己的 AI 驱动工具

使用 Ollama 、 DeepSeek和QWEN的模型上下文协议 (MCP) ，使用本地 LLM 教程的 MCP 服务器

在 Obsidian 中本地使用 DeepSeek — 无需互联网！

Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）

OpenWebUI系列之 如何通过docker自动将其更新到OpenWebUI最新版本

AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL

AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序

AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）

【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5

LLM 大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战

【实战AI】macbook M1 本地ollama运行deepseek

思维链革命：让大模型突破“机器思考”的边界

LLM Agent在多模态任务中的推理机制详解

在mac m1基于llama.cpp运行deepseek

LLaMA-Omni 深度解析：打开通往无缝人机语音交互的大门

在LLM快速迭代时代构建持久AI应用：架构设计与实施策略

大型语言模型（LLM, Large Language Models）基模和 Chat 模型之间的区别

SpringBoot集成LangChain4j：构建智能AI应用全解析

基于 esp32-s3，结合私有化大模型，集asr语音识别、llm大模型、tts语音合成，设计一个技术方案，要求用websocket保持长链接，

详解LLMOps，将DevOps用于大语言模型开发

代码与 AI 的交响乐：探索 avante.nvim 的智能编程革命

零代码玩转大模型！LLaMA Factory：你的专属模型精修师

掌握LLM工程课，让你的AI之旅充满惊喜

Dify小白入门指南：通过官方文档学习工作流编排和API调用

大模型 Agent（智能体）技术简介

LLM模型贪婪、温度、Top-k、核采样方式的区别---附代码与示例

LLM 的Top-P参数是在LLM中的每一层发挥作用，还是最后一层？

LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？

OpenWebUI系列之如何通过docker自动将其更新到OpenWebUI最新版本