llms

BEYOND BINARY REWARDS: TRAINING LMS TOREASON ABOUT THEIR UNCERTAINTY

8a30dbf3d6ae0cae1048c3331f38fe80https://gist.github.com/josherich/8a30dbf3d6ae0cae1048c3331f38fe801引言与此担忧一致，研究表明，即使最初校准良好的大型语言模型（LLMs

樱花的浪漫·2025-07-29 15:16

Gradient-Adaptive Policy Optimization:Towards Multi-Objective Alignment of Large Language Models

2025.acl-long.549.pdfhttps://aclanthology.org/2025.acl-long.549.pdf1.概述大型语言模型（LLMs）（Anthropic,2023;OpenAI

樱花的浪漫·2025-07-29 15:16

Uncovering Bias in Large Vision-Language Models at Scale with Counterfactuals

UncoveringBiasinLargeVision-LanguageModelsatScalewithCounterfactuals-ACLAnthologyhttps://aclanthology.org/2025.naacl-long.305/1.概述最近，大型视觉-语言模型（LVLMs）因其能够将语言模型（LLMs

樱花的浪漫·2025-07-29 14:43

构建高效 RAG 流程的七个关键点及其落地实践

人工智能应用浪潮中，检索增强生成（RAG）技术凭借着结合大型语言模型（LLMs）的生成能力和信息检索系统的独特优势，成为了各企业挖掘数据价值、提升业务智能化水平的关键手段之一。

charles666666·2025-07-29 10:43

LIMO：仅需817样本激活大模型数学推理能力，挑战“数据规模至上”传统范式

ShanghaiArtificialIntelligenceLaboratory）、GAIRLab联合提出的突破性研究（2025年2月发表），其核心颠覆了传统AI领域“复杂推理需海量训练数据”的认知，证明仅用817个高质量样本即可激发大语言模型（LLMs

大千AI助手·2025-07-29 00:51

AI人工智能的SGLang、vllm和YaRN大语言模型服务框架引擎的对比

简介SGLang、vLLM和YaRN在大语言模型中的应用场景和功能特点有所不同，具体如下：SGLang定位：是一种专为大型语言模型（LLMs）和视觉语言模型（VLMs）设计的高效服务框架。

没刮胡子·2025-07-28 00:56

利用 Tavily Search API 提升 AI 代理的搜索能力

TavilySearchAPI是专为大型语言模型（LLMs）设计的搜索引擎，它能够以极高的速度提供实时、准确且事实驱动的结果，对AI开发者来说是一项极具价值的工具。

VYSAHF·2025-07-27 14:17

Deja Vu: 利用上下文稀疏性提升大语言模型推理效率

温馨提示：本篇文章已同步至"AI专题精讲"DejaVu:利用上下文稀疏性提升大语言模型推理效率摘要拥有数百亿参数的大语言模型（LLMs）催生了一系列令人振奋的AI应用。

AI专题精讲·2025-07-27 12:31

Java开发者，用LLM和AI Agent打造你的智能应用：从理论到实践！

摘要你是否认为AIAgent和大型语言模型（LLMs）是Python专属？那你就错了！Java，作为企业级应用开发的主力军，正在以前所未有的速度拥抱AI浪潮。

程序猿Mr.wu·2025-07-27 05:35

LLMs 10道面试题提前看，有问有答，图文详解！

微调（Fine-tuning）LLMs指的是在特定任务或数据上对预训练好的模型进行进一步训练，使其能更好地适应目标场景的过程，其主要流程如下：数据准备：数据收集：根据目标任务收集高质量、有代表性的数据；

AI大模型-大飞·2025-07-26 16:58

NLP论文速读|chameleon：一个即插即用的组合推理模块Plug-and-Play Compositional Reasoning with Large Language Models

Plug-and-PlayCompositionalReasoningwithLargeLanguageModels论文信息：简介:该论文介绍了一个名为Chameleon的人工智能系统，旨在解决大型语言模型（LLMs

Power2024666·2025-07-24 03:37

迈向大型推理模型：基于大型语言模型的强化推理综述（附教程）

这一创新范式使LLMs能够模仿复杂的人类推理过程，如树搜索和反思性思维。近年来，学习推理的趋势逐渐兴起，强化学习（RL）被应用于训练LLMs掌握推理过程。这种方法通

LLM大模型·2025-07-22 13:05

掌握 RAG：使用 Langchain 和 Ollama 创建本地智能应用程序

引言随着大型语言模型（LLMs）的兴起，我们见证了一种新的工具类别的诞生。然而，LLMs也存在局限性，尤其是当面对需要最新信息或专有数据的商业用例时。本文将介绍如何通过微调和RAG来解决这些问题。

知世不是芝士·2025-07-22 07:42

GENERALIST REWARD MODELS: FOUND INSIDE LARGELANGUAGE MODELS

GeneralistRewardModels:FoundInsideLargeLanguageModelshttps://arxiv.org/pdf/2506.232351.概述将大型语言模型（LLMs

樱花的浪漫·2025-07-22 00:33

实现大语言模型与应用的无缝对接

在当今人工智能快速发展的时代，大语言模型（LLMs）已经成为众多应用的核心驱动力。然而，如何让这些强大的模型与各种数据源和工具进行有效集成，仍然是一个挑战。

meslog·2025-07-21 13:42

LLM4SR: A Survey on Large Language Models for Scientific Research

文章主要内容文章围绕大语言模型（LLMs）在科学研究中的应用展开，系统探讨了其在科研各关键阶段的作用、方法、挑战及未来方向。

UnknownBody·2025-07-20 20:33

大模型本地部署-dify私有化部署-教程

2、全面的模型支持：与数百种专有/开源LLMs以及数十种推理提供商和自托管解决方案无缝集成，涵盖GPT、Mistral、Llama3以及任何与OpenAIAPI兼容的模型。完整

·2025-07-20 11:05

CPO：对比偏好优化—突破大型语言模型在机器翻译中的性能边界

温馨提示：本篇文章已同步至"AI专题精讲"CPO：对比偏好优化—突破大型语言模型在机器翻译中的性能边界摘要中等规模的大型语言模型（LLMs），如参数量为7B或13B的模型，在机器翻译（MT）任务中展现出良好性能

AI专题精讲·2025-07-19 17:26

[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal

原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法

0x211·2025-07-12 10:38

详解LLMOps，将DevOps用于大语言模型开发

大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。

·2025-07-11 19:01

从数据集视角看——大语言模型（LLMs）的训练、微调和推理

1.大语言模型训练的整体框架大语言模型的训练是一个复杂的过程，涉及数据准备、模型架构、优化策略和推理部署。以下是整体框架的详细分解：1.1训练阶段预训练：在海量文本数据上学习通用语言表示，类似于“学习语言的百科全书”。微调：针对特定任务调整模型参数，类似于“针对考试复习重点内容”。指令微调：在对话或指令数据集上优化，使模型更适合交互式任务。推理：使用训练好的模型进行预测或生成。1.2核心组件数据集

爱看烟花的码农·2025-07-10 22:38

大型语言模型中的提示工程系统综述：技术与应用

摘要提示工程已成为扩展大型语言模型（LLMs）和视觉语言模型（VLMs）能力的不可或缺的技术。这种方法利用任务特定的指令（称为prompt），在不修改核心模型参数的情况下增强模型效能。

AI专题精讲·2025-07-10 17:33

推测性解码：加速多模态大型语言模型的推理

大模型（LLMs）以其卓越的性能在多个应用场景中大放异彩。然而，随着应用的深入，这些模型的推理速度问题逐渐凸显。

人工智能培训咨询叶梓·2025-07-09 21:25

中文大模型的技术债问题

中文大模型的技术债问题摘要随着中文大语言模型（LargeLanguageModels,LLMs）在自然语言处理（NLP）领域的广泛应用，其研发和部署过程中积累的“技术债”（TechnicalDebt）问题日益突出

大鹏的NLP博客·2025-07-09 20:50

个人总结 - LangChain4j应用（1）

github：Releases·langchain4j/langchain4j·GitHub官方文档：Introduction|LangChain4j简要介绍：LangChain4j是一个旨在简化大语言模型（LLMs

艾露z·2025-07-09 15:43

解密企业级大模型智能体Agentic AI 关键技术：MCP、A2A、Reasoning LLMs- GPT源代码解析

解密企业级大模型智能体AgenticAI关键技术：MCP、A2A、ReasoningLLMs-GPT源代码解析我们可以稍微看一下，这是我们GPT的基于它的源代码产生的可视化的内容。这边是model，我们在谈这个sampling的时候，本身首先就是说它这个probabilitydistribution，会有很多的参数对它进行影响。例如temperature，如果你是hightemperature的话

大模型与Agent智能体·2025-07-09 11:19

10.5 实战ChatGLM3私有数据微调之提示工程：批量生成数据稳定性秘籍

实战ChatGLM3私有数据微调之提示工程：批量生成数据稳定性秘籍在当今人工智能蓬勃发展的时代，大语言模型（LLMs）如ChatGLM3的出现，为自然语言处理领域带来了革命性的变化。

少林码僧·2025-07-08 07:37

从被动检索到主动思考：Naive RAG 到 Agentic RAG 的架构演进与关键技术解析

摘要随着大语言模型（LLMs）的广泛应用，检索增强生成（Retrieval-AugmentedGeneration,RAG）技术已成为解决模型知识滞后与幻觉问题的核心方案。

一休哥助手·2025-07-08 05:25

【AI论文】FineWeb2：一个管道，规模适配所有语言——使预训练数据处理适应每一种语言

摘要：预训练最先进的大型语言模型（LLMs）需要大量干净且多样的文本数据。

东临碣石82·2025-07-08 04:43

大语言模型应用指南：ReAct 框架

尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预

AI大模型应用实战·2025-07-07 11:44

大语言模型原理基础与前沿基于语言反馈进行微调

大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理

AI天才研究院·2025-07-07 10:03

【GitHub开源项目实战】Agent-Zero 多模态 Agent 框架的架构实现与实战落地

LLMAgent、多模态融合、LangGraph、结构化对话、函数调用、RAG、真实场景实战、开源项目分析摘要：Agent-Zero是一个以LangGraph为核心构建的多模态智能体框架，专注于大语言模型（LLMs

观熵·2025-07-06 10:02

大语言模型应用指南：谷歌 Gemini 简介

大语言模型应用指南：谷歌Gemini简介关键词：大语言模型，Gemini，谷歌，人工智能，应用指南1.背景介绍近年来，人工智能领域取得了突破性进展，尤其是大语言模型（LargeLanguageModels，LLMs

AI天才研究院·2025-07-05 05:12

解锁数据的秘密：用大型语言模型编织异构数据的交响乐

而今，大型语言模型（LLMs）如同一股清风，带来了自动化整合的希望。本文将以通俗易懂的方式，深入探讨如何利用LLMs在数据工程中实现异构数据的提取与整合，聚焦于高等教育中学习障碍这一独特场景，揭示人

步子哥·2025-07-04 21:52

重构企业智能服务：大模型部署背后的战略与落地实践

个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：从“能用”到“可用”的时代跃迁过去一年中，大语言模型（LLMs）实现了从实验室“黑科技”到企业场景“生产力”的巨大跃迁。

慌ZHANG·2025-07-04 11:46

大模型私有化部署的系统性挑战与解决方案：企业视角的深度解析

随着ChatGPT、Claude、DeepSeek、通义千问等大语言模型（LLMs）能力爆发，企业纷纷探索“AI+业务”的融合创新。

慌ZHANG·2025-07-04 08:51

大语言模型技术系列讲解：大模型应用了哪些技术

正文开始大语言模型（LLMs）在人工智能领域通常指的是参数量巨大、能够处理复杂任务的深度学习模型。这些模型使用的技术主要

知世不是芝士·2025-07-03 15:57

大模型算法工程师面试宝典：精选面试题及参考答案全解析，助你备战AI算法工程师岗位！

ii.为什么会出现LLMs复读机问题？出现LLMs复读机问题可能

大模型入门学习·2025-07-03 15:55

LLM---大语言模型技术研究报告

摘要大语言模型（LLMs）已从技术突破走向产业规模化落地。2025年，全球LLMs进入“模型即服务”（MaaS）时代，参数量级突破万亿级，多模态能力、智能体协作、专业化细分成为主流趋势。

·2025-07-03 14:23

引导语言的魔法：从简单指令到智能对话的艺术

大型语言模型（LLMs）就像一台精密的预测机器，依靠输入的提示（prompt）生成令人惊叹的输出。然而，撰写一个高效的提示并非易事——它需要科学与艺术的结合。

步子哥·2025-07-03 11:55

长尾形分布论文速览三十篇【60-89】

长尾形分布速览（60-89）这些研究展示了LLMs在长尾数据分布、持续学习、异常检测、联邦学习、对比学习、知识图谱、推荐系统、多目标跟踪、标签修复、对象检测、医疗生物医学以及其他应用中的广泛应用。

木木阳·2025-07-02 23:58

vLLM调度部署Qwen3

介绍在之前的文章中，我们介绍了如何使用ollama部署qwen3，一般而言，ollama适合个人部署使用，在面对企业级的模型部署时，一般更建议使用vLLMvLLM（高效大语言模型推理库）是一个专为大语言模型（LLMs

你好，此用户已存在·2025-07-02 10:19

【LangChain编程：从入门到实践】AI 大模型检索增强生成 RAG 实践

大模型检索增强生成RAG实践关键词：LangChain,RAG,大语言模型,检索增强生成,向量数据库,嵌入模型,提示工程1.背景介绍在人工智能和自然语言处理领域,大语言模型(LargeLanguageModels,LLMs

AI智能应用·2025-07-02 08:35

【知识图谱构建系列1】数据集介绍

hal.science/hal-04862214/项目地址：https://github.com/ChristopheCruz/LLM4KGC/项目简介我们所要学习的项目（LLM4KGC）聚焦于利用大语言模型（LLMs

几道之旅·2025-07-01 17:44

面向大语言模型幻觉的关键数据集：系统性综述与分类法

面向大语言模型幻觉的关键数据集：系统性综述与分类法摘要大语言模型（LargeLanguageModels,LLMs）在自然语言处理的多个领域取得了革命性进展，但其固有的“幻觉”问题——即生成看似合理但与事实不符或与上下文无关的内容

致Great·2025-06-30 23:23

大语言模型中的思维链提示：解锁高效互动的秘密

在当今的人工智能领域，大语言模型（LLMs）已然成为一颗耀眼的明星，它经过海量训练，能够理解并生成人类语言，在编程等诸多领域助力人们完成日常任务。

t0_54program·2025-06-29 17:01

【RAG面试题】LLMs已经具备了较强能力,存在哪些不足点?

目录LLMs核心不足点1、知识过时与静态性（LackofReal-Time&DynamicKnowledge）：2、幻觉与事实性错误（Hallucinations&FactualInaccuracies

一叶千舟·2025-06-28 15:50

潜入思维的海洋：SoftCoT++如何让语言模型更聪明

在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。

步子哥·2025-06-28 13:40

企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战

企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI

AI大模型-海文·2025-06-28 13:07

LLMs基础学习（八）强化学习专题（7）

LLMs基础学习（八）强化学习专题（7）文章目录LLMs基础学习（八）强化学习专题（7）Actor-Critic算法基础原理算法流程细节算法优缺点分析算法核心总结视频链接：https://www.bilibili.com

汤姆和佩琦·2025-06-28 08:03

推荐频道