E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
llms
BEYOND BINARY REWARDS: TRAINING LMS TOREASON ABOUT THEIR UNCERTAINTY
8a30dbf3d6ae0cae1048c3331f38fe80https://gist.github.com/josherich/8a30dbf3d6ae0cae1048c3331f38fe801引言与此担忧一致,研究表明,即使最初校准良好的大型语言模型(
LLMs
樱花的浪漫
·
2025-07-29 15:16
大模型与智能体
对抗生成网络与动作识别
强化学习
人工智能
语言模型
自然语言处理
机器学习
深度学习
Gradient-Adaptive Policy Optimization:Towards Multi-Objective Alignment of Large Language Models
2025.acl-long.549.pdfhttps://aclanthology.org/2025.acl-long.549.pdf1.概述大型语言模型(
LLMs
)(Anthropic,2023;OpenAI
樱花的浪漫
·
2025-07-29 15:16
大模型与智能体
对抗生成网络与动作识别
强化学习
语言模型
人工智能
自然语言处理
深度学习
机器学习
Uncovering Bias in Large Vision-Language Models at Scale with Counterfactuals
UncoveringBiasinLargeVision-LanguageModelsatScalewithCounterfactuals-ACLAnthologyhttps://aclanthology.org/2025.naacl-long.305/1.概述最近,大型视觉-语言模型(LVLMs)因其能够将语言模型(
LLMs
樱花的浪漫
·
2025-07-29 14:43
因果推断
大模型与智能体
人工智能
算法
机器学习
语言模型
自然语言处理
构建高效 RAG 流程的七个关键点及其落地实践
人工智能应用浪潮中,检索增强生成(RAG)技术凭借着结合大型语言模型(
LLMs
)的生成能力和信息检索系统的独特优势,成为了各企业挖掘数据价值、提升业务智能化水平的关键手段之一。
charles666666
·
2025-07-29 10:43
搜索引擎
大数据
需求分析
交互
笔记
数据库
LIMO:仅需817样本激活大模型数学推理能力,挑战“数据规模至上”传统范式
ShanghaiArtificialIntelligenceLaboratory)、GAIRLab联合提出的突破性研究(2025年2月发表),其核心颠覆了传统AI领域“复杂推理需海量训练数据”的认知,证明仅用817个高质量样本即可激发大语言模型(
LLMs
大千AI助手
·
2025-07-29 00:51
人工智能
#
OTHER
#
Prompt
人工智能
机器学习
神经网络
算法
大模型
LIMO
LessIsMore
AI人工智能的SGLang、vllm和YaRN大语言模型服务框架引擎的对比
简介SGLang、vLLM和YaRN在大语言模型中的应用场景和功能特点有所不同,具体如下:SGLang定位:是一种专为大型语言模型(
LLMs
)和视觉语言模型(VLMs)设计的高效服务框架。
没刮胡子
·
2025-07-28 00:56
Linux服务器技术
软件开发技术实战专栏
人工智能AI
人工智能
语言模型
自然语言处理
利用 Tavily Search API 提升 AI 代理的搜索能力
TavilySearchAPI是专为大型语言模型(
LLMs
)设计的搜索引擎,它能够以极高的速度提供实时、准确且事实驱动的结果,对AI开发者来说是一项极具价值的工具。
VYSAHF
·
2025-07-27 14:17
人工智能
microsoft
python
Deja Vu: 利用上下文稀疏性提升大语言模型推理效率
温馨提示:本篇文章已同步至"AI专题精讲"DejaVu:利用上下文稀疏性提升大语言模型推理效率摘要拥有数百亿参数的大语言模型(
LLMs
)催生了一系列令人振奋的AI应用。
AI专题精讲
·
2025-07-27 12:31
模型加速
人工智能
模型加速
AI技术应用
Java开发者,用LLM和AI Agent打造你的智能应用:从理论到实践!
摘要你是否认为AIAgent和大型语言模型(
LLMs
)是Python专属?那你就错了!Java,作为企业级应用开发的主力军,正在以前所未有的速度拥抱AI浪潮。
程序猿Mr.wu
·
2025-07-27 05:35
《AI+Java
前沿工坊》
人工智能
java
开发语言
LLMs
10道面试题提前看,有问有答,图文详解!
微调(Fine-tuning)
LLMs
指的是在特定任务或数据上对预训练好的模型进行进一步训练,使其能更好地适应目标场景的过程,其主要流程如下:数据准备:数据收集:根据目标任务收集高质量、有代表性的数据;
AI大模型-大飞
·
2025-07-26 16:58
人工智能
大模型
chatgpt
产品经理
AI
程序员
大模型面试题
NLP论文速读|chameleon:一个即插即用的组合推理模块Plug-and-Play Compositional Reasoning with Large Language Models
Plug-and-PlayCompositionalReasoningwithLargeLanguageModels论文信息:简介:该论文介绍了一个名为Chameleon的人工智能系统,旨在解决大型语言模型(
LLMs
Power2024666
·
2025-07-24 03:37
NLP论文速读
自然语言处理
人工智能
机器学习
深度学习
nlp
语言模型
迈向大型推理模型:基于大型语言模型的强化推理综述(附教程)
这一创新范式使
LLMs
能够模仿复杂的人类推理过程,如树搜索和反思性思维。近年来,学习推理的趋势逐渐兴起,强化学习(RL)被应用于训练
LLMs
掌握推理过程。这种方法通
LLM大模型
·
2025-07-22 13:05
人工智能
自然语言处理
知识库
本地化部署
吴恩达
大模型
RAG
掌握 RAG:使用 Langchain 和 Ollama 创建本地智能应用程序
引言随着大型语言模型(
LLMs
)的兴起,我们见证了一种新的工具类别的诞生。然而,
LLMs
也存在局限性,尤其是当面对需要最新信息或专有数据的商业用例时。本文将介绍如何通过微调和RAG来解决这些问题。
知世不是芝士
·
2025-07-22 07:42
langchain
人工智能
ai大模型
大语言模型
ollama
本地部署大模型
大模型技术
GENERALIST REWARD MODELS: FOUND INSIDE LARGELANGUAGE MODELS
GeneralistRewardModels:FoundInsideLargeLanguageModelshttps://arxiv.org/pdf/2506.232351.概述将大型语言模型(
LLMs
樱花的浪漫
·
2025-07-22 00:33
大模型与智能体
对抗生成网络与动作识别
强化学习
语言模型
人工智能
自然语言处理
深度学习
机器学习
计算机视觉
实现大语言模型与应用的无缝对接
在当今人工智能快速发展的时代,大语言模型(
LLMs
)已经成为众多应用的核心驱动力。然而,如何让这些强大的模型与各种数据源和工具进行有效集成,仍然是一个挑战。
meslog
·
2025-07-21 13:42
技术分享
语言模型
microsoft
人工智能
LLM4SR: A Survey on Large Language Models for Scientific Research
文章主要内容文章围绕大语言模型(
LLMs
)在科学研究中的应用展开,系统探讨了其在科研各关键阶段的作用、方法、挑战及未来方向。
UnknownBody
·
2025-07-20 20:33
LLM
Daily
Survey
Paper
语言模型
人工智能
自然语言处理
大模型本地部署-dify私有化部署-教程
2、全面的模型支持:与数百种专有/开源
LLMs
以及数十种推理提供商和自托管解决方案无缝集成,涵盖GPT、Mistral、Llama3以及任何与OpenAIAPI兼容的模型。完整
·
2025-07-20 11:05
CPO:对比偏好优化—突破大型语言模型在机器翻译中的性能边界
温馨提示:本篇文章已同步至"AI专题精讲"CPO:对比偏好优化—突破大型语言模型在机器翻译中的性能边界摘要中等规模的大型语言模型(
LLMs
),如参数量为7B或13B的模型,在机器翻译(MT)任务中展现出良好性能
AI专题精讲
·
2025-07-19 17:26
强化学习
人工智能
强化学习
AI技术应用
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal
原来的视角:把
LLMs
视为噪声标签的来源。现在的视角:把
LLMs
视为能够推理的代理。方法好在哪?需要的数据量少,得到的结果好。文章的方法
0x211
·
2025-07-12 10:38
论文阅读
语言模型
人工智能
自然语言处理
详解LLMOps,将DevOps用于大语言模型开发
大家好,在机器学习领域,随着技术的不断发展,将大型语言模型(
LLMs
)集成到商业产品中已成为一种趋势,同时也带来了许多挑战。
·
2025-07-11 19:01
从数据集视角看——大语言模型(
LLMs
)的训练、微调和推理
1.大语言模型训练的整体框架大语言模型的训练是一个复杂的过程,涉及数据准备、模型架构、优化策略和推理部署。以下是整体框架的详细分解:1.1训练阶段预训练:在海量文本数据上学习通用语言表示,类似于“学习语言的百科全书”。微调:针对特定任务调整模型参数,类似于“针对考试复习重点内容”。指令微调:在对话或指令数据集上优化,使模型更适合交互式任务。推理:使用训练好的模型进行预测或生成。1.2核心组件数据集
爱看烟花的码农
·
2025-07-10 22:38
AIGC
NLP
语言模型
人工智能
自然语言处理
大型语言模型中的提示工程系统综述:技术与应用
摘要提示工程已成为扩展大型语言模型(
LLMs
)和视觉语言模型(VLMs)能力的不可或缺的技术。这种方法利用任务特定的指令(称为prompt),在不修改核心模型参数的情况下增强模型效能。
AI专题精讲
·
2025-07-10 17:33
Paper阅读
语言模型
人工智能
自然语言处理
推测性解码:加速多模态大型语言模型的推理
大模型(
LLMs
)以其卓越的性能在多个应用场景中大放异彩。然而,随着应用的深入,这些模型的推理速度问题逐渐凸显。
人工智能培训咨询叶梓
·
2025-07-09 21:25
人工智能前沿
语言模型
人工智能
自然语言处理
计算机视觉
推理
多模态
算法
中文大模型的技术债问题
中文大模型的技术债问题摘要随着中文大语言模型(LargeLanguageModels,
LLMs
)在自然语言处理(NLP)领域的广泛应用,其研发和部署过程中积累的“技术债”(TechnicalDebt)问题日益突出
大鹏的NLP博客
·
2025-07-09 20:50
大模型
transformer
大模型
个人总结 - LangChain4j应用(1)
github:Releases·langchain4j/langchain4j·GitHub官方文档:Introduction|LangChain4j简要介绍:LangChain4j是一个旨在简化大语言模型(
LLMs
艾露z
·
2025-07-09 15:43
AI
java
langchain
ai
人工智能
解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning
LLMs
- GPT源代码解析
解密企业级大模型智能体AgenticAI关键技术:MCP、A2A、ReasoningLLMs-GPT源代码解析我们可以稍微看一下,这是我们GPT的基于它的源代码产生的可视化的内容。这边是model,我们在谈这个sampling的时候,本身首先就是说它这个probabilitydistribution,会有很多的参数对它进行影响。例如temperature,如果你是hightemperature的话
大模型与Agent智能体
·
2025-07-09 11:19
A2A
MCP
DeepSeek
A2A
MCP
Manus
ADK
10.5 实战ChatGLM3私有数据微调之提示工程:批量生成数据稳定性秘籍
实战ChatGLM3私有数据微调之提示工程:批量生成数据稳定性秘籍在当今人工智能蓬勃发展的时代,大语言模型(
LLMs
)如ChatGLM3的出现,为自然语言处理领域带来了革命性的变化。
少林码僧
·
2025-07-08 07:37
掌握先机!从
0
起步实战
AI
大模型微调
打造核心竞争力
机器学习
深度学习
人工智能
语言模型
从被动检索到主动思考:Naive RAG 到 Agentic RAG 的架构演进与关键技术解析
摘要随着大语言模型(
LLMs
)的广泛应用,检索增强生成(Retrieval-AugmentedGeneration,RAG)技术已成为解决模型知识滞后与幻觉问题的核心方案。
一休哥助手
·
2025-07-08 05:25
人工智能
架构
RAG
【AI论文】FineWeb2:一个管道,规模适配所有语言——使预训练数据处理适应每一种语言
摘要:预训练最先进的大型语言模型(
LLMs
)需要大量干净且多样的文本数据。
东临碣石82
·
2025-07-08 04:43
人工智能
深度学习
机器学习
大语言模型应用指南:ReAct 框架
尤其是大语言模型(LargeLanguageModels,
LLMs
),如BERT、GPT系列等,通过在大规模无标签数据上进行预训练,获得了强大的语言理解和生成能力。然而,预
AI大模型应用实战
·
2025-07-07 11:44
java
python
javascript
kotlin
golang
架构
人工智能
大语言模型原理基础与前沿 基于语言反馈进行微调
大语言模型(LargeLanguageModels,
LLMs
)如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而,如何进一步提高大语言模型的理
AI天才研究院
·
2025-07-07 10:03
计算
AI大模型企业级应用开发实战
AI人工智能与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【GitHub开源项目实战】Agent-Zero 多模态 Agent 框架的架构实现与实战落地
LLMAgent、多模态融合、LangGraph、结构化对话、函数调用、RAG、真实场景实战、开源项目分析摘要:Agent-Zero是一个以LangGraph为核心构建的多模态智能体框架,专注于大语言模型(
LLMs
观熵
·
2025-07-06 10:02
GitHub开源项目实战
github
开源
架构
大语言模型应用指南:谷歌 Gemini 简介
大语言模型应用指南:谷歌Gemini简介关键词:大语言模型,Gemini,谷歌,人工智能,应用指南1.背景介绍近年来,人工智能领域取得了突破性进展,尤其是大语言模型(LargeLanguageModels,
LLMs
AI天才研究院
·
2025-07-05 05:12
AI大模型企业级应用开发实战
AI人工智能与大数据
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
解锁数据的秘密:用大型语言模型编织异构数据的交响乐
而今,大型语言模型(
LLMs
)如同一股清风,带来了自动化整合的希望。本文将以通俗易懂的方式,深入探讨如何利用
LLMs
在数据工程中实现异构数据的提取与整合,聚焦于高等教育中学习障碍这一独特场景,揭示人
步子哥
·
2025-07-04 21:52
智能涌现
AGI通用人工智能
语言模型
人工智能
自然语言处理
重构企业智能服务:大模型部署背后的战略与落地实践
个人主页:慌ZHANG-CSDN博客期待您的关注一、引言:从“能用”到“可用”的时代跃迁过去一年中,大语言模型(
LLMs
)实现了从实验室“黑科技”到企业场景“生产力”的巨大跃迁。
慌ZHANG
·
2025-07-04 11:46
人工智能
人工智能
大模型私有化部署的系统性挑战与解决方案:企业视角的深度解析
随着ChatGPT、Claude、DeepSeek、通义千问等大语言模型(
LLMs
)能力爆发,企业纷纷探索“AI+业务”的融合创新。
慌ZHANG
·
2025-07-04 08:51
人工智能
人工智能
大语言模型技术系列讲解:大模型应用了哪些技术
正文开始大语言模型(
LLMs
)在人工智能领域通常指的是参数量巨大、能够处理复杂任务的深度学习模型。这些模型使用的技术主要
知世不是芝士
·
2025-07-03 15:57
语言模型
人工智能
自然语言处理
chatgpt
大模型
大模型算法工程师面试宝典:精选面试题及参考答案全解析,助你备战AI算法工程师岗位!
ii.为什么会出现
LLMs
复读机问题?出现
LLMs
复读机问题可能
大模型入门学习
·
2025-07-03 15:55
人工智能
产品经理
大数据
机器学习
程序员
大模型
大模型学习
LLM---大语言模型技术研究报告
摘要大语言模型(
LLMs
)已从技术突破走向产业规模化落地。2025年,全球
LLMs
进入“模型即服务”(MaaS)时代,参数量级突破万亿级,多模态能力、智能体协作、专业化细分成为主流趋势。
·
2025-07-03 14:23
引导语言的魔法:从简单指令到智能对话的艺术
大型语言模型(
LLMs
)就像一台精密的预测机器,依靠输入的提示(prompt)生成令人惊叹的输出。然而,撰写一个高效的提示并非易事——它需要科学与艺术的结合。
步子哥
·
2025-07-03 11:55
智能涌现
AGI通用人工智能
人工智能
python
机器学习
长尾形分布论文速览三十篇【60-89】
长尾形分布速览(60-89)这些研究展示了
LLMs
在长尾数据分布、持续学习、异常检测、联邦学习、对比学习、知识图谱、推荐系统、多目标跟踪、标签修复、对象检测、医疗生物医学以及其他应用中的广泛应用。
木木阳
·
2025-07-02 23:58
Long-tailed
人工智能
vLLM调度部署Qwen3
介绍在之前的文章中,我们介绍了如何使用ollama部署qwen3,一般而言,ollama适合个人部署使用,在面对企业级的模型部署时,一般更建议使用vLLMvLLM(高效大语言模型推理库)是一个专为大语言模型(
LLMs
你好,此用户已存在
·
2025-07-02 10:19
人工智能
linux
大模型
【LangChain编程:从入门到实践】AI 大模型检索增强生成 RAG 实践
大模型检索增强生成RAG实践关键词:LangChain,RAG,大语言模型,检索增强生成,向量数据库,嵌入模型,提示工程1.背景介绍在人工智能和自然语言处理领域,大语言模型(LargeLanguageModels,
LLMs
AI智能应用
·
2025-07-02 08:35
Python入门实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【知识图谱构建系列1】数据集介绍
hal.science/hal-04862214/项目地址:https://github.com/ChristopheCruz/LLM4KGC/项目简介我们所要学习的项目(LLM4KGC)聚焦于利用大语言模型(
LLMs
几道之旅
·
2025-07-01 17:44
人工智能
智能体及数字员工
Python杂货铺
AI
自建MCP
学习记录
知识图谱
面向大语言模型幻觉的关键数据集:系统性综述与分类法
面向大语言模型幻觉的关键数据集:系统性综述与分类法摘要大语言模型(LargeLanguageModels,
LLMs
)在自然语言处理的多个领域取得了革命性进展,但其固有的“幻觉”问题——即生成看似合理但与事实不符或与上下文无关的内容
致Great
·
2025-06-30 23:23
语言模型
人工智能
自然语言处理
大语言模型中的思维链提示:解锁高效互动的秘密
在当今的人工智能领域,大语言模型(
LLMs
)已然成为一颗耀眼的明星,它经过海量训练,能够理解并生成人类语言,在编程等诸多领域助力人们完成日常任务。
t0_54program
·
2025-06-29 17:01
大数据与人工智能
语言模型
人工智能
自然语言处理
个人开发
【RAG面试题】
LLMs
已经具备了较强能力,存在哪些不足点?
目录
LLMs
核心不足点1、知识过时与静态性(LackofReal-Time&DynamicKnowledge):2、幻觉与事实性错误(Hallucinations&FactualInaccuracies
一叶千舟
·
2025-06-28 15:50
AI面试题【RAG】
RAG
潜入思维的海洋:SoftCoT++如何让语言模型更聪明
在人工智能的浩瀚星空下,大型语言模型(
LLMs
)如同一颗颗璀璨的恒星,照亮了从文本生成到复杂推理的广阔领域。
步子哥
·
2025-06-28 13:40
智能涌现
语言模型
人工智能
自然语言处理
企业级AI开发利器:Spring AI框架深度解析与实战_spring ai实战
企业级AI开发利器:SpringAI框架深度解析与实战一、前言:Java生态的AI新纪元在人工智能技术爆发式发展的今天,Java开发者面临着一个新的挑战:如何将大语言模型(
LLMs
)和生成式AI(GenAI
AI大模型-海文
·
2025-06-28 13:07
人工智能
spring
python
算法
开发语言
java
机器学习
LLMs
基础学习(八)强化学习专题(7)
LLMs
基础学习(八)强化学习专题(7)文章目录
LLMs
基础学习(八)强化学习专题(7)Actor-Critic算法基础原理算法流程细节算法优缺点分析算法核心总结视频链接:https://www.bilibili.com
汤姆和佩琦
·
2025-06-28 08:03
NLP
学习
Actor-Critic
算法
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他