E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
(LLM)
Prompt:开启与AI高效对话的钥匙
简单来说,Prompt是你向AI(如大型语言模型
LLM
)发出的文本或问题,用以引导它生成特定的、高质量的
·
2025-07-20 15:34
LLM
模型 贪婪、温度、Top-k、核采样方式的区别---附代码与示例
LLM
模型贪婪、温度、Top-k、核采样方式的区别—附代码与示例在自然语言生成任务中,不同的采样技术用于从语言模型的输出中选择下一个生成的单词或词语。
繁星意未平
·
2025-07-20 12:46
AI
python
开发语言
LLM
的Top-P参数 是在
LLM
中的每一层发挥作用,还是最后一层?
LLM
的Top-P参数是在
LLM
中的每一层发挥作用,还是最后一层?
ZhangJiQun&MXP
·
2025-07-20 12:09
教学
2024大模型以及算力
2021
AI
python
人工智能
算法
机器学习
transformer
自然语言处理
KAIST:
LLM
混合递归推理
标题:Mixture-of-Recursions:LearningDynamicRecursiveDepthsforAdaptiveToken-LevelComputation来源:arXiv,2507.10524摘要缩放语言模型解锁了令人印象深刻的能力,但伴随的计算和内存需求使训练和部署都很昂贵。现有的效率工作通常针对参数共享或自适应计算,留下了如何同时实现两者的问题。我们引入了混合递归(MoR
大模型任我行
·
2025-07-20 11:06
大模型-推理优化
人工智能
自然语言处理
语言模型
论文笔记
NUS:
LLM
表格数据建模综述
标题:LanguageModelingonTabularData:ASurveyofFoundations,TechniquesandEvolution来源:arXiv,2408.10548摘要表格数据是一种跨领域的流行数据类型,由于其异构性和复杂的结构关系,带来了独特的挑战。在表格数据分析中实现高预测性能和鲁棒性对许多应用程序具有重大前景。受自然语言处理,特别是转换器架构的最新进展的影响,出现了
·
2025-07-20 11:36
大模型本地部署-dify私有化部署-教程
一、简介dify是一个开源的
LLM
应用开发平台。其直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等,可以让您快速从原型到生产。
·
2025-07-20 11:05
AIGC革命:基于魔搭社区的
LLM
应用开发实战——从模型微调到系统部署
AIGC革命:基于魔搭社区的
LLM
应用开发实战——从模型微调到系统部署1.AIGC技术演进与魔搭社区生态解析人工智能生成内容(AIGC)正在重塑内容创作、软件开发和人机交互的边界。
Liudef06小白
·
2025-07-20 10:25
AIGC
人工智能
特殊专栏
人工智能
魔搭
AIGC
LLM
人工智能界的“黑话“大揭秘:AI新词汇速成指南
LLM
(大型语言模型):AI界的"大胃王"
LLM
是吞噬了互联网大部分文字的"数据饕餮"。特点:训练数据以TB(万亿字节)计算参数动辄上千亿计算能力堪比小
·
2025-07-20 09:53
解密Claude系列:从原理到实践的全方位解析
引言:Claude系列模型的崛起在人工智能领域,大型语言模型(
LLM
)的发展日新月异。OpenAI的GPT系列和Anthropic的Claude系列无疑是这一领域的双子星。
软考和人工智能学堂
·
2025-07-20 08:49
强化学习
人工智能
Claude快速入门
Claude
智能体架构设计的五大核心原则:构建下一代AI系统的工程基石
传统
LLM
一休哥助手
·
2025-07-20 07:37
人工智能
入门大模型神器:开源项目Happy
LLM
保姆级教程!
Happy-LLMHappy-
LLM
——从零开始的大语言模型原理与实践教程。
·
2025-07-20 05:27
【DeepSeek实战】10、模型上下文协议(MCP)全解析:从核心架构到实战应用,揭秘AI协作的“凤雏”之力
在人工智能技术飞速发展的今天,大型语言模型(
LLM
)的能力不断突破,但跨模型协作、上下文一致性维护等问题却成为制约AI系统向更智能、更协同方向发展的瓶颈。
无心水
·
2025-07-20 03:12
人工智能
架构
DeepSeek实战
模型上下文协议MCP
CSDN技术干货
DeepSeek
AI大模型
Spring AI 函数调用(Function Call)系统设计方案
1.2主要功能需求支持通过注解将普通Java方法标记为可被AI调用的函数自动生成符合
LLM
要求的函数描述和参数定义安全地解析和执行模型的函数调用请求处理并返回执行结果给模型提供扩展点以支持不同
LLM
提供商的特定实现
大树~~
·
2025-07-20 00:21
AI应用开发
spring
人工智能
数据库
SpringAI
Function
Call
[特殊字符]
LLM
(大型语言模型):智能时代的语言引擎与通用推理基座
从千亿参数到人类认知的AI革命一、核心定义与核心特征
LLM
(LargeLanguageModel)是基于海量文本数据训练的深度学习模型,通过神经网络架构(尤其是Transformer)模拟人类语言的复杂规律
大千AI助手
·
2025-07-20 00:48
人工智能
Python
#
OTHER
语言模型
人工智能
自然语言处理
LLM
大模型
Transformer
LLM
系统性学习完全指南(初学者必看系列)
前言这篇文章将系统性的讲解
LLM
(LargeLanguageModels,
LLM
)的知识和应用。
GA琥珀
·
2025-07-19 19:11
LLM
学习
人工智能
语言模型
Synergizing RAG and Reasoning: A Systematic Review-RAG与推理能力深度结合-新方向
欢迎关v:数据分析能量站0论文小结一、研究背景与核心问题大语言模型(
LLM
)在处理复杂任务时面临两大瓶颈:知识局限性:纯
LLM
存在“知识幻觉”(编造事实)和“领域知识缺口”;推理浅度:传统检索增强生成(
数据分析能量站
·
2025-07-19 19:05
机器学习
人工智能
CPO:对比偏好优化—突破大型语言模型在机器翻译中的性能边界
然而,它们仍未能达到最先进的传统编码器-解码器翻译模型,或是如GPT-4(OpenAI,2023)等更大规模
LLM
的表现。在本研究中,我们致力于弥合这一性能差距。我们首先评估了在机器翻译任
AI专题精讲
·
2025-07-19 17:26
强化学习
人工智能
强化学习
AI技术应用
飞算JavaAI
通过大语言模型(
LLM
)实现自然语言到代码的转换,覆盖需求分析、接口设计、表结构设计、业务逻辑生成、代码生成与合并等全流程开发环节。
·
2025-07-19 15:41
LLM
- 通过案例轻松理解MCP、Tool Calling、Agent
文章目录一、MCP是什么?二、MCP解决了哪些痛点?三、什么是ToolCalling?四、对比案例一:ToolCallingvsMCP五、对比案例二:AgentvsAgent+MCP六:使用场景理解Agent→ToolCalling→MCP场景一:智能助手帮你整理工作安排(重构版)Agent的理解与规划ToolCalling的执行流程MCP的幕后支撑场景二:智能电商客服处理订单异常Agent的理解
小小工匠
·
2025-07-19 14:38
【LLM大模型】
MCP
Function
Call
Agent
Tool
Calling
如何增强
LLM
(大语言模型)的“置信度”和“自信心” :
LLM
的“自信”不是“什么都能答”,而是“该答的答得准,不该答的敢说不”。
如何增强
LLM
(大语言模型)的“置信度”和“自信心”Pleaseprovideafirmanswer,andforthosewhodon’tknow,pleasereply‘unknown’
LLM
(大语言模型
ZhangJiQun&MXP
·
2025-07-19 11:44
教学
2021
AI
python
2024大模型以及算力
语言模型
人工智能
自然语言处理
深度学习
transformer
机器学习
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代,大型语言模型(
LLM
)的推理和部署面临着诸多挑战,尤其是当模型规模日益庞大时,如何高效地利用硬件资源成为关键问题。
·
2025-07-19 11:13
AI应用服务
AI大模型--AI应用,该如何和前端交互,呈现
llm
模型答复内容呢?向
LLM
大模型提问后,系统得先识别问题,再从数据网络找信息,接着推理出正确结果,还得防止模型“胡编乱造”(控制模型幻想)。
SUPER5266
·
2025-07-19 10:35
人工智能
LLM
中 最后一个词语的表征(隐藏状态)通常会融合前面所有词语的信息吗?
LLM
中最后一个词语的表征(隐藏状态)通常会融合前面所有词语的信息吗?
ZhangJiQun&MXP
·
2025-07-12 15:44
教学
2024大模型以及算力
2021
AI
python
机器学习
算法
深度学习
人工智能
LLM
的表征做减法的是什么,自然语言是一个矩阵,怎么进行减法的
LLM
的表征做减法的是什么,自然语言是一个矩阵,怎么进行减法的有个假设:就是最后一个词语融合了前面词语的信息减法操作主要用于提取模型内部表征中的"诚实性"概念向量。
ZhangJiQun&MXP
·
2025-07-12 14:40
教学
2024大模型以及算力
2021
AI
python
计算机视觉
人工智能
机器学习
算法
深度学习
LLM
-生成器判别器的实现
总结首先,使用GPT模型获取每个词的生成概率pLLMp_{
LLM
}pLLM。
·
2025-07-12 12:23
利用本地
LLM
、MCP、DeepSeek 集成构建您自己的 AI 驱动工具
在本指南中,我将引导您构建一个具有本地运行的大型语言模型(
LLM
)和MCP集成的AI工具-让您以类似的方式自动执行利用MCP的工具您喜欢的任务。
知识大胖
·
2025-07-12 11:51
NVIDIA
GPU和大语言模型开发教程
人工智能
mcp
deepseek
使用 Ollama 、 DeepSeek和QWEN的模型上下文协议 (MCP) ,使用本地
LLM
教程的 MCP 服务器
MCP或模型上下文协议由Anthropic去年发布,它可以帮助
LLM
连接软件并对其进行控制。
知识大胖
·
2025-07-12 11:51
NVIDIA
GPU和大语言模型开发教程
服务器
运维
人工智能
qwen2vl
deepseek
在 Obsidian 中本地使用 DeepSeek — 无需互联网!
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地
LLM
?如果是,那么本指南适合您!
知识大胖
·
2025-07-12 11:21
NVIDIA
GPU和大语言模型开发教程
人工智能
deepseek
Llama-Omni会说话的人工智能“语音到语音
LLM
” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式(教程含源码)
——史蒂夫·乔布斯近年来,人机交互领域发生了重大变化,尤其是随着ChatGPT、GPT-4等大型语言模型(
LLM
)的出现。
知识大胖
·
2025-07-12 11:50
NVIDIA
GPU和大语言模型开发教程
llama
人工智能
nvidia
llm
OpenWebUI系列之 如何通过docker自动将其更新到OpenWebUI最新版本
它支持各种
LLM
运行器,包括Ollama和OpenAI兼容API。如何通过docker自动将其更新到OpenWebUI最新版本?
知识大胖
·
2025-07-12 11:20
NVIDIA
GPU和大语言模型开发教程
docker
llm
openwebui
AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL
简介一款全栈应用程序,可让您将任何文档、资源或内容转换为上下文,任何
LLM
都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的
LLM
或矢量数据库,并支持多用户管理和权限。
知识大胖
·
2025-07-12 11:20
NVIDIA
GPU和大语言模型开发教程
mysql
postgresql
数据库
anythingllm
ollama
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序
您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序,该应用程序基本上是一个具有许可的完整ChatGPT,但具有任何
LLM
、嵌入模型或矢量数据库。
知识大胖
·
2025-07-12 11:50
NVIDIA
GPU和大语言模型开发教程
llama3
anythingllm
llm
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志,以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型(教程含安装步骤)
您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序,该应用程序基本上是一个具有许可的完整ChatGPT,但具有任何
LLM
、嵌入模型或矢量数据库。
知识大胖
·
2025-07-12 11:20
NVIDIA
GPU和大语言模型开发教程
llama3
ai
anythinllm
llama
【AI大模型】
LLM
模型架构深度解析:BERT vs. GPT vs. T5
理解它们的差异是
LLM
开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
我爱一条柴ya
·
2025-07-12 10:10
学习AI记录
ai
人工智能
AI编程
python
LLM
大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战
LLM
大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战1.环境准备GPU设备:A10,3090,V100,A100均可.
汀、人工智能
·
2025-07-12 10:09
LLM技术汇总
人工智能
自然语言处理
LLM
Agent
vLLM
AI大模型
大模型部署
【实战AI】macbook M1 本地ollama运行deepseek
请自行;2.设备macbookM132G下载ollamaOllama是一款跨平台推理框架客户端(MacOS、Windows、Linux),专为无缝部署大型语言模型(
LLM
)(如Llama2、Mistral
东方鲤鱼
·
2025-07-12 08:24
chat
AI
macos
ai
llama
AIGC
chatgpt
思维链革命:让大模型突破“机器思考”的边界
思维链技术深度解析文章(原文链接)的博客化重构,融合技术本质与应用实践:思维链革命:让大模型突破“机器思考”的边界——解析ChainofThought技术体系与下一代推理架构一、从黑箱到透明思考:CoT的核心突破传统
LLM
John Song
·
2025-07-12 07:13
AI
人工智能
思维链2.0
CoT
多模态思维链
元认知优化
LLM
Agent在多模态任务中的推理机制详解
文章目录一、引言二、多模态LLMAgent的基本架构2.1系统组成2.2工作流程图三、多模态表示与对齐3.1跨模态嵌入空间3.2模态对齐技术四、多模态推理策略4.1基于提示的推理(Prompt-basedReasoning)4.2多模态思维链(CoT)推理4.3多模态工具使用五、实现案例:多模态问答系统5.1系统架构5.2示例应用六、高级多模态推理技术6.1多模态递归推理6.2多模态记忆与检索6.
·
2025-07-12 06:12
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库,目标是在各种硬件上实现
LLM
推断,保持最小设置和最先进性能。
·
2025-07-12 06:41
LLaMA-Omni 深度解析:打开通往无缝人机语音交互的大门
LLaMA-Omni不仅实现了低至226ms的惊人交互延迟,还能同时生成高质量的文本与语音回复,真正意义上让大语言模型(
LLM
)具备了“听说”的能力。
kakaZhui
·
2025-07-12 06:41
前沿多模态大模型:论文与实战
llama
交互
LLM
TTS
语音识别
语音合成
人工智能
在
LLM
快速迭代时代构建持久AI应用:架构设计与实施策略
引言:技术浪潮下的开发困境大型语言模型(
LLM
)的发展速度令人瞠目:从GPT-3到GPT-4,从Claude1到Claude3,从Llama1到Llama3,迭代周期正在从"年"缩短到"月"。
·
2025-07-12 02:44
大型语言模型(
LLM
, Large Language Models)基模和 Chat 模型之间的区别
一、概述最近看大模型相关的知识,有看到大模型都有基础模型(base)和对话模型(chat),不太清楚什么时候用到基础模型,什么时候用到对话模型,故有此文。通过了解,最简单的概述就是基于基础模型会训练出一个对话(Chat)模型,对话模型主要用于对话场景,基础模型主要做文本生成,没有上下文对话的能力。在模型命名上也能看出来区别,例如:Qwen-72B和Qwen-72B-ChatChatGLM3-6B-
·
2025-07-12 01:37
SpringBoot集成LangChain4j:构建智能AI应用全解析
在企业级应用中融入大语言模型(
LLM
)能力已成为趋势,而LangChain4j作为专为Java设计的
LLM
集成框架,与SpringBoot的结合为开发者提供了强大而灵活的解决方案。
java干货仓库
·
2025-07-12 00:58
八股文汇总
Spring
大模型
spring
boot
人工智能
后端
基于 esp32-s3,结合私有化大模型,集asr语音识别、
llm
大模型、tts语音合成,设计一个技术方案,要求用websocket保持长链接,
以下方案演示了如何基于ESP32-S3,通过私有化大模型组合ASR(语音识别)、
LLM
(语言大模型)和TTS(语音合成)来构建一个语音交互系统,并且通过WebSocket保持与服务器的长连接通讯。
·
2025-07-11 20:03
详解LLMOps,将DevOps用于大语言模型开发
为了有效应对这些挑战,数据科学家们转向了一种新型的DevOps实践
LLM
-OPS,专为大型语言模型的开发和维护而设计。
·
2025-07-11 19:01
代码与 AI 的交响乐:探索 avante.nvim 的智能编程革命
本文将带你走进avante.nvim的世界,探索它如何通过大语言模型(
LLM
)和上下文感知机制,重新定义编程的艺术与科学。从灵感火花到代码现实:AI驱动的编程新时代想象一下,你正在编写一个复杂的P
步子哥
·
2025-07-11 18:48
人工智能
零代码玩转大模型!LLaMA Factory:你的专属模型精修师
你是否曾对大语言模型(
LLM
)的强大能力心驰神往,却苦于以下难题?想定制专属模型?微调代码看不懂,环境配置太复杂…硬件资源有限?动辄需要数张A100,普通设备望而却步…中文任务不给力?
jane_xing
·
2025-07-11 17:41
人工智能
llama
掌握
LLM
工程课,让你的AI之旅充满惊喜
掌控AI时代的密码:深入
LLM
工程课程在人工智能迅猛发展的今天,对大语言模型(
LLM
)的深入理解和应用能力已经成为引领技术潮流的重要基石。
·
2025-07-11 15:31
Dify小白入门指南:通过官方文档学习工作流编排和API调用
Dify小白入门指南:通过官方文档学习工作流编排和API调用一、Dify平台简介与核心功能Dify是一个开源的
LLM
应用开发平台,被设计为一个"生成式AI应用创新引擎",它提供了从Agent构建到AI工作流编排
伟大无须多言
·
2025-07-11 12:39
学习
dify
ai
大模型 Agent(智能体)技术简介
大模型Agent(智能体)技术是当前人工智能领域的前沿方向,它赋予大型语言模型(
LLM
)自主感知、规划、决策和行动的能力,使其不再局限于“被动应答”,而是能主动完成复杂任务。
北京地铁1号线
·
2025-07-11 11:35
自然语言处理与大语言模型
大模型
语言模型
Agent
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他