E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Python&LLM
L3-4、让 Prompt 更聪明:调试技巧与智能问答系统实战
让Prompt更聪明:调试技巧与智能问答系统实战在大语言模型(
LLM
)应用开发中,Prompt工程是核心技能。
何双新
·
2025-04-29 02:48
Prompt工程专栏
prompt
COT 思维链、TOT 思维树与 GOT 思维图:概念、代码与应用
在人工智能领域,尤其是自然语言处理(NLP)和大型语言模型(
LLM
)的研究中,推理能力的提升一直是研究的核心方向之一。
CarlowZJ
·
2025-04-29 00:31
COT
思维链
TOT
思维树
GOT
思维图
2W8000字
LLM
架构文章阅读指北
完整的专栏内容欢迎订阅:
LLM
架构专栏1、
LLM
大模型架构专栏||从NLP基础谈起2、
LLM
大模型架构专栏||自然语言处理(NLP)之建模3、
LLM
大模型架构之词嵌入(Part1)3、
LLM
大模型架构之词嵌入
柏企
·
2025-04-28 23:56
程序人生
LLM
并行计算的论文
LLM
并行计算的论文基础并行计算方法相关《Gpipe:EfficientTrainingofGiantNeuralNetworksusingPipelineParallelism》:提出了Gpipe这种流水线并行方法
ZhangJiQun&MXP
·
2025-04-28 22:21
2021
论文
2021
AI
python
教学
人工智能
自然语言处理
语言模型
【
LLM
】llama.cpp:合并 GGUF 模型分片
GGUF(GPT-GeneratedUnifiedFormat)是一种专为大规模语言模型设计的二进制文件格式,支持将模型分割成多个分片(*-of-*.gguf)。当从开源社区(如HuggingFace或ModelScope)下载量化模型时,常会遇到分片存储的情况。本教程将引导你使用llama.cpp工具包中的llama-gguf-split,将这些分片合并为一个完整的GGUF模型文件。前言与适用场
T0uken
·
2025-04-28 21:11
llama
语言模型
AI大模型日报#0622:Claude 3.5 Sonnet超越GPT-4o、盘古大模型跳级发布、松鼠AI多模态教育大模型
导读:AI大模型日报,爬虫+
LLM
自动生成,一文览尽每日AI大模型要点资讯!目前采用“文心一言”(ERNIE-4.0-8K-latest)生成了今日要点以及每条资讯的摘要。欢迎阅读!
常政
·
2025-04-28 19:01
人工智能
AI大模型日报
大模型
AIGC
AI资讯
【
LLM
入门之 Gemini 】(一) 获取API_KEY 以及本地运行
LLM
入门教程系列最近就写点
LLM
入门的吧=。=本篇会介绍谷歌的GenminiAPI简单的调用。首先打开官网,然后登陆等一系列步骤后,点击创建API_KEY然后你会得到你的key,保存好他。
通过图灵测试的人类
·
2025-04-28 18:27
NLP
自然语言处理
人工智能
python
DeepSeek部署入门教程!一键本地推理,DeepSeek-R1 蒸馏模型 + llama.cpp 部署教程!
前言在当今快速发展的AI领域,本地运行大型语言模型(
LLM
)的需求日益增长。llama.cpp是一个高性能的C/C++库,专门用于运行
LLM
,支持多种硬件加速选项。
AI大模型入门
·
2025-04-28 16:40
llama
语言模型
DeepSeek
大数据
人工智能
自然语言处理
大模型微调:技术迭代与实践指南
在人工智能领域,大模型(
LLM
)的微调是一个关键过程,它使模型能够适应特定的任务和数据集。微调是深度学习中用于改进预训练模型性能的重要技术。
人工智能培训咨询叶梓
·
2025-04-28 15:07
人工智能前沿
语言模型
人工智能
微调
提示工程
调优
性能优化
大模型培训
大模型外挂MCP教程(3):一图看懂Function Calling的工作流程-提示词与模型微调
注意:我们这个图中有两个
LLM
模型,其实实际使用中是一个,这里便于理解,只是不同场景下的两次调用。在大模型的各种应用领域中,Functioncalling(函数调用)作为
程序员寒山
·
2025-04-28 10:33
windows
microsoft
linux
MCP
Function
Functioncall
6、LangChain进阶:自定义组件专题
Callback处理回调概念LangChain提供了一个回调系统,允许您连接到
LLM
应用程序的各个阶段。这对于日志记录、监控、流式处理和其他任务非常有用。
Hugo_Hoo
·
2025-04-28 08:26
AI大模型应用开发技术路线
langchain
人工智能
AI编程
RAG基础
其核心作用是给
LLM
大模型外挂专门的知识库,指导大模型生成更准确的输出。为什么要给
LLM
大模型外挂知识库呢?因为虽然大模型的能力越来越强大,但其内在的缺点也非常明显。第一,存在幻觉问题。
sztu_aYu
·
2025-04-28 08:55
AI产品
人工智能
产品经理
5、Rag基础:RAG 专题
大型语言模型(
LLM
)用海量数据进行训练,使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。
Hugo_Hoo
·
2025-04-28 08:23
AI大模型应用开发技术路线
人工智能
AI编程
langchain
LLM
-Agent-MCP
生物学隐喻技术组件生物学隐喻核心逻辑
LLM
大脑负责高级认知(如语言理解、推理),是信息处理的核心Agent中枢神经系统(脊髓+脑干)协调动作与资源调度(如任务拆解、工具调用),连接高级认知与执行层MCP
userkang
·
2025-04-28 08:51
AI
人工智能
ai
LLM
Agent
MCP
Dify中ChatFlow与WorkFlow的区别及使用场景详解
Dify中ChatFlow与WorkFlow的区别及使用场景详解一、Dify简介Dify是一个强大的
LLM
应用开发平台,旨在帮助开发者快速构建基于大型语言模型的应用。
lingding_cn
·
2025-04-28 05:32
python
ai
dify
Dify
ChatFlow
WorkFlow
LLM应用
AI开发
《2025四大AI终极对决:如何用ChatGPT、DeepSeek、通义千问和文心一言提升项目管理效率?》
在当今快速发展的AI领域,大型语言模型(
LLM
)已经成为项目管理、智能助手和内容创作的重要工具。DooTask作为一款高效的项目管理软件,可以结合这些AI助手提升团队协作效率。
拾忆-eleven
·
2025-04-28 03:19
人工智能
人工智能
chatgpt
文心一言
AI Agent: MCP和AI Agent的联系
MCP(ModelContextProtocol,模型上下文协议)是由Anthropic公司于2024年提出的开放标准协议,旨在解决大型语言模型(
LLM
)与外部工具、数据源之间的交互难题。
InnoLink_1024
·
2025-04-28 03:17
AGI
人工智能
MCP
人工智能
agi
ai
《解锁LLMs from scratch:开启大语言模型的探索之旅》
仅需Python基础,从0构建大语言模型;从0逐步构建GLM4\Llama3\RWKV6,深入理解大模型原理项目首页-LLMs-from-scratch:从零开始逐步指导开发者构建自己的大型语言模型(
LLM
空云风语
·
2025-04-28 03:47
人工智能
神经网络
深度学习
语言模型
人工智能
自然语言处理
解析 Llama-Factory:从微调到推理的架构
轻松搞定大模型微调与推理的开源神器©作者|DWT来源|神州问学一、前言:Llama-Factory的背景与重要性在人工智能(AI)领域,尤其是自然语言处理(NLP)技术迅速发展的今天,如何高效地微调和部署大型语言模型(
LLM
神州问学
·
2025-04-28 00:03
人工智能
MCP的资源管理:如何向
LLM
暴露数据和内容
资源管理允许开发者将外部数据和内容暴露给
LLM
(大型语言模型),从而让
LLM
能够更好地理解和处理用户的请求。
CarlowZJ
·
2025-04-27 22:50
MCP
python
开发语言
MCP
6.1 客户服务:智能客服与自动化支持系统的构建
基于大语言模型(
LLM
)和智能代理(Agent)的技术为构建智能客服与自动化支持系统提供了强大的支持,不仅提升了服务效率,还优化了用户体验。
MonkeyKing.sun
·
2025-04-27 16:10
大模型+agent企业应用实践
人工智能
agent
智能赋能与精准评估:大语言模型在自动作文评分中的效度验证及改进路径
大语言模型(
LLM
)作为人工智能发展的前沿成果,凭借其强大的语义理解与生成能力,在自然语言处理任务中展现出卓越的性能,也为教育测评的革新带来了新的契机。
燕鹏01
·
2025-04-27 11:37
智教新视界:AI
与教育科技融合
语言模型
搜索引擎
人工智能
云主机轻松部署 DeepSeek
DeepSeek3安装Ollama3部署DeepSeek4安装ChatBox4CodeArtsIDE集成DeepSeek91概述案例介绍DeepSeek是一家创新型科技公司,长久以来专注于开发先进的大语言模型(
LLM
陈天伟教授
·
2025-04-27 09:25
DeepSeek
小白入手
人工智能
机器学习
深度学习
数据挖掘
LangChain 实战:Agent思维_langchain的agent 多个参数怎么解决
AgentsAgent是一个抽象概念,当
LLM
无法根据自身数据回复用户即将不得不正儿八经说假话时,Agent帮我们找来一个外部工具,解决之。除了代理的概
AGI学习社
·
2025-04-27 06:06
langchain
人工智能
数据库
产品经理
深度学习
chatgpt
Xinference 和 Ollama 的主要区别
Ollama:核心目标:专注于本地
LLM
的轻量化运行与调试。目标用户:个人开发者、快速实验
LLM
的小型团队。架构与功
chunmiao3032
·
2025-04-27 06:31
语言模型
理想MindVLA学习解读
1)关键技术3D高斯混合专家模型MoE从头训练的
LLM
模型底座人类反馈强化学习基于扩散模型的自车+周车闭环轨迹2)框架3)引申的技术细分
SLAM必须dunk
·
2025-04-27 05:57
学习
Ollama教程与大模型本地部署指南
教程与大模型本地部署指南目录Ollama简介安装与配置模型管理API使用本地部署步骤常见问题与解决方案性能优化应用案例1.Ollama简介1.1什么是OllamaOllama是一个开源的本地大语言模型(
LLM
爱编程的王小美
·
2025-04-27 01:32
大模型
人工智能
NLP高频面试题(五十五)——DeepSeek系列概览与发展背景
大型模型浪潮背景近年来,大型语言模型(LargeLanguageModel,
LLM
)领域发展迅猛,从GPT-3等超大规模模型的崛起到ChatGPT的横空出世,再到GPT-4的问世,模型参数规模和训练数据量呈指数级增长
Chaos_Wang_
·
2025-04-27 00:28
NLP/大模型八股
自然语言处理
人工智能
llm
+rag本地化部署手册
llm
+rag本地化部署手册1.linux环境搭建a.基础实验环境搭建官网安装dockerdesktop即可,详情见下方Docker一节b.使用WSL2进行搭建或者使用原生linux进行搭建在管理员模式下打开
CLAYo
·
2025-04-26 19:58
llm
[论文阅读]ReAct: Synergizing Reasoning and Acting in Language Models
2210.03629]ReAct:SynergizingReasoningandActinginLanguageModelsICLR2023这是一篇在2022年挂出来的论文,不要以现在更加强大且性能综合的
LLM
0x211
·
2025-04-26 18:48
论文阅读
语言模型
人工智能
自然语言处理
DeepSeek与清华联合发布重磅论文:从 SPCT 到 Meta Reward Model,或预示DeepSeek R2将近
与清华大学研究团队联合发布题为《奖励模型的推理时Scaling方法及其在大规模语言模型中的应用》的重磅论文,提出自我原则点评调优(SPCT)与元奖励模型(MetaRewardModel)两大核心技术,为大语言模型(
LLM
LinkTime_Cloud
·
2025-04-26 16:03
人工智能
千问2.5-VL-7B的推理、微调、部署_笔记2
ms-swift是魔搭社区官方提供的
LLM
工具箱,支持300+大语言模型和80+多模态大模型的微调到部署。ms-swift开源地址:https://github.com/modelscope/
山山而川_R
·
2025-04-26 11:36
视觉大模型_1
笔记
主流开源
LLM
应用开发平台详解
以下是关于开源的
LLM
(大语言模型)应用开发平台的详细解析,涵盖核心功能、技术特点、使用场景、优缺点对比及代码示例。
爱的叹息
·
2025-04-26 11:04
人工智能
开源
人工智能
LangChain表达式LCEL(一)
例如,从
LLM
流式传输令牌到一个流式输出解析器,就可以以与
LLM
提供者输出原始
荧惑yh
·
2025-04-26 03:13
LangChain
langchain
LangChain 表达式语言 (LCEL)
LCEL从第一天开始就设计为支持将原型直接投入生产环境,无需代码更改,从最简单的“提示+
LLM
”链条到最复杂的链条(我们已经看到有人在生产环境中成功运行了包含数百个步骤的LCEL链条)。
龙大.
·
2025-04-26 03:13
AI
langchain
Transformer是什么,如何搭建
LLM
大语言模型
Transformer是什么,如何搭建
LLM
大语言模型一、什么是Transformer和LLMTransformer是一中深度学习模型框架,最初由Vaswani等人在2017年的论文“AttentionIsAllYouNeed
酒盏花枝贫者缘。
·
2025-04-26 03:36
大模型
Transformer
DeepSpeed
语言模型
llama
transformer
结合AI客户端玩转go MCP项目开发
MCP的核心目标是让
LLM
应用程序能够轻松集成外部系统,这在当前AI驱动的应用开发中非常重要。
爱因诗贤
·
2025-04-26 02:04
人工智能
golang
开发语言
如何用go语言搭MCP
2.官方MCP架构图MCPHosts:是指
LLM
启动连接的应用程序,如Cursor、ClaudeDesktop、IDE或AI工具
爱因诗贤
·
2025-04-26 02:34
golang
开发语言
后端
AI编程
LLM
进阶——Transformer
文章目录一、前置知识1、(Encoder-Decoder)结构2、注意力机制二、Transformer结构1、介绍2、输入层1)BytePairEncoding2)位置编码——positionalEncoding3、核心架构三、Transformer库1、介绍2、demo一、前置知识1、(Encoder-Decoder)结构在深度学习中,编码器-解码器(Encoder-Decoder)结构是一种常
轩不丢
·
2025-04-26 02:04
LLM
transformer
深度学习
人工智能
神经网络
自然语言处理
nlp
001
LLM
大模型之Transformer 模型
参考《大规模语言模型--从理论到实践》目录一、综述二、Transformer模型三、嵌入表示层(位置编码代码)一、综述语言模型目标是建模自然语言的概率分布,在自然语言处理研究中具有重要的作用,是自然语言处理基础任务之一。大量的研究从n元语言模型(n-gramLanguageModels)、神经语言模型(NeuralLanguageModels,NLM)以及预训练语言模型(Pre-trainedLa
黄家驹beyond
·
2025-04-26 02:04
LLM大模型
transformer
深度学习
人工智能
nlp
一文详解训练
LLM
流程
1.摘要
LLM
训练是利用大规模数据对深度学习模型进行预训练的过程,旨在培养能够理解和生成自然语言文本的模型。这个过程通过处理海量文本数据,让模型学习语言的统计规律、语义信息和上下文关系。
莫杨94
·
2025-04-26 01:55
llama
人工智能
深度学习
自然语言处理
详解各种
LLM
系列|(4)GLM(GPT国内最强开源平替)模型架构、预训练技术详解
一、引言论文地址:arXiv:https://arxiv.org/abs/2103.10360官网:https://chatglm.cn/blogGithub:https://github.com/THUDM/ChatGLM-6B在日益增多的开源大模型中,由清华大学研发的开源大模型GLM由于效果出众而受到大众关注,而且清华大学开源了基于GLM架构研发的基座模型:ChatGLM-6B以及GLM-13
m0_74825746
·
2025-04-26 01:54
面试
学习路线
阿里巴巴
gpt
开源模型应用落地-qwen2-7b-instruct-LoRA微调-Axolotl-单机单卡-V100(九)
二、术语介绍2.1.LoRA微调LoRA(Low-RankAdaptation)用于微调大型语言模型(
LLM
)。
开源技术探险家
·
2025-04-26 00:48
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
机器学习漏洞大汇总——利用机器学习服务
WANDBWeave目录遍历-CVE-2024-7340[Weave]是一个用于评估和跟踪大型语言模型(
LLM
)应用程序的工具包,由Weights&Biases(WANDB)构建
红云谈安全
·
2025-04-25 23:46
机器学习
人工智能
网络安全
从零构建 AI Agent:
LLM
大模型应用开发实践
从零构建AIAgent:
LLM
大模型应用开发实践Building-AI-Agent-from-Scratch-
LLM
-based-Application-Development-Practice文章目录从零构建
AI天才研究院
·
2025-04-25 20:51
计算
DeepSeek
R1
&
大数据AI人工智能大模型
ChatGPT
人工智能
agent
语言模型
一文秒懂AI核心:Agent、RAG、Function Call与MCP全解析
如今大语言模型(
LLM
)的风头一时无两,它们能写诗、能聊天、能编程,简直无所不能!但你有没有发现,有时候它们也挺“傻白甜”的?
我爱学大模型
·
2025-04-25 20:20
人工智能
langchain
AI大模型
AI
RAG
Agent
MCP
TestBrain开源程序是一款集使用AI(如deepseek)大模型自动生成测试用例、和测试用例评审、RAG知识库管理的web平台系统
一、软件介绍文末提供程序和源码下载TestBrain开源程序是一款集使用AI(如deepseek)大模型自动生成测试用例、和测试用例评审、RAG知识库管理的web平台系统一个基于
LLM
的智能测试用例生成平台
2301_78755287
·
2025-04-25 20:47
测试用例
人工智能
deepseek
机器学习
代码复审
深度学习
我们为什么要用本地大模型?如何搭建私有化大模型?
LLM
的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。前排提示,文末有大模型AGI-CSDN独家资料包哦!我
程序员二飞
·
2025-04-25 17:29
人工智能
chatgpt
职场和发展
prompt
数据库
java
大模型RAG入门到实战基础教程(非常详细),保姆级教程!
写在前面大模型(LargeLanguageModel,
LLM
)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分域时,通用大模型就会面临专业知识不足的问题。
程序员二飞
·
2025-04-25 17:28
java
数据库
缓存
人工智能
前端
深度学习
开发语言
【AIGC】大模型面试高频考点-
LLM
量化方法对比:GPTQ、GGUF、AWQ
LLM
量化方法对比:GPTQ、GGUF、AWQ(一)模型加载(二)分片(三)量化(四)预量化(GPTQ、AWQ、GGUF)(1)GPTQ(2)GGUF(3)AWQ(五)总结(1)GPTQ:基于GPT的量化方法
LeeZhao@
·
2025-04-25 12:51
AIGC高频面试题
AIGC
人工智能
agi
计算机视觉
自然语言处理
上一页
16
17
18
19
20
21
22
23
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他