E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Python&LLM
大语言模型:是逐字生成还是一次多词?
大语言模型(
LLM
)既可以按顺序逐个生成单词(token),也能实现一次生成多个token核心差异源于解码策略与模型架构设计一、常规“逐个生成”模式(基础逻辑)多数入门级演示或简单文本生成中,
LLM
会默认按
ZhangJiQun&MXP
·
2025-07-03 14:51
教学
2024大模型以及算力
2021
AI
python
算法
prompt
人工智能
自然语言处理
均值算法
微软:
LLM
训练数据组织框架DELT
标题:DataEfficacyforLanguageModelTraining来源:arXiv,2506.21545摘要数据是语言模型(LM)训练的基础。最近的研究一直致力于数据效率,其目的是通过选择训练数据的最小或最优子集来最大限度地提高性能。数据过滤、采样和选择等技术在这一领域起着至关重要的作用。为了补充这一点,我们定义了数据效能,它侧重于通过优化训练数据的组织来最大限度地提高性能,目前尚未得
大模型任我行
·
2025-07-03 13:17
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
思维树(Tree of Thoughts): 超越链式思维的AI推理新范式
引言在人工智能快速发展的今天,大语言模型(
LLM
)的推理能力一直是研究的热点。
司南锤
·
2025-07-03 13:45
LLM
人工智能
云原生环境下部署大语言模型服务:以 DeepSeek 为例的实战教程
个人主页:一ge科研小菜鸡-CSDN博客期待您的关注一、引言随着DeepSeek、Qwen、ChatGLM等大语言模型(
LLM
)的开放与普及,企业将其私有化部署并服务化的需求愈发迫切。
一ge科研小菜菜
·
2025-07-03 13:42
人工智能
Python
编程语言
语言模型
人工智能
自然语言处理
用Firecrawl轻松获取网站数据,提升AI应用的效率!
它不仅能够将整个网站的数据转化为适用于大语言模型(
LLM
)的markdown或结构化数据,还能通过单一的API实现数据抓取、爬取和提取。从此,清晰、整洁的数据触手可及。什么是Firecrawl?
人工智能我来了
·
2025-07-03 12:33
人工智能
AI
人工智能
探秘AI的秘密:leaked-system-prompts
揭秘:揭秘系统提示合集背后的秘密在当今这个人工智能技术迅速发展的时代,了解和使用大型语言模型(
LLM
)已成为技术爱好者、开发者和研究人员的共同目标。
人工智能我来了
·
2025-07-03 11:28
人工智能
AI
人工智能
深入探索 Vanna:让数据库交互更智能
Vanna,一个基于Python的开源工具,通过结合检索增强(RetrievalAugmentation)和大型语言模型(
LLM
),为这一问题提供了一个创新的解决方案。本文将深入探讨Vanna
从零开始学习人工智能
·
2025-07-03 11:56
数据库
交互
语言的钥匙:提示工程的艺术与驾驭AI的智慧
当大型语言模型(
LLM
)如GPT-4展现出令人惊叹的通用能力,却又伴随着“幻觉”、“黑箱”和“不可控”等阴影时,一个核心问题变得无比迫切:人类如何有效地与这些庞然大物沟通,引导它们可靠、安全、精准地完成任务
田园Coder
·
2025-07-03 10:51
人工智能科普
人工智能
科普
VSCode-Copilot的系统提示词
title:VSCode-Copilot系统提示词date:2025-07-0211:05categories:技术tags:AI人工智能
LLM
大语言模型提示词Microsoft开源了VSCodeCopilotChat
youngqqcn
·
2025-07-03 10:19
AI
vscode
copilot
ide
LLM
应用选型指南,适用场景全解析
基本定义微调:是指利用更小、更具针对性的数据集对经过预先训练的大语言模型进一步训练的过程。在这个过程中,模型基于新数据集修改权重和参数,学习特定于任务的模式,同时保留来自最初预训练模型的知识。RAG:即检索增强生成,是将检索大量外部知识的过程与文本生成结合在一起的一种方法。它会从大型外部数据库中检索与输入问题相关的信息,将这些信息作为上下文提供给大语言模型,辅助其生成回答。微调适用场景1.特定领域
认知超载
·
2025-07-03 08:36
AI
人工智能
LangSmith 深度解析:构建企业级
LLM
应用的全生命周期平台
LangSmith深度解析:构建企业级
LLM
应用的全生命周期平台LangSmith是LangChain生态系统中的核心组件,为
LLM
应用提供从开发到生产的全链路支持。
小赖同学啊
·
2025-07-03 06:20
人工智能
人工智能
LangChain4j在Java企业应用中的实战指南-2
LangChain4j在Java企业应用中的实战指南文章标签langchain4j,JavaAI,RAG系统,智能应用开发,LangChain4j实战,企业级AI应用,Java微服务,检索增强生成文章简述随着大语言模型(
LLM
在未来等你
·
2025-07-03 04:43
大模型应用开发
AI
技术
编程
Java
Spring
(论文总结)思维链激发
LLM
推理能力
研究背景&动机背景:扩大模型规模已被证实具有提升模型性能和模型效率的功效,但是
LLM
对于完成推理、算术任务仍有较大不足。
靈镌sama
·
2025-07-03 03:58
论文解读
人工智能
LangChain4j在Java企业应用中的实战指南-3
在Java企业应用中的实战指南】文章标签langchain4j,JavaAI,RAG系统,智能应用开发,LangChain4j实战,企业级AI应用,Java微服务,检索增强生成文章简述随着大语言模型(
LLM
在未来等你
·
2025-07-03 02:24
大模型应用开发
AI
技术
编程
Java
Spring
千亿参数大模型轻量化实战:手机端
LLM
推理加速300%方案
点击跳转到网站《千亿参数大模型轻量化实战:手机端
LLM
推理加速300%方案》副标题:2025实测骁龙8Gen4+FP4稀疏量化技术,70B模型推理延迟低至127ms,重构移动端AI天花板封面图:[高通骁龙
·
2025-07-03 00:33
大模型学习 (Datawhale_Happy-
LLM
)笔记7: Encoder-Decoder PLM
大模型学习(Datawhale_Happy-
LLM
)笔记7:Encoder-DecoderPLM1.Encoder-Decoder架构概述1.1架构基础Encoder-DecoderPLM是基于原始Transformer
lxltom
·
2025-07-02 23:31
学习
笔记
language
model
自然语言处理
神经网络
人工智能
深度学习
[AI笔记]-
LLM
中的3种架构:Encoder-Only、Decoder-Only、Encoder-Decoder
一、概述架构描述特点案例Encoder-Only仅包含编码器部分这类模型主要专注输入数据中提取特征或上下文信息,通常不需要生成新内容、只需要理解输入的任务,如:分类(文本分类、情感分析等)、信息抽取、序列标注等。在这种架构中,所有的注意力机制和网络层都集中在编码输入数据上,其输出通常是关于输入的复杂语义表示。谷歌的BERT、智谱AI发布的第四代基座大语言模型GLM4Decoder-Only也被称为
Micheal超
·
2025-07-02 23:29
AI笔记
人工智能
笔记
架构
提示技术系列——主动提示
提示工程是指通过设计、优化和迭代输入到大语言模型(
LLM
)的提示(Prompt),系统性提升模型输出质量(如相关性、准确性、可控性)的实践领域。
AIGC包拥它
·
2025-07-02 22:17
提示技术
人工智能
prompt
python
langchain
workflow的可编排协作模式
一、传统单一模式特点:使用标准框架进行线性编排所有任务按固定顺序执行适合简单、确定性强的流程适用场景:规则明确、步骤固定的业务流程自动化二、路由模式核心机制:
LLM
先识别用户意图根据意图路由到对应处理模块优势
思绪漂移
·
2025-07-02 21:41
人工智能
agent
workflow
模式
AI agent开发出办公AI小助手的学习方案和路线
此方案参考当前主流大模型(
LLM
)及相关工具链生态,总体目标是从零开始了解所需知识体系与技能,并能在实践中构建自动化的客服AI或者办公辅助类AI助手。
云博士的AI课堂
·
2025-07-02 20:34
大模型技术开发与实践
大模型
AI
Agent
人工智能
自动化
构建下一代云原生大模型多租户平台:架构设计与关键挑战
个人主页:慌ZHANG-CSDN博客期待您的关注一、引言:从单用户部署到多租户平台的转型趋势随着开源大语言模型(
LLM
)能力日益强大,企业部署与应用大模型已从“验证可行性”的早期阶段,逐步迈向“规模化服务
慌ZHANG
·
2025-07-02 16:08
人工智能
云原生后端
云原生
人工智能
vLLM调度部署Qwen3
其核心目标是通过创新的软件和算法设计,大幅提升
LLM
在生成文本时的吞吐量和效率,尤其适用于处理高并发的推理请求。从各种基准
你好,此用户已存在
·
2025-07-02 10:19
人工智能
linux
大模型
初学Spring AI 笔记
目录SpringAI简介依赖与环境配置基础概念集成OpenAI(或其他
LLM
提供商)Prompt模板引擎Embedding与向量数据库SpringAIChatClient使用SpringAI和LangChain
笑衬人心。
·
2025-07-02 05:14
大模型学习
spring
人工智能
笔记
基于langchain的法律助手工作流的搭建
该工作流有四个
llm
组成,包括三个worker以及一个planner。planner用于识别用户输入,将其划分为具体任务并调用相应的worker。
一尾清风915
·
2025-07-02 04:04
langchain
语言模型
python
人工智能
chatgpt
ai
LLM
大语言模型学习笔记(1)
1.概念大语言模型(
LLM
,LargeLanguageModel),也称大型语言模型,是一种旨在理解和生成人类语言的人工智能模型。
Arixs666
·
2025-07-02 03:31
大语言模型
语言模型
笔记
人工智能
大语言模型
LLM
原理篇
大模型席卷全球,彷佛得模型者得天下。对于IT行业来说,以后可能没有各种软件了,只有各种各样的智体(Agent)调用各种各样的API。在这种大势下,笔者也阅读了很多大模型相关的资料,和很多新手一样,开始脑子里都是一团乱麻,随着相关文章越读越多,再进行内容梳理,终于理清了一条清晰的脉络。笔者写原理篇时心情是有些惴惴不安的,因为毕竟对大模型的研究有限,缺乏深度。但是,还是觉得有必要记录一下学习理解心得,
·
2025-07-02 03:59
大语言模型(
LLM
)笔记
一、什么是大语言模型(
LLM
)?
LLM
(LargeLanguageModel)是基于Transformer架构构建,并在海量文本语料上训练出的具备自然语言理解和生成能力的深度神经网络模型。
笑衬人心。
·
2025-07-02 03:59
大模型学习
语言模型
笔记
人工智能
智能之火,重塑创造:大模型如何点燃新一代开发引擎?
今天,我们站在一个崭新的临界点上:大语言模型(
LLM
)正将人工智能的“普罗米修斯之火”引入软件开发的核心腹地。这不再仅仅是效率的优化,更是对开发者角色、开发流程乃至软件本质的深度重塑。
黑巧克力可减脂
·
2025-07-02 00:42
AIGC
人工智能
AIGC
智能新纪元:大语言模型如何重塑电商“人货场”经典范式
而大语言模型(
LLM
)的出现,恰似一柄重铸商业逻辑的“科技之锤”,正在为电商领域开启一场静水深流的革命性变革。基石重塑:当“人货场”遇见大模型智能经典理论再审视:
黑巧克力可减脂
·
2025-07-02 00:41
AIGC
语言模型
人工智能
自然语言处理
AI:微调框架 LLaMA-Factory(Large Language Model Factory)
LLaMA-Factory(LargeLanguageModelFactory)是由北航团队开源的高效大语言模型(
LLM
)微调框架,旨在简化大型语言模型的定制化训练流程,支持超过100种主流模型和多种先进微调技术
xyzroundo
·
2025-07-02 00:40
AI
人工智能
llama
语言模型
sft
llama-factory
AI
大模型系列——提示词工程:从原理、实践到未来的一部系统性综述
提示词工程:从原理、实践到未来的一部系统性综述摘要本文系统性地阐述了提示词工程(PromptEngineering)这一关键领域,它作为释放大语言模型(
LLM
)潜能的核心人机交互范式。
猫猫姐
·
2025-07-01 20:39
大模型
人工智能
大模型
提示词
【知识图谱构建系列1】数据集介绍
文章目录项目简介数据集简介数据集核心内容应用与影响小细节参考论文:hal.science/hal-04862214/项目地址:https://github.com/ChristopheCruz/
LLM
4KGC
几道之旅
·
2025-07-01 17:44
人工智能
智能体及数字员工
Python杂货铺
AI
自建MCP
学习记录
知识图谱
LangChain4j -- ChatMemory
ChatMemory的主要功能驱逐策略:为了适应
LLM
的上下文窗口限制、控制成本和延迟。持久化:
大白鹅~
·
2025-07-01 13:20
java
ai
MCP vs LangChain:标准化协议与开发框架的优劣对比
随着大型语言模型(
LLM
)技术的迅速发展,开发者需要高效的工具来构建基于
LLM
的应用。MCP(ModelContextProtocol)和LangChain作为两种主流解决方案,各有优缺点。
guohuang
·
2025-07-01 04:57
MCP
人工智能
深度学习
大模型
LangGraph深度解析:构建持久化、可观测的智能体工作流
作为LangChain生态系统的战略补充,它解决了传统
LLM
应用在以下方面的关键痛点:持久化执行:支持长时间运行(数小时/天级)的工作流,故
kakaZhui
·
2025-07-01 00:03
大模型Agent入门与代码实战
AIGC
LLM
人工智能
Agent
Mcp
面向大语言模型幻觉的关键数据集:系统性综述与分类法
为了系统性地评估、理解并缓解
LLM
的幻觉现象,学术界和工业界开发了大量多样化的数据集与基准。本文对大模型幻觉领域的关键数据集
致Great
·
2025-06-30 23:23
语言模型
人工智能
自然语言处理
导师要求一天完成综述,我7分钟搞定——打造一个全本地DeepResearch助手
1.项目背景LocalDeepResearcher是一个本地化运行的AI研究助手,旨在通过结合大语言模型(
LLM
)和搜索工具,实现自动化深度研究并生成结构化报告。
小洛~·~
·
2025-06-30 23:21
人工智能
深度学习
chatgpt
gpt
AI写作
通过本地
LLM
搭建本地RAG
整体思路通过ollama下载并搭建本地大预言模型
LLM
。通过ollama搭建embedding模型。通过langchain文件加载器加载本地内容文件(PDF文件)。
TBM矩阵
·
2025-06-30 17:14
#
AI体系学习
人工智能
微调大语言模型后,如何评估效果?一文讲清
在做大语言模型(
LLM
)微调时,“怎么判断模型调得好不好”是必须回答的问题。无论是在研究、项目落地,还是面试中,评估方法都不能停留在“训练loss降了”这么简单。
茫茫人海一粒沙
·
2025-06-30 11:28
人工智能
本地运行大型语言模型(
LLM
)的实践指南
技术背景介绍近年来,项目如llama.cpp、Ollama、GPT4All等的流行标志着在本地设备上运行大型语言模型(
LLM
)的需求日益增长。选择在本地运行
LLM
,至少有两个重要的好处:隐私和成本。
yunwu12777
·
2025-06-30 11:58
语言模型
人工智能
自然语言处理
构建私有视觉搜索应用:多模态大模型的应用实例
本教程将向您展示如何通过代码示例,使用开源多模态
LLM
构建私有视觉搜索和问答系统。技术背景介绍多模态大模型结合了文本和图像处理能力,使得我们可以开发更智能的应用程序。通过
2301_80727036
·
2025-06-30 10:24
自然语言处理
Spring AI 结合 MCP MySQL 实现对话式数据库查询
什么是SpringAI和MCPMySQLSpringAI框架概述SpringAI是基于Spring生态的人工智能集成框架,它提供了:与大型语言模型(
LLM
)的集成能力对话管理和自然语言处理功能业务逻辑
没刮胡子
·
2025-06-30 01:32
软件开发技术实战专栏
人工智能AI
Spring
数据库
spring
人工智能
spring-ai
mcp-server
mysql
构建智能对话式BI的关键:ChatBI场景下的Agent框架选型深
Agent框架如同应用的“龙骨”,为
LLM
赋予了感知、思考、
·
2025-06-29 19:18
【LangChain】langchain.chains.create_sql_query_chain() 函数:基于自然语言生成 SQL 查询的链(Chain)
langchain.chains.create_sql_query_chain函数是LangChain库中的一个函数,用于创建基于自然语言生成SQL查询的链(Chain),结合语言模型(
LLM
)和数据库上下文生成可执行的
彬彬侠
·
2025-06-29 18:39
LangChain
langchain
chains
create_sql_quer
sql_database
sql
AIGC领域Prompt工程:原理、方法与行业应用
AIGC领域Prompt工程:原理、方法与行业应用关键词:Prompt工程、大语言模型(
LLM
)、提示设计、少样本学习、AIGC应用、思维链(CoT)、提示优化摘要:随着AIGC(人工智能生成内容)技术的爆发式发展
AI天才研究院
·
2025-06-29 17:04
ChatGPT
计算
AI大模型应用入门实战与进阶
AIGC
prompt
ai
Promptify与ReActAgent
传统
LLM
应用开发痛点:反复调试:需手工编写/调整prompt格式(如调整分隔符、示例数量)兼容性差:不同模型需重写适配代码输出不稳定:非结构化文本需额外解析Promptify用标准化流水线解决上述问题
frostmelody
·
2025-06-29 17:00
人工智能
大模型系列——Ollama WebUI 简明教程
大模型系列——OllamaWebUI简明教程OpenWebUI,以前称为OllamaWebUI,支持各种大型语言模型(
LLM
)运行器,是本地部署并与语言模型交互的多功能工具。
猫猫姐
·
2025-06-29 13:35
大模型
大模型
人工智能
产品思想实验:AI 长期记忆存储单元(Memory Graph Unit)
在现有
LLM
架构中,“记忆”通常是以线性上下文或简单数据库形式存在,缺乏结构化、语义链接和跨模型兼容性。我们要做的,是将“记忆”升级为一个具备智能检索能力、语义感知能力和多模型兼容能力的图谱系统。
·
2025-06-29 10:35
人工智能
【AI】为Cursor配置MCP服务器
】为Cursor配置MCP服务器categories:AItags:CursorMCPAI编程开发工具AI一、Cursor与MCP服务简介Cursor是一款AI驱动的代码编辑器,通过集成大型语言模型(
LLM
自学也学好编程
·
2025-06-29 09:04
AI
MCP
人工智能
ai
AI编程
【通过pip安装 Open-WebUI 快速使用入门】
它支持各种
LLM
运行器,如Ollama和OpenAI兼容的API,内置RAG推理引擎,使其成为强大的AI部署解决方案。
慕慕涵雪月光白
·
2025-06-29 08:59
llama
代理模式
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他