E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Python&LLM
白话文讲解大模型必修基础知识 | Transformer架构(小白也能看懂)
它在机器翻译、文本生成、问答系统、情感分析等任务中表现出了卓越的能力,并且是大规模语言模型(
LLM
,LargeLanguageModels)的基础。
大模型面试
·
2025-04-09 18:34
transformer
深度学习
人工智能
语言模型
agi
AI大模型
LLM
万字长文 | 如何让你的大模型“开口”说话:从ASR到端到端语音大模型的进化之旅
我们将分两期进行探讨,如何让大型语言模型(
LLM
)“发声”,第一期(语音三剑客):围绕从文字到声音的互相转换,以及这一过程中的关键技术——自动语音
南七小僧
·
2025-04-09 16:48
人工智能
AI技术产品经理
自然语言处理
大模型
python
asr
tts
语音识别
从感知到共创:AI赋能人类想象力的边界重塑
但随着大语言模型(
LLM
)的兴起,这种认知正悄然发生改变。
慌ZHANG
·
2025-04-09 15:14
Python
AI模型
人工智能
【DeepSeek】从文本摘要到对话生成:DeepSeek 在 NLP 任务中的实战指南
引言随着大语言模型(
LLM
)的发展,越来越多的企业和开发者希望将其应用于具体业务场景中。然而,由于缺乏明确的使用示例和最佳实践,许多开发者在落地过程中遇到
·
2025-04-09 13:29
deepseek自然语言处理
大模型国产化适配7-华为昇腾
LLM
落地可选解决方案(MindFormers、ModelLink、MindIE)
大模型国产化适配7-华为昇腾
LLM
落地可选解决方案(MindFormers、ModelLink、MindIE)原创吃果冻不吐果冻皮吃果冻不吐果冻皮2024-04-1712:00四川随着ChatGPT的现象级走红
强化学习曾小健
·
2025-04-09 11:20
LLM大语言模型
python
开发语言
人工智能
llama
agi
2024 年最值得尝试的 8 个 AI 开源大模型
如果要将
LLM
按照是否开源来划分的话,那么,OpenAI的ChatGPT,Google的Gemini这一类就属于闭源模型,也可以说是专有的
LLM
,用户并不能深入到模型层面去使用,而是只能在基于模型的聊天应用层使用
七七Seven~
·
2025-04-09 06:46
人工智能
开源
知识图谱
学习
语言模型
自然语言处理
我们公司落地大模型的路径、方法和坑
最近一年,
LLM
(大型语言模型)已经成熟到可以投入实际应用中了。预计到2025年,AI领域的投资会飙升到2000亿美元。现在,不只是机器学习专家,任何人都能轻松地把AI技术融入自己的产品里。
IT猫仔
·
2025-04-09 06:46
人工智能
语言模型
机器学习
大数据
自然语言处理
地质科研智能革命:当大语言模型“扎根”地质现场、大语言模型本地化部署与AI智能体协同创新实践
大语言模型(
LLM
)与AI智能体的本地化部署技术,正在为这一领域带来三重新范式突破:知识提取:从百年地质文献中构建结构化知识图谱决策辅助:基于岩石薄片图像与地球化学数据的智能矿物判别流程再造
KY_chenzhao
·
2025-04-09 06:46
人工智能
语言模型
deepseek
chatgpt
智能体
使用 JSON Schema 实现语言模型的结构化输出:跨平台实践指南
随着大语言模型(
LLM
)的广泛应用,开发者常常需要从模型中提取结构化数据,例如JSON格式的输出,以便直接用于程序化处理。
田猿笔记
·
2025-04-09 05:44
AI
高级应用
json
语言模型
人工智能
LLM
大模型在融合通信产品中的应用实践_文档生成
前言
LLM
问题幻觉:在没有答案的情况下提供虚假信息。过时:当用户需要特定的当前响应时,提供过时或通用的信息。来源:从非权威来源创建响应。
脱泥不tony
·
2025-04-09 03:02
大模型
AI大模型
语言模型
人工智能
RAG
LLM
大语言模型
如何利用Dify搭建MCP服务器:构建灵活的AI应用生态系统
使用Dify搭建MCP服务器完整指南引言随着人工智能技术的快速发展,大语言模型(
LLM
)应用已经成为各行各业提升效率和创新的重要工具。
AI Agent首席体验官
·
2025-04-08 14:05
服务器
人工智能
运维
智能体开发实战指南:提示词设计、开发框架与工作流详解
在大语言模型(
LLM
)驱动的智能体(Agent)快速发展的今天,构建一个实用、智能的Agent已不再遥不可及。
禁止默
·
2025-04-08 09:31
大模型
智能体
人工智能
LLM
架构与关键技术解析
标题:
LLM
架构与关键技术解析文章信息摘要:理解
LLM
的架构和关键技术(如Transformer、注意力机制、采样技术)是成为
LLM
科学家的基础,这些技术为模型的构建和优化提供了理论支持。
XianxinMao
·
2025-04-08 02:18
人工智能
架构
人工智能
数据驱动防灾:AI 大模型在地质灾害应急决策中的关键作用。基于DeepSeek/ChatGPT的AI智能体开发
本地化大模型:基于私有地质数据微调
LLM
,实现灾害文本报告解析、风险知识图谱构建
KY_chenzhao
·
2025-04-07 19:27
人工智能
chatgpt
本地化部署
智能体
deepseek
AI多模态模型架构之
LLM
主干(1):ChatGLM系列
〔探索AI的无限可能,微信关注“AIGCmagic”公众号,让AIGC科技点亮生活〕本文作者:AIGCmagic社区刘一手前言AI多模态大模型发展至今,每年都有非常优秀的工作产出,按照当前模型设计思路,多模态大模型的架构主要包括以下几个部分:模态编码器(ModalityEncoder,ME):负责将不同模态的输入编码成特征。常见的编码器包括图像的NFNet-F6、ViT、CLIPViT等,音频的W
AIGCmagic社区
·
2025-04-07 18:53
AI多模态
AIGC
人工智能
Open WebUI:构建私有化AI交互平台的开源利器
一、项目定位与核心价值OpenWebUI是一个专为
LLM
交互设计的开源Web界面,支持对接Ollama、OpenAIAPI、Groq等
几道之旅
·
2025-04-07 14:27
人工智能
智能体及数字员工
人工智能
交互
【
LLM
】基于ollama 实现模型多轮对话
基于ollama实现模型多轮对话ollama下载安装DownloadOllamaonWindows](https://ollama.com/download)Ollama官网下载安装后,ollama在c盘模型安装路径也默认为c盘,如需更改可以更新环境变量在ollama安装路径下启动cmdollamarunqwen2.5:7B即可自动下载并运行python使用ollama安装ollama库:pipi
丕羽
·
2025-04-07 14:27
LLM
python
开发语言
语言模型
自然语言处理
人工智能
企业知识库落地案例:构建支持权限与多场景查询的 Dify 企业知识库助手
引入像Dify这样的
LLM
应用开发平台构建智能问答助手,为激活企业知识资产提供了强大的武
超人阿亚
·
2025-04-07 12:48
数据库
人工智能
大数据
【人工智能时代】- 大型语言模型(
LLM
)理论简介
一、什么是大型语言模型(
LLM
)1.1大型语言模型(
LLM
)的概念大语言模型(
LLM
,LargeLanguageModel),也称大型语言模型,是一种旨在理解和生成人类语言的人工智能模型。
xiaoli8748_软件开发
·
2025-04-07 00:35
人工智能时代
人工智能
语言模型
自然语言处理
综述:大语言 RDRec:如何利用大语言模型做推荐系统模型在信息抽取上的应用_rdrec 模型
推荐系统RDRec:RationaleDistillationforLLM-basedRecommendation大型语言模型(
LLM
)通过文本提示实现用户与物品间的有效语义推理,其推荐模型备受瞩目。
AI大模型-搬运工
·
2025-04-07 00:32
语言模型
人工智能
自然语言处理
AI大模型
产品经理
大模型
大语言模型
大型语言模型的10大现实应用
LLM
应用程序可以执行许多任务,包括撰写文章、创作诗歌、程序设计,甚至进行一般性对话。以Op
IT猫仔
·
2025-04-06 23:57
语言模型
人工智能
自然语言处理
NVIDIA开源AgentIQ
订阅:https://rengongzhineng.io/【本周AI新闻:你不能错过的Anthropic关于
LLM
思维揭秘和AIAgent浪潮的到
新加坡内哥谈技术
·
2025-04-06 18:21
人工智能
自然语言处理
语言模型
深度学习
自动化
【大模型知识点】SwiGLU激活函数
SwiGLU(Swish-GatedLinearUnit)是一种结合了Swish激活函数和GLU(GatedLinearUnit)机制的激活函数,广泛应用于现代大型语言模型(
LLM
)中,尤其是在Transformer
自信的小螺丝钉
·
2025-04-06 11:08
AI知识
LLM
激活函数
SwiGLU
RELU
Spring AI Alibaba MCP(Model Context Protocol)模型上下文协议 让AI操作本地文件系统示例
SpringAIAlibaba官方文档:SpringAIAlibaba模型上下文协议介绍模型上下文协议,规范应用程序如何向
LLM
提供上下文,实际上是通过统一的方式(JSON-RPC消息格式),将MCPServer
Inherentmind
·
2025-04-06 10:59
spring
java
ai
如何用Spring AI构建MCP Client-Server架构
为突破模型知识边界,增强上下文理解能力,开发者普遍采用多源数据集成策略,将
LLM
与搜索引擎、数据库、文件系统等外部资源互联。
程序猿DD
·
2025-04-06 10:57
经验分享
开源
LLM
应用开发平台 Dify 全栈部署指南(Docker Compose 方案)
开源
LLM
应用开发平台Dify全栈部署指南(DockerCompose方案)一、部署环境要求与前置检查1.1硬件最低配置组件要求CPU双核及以上内存4GB及以上磁盘空间20GB可用空间1.2系统兼容性验证
曼岛_
·
2025-04-06 06:33
AI
开源
docker
容器
Dify与RAGFlow结合:智能应用开发与深度文档理解的优化
文章目录引言RAGFlow与Dify简介1.1RAGFlow:深度文档理解的RAG引擎1.2Dify:
LLM
应用开发平台与RAG集成混合检索与深度文档理解2.1混合检索的原理与设置2.2混合检索在Dify
我就是全世界
·
2025-04-06 05:56
人工智能
LLM
架构解析:门控循环单元(GRU)(第三部分)—— 从基础原理到实践应用的深度探索
本专栏深入探究从循环神经网络(RNN)到Transformer等自然语言处理(NLP)模型的架构,以及基于这些模型构建的应用程序。本系列文章内容:NLP自然语言处理基础词嵌入(WordEmbeddings)循环神经网络(RNN)、长短期记忆网络(LSTM)和门控循环单元(GRU)3.1循环神经网络(RNN)3.2长短期记忆网络(LSTM)3.3门控循环单元(GRU)(本文)编码器-解码器架构(En
硅基创想家
·
2025-04-06 01:32
#
大模型架构解析
LLM
Architecture
gru
深度学习
人工智能
LLM架构
LLM
词嵌入模型
公司论坛数据构建情感标注数据集思考
所以想思考做一个情感标注数据集,对负面的言论有快的处理方案,当然公司采用了一套成熟的流程,但是作者本人也进行了思考,从数据分析到
LLM
,常见的对文本处理的需求包含:1、实体抽取,实体关系分析2、文本情感分析
大泽九章
·
2025-04-06 01:31
sklearn
python
pywebio 流式输出,显示为markdown(一)
首先总结了作者的实现思路与精简代码,然后结合交互界面经验进行改进,此外编写了与
LLM
服务器交互部分以及测试代码。最后参考中有一篇研究人类阅读速度的文章,可以作为
LLM
推理速度、交互界面显示速
悠_逸
·
2025-04-06 01:28
大模型
chatgpt
前端
python
人工智能
语言模型
拨开迷雾:
LLM
Agent 的 MCP 究竟是什么?【之二(完)】
--------------------------------------书接上文----------------------4.MCP循环:让Agent“活”起来这三个组件并非孤立工作,它们构成了一个持续循环的感知-思考-行动(Perceive-Think-Act)过程:感知(Perception):Agent接收外部输入(用户请求、API响应等),Perception组件处理这些输入,将其转
kakaZhui
·
2025-04-05 22:11
人工智能
AIGC
python
llm
agent
DeepSeek
MCP
【实战】如何基于 Python Flask 快速开发一个支持 OpenAI 流式接口的
LLM
Server
本文介绍一步步使用轻量级的PythonWeb框架Flask,快速开发一个后端服务,它不仅能调用你的
LLM
,还能模拟OpenAI的chat/completions流式接口,让你的前端应用或客户端可以无缝对接
kakaZhui
·
2025-04-05 22:40
python
flask
开发语言
人工智能
AIGC
DeepSeek
Agent
1W8000字 从理论到实践: MCP 在 7 大 AI 框架中的具体应用
用Python和TypeScript框架,基于MCP服务器为
LLM
赋能,打造AI应用MCP支持的AI框架AI代理工具包为开发者开放了各种API,让AI解决方案具备执行任务的工具,确保能给出准确结果,提升用户满意度
·
2025-04-05 22:24
人工智能
AI agent(以AutoGPT为例)和AI Workflow 区别
AutoGPT介绍AutoGPT是基于大型语言模型(
LLM
)的自主AI代理,能够连接互联网并自主规划执行复杂任务。关键特征无缝集成与低代码工作流:无需大量编码知识即可快速创建复杂工作流。
Twilight-pending
·
2025-04-05 22:09
AI
Agent
工具使用
大方向
人工智能
LLM
优化技术(4)——flash_attention 原理
在长序列的
LLM
推理任务中,能够有效
哦豁灬
·
2025-04-05 22:37
大模型
LLM
深度学习
人工智能
深度学习
LLM
大模型
self-attention
模型上下文协议(MCP)深度解析:技术原理、应用案例与未来展望
引言在AI技术迅猛发展的今天,大型语言模型(
LLM
)与外部数据源和工具之间的交互面临着巨大挑战。
monsion
·
2025-04-05 16:00
人工智能
网络协议
星辰与智慧的宇宙之舞:KUMO生成性评估AI思维之旅
大型语言模型(
LLM
)以常常令人惊叹的超凡推理能力震撼着我们的世界。然而,一个困扰我们的疑问依然存在:这些模型是否真的理解复杂问题?它们是否真正在推理,还是仅仅是在重复从海量网络数据中记忆下来的模式?
步子哥
·
2025-04-05 15:53
人工智能
开源且完全没有审核限制的大型语言模型的概述
开源且完全没有审核限制的大型语言模型的概述关键要点研究表明,存在多个开源的大型语言模型(
LLM
)完全没有审核限制,适合开放对话。
@BreCaspian
·
2025-04-05 12:06
NLP
开源
语言模型
人工智能
Prompt攻击是什么
什么是Prompt攻击Prompt攻击(PromptInjection/Attack)是指通过精心构造的输入提示(Prompt),诱导大语言模型(
LLM
)突破预设安全限制、泄露敏感信息或执行恶意操作的攻击行为
快乐的打字员
·
2025-04-05 12:33
LLM
prompt
安全
人工智能
内容安全
Prompt攻击
提示攻击
LLM
大模型技术实战5:一文总结Prompt提示工程策略与技巧_
llm
prompt
提示工程是一门新兴学科,就像是为大语言模型(
LLM
)设计的"语言游戏"。通过这个"游戏",我们可以更有效地引导
LLM
来处理问题。只有熟悉了这个游戏的规则,我们才能更清楚地认识到
LLM
的能力和局限。
福福很能吃
·
2025-04-05 12:02
prompt
人工智能
学习
分布式
gpt-3
语言模型
使用 Python 微调大模型,实现特定领域模型
使用Python微调大模型,实现特定领域模型在本指南中,我们将介绍如何使用Python来微调大语言模型(
LLM
),以实现特定领域的优化。
程序猿学长
·
2025-04-05 11:26
python
人工智能
如何将大型语言模型(
LLM
)转换为嵌入模型
实验证明,
LLM
2Vec模型在嵌入任务上具有更好的性能,它可以为组织开辟新的场所,并以非常低的成本快速创建专门的嵌入模型。
极道亦有道
·
2025-04-05 07:29
语言模型
人工智能
自然语言处理
AWS Langfuse AI用Bedrock模型使用完全教程
准备工作创建Langfuse账户1.创建
LLM
应用程序启用Bedrock模型运行
LLM
应用程序设置LangfuseCloud为自己的应用程序添
小涵
·
2025-04-05 06:24
AWS云企业实践技术分享
AI
aws
人工智能
云计算
AI
LLM
llama
GenAI
Python中
LLM
的模型轻量化架构:MobileBERT与TinyBERT
在当今的人工智能领域,大型语言模型(
LLM
)如BERT、GPT等已经成为了自然语言处理(NLP)任务的核心。然而,这些模型通常具有庞大的参数量和计算复杂度,这使得它们在资源受限的设备上部署变得困难。
二进制独立开发
·
2025-04-04 23:10
python
架构
开发语言
人工智能
学习
分布式
bert
如何搭建
LLM
应用本地开发环境
1.安装miniconda,访问miniconda官网下载安装包,下载后通过conda--versionpython--version进行验证安装conda的目的在于管理python的运行时环境,它可以为每个python项目分配一个单独的空间用于项目开发,保证每个项目的python环境能够隔离开,每个项目的python及相关依赖可以不受影响如下图所示,使用condainfo-e查看当前的环境列表,
佑瞻
·
2025-04-04 22:00
人工智能
post
conda
chroma
pgvector
llm应用
解读 DeepSeek-R1 论文 - 通俗易懂版
引言:让AI学会"思考"的新突破在近年来的人工智能浪潮中,大型语言模型(
LLM
)如ChatGPT已经能回答各种问题,但它们在复杂推理方面仍有不足。
工业甲酰苯胺
·
2025-04-04 19:43
deepseek
LLM
大语言模型训练推理-eagle投机小模型训练
步骤一:安装EagleEagle训练适配代码存放在代码包AscendCloud-
LLM
-x.x.x.zip的
llm
_tools/spec_decode/EAGLE目录下。
herry456
·
2025-04-04 19:12
深度学习
LLM
不断提升智能下限,MCP 不断提升创意上限
作者:望宸导读:
LLM
是大脑,MCP是手脚。
LLM
不断提升智能下限,MCP不断提升创意上限。所有的应用和软件都会被AI改造,将向所有的应用和软件都会被MCP改造的新范式演进。
·
2025-04-04 19:06
云原生微服务llm
6. LangChain4j 基于RAG实现一套企业智能客服系统
RAG介绍
LLM
的知识仅限于它所训练的数据。如果你想让
LLM
了解特定领域的知识或专有数据,你可以使用RAG。什么是RAG?
gorgor在码农
·
2025-04-04 13:31
AI实战
人工智能
LangChain4j
ai
java
python
Spring AI与DeepSeek实战三:打造企业知识库
一、概述企业应用集成大语言模型(
LLM
)落地的两大痛点:知识局限性:
LLM
依赖静态训练数据,无法覆盖实时更新或垂直领域的知识;幻觉:当
LLM
遇到训练数据外的提问时,可能生成看似合理但错误的内容。
·
2025-04-04 10:27
运维
上一页
20
21
22
23
24
25
26
27
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他