Python&LLM 第24页

白话文讲解大模型必修基础知识 | Transformer架构（小白也能看懂）

它在机器翻译、文本生成、问答系统、情感分析等任务中表现出了卓越的能力，并且是大规模语言模型（LLM,LargeLanguageModels）的基础。

大模型面试·2025-04-09 18:34

万字长文 | 如何让你的大模型“开口”说话：从ASR到端到端语音大模型的进化之旅

我们将分两期进行探讨，如何让大型语言模型（LLM）“发声”，第一期（语音三剑客）：围绕从文字到声音的互相转换，以及这一过程中的关键技术——自动语音

南七小僧·2025-04-09 16:48

从感知到共创：AI赋能人类想象力的边界重塑

但随着大语言模型（LLM）的兴起，这种认知正悄然发生改变。

慌ZHANG·2025-04-09 15:14

【DeepSeek】从文本摘要到对话生成：DeepSeek 在 NLP 任务中的实战指南

引言随着大语言模型（LLM）的发展，越来越多的企业和开发者希望将其应用于具体业务场景中。然而，由于缺乏明确的使用示例和最佳实践，许多开发者在落地过程中遇到

·2025-04-09 13:29

大模型国产化适配7-华为昇腾LLM落地可选解决方案（MindFormers、ModelLink、MindIE）

大模型国产化适配7-华为昇腾LLM落地可选解决方案（MindFormers、ModelLink、MindIE）原创吃果冻不吐果冻皮吃果冻不吐果冻皮2024-04-1712:00四川随着ChatGPT的现象级走红

强化学习曾小健·2025-04-09 11:20

2024 年最值得尝试的 8 个 AI 开源大模型

如果要将LLM按照是否开源来划分的话，那么，OpenAI的ChatGPT，Google的Gemini这一类就属于闭源模型，也可以说是专有的LLM，用户并不能深入到模型层面去使用，而是只能在基于模型的聊天应用层使用

七七Seven～·2025-04-09 06:46

我们公司落地大模型的路径、方法和坑

最近一年，LLM（大型语言模型）已经成熟到可以投入实际应用中了。预计到2025年，AI领域的投资会飙升到2000亿美元。现在，不只是机器学习专家，任何人都能轻松地把AI技术融入自己的产品里。

IT猫仔·2025-04-09 06:46

地质科研智能革命：当大语言模型“扎根”地质现场、大语言模型本地化部署与AI智能体协同创新实践

大语言模型（LLM）与AI智能体的本地化部署技术，正在为这一领域带来‌三重新范式突破‌：‌知识提取‌：从百年地质文献中构建结构化知识图谱‌决策辅助‌：基于岩石薄片图像与地球化学数据的智能矿物判别‌流程再造‌

KY_chenzhao·2025-04-09 06:46

使用 JSON Schema 实现语言模型的结构化输出：跨平台实践指南

随着大语言模型（LLM）的广泛应用，开发者常常需要从模型中提取结构化数据，例如JSON格式的输出，以便直接用于程序化处理。

田猿笔记·2025-04-09 05:44

LLM大模型在融合通信产品中的应用实践_文档生成

前言LLM问题幻觉：在没有答案的情况下提供虚假信息。过时：当用户需要特定的当前响应时，提供过时或通用的信息。来源：从非权威来源创建响应。

脱泥不tony·2025-04-09 03:02

如何利用Dify搭建MCP服务器：构建灵活的AI应用生态系统

使用Dify搭建MCP服务器完整指南引言随着人工智能技术的快速发展，大语言模型（LLM）应用已经成为各行各业提升效率和创新的重要工具。

AI Agent首席体验官·2025-04-08 14:05

智能体开发实战指南：提示词设计、开发框架与工作流详解

在大语言模型（LLM）驱动的智能体（Agent）快速发展的今天，构建一个实用、智能的Agent已不再遥不可及。

禁止默·2025-04-08 09:31

LLM架构与关键技术解析

标题：LLM架构与关键技术解析文章信息摘要：理解LLM的架构和关键技术（如Transformer、注意力机制、采样技术）是成为LLM科学家的基础，这些技术为模型的构建和优化提供了理论支持。

XianxinMao·2025-04-08 02:18

数据驱动防灾：AI 大模型在地质灾害应急决策中的关键作用。基于DeepSeek/ChatGPT的AI智能体开发

本地化大模型‌：基于私有地质数据微调LLM，实现灾害文本报告解析、风险知识图谱构建

KY_chenzhao·2025-04-07 19:27

AI多模态模型架构之LLM主干(1)：ChatGLM系列

〔探索AI的无限可能，微信关注“AIGCmagic”公众号，让AIGC科技点亮生活〕本文作者：AIGCmagic社区刘一手前言AI多模态大模型发展至今，每年都有非常优秀的工作产出，按照当前模型设计思路，多模态大模型的架构主要包括以下几个部分：模态编码器(ModalityEncoder,ME)：负责将不同模态的输入编码成特征。常见的编码器包括图像的NFNet-F6、ViT、CLIPViT等，音频的W

AIGCmagic社区·2025-04-07 18:53

Open WebUI：构建私有化AI交互平台的开源利器

一、项目定位与核心价值OpenWebUI是一个专为LLM交互设计的开源Web界面，支持对接Ollama、OpenAIAPI、Groq等

几道之旅·2025-04-07 14:27

【LLM】基于ollama 实现模型多轮对话

基于ollama实现模型多轮对话ollama下载安装DownloadOllamaonWindows](https://ollama.com/download)Ollama官网下载安装后,ollama在c盘模型安装路径也默认为c盘,如需更改可以更新环境变量在ollama安装路径下启动cmdollamarunqwen2.5:7B即可自动下载并运行python使用ollama安装ollama库:pipi

丕羽·2025-04-07 14:27

企业知识库落地案例：构建支持权限与多场景查询的 Dify 企业知识库助手

引入像Dify这样的LLM应用开发平台构建智能问答助手，为激活企业知识资产提供了强大的武

超人阿亚·2025-04-07 12:48

【人工智能时代】- 大型语言模型（LLM）理论简介

一、什么是大型语言模型（LLM）1.1大型语言模型（LLM）的概念大语言模型（LLM，LargeLanguageModel），也称大型语言模型，是一种旨在理解和生成人类语言的人工智能模型。

xiaoli8748_软件开发·2025-04-07 00:35

综述：大语言 RDRec：如何利用大语言模型做推荐系统模型在信息抽取上的应用_rdrec 模型

AI大模型-搬运工·2025-04-07 00:32

大型语言模型的10大现实应用

LLM应用程序可以执行许多任务，包括撰写文章、创作诗歌、程序设计，甚至进行一般性对话。以Op

IT猫仔·2025-04-06 23:57

NVIDIA开源AgentIQ

订阅：https://rengongzhineng.io/【本周AI新闻:你不能错过的Anthropic关于LLM思维揭秘和AIAgent浪潮的到

新加坡内哥谈技术·2025-04-06 18:21

【大模型知识点】SwiGLU激活函数

SwiGLU（Swish-GatedLinearUnit）是一种结合了Swish激活函数和GLU（GatedLinearUnit）机制的激活函数，广泛应用于现代大型语言模型（LLM）中，尤其是在Transformer

自信的小螺丝钉·2025-04-06 11:08

Spring AI Alibaba MCP(Model Context Protocol)模型上下文协议让AI操作本地文件系统示例

SpringAIAlibaba官方文档：SpringAIAlibaba模型上下文协议介绍模型上下文协议，规范应用程序如何向LLM提供上下文，实际上是通过统一的方式（JSON-RPC消息格式），将MCPServer

Inherentmind·2025-04-06 10:59

如何用Spring AI构建MCP Client-Server架构

为突破模型知识边界，增强上下文理解能力，开发者普遍采用多源数据集成策略，将LLM与搜索引擎、数据库、文件系统等外部资源互联。

程序猿DD·2025-04-06 10:57

开源 LLM 应用开发平台 Dify 全栈部署指南（Docker Compose 方案）

开源LLM应用开发平台Dify全栈部署指南（DockerCompose方案）一、部署环境要求与前置检查1.1硬件最低配置组件要求CPU双核及以上内存4GB及以上磁盘空间20GB可用空间1.2系统兼容性验证

曼岛_·2025-04-06 06:33

Dify与RAGFlow结合：智能应用开发与深度文档理解的优化

文章目录引言RAGFlow与Dify简介1.1RAGFlow：深度文档理解的RAG引擎1.2Dify：LLM应用开发平台与RAG集成混合检索与深度文档理解2.1混合检索的原理与设置2.2混合检索在Dify

我就是全世界·2025-04-06 05:56

LLM架构解析：门控循环单元（GRU）（第三部分）—— 从基础原理到实践应用的深度探索

本专栏深入探究从循环神经网络（RNN）到Transformer等自然语言处理（NLP）模型的架构，以及基于这些模型构建的应用程序。本系列文章内容：NLP自然语言处理基础词嵌入（WordEmbeddings）循环神经网络（RNN）、长短期记忆网络（LSTM）和门控循环单元（GRU）3.1循环神经网络（RNN）3.2长短期记忆网络（LSTM）3.3门控循环单元（GRU）（本文）编码器-解码器架构（En

硅基创想家·2025-04-06 01:32

公司论坛数据构建情感标注数据集思考

所以想思考做一个情感标注数据集，对负面的言论有快的处理方案，当然公司采用了一套成熟的流程，但是作者本人也进行了思考，从数据分析到LLM，常见的对文本处理的需求包含：1、实体抽取，实体关系分析2、文本情感分析

大泽九章·2025-04-06 01:31

pywebio 流式输出，显示为markdown（一）

首先总结了作者的实现思路与精简代码，然后结合交互界面经验进行改进，此外编写了与LLM服务器交互部分以及测试代码。最后参考中有一篇研究人类阅读速度的文章，可以作为LLM推理速度、交互界面显示速

悠_逸·2025-04-06 01:28

拨开迷雾：LLM Agent 的 MCP 究竟是什么？【之二(完)】

--------------------------------------书接上文----------------------4.MCP循环：让Agent“活”起来这三个组件并非孤立工作，它们构成了一个持续循环的感知-思考-行动(Perceive-Think-Act)过程：感知(Perception)：Agent接收外部输入（用户请求、API响应等），Perception组件处理这些输入，将其转

kakaZhui·2025-04-05 22:11

【实战】如何基于 Python Flask 快速开发一个支持 OpenAI 流式接口的 LLM Server

本文介绍一步步使用轻量级的PythonWeb框架Flask，快速开发一个后端服务，它不仅能调用你的LLM，还能模拟OpenAI的chat/completions流式接口，让你的前端应用或客户端可以无缝对接

kakaZhui·2025-04-05 22:40

1W8000字从理论到实践： MCP 在 7 大 AI 框架中的具体应用

用Python和TypeScript框架，基于MCP服务器为LLM赋能，打造AI应用MCP支持的AI框架AI代理工具包为开发者开放了各种API，让AI解决方案具备执行任务的工具，确保能给出准确结果，提升用户满意度

·2025-04-05 22:24

AI agent（以AutoGPT为例）和AI Workflow 区别

AutoGPT介绍AutoGPT是基于大型语言模型（LLM）的自主AI代理，能够连接互联网并自主规划执行复杂任务。关键特征无缝集成与低代码工作流：无需大量编码知识即可快速创建复杂工作流。

Twilight-pending·2025-04-05 22:09

LLM 优化技术(4)——flash_attention 原理

在长序列的LLM推理任务中，能够有效

哦豁灬·2025-04-05 22:37

模型上下文协议（MCP）深度解析：技术原理、应用案例与未来展望

引言在AI技术迅猛发展的今天，大型语言模型（LLM）与外部数据源和工具之间的交互面临着巨大挑战。

monsion·2025-04-05 16:00

星辰与智慧的宇宙之舞：KUMO生成性评估AI思维之旅

大型语言模型（LLM）以常常令人惊叹的超凡推理能力震撼着我们的世界。然而，一个困扰我们的疑问依然存在：这些模型是否真的理解复杂问题？它们是否真正在推理，还是仅仅是在重复从海量网络数据中记忆下来的模式？

步子哥·2025-04-05 15:53

开源且完全没有审核限制的大型语言模型的概述

开源且完全没有审核限制的大型语言模型的概述关键要点研究表明，存在多个开源的大型语言模型（LLM）完全没有审核限制，适合开放对话。

@BreCaspian·2025-04-05 12:06

Prompt攻击是什么

什么是Prompt攻击Prompt攻击（PromptInjection/Attack）是指通过精心构造的输入提示（Prompt），诱导大语言模型（LLM）突破预设安全限制、泄露敏感信息或执行恶意操作的攻击行为

快乐的打字员·2025-04-05 12:33

LLM大模型技术实战5：一文总结Prompt提示工程策略与技巧_llm prompt

提示工程是一门新兴学科，就像是为大语言模型（LLM）设计的"语言游戏"。通过这个"游戏"，我们可以更有效地引导LLM来处理问题。只有熟悉了这个游戏的规则，我们才能更清楚地认识到LLM的能力和局限。

福福很能吃·2025-04-05 12:02

使用 Python 微调大模型，实现特定领域模型

使用Python微调大模型，实现特定领域模型在本指南中，我们将介绍如何使用Python来微调大语言模型（LLM），以实现特定领域的优化。

程序猿学长·2025-04-05 11:26

如何将大型语言模型（LLM）转换为嵌入模型

实验证明，LLM2Vec模型在嵌入任务上具有更好的性能，它可以为组织开辟新的场所，并以非常低的成本快速创建专门的嵌入模型。

极道亦有道·2025-04-05 07:29

AWS Langfuse AI用Bedrock模型使用完全教程

准备工作创建Langfuse账户1.创建LLM应用程序启用Bedrock模型运行LLM应用程序设置LangfuseCloud为自己的应用程序添

小涵·2025-04-05 06:24

Python中LLM的模型轻量化架构：MobileBERT与TinyBERT

在当今的人工智能领域，大型语言模型（LLM）如BERT、GPT等已经成为了自然语言处理（NLP）任务的核心。然而，这些模型通常具有庞大的参数量和计算复杂度，这使得它们在资源受限的设备上部署变得困难。

二进制独立开发·2025-04-04 23:10

如何搭建LLM应用本地开发环境

1.安装miniconda，访问miniconda官网下载安装包，下载后通过conda--versionpython--version进行验证安装conda的目的在于管理python的运行时环境，它可以为每个python项目分配一个单独的空间用于项目开发，保证每个项目的python环境能够隔离开，每个项目的python及相关依赖可以不受影响如下图所示，使用condainfo-e查看当前的环境列表，

佑瞻·2025-04-04 22:00

解读 DeepSeek-R1 论文 - 通俗易懂版

引言：让AI学会"思考"的新突破在近年来的人工智能浪潮中，大型语言模型（LLM）如ChatGPT已经能回答各种问题，但它们在复杂推理方面仍有不足。

工业甲酰苯胺·2025-04-04 19:43

LLM大语言模型训练推理-eagle投机小模型训练

步骤一：安装EagleEagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。

herry456·2025-04-04 19:12

LLM 不断提升智能下限，MCP 不断提升创意上限

作者：望宸导读：LLM是大脑，MCP是手脚。LLM不断提升智能下限，MCP不断提升创意上限。所有的应用和软件都会被AI改造，将向所有的应用和软件都会被MCP改造的新范式演进。

·2025-04-04 19:06

6. LangChain4j 基于RAG实现一套企业智能客服系统

RAG介绍LLM的知识仅限于它所训练的数据。如果你想让LLM了解特定领域的知识或专有数据，你可以使用RAG。什么是RAG？

gorgor在码农·2025-04-04 13:31

Spring AI与DeepSeek实战三：打造企业知识库

一、概述企业应用集成大语言模型（LLM）落地的两大痛点：知识局限性：LLM依赖静态训练数据，无法覆盖实时更新或垂直领域的知识；幻觉：当LLM遇到训练数据外的提问时，可能生成看似合理但错误的内容。

·2025-04-04 10:27

推荐频道

Python&LLM