DeepEP

【AI Infra】基础学习汇总篇

来源：材料主要源于【DeepEP官方介绍】进行的，每个知识点的修正和深入主要参考各平台大佬的文章，其中也可能含有少量的个人实验自证。结语：如果有帮到你的地方，就点个赞和关注一下呗，谢谢！！！

逆羽飘扬·2025-07-04 01:41

DeepEP 的实战与深度剖析

DeepSeek.ai推出的DeepEP，专为MoE/EP通信优化，实现了GPU原生高吞吐、低延迟通信，极大释放了底层硬件潜力。

DeepLink_01·2025-07-01 10:33

DeepEP开源MoE模型分布式通信库

DeepEP是由DeepSeek团队于2025年1月15日正式开源的。

老兵发新帖·2025-06-22 14:18

DeepSeek 开发接入技术难点解析：从模型架构到工程落地的实战指南

一、核心技术难点全景透视DeepSeek作为国产大模型的标杆，其技术架构深度融合了MoE（混合专家系统）、MLA（多头潜在注意力）和DeepEP分布式通信库等创新设计。

与AI共生·2025-05-29 19:56

DeepSeek底层揭秘——deepEP

1.什么是deepEP？(1)定义deepEP(DeepSeekEndPoint)是DeepSeek开源的一款高性能、低延迟的分布式通信库，专为大规模深度学习训练和推理场景设计。

9命怪猫·2025-03-26 12:45

程序员必看！DeepSeek全栈开发实战指南：从代码生成到性能优化

一、DeepSeek技术新突破：程序员效率革命（开篇结合最新技术动态）2025年2月25日，DeepSeek接连放出两大技术王牌：全球首个面向MoE模型的全栈通信库DeepEP开源，以及深度思考R1模型的全面升级

AI创享派·2025-03-18 20:59

让MoE架构效率提升的神助攻【DeepEP】

摘要：本文将针对DeepEP项目进行深入浅出的功能解析与设计分析，并在此基础上提出一些潜在的优化思路。本报告分为三个主要部分：功能解析、创新设计点、可能的优化方案。

碣石潇湘无限路·2025-03-16 17:51

程序员必看！DeepSeek全栈开发指南：从代码生成到分布式训练的黑科技解析

一、DeepSeek技术新突破：程序员必须掌握的MoE架构实战2025年2月25日，DeepSeek开源了专为MoE模型设计的DeepEP通信库，这项技术革新直接影响了分布式训练和推理效率。

AI创享派·2025-03-16 06:00

DeepSeek开源周：全面革新AI基础设施技术的盛宴

开源项目发布时间线项目2月24日2月25日2月26日2月27日2月28日FlashMLA★DeepEP★DeepGEMM★DualPipe与

大刘讲IT·2025-03-09 06:54

【AGI】DeepSeek开源周：The whale is making waves！

：DeepSeek-V3系列2.推理优化模型：DeepSeek-R1系列3.多模态模型：Janus系列二、开源周三大工具库的技术解析1.FlashMLA：解码效率的极限突破（2025.02.24）2.DeepEP

LeeZhao@·2025-03-07 09:10

DeepSeek开源技术全景解析：从硬件榨取到AI民主化革命

民主化革命一、开源周核心成果概览2025年2月24日启动的"开源周"计划，DeepSeek团队连续发布三项底层技术突破：FlashMLA（2.24）：动态资源调度算法，Hopper架构GPU性能榨取专家DeepEP

大刘讲IT·2025-03-07 09:09

DeepSeek 最新发布 DeepEP：一款用于 MoE 模型训练和推理的开源 EP 通信库

采用Mixture-of-Experts（MoE）架构的大型语言模型在没有相应计算量增加的情况下显著提升了模型容量。然而，这种方法也引入了一些挑战，尤其是在GPU之间的通信方面。在MoE模型中，对于任何给定的token，只有一部分专家是活跃的，因此在设备之间高效地交换数据至关重要。传统的全对全（all-to-all）通信方法可能会造成瓶颈，增加延迟，并导致GPU资源利用不足。在对延迟敏感的场景中，

强哥之神·2025-03-01 01:37

AI基建狂魔！DeepSeek五天开源5大杀器实测：训练成本砍半+推理速度起飞，算法圈已疯（附删库跑路教程）

FlashMLA让推理速度飙升40%，DeepEP根治MoE通信癌，FP8核弹库DeepGEMM暴力提效，DualPipe+EPLB把GPU榨到一滴不剩，3FS化身数据闪电侠！

AI仙人掌·2025-02-28 22:18

DeepSeek开源周第二弹：DeepEP如何用RDMA+FP8让MoE模型飞起来？

一、引言：MoE模型的通信瓶颈与DeepEP的诞生在混合专家（MoE）模型训练中，专家间的全对全（All-to-All）通信成为性能瓶颈。

曦紫沐·2025-02-28 04:03

DeepEP：开源通信库的高效专家并行计算解决方案

摘要DeepEP是一个专为Mixture-of-Experts（MoE）和专家并行计算设计的开源通信库。它提供高效的all-to-all通信模式，支持GPU之间的高吞吐量和低延迟数据交换。

耶耶Norsea·2025-02-27 16:41

DeepSeek开源周合集

周一：FlashMLA，核心成就：GPU带宽利用接近理论极限，算力利用效率翻倍；周二：DeepEP，一个高效的MOE架构专家并行通信库：支持高效且优化后的全对全通信使用NVlink和RDMA进行节点内和节点间通信用于训练和推理填充的高吞吐量内核用于推理解码的低延迟内核原生支持

Vip.Gong·2025-02-27 14:03

DeepSeek 开源周：DeepEP 项目详解，GPU 压榨计划启动！

引言就在今天，2025年2月25日，DeepSeek再次为人工智能社区带来了一场技术盛宴——DeepEP项目的开源。

东方佑·2025-02-26 18:29

推荐频道