E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
DeepEP
【AI Infra】基础学习汇总篇
来源:材料主要源于【
DeepEP
官方介绍】进行的,每个知识点的修正和深入主要参考各平台大佬的文章,其中也可能含有少量的个人实验自证。结语:如果有帮到你的地方,就点个赞和关注一下呗,谢谢!!!
逆羽飘扬
·
2025-07-04 01:41
AI基础知识
人工智能
学习
DeepEP
的实战与深度剖析
DeepSeek.ai推出的
DeepEP
,专为MoE/EP通信优化,实现了GPU原生高吞吐、低延迟通信,极大释放了底层硬件潜力。
DeepLink_01
·
2025-07-01 10:33
开源项目分享
Ai
分布式
github
DeepEP
开源项目
GPU加速
MoE/EP架构
DeepEP
开源MoE模型分布式通信库
DeepEP
是由DeepSeek团队于2025年1月15日正式开源的。
老兵发新帖
·
2025-06-22 14:18
人工智能
DeepSeek 开发接入技术难点解析:从模型架构到工程落地的实战指南
一、核心技术难点全景透视DeepSeek作为国产大模型的标杆,其技术架构深度融合了MoE(混合专家系统)、MLA(多头潜在注意力)和
DeepEP
分布式通信库等创新设计。
与AI共生
·
2025-05-29 19:56
大厂
AI
工程师的技术私房课
架构
DeepSeek底层揭秘——
deepEP
1.什么是
deepEP
?(1)定义
deepEP
(DeepSeekEndPoint)是DeepSeek开源的一款高性能、低延迟的分布式通信库,专为大规模深度学习训练和推理场景设计。
9命怪猫
·
2025-03-26 12:45
AI
人工智能
大模型
ai
程序员必看!DeepSeek全栈开发实战指南:从代码生成到性能优化
一、DeepSeek技术新突破:程序员效率革命(开篇结合最新技术动态)2025年2月25日,DeepSeek接连放出两大技术王牌:全球首个面向MoE模型的全栈通信库
DeepEP
开源,以及深度思考R1模型的全面升级
AI创享派
·
2025-03-18 20:59
后端
让MoE架构效率提升的神助攻【
DeepEP
】
摘要:本文将针对
DeepEP
项目进行深入浅出的功能解析与设计分析,并在此基础上提出一些潜在的优化思路。本报告分为三个主要部分:功能解析、创新设计点、可能的优化方案。
碣石潇湘无限路
·
2025-03-16 17:51
开源
架构
llama
ai
程序员必看!DeepSeek全栈开发指南:从代码生成到分布式训练的黑科技解析
一、DeepSeek技术新突破:程序员必须掌握的MoE架构实战2025年2月25日,DeepSeek开源了专为MoE模型设计的
DeepEP
通信库,这项技术革新直接影响了分布式训练和推理效率。
AI创享派
·
2025-03-16 06:00
后端
DeepSeek开源周:全面革新AI基础设施技术的盛宴
开源项目发布时间线项目2月24日2月25日2月26日2月27日2月28日FlashMLA★
DeepEP
★DeepGEMM★DualPipe与
大刘讲IT
·
2025-03-09 06:54
开源
人工智能
ai
【AGI】DeepSeek开源周:The whale is making waves!
:DeepSeek-V3系列2.推理优化模型:DeepSeek-R1系列3.多模态模型:Janus系列二、开源周三大工具库的技术解析1.FlashMLA:解码效率的极限突破(2025.02.24)2.
DeepEP
LeeZhao@
·
2025-03-07 09:10
AIGC重塑生活神器
agi
开源
人工智能
AIGC
生活
语言模型
DeepSeek开源技术全景解析:从硬件榨取到AI民主化革命
民主化革命一、开源周核心成果概览2025年2月24日启动的"开源周"计划,DeepSeek团队连续发布三项底层技术突破:FlashMLA(2.24):动态资源调度算法,Hopper架构GPU性能榨取专家
DeepEP
大刘讲IT
·
2025-03-07 09:09
开源
人工智能
DeepSeek 最新发布
DeepEP
:一款用于 MoE 模型训练和推理的开源 EP 通信库
采用Mixture-of-Experts(MoE)架构的大型语言模型在没有相应计算量增加的情况下显著提升了模型容量。然而,这种方法也引入了一些挑战,尤其是在GPU之间的通信方面。在MoE模型中,对于任何给定的token,只有一部分专家是活跃的,因此在设备之间高效地交换数据至关重要。传统的全对全(all-to-all)通信方法可能会造成瓶颈,增加延迟,并导致GPU资源利用不足。在对延迟敏感的场景中,
强哥之神
·
2025-03-01 01:37
人工智能
LLM
机器学习
Latent
Space
语言模型
deepseek
AI基建狂魔!DeepSeek五天开源5大杀器实测:训练成本砍半+推理速度起飞,算法圈已疯(附删库跑路教程)
FlashMLA让推理速度飙升40%,
DeepEP
根治MoE通信癌,FP8核弹库DeepGEMM暴力提效,DualPipe+EPLB把GPU榨到一滴不剩,3FS化身数据闪电侠!
AI仙人掌
·
2025-02-28 22:18
人工智能
深度学习
人工智能
大模型
算法
开源
DeepSeek开源周第二弹:
DeepEP
如何用RDMA+FP8让MoE模型飞起来?
一、引言:MoE模型的通信瓶颈与
DeepEP
的诞生在混合专家(MoE)模型训练中,专家间的全对全(All-to-All)通信成为性能瓶颈。
曦紫沐
·
2025-02-28 04:03
大模型
deepseek
DeepEP
:开源通信库的高效专家并行计算解决方案
摘要
DeepEP
是一个专为Mixture-of-Experts(MoE)和专家并行计算设计的开源通信库。它提供高效的all-to-all通信模式,支持GPU之间的高吞吐量和低延迟数据交换。
耶耶Norsea
·
2025-02-27 16:41
网络杂烩
人工智能
DeepSeek开源周合集
周一:FlashMLA,核心成就:GPU带宽利用接近理论极限,算力利用效率翻倍;周二:
DeepEP
,一个高效的MOE架构专家并行通信库:支持高效且优化后的全对全通信使用NVlink和RDMA进行节点内和节点间通信用于训练和推理填充的高吞吐量内核用于推理解码的低延迟内核原生支持
Vip.Gong
·
2025-02-27 14:03
人工智能
transformer
chatgpt
文心一言
python
scikit-learn
深度学习
DeepSeek 开源周:
DeepEP
项目详解,GPU 压榨计划启动!
引言就在今天,2025年2月25日,DeepSeek再次为人工智能社区带来了一场技术盛宴——
DeepEP
项目的开源。
东方佑
·
2025-02-26 18:29
量子变法
开源
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他