deepseekllm

推荐频道

deepseekllm

DeepSeek技术发展详细时间轴与技术核心解析

11月29日：推出DeepSeekLLM，这是参数规模高达670亿

anneCoder·2025-06-07 12:02

自动驾驶大模型---小米&华科的ORION端到端方案

1背景关于大模型/端到端，笔者也已经写了一个系列，其中主要包括以下几篇（持续更新）：《大模型---DeepseekLLM大语言模型原理》《大模型---一文看懂视觉语言大模型VLM》《大模型实战---人人都可以部署

智能汽车人·2025-06-03 03:30

DeepSeek本地私有部署（基于Ollama）

自成立以来，DeepSeek在短短一年多的时间里取得了显著的进展，推出了多个引人注目的开源模型，包括DeepSeekCoder、DeepSeekLLM、DeepSeek-V2、DeepSeek-V3、DeepSeek-Rl

奶羊cnk·2025-05-26 04:21

deepseek具体应用场景

以下是基于证据的详细总结：金融领域DeepSeek在金融领域的应用表现突出，例如通过其大语言模型（如DeepSeekLLM67Bt）提供数学、逻辑推理等能力，帮助金融机构提升服务效率。

ahyouxiang·2025-03-20 06:06

DeepSeek发展背景和前景

2.技术演进：2024年1月：发布首个大模型DeepSeekLLM，包含670亿参数，在2万亿token的数据集上训练，性能超越Llama270BBase。202

爱吃苹果的日记本·2025-03-12 02:18

Deepseek相关梳理

2024年1月5日，发布首个大模型DeepSeekLLM。5月，宣布开源第二代MoE大模型DeepSeek-V2。9月5日，升级推出DeepSeekV2.5新模型。

stars and seas·2025-03-02 11:50

DeepSeek：大模型时代的“破局者”

2024年1月5日，发布首个包含670亿参数的大模型DeepSeekLLM，该模型从零开

qq_44233281·2025-02-26 10:02

DeepSeek模型架构及优化内容

DeepSeekv1版本模型结构DeepSeekLLM基本上遵循LLaMA的设计：采⽤Pre-Norm结构，并使⽤RMSNorm函数.利⽤SwiGLU作为Feed-ForwardNetwork（FFN）

开出南方的花·2025-02-12 19:39

上一页 1 下一页

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他