E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
deepseekllm
DeepSeek技术发展详细时间轴与技术核心解析
11月29日:推出
DeepSeekLLM
,这是参数规模高达670亿
anneCoder
·
2025-06-07 12:02
深度学习
人工智能
chatgpt
自动驾驶大模型---小米&华科的ORION端到端方案
1背景关于大模型/端到端,笔者也已经写了一个系列,其中主要包括以下几篇(持续更新):《大模型---
DeepseekLLM
大语言模型原理》《大模型---一文看懂视觉语言大模型VLM》《大模型实战---人人都可以部署
智能汽车人
·
2025-06-03 03:30
自动驾驶
人工智能
机器学习
DeepSeek本地私有部署(基于Ollama)
自成立以来,DeepSeek在短短一年多的时间里取得了显著的进展,推出了多个引人注目的开源模型,包括DeepSeekCoder、
DeepSeekLLM
、DeepSeek-V2、DeepSeek-V3、DeepSeek-Rl
奶羊cnk
·
2025-05-26 04:21
人工智能
deepseek
deepseek具体应用场景
以下是基于证据的详细总结:金融领域DeepSeek在金融领域的应用表现突出,例如通过其大语言模型(如
DeepSeekLLM
67Bt)提供数学、逻辑推理等能力,帮助金融机构提升服务效率。
ahyouxiang
·
2025-03-20 06:06
人工智能
DeepSeek发展背景和前景
2.技术演进:2024年1月:发布首个大模型
DeepSeekLLM
,包含670亿参数,在2万亿token的数据集上训练,性能超越Llama270BBase。202
爱吃苹果的日记本
·
2025-03-12 02:18
人工智能
Deepseek相关梳理
2024年1月5日,发布首个大模型
DeepSeekLLM
。5月,宣布开源第二代MoE大模型DeepSeek-V2。9月5日,升级推出DeepSeekV2.5新模型。
stars and seas
·
2025-03-02 11:50
人工智能
DeepSeek:大模型时代的“破局者”
2024年1月5日,发布首个包含670亿参数的大模型
DeepSeekLLM
,该模型从零开
qq_44233281
·
2025-02-26 10:02
ai
深度学习
人工智能
DeepSeek模型架构及优化内容
DeepSeekv1版本模型结构
DeepSeekLLM
基本上遵循LLaMA的设计:采⽤Pre-Norm结构,并使⽤RMSNorm函数.利⽤SwiGLU作为Feed-ForwardNetwork(FFN)
开出南方的花
·
2025-02-12 19:39
架构
人工智能
机器学习
Attention
NLP
pytorch
深度学习
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他