DeepSeek V3 两周使用总结

DeepSeek V3 两周使用总结

机器学习AI算法工程 2025年01月25日 10:10 广西

向AI转型的程序员都关注公众号 机器学习AI算法工程

2024 年 12 月 26 日,杭州深度求索人工智能基础技术研究有限公司发布 DeepSeek-V3 大模型。官方宣称:(1)基于自研的 MoE 模型和 671B 参数,在 14.8T token 上进行了预训练;(2)多项评测成绩超越了 Qwen2.5 - 72B 和 Llama - 3.1 - 405B 等其他开源模型,在性能上与世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。个人自 2025 年 1 月 3 日开始试用,至今两周零两天,以下是使用过程中的心得体会与经验总结,仅供参考。

DeepSeek V3 免费使用地址:https://chat.deepseek.com/

一、先说结论

以下结论仅针对免费使用版(非开源版):

(1)优点

你可能感兴趣的:(LLM大语言模型,Deepseek原理与使用,人工智能)