DeepSeek HuggingFace 70B Llama 版本 (DeepSeek-R1-Distill-Llama-70B)

简简单单 Online zuozuo :本心、输入输出、结果

文章目录

  • DeepSeek HuggingFace 70B Llama 版本 (DeepSeek-R1-Distill-Llama-70B)
    • 前言
      • vllm 方式在本地部署 DeepSeek-R1-Distill 模型
      • SGLang 方式在本地部署 DeepSeek-R1-Distill 模型
      • DeepSeek-R1 相关的 Models,以及 HuggingFace 下载地址
      • DeepSeek-R1 的评估结果
      • DeepSeek-R1-Distill Models,DeepSeek-R1 蒸馏的模型列表以及 HuggingFace 下载地址
      • DeepSeek-R1-Distill Models 蒸馏模型评估结果

DeepSeek HuggingFace 70B Llama 版本 (DeepSeek-R1-Distill-Llama-70B)


编辑 | 简简单单 Online zuozuo
地址 | https://blog.csdn.net/qq_15071263


如果觉得本文对你有帮助,欢迎点赞、收藏、评论,谢谢

前言

  1. DeepSeek-R1-Zero 是一种通过大规模强化学习 (RL) 训练的模型,没有监督微调 (SFT) 作为初步步骤,在推理方面表现出了卓越的性能。
  2. 随着 RL 的出现,DeepSeek-R1-Zero 自然而然地出现了许多强大而有趣的

你可能感兴趣的:(m1,Python,领域,m4,杂项,llama,DeepSeek,DeepSeek,R1,DeepSeek,V3,Ollama)