deepseek学习笔记

原计划是基于BERT或者GPT做一些自然语言处理的应用研究,deepseek出来之后,决定使用deepseek来做,相信能够获得更好的效果。

1、deepseek的论文

deepseek的论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》于2025年1月下旬同步发布在了github和arxiv上。

github地址:https://github.com/deepseek-ai/DeepSeek-R1

arxiv地址:https://arxiv.org/abs/2501.12948

2、deepseek的版本及开源情况

根据论文摘要,deepseek总共开源了deepseek-R1-Zero、DeepSeek-R1,以及6个基于Qwen和LLaMA从DeepSeek-R1中知识蒸馏得到的小模型。

这些模型在HuggingFace上的下载地址

deepseek-ai (DeepSeek)

你可能感兴趣的:(学习,笔记)