DeepSeek本地私有部署(基于Ollama)

      DeepSeek 是一家由中国知名量化私募巨头幻方量化创立的人工智能公司,致力于开发高效、高性能的生成式AI 模型。自成立以来,DeepSeek 在短短一年多的时间里取得了显著的进展,推出了多个引人注目的开源模型,包括 DeepSeek Coder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3、DeepSeek-Rl和多模态模型Janus。

       DeepSeek的爆火,引发了全球科技震动,甚至直接导致了NVIDIA股价暴跌18%,全球科技股市市值蒸发了约1万亿美元。华尔街和科技媒体纷纷惊呼,DeepSeek的起,正在颠全球AI产业格局,对美国科技巨头构成了前所未有的挑战。美国总统特朗普罕见地公开赞扬DeepSeek的起是“积极的”,并认为这是一个给美国敲响的 “警钟”。微软 CE0 Satya Nadella 和openAICE0SamAltman也对DeepSeek表示赞赏。

       DeepSeek-V3模型在性能上全面对标海外领军闭源模型,生成速度也大幅提升,成为当前最强大的开源基础模型之一。
        DeepSeek-V3是一款拥有671B参数的大型混合专家(MoE)模型,其中每个token会有37 B参数被激活。

      DeepSeek-R1在性能上全面对齐OpenAl01正式版,并开放了思维链输出功能。
      DeepSeek 还宣布将模型开源License 统一变更为MIT许可证,并明确用户协议允许“模型蒸馏”,进一步拥抱开源,促进技术共享。

DeepSeek本地私有部署(基于Ollama)_第1张图片

你可能感兴趣的:(人工智能,deepseek)