Llama 4 群:原生多模态 AI 创新新时代的开始

  • 我们正在分享 Llama 4 群中的首批模型,这将使人们能够构建更加个性化的多模式体验。
  • Llama 4 Scout 拥有 170 亿个活跃参数,包含 16 位专家模型,是同类产品中全球最佳的多模态模型,其性能比所有前代 Llama 模型都更强大,并且仅需单块 NVIDIA H100 GPU 即可运行。此外,Llama 4 Scout 提供业界领先的 10M 上下文窗口,在众多广泛报道的基准测试中,其结果均优于 Gemma 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。
  • Llama 4 Maverick 是一个拥有 170 亿个活跃参数、包含 128 位专家的模型,是同类最佳的多模态模型,在众多广泛报道的基准测试中均击败了 GPT-4o 和 Gemini 2.0 Flash,同时在推理和编码方面取得了与全新 DeepSeek v3 相当的结果——活跃参数数量不到后者的一半。Llama 4 Maverick 提供了一流的性价比,其实验性聊天版本在LMArena上的 ELO 得分为 1417 。
  • 这些模型是我们迄今为止最好的,得益于 Llama 4 Behemoth 的提炼。Llama 4 Behemoth 是一个拥有 2880 亿个活跃参数、拥有 16 位专家的模型,是我们迄今为止最强大的 LLM,也是全球最智能的 LLM 之一。Llama 4 Behemoth 在多项 STEM 基准测试中的表现优于 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。Llama 4 Behemoth 仍在训练中,尽管它仍在运行中,我们也很高兴能分享更多关于它的细节。
  • 立即在llama.com和Hugging Face下载 Llama 4 Scout 和 Llama 4 Maverick 型号。在 WhatsApp、Messenger、Instagram Direct 和网页端试用基于 Llama 4 构建的 Meta AI 。

随着越来越多的人继续使用人工智能来改善日常生活,领先的模型和系统的开放至关重要,这样每个人都可以构建个性化体验的未来。今天,我们很高兴地宣布推出支持整个Llama生态系统的最先进的模型套件。我们即将推出 Llama 4 Scout 和 Llama 4 Maverick,它们是首批开放权重的原生多模态模型,拥有前所未有的上下文长度支持,也是我们首个采用混合专家 (MoE) 架构构建的模型。我们还将预览 Llama 4 Behemoth,它是世界上最智能的 LLM 之一,也是我们迄今为止最强大的 LLM,可以作为我们新模型的老师。

这些 Llama 4 模型标志着 Llama 生态系统新时代的开启。我们在 Llama 4 系列中设计了两款高效模型:Llama 4 Scout(一个拥有 16 位专家的 170 亿活跃参数模型)和 Llama 4 Maverick(一个拥有 128 位专家的 170 亿活跃参数模型)。前者适用于单个 H100 GPU(支持 Int4 量化),而后者适用于单个 H100 主机。我们还训练了一个教师模型 Llama 4 Behemoth,其在 MATH-500 和 GPQA Diamond 等 STEM 基准测试中的表现优于 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。虽然 Llama 4 Behemoth 仍在训练中,我们尚未发布,但我们很高兴分享更多关于我们方法的技术细节。

我们始终坚信开放驱动创新,对开发者、Meta 以及世界都大有裨益。我们今日起将在llama.com和Hugging Face上开放 Llama 4 Scout 和 Llama 4 Maverick 的下载,以便每个人都能继续使用我们的最新技术打造全新体验。我们也将在未来几天通过合作伙伴提供这些应用。您也可以从今日起在 WhatsApp、Messenger、Instagram Direct 以及Meta.AI网站上试用 Llama 4 的 Meta AI。

这只是 Llama 4 系列的开端。我们相信,最智能的系统需要能够执行通用操作,与人类自然对话,并解决前所未有的难题。赋予 Llama 在这些领域的超能力,将为我们平台上的用户带来更好的产品,并为开发者提供更多机会,在下一个重要的消费者和商业用例上进行创新。我们将继续研究和制作模型和产品的原型,并将于 4 月 29 日在 LlamaCon 上分享更多关于我们愿景的内容——立即注册了解更多信息。

无论您是基于我

你可能感兴趣的:(llama,人工智能)