抢先体验全新极小大模型Qwen3:0.6B

全民都在期待DeepSeek-R2的发布,但是一不小心被阿里截胡了,2025 年 4 月 29 日,阿里巴巴发布并开源了通义千问 Qwen3 系列大模型。据 大模型镜像网站 上关于Qwen3的介绍:
Qwen3 是 Qwen 系列中最新一代的大型语言模型,提供一整套密集模型和混合专家 (MoE) 模型。Qwen3 基于广泛的培训而构建,在推理、指令遵循、代理功能和多语言支持方面取得了突破性的进步。
Qwen3 大模型的最大特色是:独特支持单个模型在思维模式(用于复杂的逻辑推理、数学和编码)和非思维模式(用于高效的通用对话)之间无缝切换,确保在各种场景中实现最佳性能。而且其推理能力显著增强,超越了之前的 QwQ(思考模式)和 Qwen2.5 指导模型(非思考模式)在进行数学、代码生成和常识性逻辑推理方面的表现。
另外,最为惊喜的是Qwen3系列模型中还包括一个0.6B参数的“极小”大模型,模型文件大小只有522MB,但支持32KB的上下文,可在普通手机上流畅运行。还等什么呢,赶快动手尝尝鲜吧!

安装Qwen3:0.6B模型

首先参照我前面的文章 Docker+Ollama+RAGFlow本地部署DeepSeek R1并构建本地知识库 安装好Docker、Ollama和Open-WebUI。需要注意的是:由于Qwen3是新发布的模型

你可能感兴趣的:(AI大模型,#,ai,AI编程,语言模型,人工智能,数据库)