LLM(大模型)开源项目介绍与使用场景
首先介绍我们目前市面上主流比较强的通用大模型,榜单来自于SuperCLUE总排行榜(2025年3月)
排名 | 模型名称 | 机构 | 总分 | 数学推理 | 科学推理 | 代码生成 | 智能体Agent | 精确指令遵循 | 文本理解与创作 |
---|---|---|---|---|---|---|---|---|---|
1 | o3-mini(high) | OpenAI | 76.01 | 94.74 | 70.00 | 88.78 | 57.14 | 66.4 | 79.01 |
2 | DeepSeek-R1 | 深度求索 | 70.33 | 85.96 | 64.00 | 86.94 | 65.18 | 39.52 | 80.41 |
3 | Claude 3.7 Sonnet | Anthropic | 68.02 | 78.07 | 59.00 | 86.73 | 56.62 | 48.92 | 78.77 |
4 | GPT-4.5-Preview | OpenAI | 67.46 | 67.54 | 70.00 | 79.18 | 71.88 | 35.75 | 80.4 |
5 | QwQ-32B | 阿里巴巴 | 66.38 | 88.6 | 67.00 | 81.84 | 48.66 | 29.92 | 82.27 |
6 | Gemini-2.0-Pro-Exp-02-05 | 65.35 | 65.79 | 70.71 | 77.76 | 64.88 | 33.6 | 79.34 | |
7 | Doubao-1.5-pro-32k-250115 | 字节跳动 | 64.68 | 62.28 | 70.00 | 76.94 | 54.46 | 46.77 | 77.66 |
8 | hunyuan-turbos-20250226 | 腾讯 | 62.49 | 47.37 | 63.00 | 74.49 | 70.09 | 41.13 | 78.88 |
9 | DeepSeek-R1-Distill-Qwen-32B | 深度求索 | 59.94 | 85.85 | 62.89 | 73.43 | 36.77 | 23.18 | 77.53 |
10 | Qwen-max-latest | 阿里巴巴 | 59.34 | 42.98 | 68.00 | 76.33 | 58.48 | 29.38 | 80.88 |
针对榜单主流模型以及对应的厂商介绍
主要介绍3种:LM Studio、Ollama、GPT4All
命令行界面 (CLI): 主要通过命令行进行操作,适合熟悉命令行的用户。
模型管理: 提供方便的命令来下载、管理和运行 LLM。
支持多种模型: 支持多种流行的开源 LLM,如 Llama 2、Mistral、Codellama 等。
自定义模型: 允许用户通过 Modelfile 定义和运行自定义模型。
API 服务器: 可以启动一个 API 服务器,方便与其他应用集成。
GPU 加速: 支持 GPU 加速。
跨平台: 支持 macOS、Linux 和 Windows (通过 WSL 2)。
开源: 完全开源,社区活跃。
相对较高的技术门槛: 更适合有一定技术基础的用户。
部署教程:https://blog.csdn.net/star_nwe/article/details/143141025
因为模型的地址在国外,如果下载过慢可以选择用魔塔社区的镜像地址下载:如:
DeepSeek-R1:
ollama run modelscope.cn/unsloth/DeepSeek-R1-Distill-Qwen-7B-GGUF
对比总结表格:
特性 | LM Studio | Ollama | GPT4All |
---|---|---|---|
核心理念 | 易用性, GUI, 本地 LLM | 灵活性, CLI, 本地 LLM | 易用性, CPU 推理, 本地 LLM |
主要功能 | GUI, 聊天界面, 模型发现, 一键安装, 本地服务器 | CLI, 模型管理, 自定义模型, API 服务器 | GUI/CLI, 聊天界面, CPU 优化, 易于安装 |
适用场景 | 普通用户, 快速体验 LLM, 无需代码 | 技术用户, 自定义模型, 集成 | 普通用户, CPU 运行, 简单体验 |
技术要求 | 低 | 中等 (熟悉命令行) | 低 |
GPU 加速 | 支持 | 支持 | 有限支持/更侧重CPU |
跨平台 | Windows, macOS, Linux | macOS, Linux, Windows (WSL2) | Windows, macOS, Linux |
开源 | 否 | 是 | 是 |
生态 | 相对封闭 | 活跃开源社区 | 相对不活跃 |
如何选择:
总之, 如果你注重易用性和图形界面, LM Studio 是首选. 如果你喜欢命令行和定制化, Ollama 更好. 如果你希望强调免费和 CPU 运行降低门槛, GPT4All 适合.
这里主要介绍Langflow、Flowise、Dify、Coze、AutoGPT UI 和 AgentGPT
都是基于 LangChain 的工作流工具,帮助开发者设计、构建并部署多步骤的 LLM 应用程序。二者的核心区别在于界面设计和功能的简洁性,Flowise 更加强调可视化设计。
Langflow:(https://www.langflow.org/)
Langflow 是一个基于 LangChain 的框架,专注于为 LLM(大语言模型)应用程序 提供构建流式流程的能力。Langflow 使开发者能够构建对话流、自动化工作流和集成多种工具等,使得开发人员可以通过低代码的方式开发更加复杂的应用。
核心特点:
Flowise:(https://flowiseai.com/)
Flowise 是一个开源工具,帮助用户在没有编程背景的情况下,快速构建、管理和优化 语言模型应用 的工作流。类似于 Langflow,它也是基于 LangChain 构建的,但其目标是让用户可以通过图形化的方式设计工作流,尤其适合需要与多个外部数据源交互的应用场景。
核心特点:
AutoGPT 和 AgentGPT:这两款产品都聚焦于自定义和自动执行任务,且支持代理的自主决策与执行。它们的核心区别在于 AutoGPT 更加关注自主学习和任务执行的自我改进能力,而 AgentGPT 强调任务灵活性和定制性。
AutoGPT:(https://agpt.co/)
AutoGPT 是一种 自主代理 系统,结合了 大语言模型 和一些自我强化学习机制,目标是实现完全的自动化应用。AutoGPT 可以根据用户的需求,主动执行任务并进行反馈,甚至可以进行自我改进。搭配AutoGPT UI使用
核心特点:
AgentGPT:(https://agentgpt.reworkd.ai/zh)
AgentGPT 是一个 自定义代理 系统,能够通过提供用户输入并将其转化为操作任务,来帮助用户完成实际任务。与 AutoGPT 类似,AgentGPT 可以自动执行任务并进行调度,但它更强调任务的可定制性和执行逻辑的灵活性。
核心特点:
相当于上面的结合体平台,功能更加全面,可以使用工作流构建也可以使用agent构建自己的LLM 应用
Dify 和 Coze:这两款工具都集成了大语言模型(LLM)和任务自动化功能,适合用来构建智能应用。Dify 更偏向于开发者进行智能应用的构建,而 Coze 则专注于团队协作和智能工作流管理。
Dify:(https://dify.ai)
Dify 是一个开放平台,致力于简化和加速开发 智能应用。它集成了大语言模型(LLM),可以帮助开发者构建智能对话、推荐系统等应用。Dify 允许用户通过创建多步骤的工作流,来管理和调度任务。
核心特点:
Coze(扣子):(https://www.coze.com/)
Coze 是一款 AI 驱动的协作工具,专注于 智能工作流 和 自动化任务,支持多个人工智能应用的整合。它更像是一个能够在企业环境中使用的智能助手,帮助企业自动化日常流程和任务。
核心特点:
一般如果是企业落地场景一般推荐使用Dify进行搭建一个综合智能体应用,在通过API进行调用接入本地应用服务实现项目场景的落地
主要以图像识别为主,例如通过摄像头实现查询工厂内员工是否有正常穿戴工作服和头盔等图像识别功能等(通过视觉识别模型:Qwen2.5-VL-72B-Instruct、Gemini 2.0 Flash Thinking Experimental 01-21)
操作人员通过语音实现现场设备的控制,如:通过话筒说关闭1号设备,系统自动去关闭对应的1号设备;(通过调用语音识别模型,或者文本转语音在通过调用文本模型)
通过语音说查找某个报表,系统弹出跳转到指定页面,页面快速实现调出指定报表功能页面。(通过调用语音识别模型,或者文本转语音在通过调用文本模型)browser-use + 语音控制模型/deepseek(先把语音转文字) 实现浏览器控制
在工程安装或者设备维修保养的时候,对着系统说查找某个设备的安装,系统自动调用对应设备的安装保养手册(通过调用语音识别模型,或者文本转语音在通过调用文本模型)
1.Chat2DB :https://chat2db-ai.com/resources/docs/start-guide/getting-started
a)Chat2DB 是一款AI first的数据管理、开发、分析工具,它的核心是AIGC(Artificial Intelligence Generation Code)能力,它可以将自然语言转换为SQL,也可以将SQL转换为自然语言,也可以自动生成报表,极大的提升人员的效率。通过一个产品可以实现数据管理、数据开发、数据分析的能力,即使不懂SQL的运营业务也可以使用快速查询业务数据、生成报表能力。
2.data-formulator:https://github.com/microsoft/data-formulator
微软雷德蒙研究院的研究员们开发的一款超实用的AI 工具——Data Formulator,这款工具巧妙地结合了图形化用户界面(就是咱们熟悉的点选、拖拽操作)和自然语言输入(比如直接打字告诉它你的需求),让用户能更轻松地向 AI 传达自己的想法。这样一来,无论是调整图表样式还是更新数据,AI 都能精准理解你的意图,一步步帮你完成复杂的可视化设计。简单来说,Data Formulator 就像是一个