方渐鸿

【2025】LLM(大模型)开源项目介绍与使用场景

LLM(大模型)开源项目介绍与使用场景

一、大语言模型
- 通用大模型
二、大模型本地部署
- 1. Ollama:（[https://ollama.com/](https://ollama.com/)）
- 2. LM Studio:([https://lmstudio.ai/](https://lmstudio.ai/))
- 3. GPT4All:([https://gpt4all.io](https://gpt4all.io/index.html?ref=localhost))
三、大模型(LLM)工具
- 1、低代码 LLM 工作流构建器： Langflow 和 Flowise
- 2、自主代理平台/工具：AutoGPT 和 AgentGPT
- 3、LLM 应用开发平台：
四、AI物联网实现方向
- 1.人工智能和物联网：
- 2.语言控制：
- 3.报表分析：
- 4.知识检索：
五、AI落地相关优秀项目：

一、大语言模型

通用大模型

首先介绍我们目前市面上主流比较强的通用大模型，榜单来自于SuperCLUE总排行榜（2025年3月）

排名	模型名称	机构	总分	数学推理	科学推理	代码生成	智能体Agent	精确指令遵循	文本理解与创作
1	o3-mini(high)	OpenAI	76.01	94.74	70.00	88.78	57.14	66.4	79.01
2	DeepSeek-R1	深度求索	70.33	85.96	64.00	86.94	65.18	39.52	80.41
3	Claude 3.7 Sonnet	Anthropic	68.02	78.07	59.00	86.73	56.62	48.92	78.77
4	GPT-4.5-Preview	OpenAI	67.46	67.54	70.00	79.18	71.88	35.75	80.4
5	QwQ-32B	阿里巴巴	66.38	88.6	67.00	81.84	48.66	29.92	82.27
6	Gemini-2.0-Pro-Exp-02-05	Google	65.35	65.79	70.71	77.76	64.88	33.6	79.34
7	Doubao-1.5-pro-32k-250115	字节跳动	64.68	62.28	70.00	76.94	54.46	46.77	77.66
8	hunyuan-turbos-20250226	腾讯	62.49	47.37	63.00	74.49	70.09	41.13	78.88
9	DeepSeek-R1-Distill-Qwen-32B	深度求索	59.94	85.85	62.89	73.43	36.77	23.18	77.53
10	Qwen-max-latest	阿里巴巴	59.34	42.98	68.00	76.33	58.48	29.38	80.88

针对榜单主流模型以及对应的厂商介绍

o3-mini(high) （https://chatgpt.com） (OpenAI 高速轻量版，体验前沿，非开源！): OpenAI 最新推出的轻量级模型版本，可能是 GPT-4o 的精简高速版。旨在提供更快速的响应和高效的推理体验，方便用户在算力受限或需要快速反馈的场景下使用。非开源！是体验 OpenAI 最新技术，注重速度和效率用户的闭源选择。（国内使用因为需要科学上网，并且官网经常会检测ip，影响使用体验，并且API关闭了免费调用，推荐不缺钱使用）
DeepSeek-R1 （https://www.deepseek.com/） (算法优化，本地部署领先，开源！): DeepSeek 公司今年大热的明星模型，以算法优化和卓越推理能力著称。能够在更少算力下实现更高精度，推动大模型本地化部署。开源！是追求高性能、高效率，并希望进行本地部署和二次开发的开源优选。（因为热度太高了，官网调用基本上很难调用成功，所以推荐到第三方模型厂家调用相对不会卡，可以选择硅基流动或者阿里等各大云服务厂商以及可以使用groq进行免费调用api。因为开源，所以可以很方便的进行本地部署。推荐使用）
Claude 3.7 Sonnet （https://claude.ai/）(Anthropic 高性价比之选，均衡能力，非开源！): Claude研发团队核心成员基本上来自于OpenAI。Anthropic Claude 3 系列中的 Sonnet 版本，定位为性能与成本的平衡点。在保持 Claude 3 系列优秀推理和创作能力的同时，提供更具竞争力的价格。非开源！适合对模型性能有要求，同时注重成本效益的闭源用户。（和chat gpt 差不多，一公司出来的，基本上也是国内非常不友善，官网可以免费使用，但api调用同样收费）
QwQ-32B（https://tongyi.aliyun.com/ ）(阿里推理最强，开源！): 阿里目前最强的推理模型，性能比肩DeepSeek-R1，并且开源。 （国内开源扛把子，阿里yyds，阿里目前基本上各类型的语言模型都有涉及。推荐使用）
Gemini-2.0-Pro-Exp-02-05 （https://aistudio.google.com/）(Google Gemini Pro 实验版，探索前沿，非开源！): Google Gemini Pro 模型的实验版本，标注 “Exp” 和日期，表明这是一个实验性质的早期版本，可能用于内部测试或特定目的。代表 Google 在 Gemini 模型上的持续迭代和探索。非开源！适合关注 Google 大模型技术发展，具有实验精神和探索精神的。并且可以一次性传输2M token的输入数据，应该是目前市面上可以一次性输入最大token的厂商了。（可以通过API免费调用他家的最新大语言模型，包括视觉识别，并且是目前可以一次性传输最大量的输入token的厂商，推荐使用）
Doubao-1.5-pro(豆包 Pro，非开源！):模型使用 MoE 架构，并通过训练-推理一体化设计，探索模型性能和推理性能之间的极致平衡。Doubao-1.5-pro 仅用较小激活参数，即可比肩一流超大稠密预训练模型的性能，并在多个评测基准上取得优异成绩。值得注意的是，通过模型结构和训练算法优化，我们将 MoE 模型的性能杠杆提升至 7 倍，此前，业界的普遍水平为不到 3 倍。（目前国内非研发人员使用量最大厂商，听身边的朋友说使用起来还不错，在DeepSeek没火之前一直是国内下载量第一的，并且使用过字节的coze，体验效果不错）
hunyuan-turbos-20250226 (腾讯混元 Turbo S，速度优化，非开源！): “混元” 为腾讯公司的大模型品牌， “Turbo S” 和 “速度优化” 表明该版本可能侧重于提升推理速度和效率。“20250226” 是版本日期，非开源！适合需要腾讯系大模型支持，注重速度和效率的闭源用户。（近期广告投放过多了，哪都是腾讯混元）

二、大模型本地部署

主要介绍3种：LM Studio、Ollama、GPT4All

1. Ollama:（https://ollama.com/）

定位: 命令行优先的本地 LLM 运行工具，更注重灵活性和可定制性。
特点:
- 命令行界面 (CLI): 主要通过命令行进行操作，适合熟悉命令行的用户。
- 模型管理: 提供方便的命令来下载、管理和运行 LLM。
- 支持多种模型: 支持多种流行的开源 LLM，如 Llama 2、Mistral、Codellama 等。
- 自定义模型: 允许用户通过 Modelfile 定义和运行自定义模型。
- API 服务器: 可以启动一个 API 服务器，方便与其他应用集成。
- GPU 加速: 支持 GPU 加速。
- 跨平台: 支持 macOS、Linux 和 Windows (通过 WSL 2)。
- 开源: 完全开源，社区活跃。
- 相对较高的技术门槛: 更适合有一定技术基础的用户。
  部署教程：https://blog.csdn.net/star_nwe/article/details/143141025
  因为模型的地址在国外，如果下载过慢可以选择用魔塔社区的镜像地址下载：如：
  DeepSeek-R1:
  
  ollama run modelscope.cn/unsloth/DeepSeek-R1-Distill-Qwen-7B-GGUF

2. LM Studio:(https://lmstudio.ai/)

定位: 强调易用性和图形化界面的本地 LLM 运行环境。
特点:
- 图形化界面 (GUI): 提供直观的图形化界面，用户可以轻松下载、管理和运行各种开源 LLM。
- 内置聊天界面: 具有内置的聊天界面，可以直接与 LLM 交互，无需编写代码。
- 模型发现: 方便地浏览和发现 Hugging Face Hub 上的各种开源模型。
- 一键安装和运行: 简化了模型的安装和运行过程，降低了使用门槛。
- 本地推理服务器 (Local Inference Server): 可以启动一个本地服务器，通过兼容 OpenAI API 的方式访问 LLM，方便集成到其他应用。
- GPU 加速: 支持 GPU 加速，可以显著提高推理速度。
- 跨平台: 支持 Windows、macOS 和 Linux。
- 相对封闭的生态： 虽然支持很多开源模型，但用户不容易自己添加模型，自定义程度相对较低。
  部署教程：https://blog.csdn.net/hj960511/article/details/145390784

3. GPT4All:(https://gpt4all.io)

定位: 开源的本地 LLM 运行工具，强调易用性和 CPU 推理。
特点:
- 开源和免费： 完全免费，可以自由使用。
- 图形化界面 (GUI) 和命令行界面 (CLI)： 两种方式都支持。
- 内置聊天界面: 提供简单的聊天界面，方便与 LLM 交互。
- CPU 优化: 即使没有强大的 GPU，也可以在 CPU 上运行 LLM，降低了硬件要求。
- 模型支持: 支持多种流行的开源 LLM。
- 易于安装: 安装过程简单，开箱即用。
- 性能相对较低: 在 CPU 上运行 LLM 的速度通常比 GPU 慢。
- 相对不活跃： 相较于前两个，更新并不是很频繁

对比总结表格:

特性	LM Studio	Ollama	GPT4All
核心理念	易用性, GUI, 本地 LLM	灵活性, CLI, 本地 LLM	易用性, CPU 推理, 本地 LLM
主要功能	GUI, 聊天界面, 模型发现, 一键安装, 本地服务器	CLI, 模型管理, 自定义模型, API 服务器	GUI/CLI, 聊天界面, CPU 优化, 易于安装
适用场景	普通用户, 快速体验 LLM, 无需代码	技术用户, 自定义模型, 集成	普通用户, CPU 运行, 简单体验
技术要求	低	中等 (熟悉命令行)	低
GPU 加速	支持	支持	有限支持/更侧重CPU
跨平台	Windows, macOS, Linux	macOS, Linux, Windows (WSL2)	Windows, macOS, Linux
开源	否	是	是
生态	相对封闭	活跃开源社区	相对不活跃

如何选择：

LM Studio: 如果您是普通用户，希望以最简单的方式在本地运行 LLM，不需要编写代码，并且希望有一个友好的图形化界面，那么 LM Studio 是最佳选择。
Ollama: 如果您是技术用户，熟悉命令行，希望有更大的灵活性和可定制性，能够自己定义和运行模型，并且希望与其他应用集成，那么 Ollama 更适合。
GPT4All: 如果您的硬件资源有限，没有强大的 GPU，或者希望在 CPU 上运行 LLM，并且希望有一个简单易用的工具，那么 GPT4All 是一个不错的选择。

总之, 如果你注重易用性和图形界面, LM Studio 是首选. 如果你喜欢命令行和定制化, Ollama 更好. 如果你希望强调免费和 CPU 运行降低门槛, GPT4All 适合.

三、大模型(LLM)工具

这里主要介绍Langflow、Flowise、Dify、Coze、AutoGPT UI 和 AgentGPT

1、低代码 LLM 工作流构建器： Langflow 和 Flowise

都是基于 LangChain 的工作流工具，帮助开发者设计、构建并部署多步骤的 LLM 应用程序。二者的核心区别在于界面设计和功能的简洁性，Flowise 更加强调可视化设计。

Langflow：（https://www.langflow.org/）
Langflow 是一个基于 LangChain 的框架，专注于为 LLM（大语言模型）应用程序提供构建流式流程的能力。Langflow 使开发者能够构建对话流、自动化工作流和集成多种工具等，使得开发人员可以通过低代码的方式开发更加复杂的应用。

核心特点：
- 基于 LangChain：LangChain 是一个支持 LLM 应用程序开发的框架，Langflow 就是其上层封装，简化开发过程。
- 工作流和对话流构建：允许开发人员快速设计和部署多步的 LLM 应用程序，支持 API 调用、文件存储等多种操作。
- 可视化界面：允许通过图形化界面拖拽组件，来构建流程。
Flowise：（https://flowiseai.com/）
Flowise 是一个开源工具，帮助用户在没有编程背景的情况下，快速构建、管理和优化语言模型应用的工作流。类似于 Langflow，它也是基于 LangChain 构建的，但其目标是让用户可以通过图形化的方式设计工作流，尤其适合需要与多个外部数据源交互的应用场景。

核心特点：
- 拖拽式界面：通过可视化界面快速构建工作流。
- 多数据源支持：支持与 RESTful API、数据库、Webhooks 等进行集成。
- 集成 LLM：基于 LangChain，支持与 OpenAI、LlamaIndex、Pinecone 等流行工具的集成。
- 开放源码：免费开源，任何开发者都可以根据需要进行修改。

2、自主代理平台/工具：AutoGPT 和 AgentGPT

AutoGPT 和 AgentGPT：这两款产品都聚焦于自定义和自动执行任务，且支持代理的自主决策与执行。它们的核心区别在于 AutoGPT 更加关注自主学习和任务执行的自我改进能力，而 AgentGPT 强调任务灵活性和定制性。

AutoGPT：（https://agpt.co/）
AutoGPT 是一种自主代理系统，结合了大语言模型和一些自我强化学习机制，目标是实现完全的自动化应用。AutoGPT 可以根据用户的需求，主动执行任务并进行反馈，甚至可以进行自我改进。搭配AutoGPT UI使用

核心特点：
- 自主决策：自动化执行任务，无需人工干预。
- 持续学习：可以根据用户需求和环境变化不断学习和适应。
- 多任务支持：不仅可以用于对话生成，还可以处理如电子邮件、文档编写、网络抓取等任务。
AgentGPT：（https://agentgpt.reworkd.ai/zh）
AgentGPT 是一个自定义代理系统，能够通过提供用户输入并将其转化为操作任务，来帮助用户完成实际任务。与 AutoGPT 类似，AgentGPT 可以自动执行任务并进行调度，但它更强调任务的可定制性和执行逻辑的灵活性。

核心特点：
- 自定义代理：支持用户定义代理执行的具体任务，极大地提升灵活性。
- 多功能集成：支持与多种应用、API 的集成。
- 基于任务的模型：针对特定任务进行优化，执行效率较高。

3、LLM 应用开发平台：

相当于上面的结合体平台，功能更加全面，可以使用工作流构建也可以使用agent构建自己的LLM 应用
Dify 和 Coze：这两款工具都集成了大语言模型（LLM）和任务自动化功能，适合用来构建智能应用。Dify 更偏向于开发者进行智能应用的构建，而 Coze 则专注于团队协作和智能工作流管理。

Dify：（https://dify.ai）
Dify 是一个开放平台，致力于简化和加速开发智能应用。它集成了大语言模型（LLM），可以帮助开发者构建智能对话、推荐系统等应用。Dify 允许用户通过创建多步骤的工作流，来管理和调度任务。

核心特点：
- 多功能平台：不仅支持 LLM，还支持数据库和 API 调用。
- 自动化任务：通过工作流自动化调度和执行任务，提供智能决策支持。
- 集成外部数据源：可以与 REST API、Webhooks、数据库等集成。
Coze（扣子）：（https://www.coze.com/）
Coze 是一款 AI 驱动的协作工具，专注于智能工作流和自动化任务，支持多个人工智能应用的整合。它更像是一个能够在企业环境中使用的智能助手，帮助企业自动化日常流程和任务。

核心特点：
- 自动化任务调度：通过 AI 来自动化重复任务。
- 协作性强：多个用户可以一起在平台上共同完成任务。
- 集成多种工具：包括对话型 AI、邮件、日程管理等。

四、AI物联网实现方向

一般如果是企业落地场景一般推荐使用Dify进行搭建一个综合智能体应用，在通过API进行调用接入本地应用服务实现项目场景的落地

1.人工智能和物联网：

主要以图像识别为主，例如通过摄像头实现查询工厂内员工是否有正常穿戴工作服和头盔等图像识别功能等（通过视觉识别模型：Qwen2.5-VL-72B-Instruct、Gemini 2.0 Flash Thinking Experimental 01-21）

2.语言控制：

操作人员通过语音实现现场设备的控制，如：通过话筒说关闭1号设备，系统自动去关闭对应的1号设备；（通过调用语音识别模型，或者文本转语音在通过调用文本模型）

3.报表分析：

通过语音说查找某个报表，系统弹出跳转到指定页面，页面快速实现调出指定报表功能页面。（通过调用语音识别模型，或者文本转语音在通过调用文本模型）browser-use + 语音控制模型/deepseek（先把语音转文字）实现浏览器控制

4.知识检索：

在工程安装或者设备维修保养的时候，对着系统说查找某个设备的安装，系统自动调用对应设备的安装保养手册（通过调用语音识别模型，或者文本转语音在通过调用文本模型）

五、AI落地相关优秀项目：

1.Chat2DB ：https://chat2db-ai.com/resources/docs/start-guide/getting-started
a)Chat2DB 是一款AI first的数据管理、开发、分析工具，它的核心是AIGC（Artificial Intelligence Generation Code）能力，它可以将自然语言转换为SQL，也可以将SQL转换为自然语言，也可以自动生成报表，极大的提升人员的效率。通过一个产品可以实现数据管理、数据开发、数据分析的能力，即使不懂SQL的运营业务也可以使用快速查询业务数据、生成报表能力。

2.data-formulator：https://github.com/microsoft/data-formulator
微软雷德蒙研究院的研究员们开发的一款超实用的AI 工具——Data Formulator，这款工具巧妙地结合了图形化用户界面（就是咱们熟悉的点选、拖拽操作）和自然语言输入（比如直接打字告诉它你的需求），让用户能更轻松地向 AI 传达自己的想法。这样一来，无论是调整图表样式还是更新数据，AI 都能精准理解你的意图，一步步帮你完成复杂的可视化设计。简单来说，Data Formulator 就像是一个

Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
12张思维导图读懂《关键对话》蜜蜂学堂
你一定遇到过下列情况：·向上司提出你精心设计的方案，却被泼了一头冷水。·要求下属加班，下属以沉默相对抗。·和家人谈“开源节流”，他却只当是耳边风。·要邻居遵守公德，对方却依然我行我素。·要你的另一半浪漫些，对方却还是像根木头一样。·请朋友还钱，朋友却总是找各种借口推托。当你遇到这些情况时，你是沉默以对，还是尖刻批评，抑或拍案而起？别觉得灰心丧气，因为大部分人都和你一样，在面对难以解决却又会对生活产
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
Pktgen-DPDK：开源网络测试工具的深度解析与应用艾古力斯
本文还有配套的精品资源，点击获取简介：Pktgen-DPDK是基于DPDK的高性能流量生成工具，适用于网络性能测试、硬件验证及协议栈开发。它支持多种网络协议，能够模拟高吞吐量的数据包发送。本项目通过利用DPDK的高速数据包处理能力，允许用户自定义数据包内容，并实现高效的数据包管理与传输。文章将指导如何安装DPDK、编译Pktgen、配置工具以及使用方法，最终帮助开发者和网络管理员深入理解并优化网络
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息