双木的木

架构师炼丹炉 | 大语言模型引擎全解析：Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama

本文来源公众号“架构师炼丹炉”，仅用于学术分享，侵权删，干货满满。

原文链接：大语言模型引擎全解析：Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama

本文将带你深入了解 Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama 这些引擎，帮助你找到最适合的工具，释放大语言模型的全部潜力！

一、Transformers 引擎：NLP领域的全能王者

开发者：Hugging Face

核心特色：作为当下最炙手可热的开源NLP库，Transformers堪称NLP领域的“瑞士军刀”，它支持数百种预训练模型，涵盖GPT、BERT、T5等知名模型，从模型加载、微调，到推理，提供了一站式解决方案。

显著优势：

兼容性强：完美适配PyTorch和TensorFlow，为开发者提供更多选择。
生态繁荣：拥有活跃的社区，丰富的模型库与完善的文档，无论是初学者入门，还是专家深入研究，都能从中获益。
应用广泛：适用于从学术研究到工业生产的各类NLP任务。
适用场景：当你需要快速实现文本分类、生成、翻译等任务时，Transformers是不二之选，能助力你轻松实现NLP应用落地。

二、vLLM 引擎：GPU推理的性能巅峰

开发者：UC Berkeley研究团队

核心特色：vLLM专注于大语言模型推理，凭借创新的内存管理技术（如PagedAttention），大幅提升GPU利用率与推理速度，堪称GPU推理的“性能怪兽”。

显著优势：

性能卓越：极致的推理速度，能够满足大规模部署需求。
内存高效：高效的内存管理，支持更大的模型批次处理。
场景适配：专为GPU优化，在高并发场景中表现出色。

适用场景：若你需在生产环境部署大语言模型，并追求极致性能，vLLM无疑是最佳选择，它能提升模型推理速度，降低硬件成本。

三、Llama.cpp 引擎：CPU上的轻量化先锋

开发者：社区项目

核心特色：Llama.cpp基于C++实现，专为运行Meta的LLaMA模型而生，通过优化计算与内存管理，让大模型在CPU上运行成为现实，是CPU设备上的“轻量级王者”。

显著优势：

轻量运行：无需GPU，在普通CPU设备上即可运行。
灵活部署：适合资源受限环境，如嵌入式设备、低配服务器。
开源拓展：开源特性使其易于扩展和定制。
适用场景：当设备无GPU资源，却需运行大语言模型时，Llama.cpp是理想之选，让普通设备也能体验大语言模型的强大。

四、SGLang 引擎：高效推理的潜力新星

开发者：未知

核心特色：SGLang专注高效推理，可能运用稀疏计算、分布式优化等技术提升性能，虽充满神秘感，但潜力无限。

显著优势：

场景优化：针对特定场景深度优化，显著提升推理效率。
企业适配：适合对高性能推理有需求的企业级应用。
适用场景：在大规模分布式环境中运行大语言模型，SGLang值得一试，是探索未来推理技术的重要窗口。

五、MLX 引擎：高效计算的未来之光

开发者：未知

核心特色：MLX可能是针对大语言模型优化的机器学习框架，聚焦高效计算与推理，是高效计算领域的“未来之星”。

显著优势：

硬件适配：可能针对TPU或定制芯片等特定硬件进行优化。
效率优先：适用于追求极致计算效率的场景。
适用场景：若需在特定硬件上运行大语言模型，MLX值得关注，其潜在的硬件优化能力，有望引领未来高效计算。

六、Ollama：本地大模型运行的便捷之选

开发者：社区项目

核心特色：Ollama是本地运行大语言模型的利器，支持LLaMA、GPT等多种模型，简化模型部署与运行流程。

显著优势：

简单易用：操作简便，适合个人用户与开发者。
本地运行：无需云端资源，完全在本地设备实现模型运行。
模型丰富：支持多种模型，使用灵活。
适用场景：若想在个人设备上测试或运行大语言模型，Ollama是绝佳选择，助你摆脱云端依赖，随时体验大模型魅力

七、指标对比

1. 性能对比

引擎	性能特点	硬件支持	适用模型规模
Transformers	通用性强，性能中等，适合中小规模模型推理和训练。	CPU/GPU	中小规模模型
vLLM	高性能推理，通过 PagedAttention 等技术优化 GPU 内存和计算效率。	GPU	大规模模型
Llama.cpp	针对 CPU 优化，性能中等，适合资源受限的环境。	CPU	中小规模模型
SGLang	可能通过稀疏计算或分布式优化提升性能，具体性能取决于实现。	未知（可能 GPU）	中大规模模型
MLX	可能针对特定硬件（如 TPU 或定制芯片）优化，性能潜力高。	特定硬件	中大规模模型
Ollama	性能中等，适合本地运行，无需高性能硬件。	CPU/GPU	中小规模模型

总结:

vLLM 在 GPU 上的推理性能最优，适合大规模模型。
Llama.cpp 和 Ollama 适合在 CPU 或低配设备上运行中小规模模型。
SGLang 和 MLX 的性能潜力较大，但需要更多实践验证。

2. 并发能力对比

引擎	并发支持	适用场景
Transformers	支持多线程和多 GPU 推理，但并发能力受限于框架和硬件。	中小规模并发任务
vLLM	高并发支持，通过内存优化和批处理技术显著提升并发性能。	高并发推理任务
Llama.cpp	并发能力有限，适合低并发场景。	单任务或低并发任务
SGLang	可能通过分布式计算支持高并发，具体能力取决于实现。	中高并发任务
MLX	可能针对高并发优化，具体能力取决于硬件和实现。	中高并发任务
Ollama	并发能力中等，适合本地低并发任务。	单任务或低并发任务

总结:

vLLM 在高并发场景下表现最佳，适合生产环境。
Transformers 和 SGLang 适合中等并发任务。
Llama.cpp 和 Ollama 更适合单任务或低并发场景。

3. 适用场景对比

引擎	适用场景	优势
Transformers	研究、开发、中小规模生产环境。	功能全面，社区支持强大，适合多种 NLP 任务。
vLLM	大规模模型推理、高并发生产环境。	极致性能，高效内存管理，适合企业级应用。
Llama.cpp	资源受限环境（如嵌入式设备、低配服务器）。	轻量级，无需 GPU，适合低成本部署。
SGLang	中大规模模型推理、分布式计算环境。	可能通过优化提升性能，适合探索性项目。
MLX	特定硬件环境（如 TPU 或定制芯片）。	可能针对硬件优化，适合高性能计算场景。
Ollama	本地开发、测试、个人使用。	简单易用，无需云端资源，适合个人用户。

总结:

Transformers 是通用性最强的工具，适合大多数 NLP 任务。
vLLM 是企业级高并发场景的首选。
Llama.cpp 和 Ollama 适合个人开发者或资源受限的环境。
SGLang 和 MLX 适合需要高性能或特定硬件支持的场景。

4. 硬件兼容性对比

引擎	硬件支持	适用设备类型
Transformers	CPU/GPU	普通服务器、个人电脑、云服务器
vLLM	GPU	高性能 GPU 服务器
Llama.cpp	CPU	低配设备、嵌入式设备
SGLang	未知（可能 GPU）	高性能服务器
MLX	特定硬件	TPU、定制芯片等
Ollama	CPU/GPU	个人电脑、普通服务器

总结:

Transformers 和 Ollama 兼容性最强，支持多种设备。
vLLM 和 SGLang 需要高性能 GPU 或服务器。
Llama.cpp 适合低配设备，而 MLX 需要特定硬件支持。

八、每秒输出token对比

1. 性能影响因素

在对比 TPS 之前，需要明确影响性能的关键因素：

硬件性能: GPU 的算力、显存带宽、显存容量等。
模型规模: 参数量越大，推理速度越慢。
批处理大小（Batch Size）: 较大的批处理可以提高吞吐量，但会增加显存占用。
引擎优化: 不同引擎在内存管理、计算优化等方面的表现差异显著。

2. GPU 性能对比

以下是 A800、A100 和 H100 的主要参数对比：

GPU 型号	FP32 算力 (TFLOPS)	显存容量 (GB)	显存带宽 (TB/s)	适用场景
A800	19.5	40/80	2.0	推理、训练
A100	19.5	40/80	2.0	高性能计算、AI 训练
H100	30.0	80	3.35	高性能推理、AI 训练

H100 是目前性能最强的 GPU，适合高吞吐量和高并发场景。
A100 和 A800 性能接近，但 A800 主要针对中国市场，符合出口管制要求。

3. 引擎 TPS 对比

以下是各引擎在不同 GPU 上的 预估 TPS（以 LLaMA-13B 模型为例）：

引擎	A800 (TPS)	A100 (TPS)	H100 (TPS)	备注
Transformers	50-100	60-120	80-150	性能中等，适合中小规模推理。
vLLM	200-400	300-600	500-1000	高性能推理，优化显存和批处理。

说明:

vLLM 在高性能 GPU（如 H100）上的表现最佳，TPS 可达 500-1000，远超其他引擎。
Transformers 性能中等，适合通用场景。
Llama.cpp 和 Ollama 性能较低，适合资源受限的环境。
SGLang 和 MLX 的性能数据较少，需进一步测试。

九、这里简单介绍一下 Xinference 安装

Xinference 在 Linux, Windows, MacOS 上都可以通过 pip 来安装。如果需要使用 Xinference 进行模型推理，可以根据不同的模型指定不同的引擎。

如果你希望能够推理所有支持的模型，可以用以下命令安装所有需要的依赖：

pipinstall"xinference[all]"

备注

如果你想使用 GGML 格式的模型，建议根据当前使用的硬件手动安装所需要的依赖，以充分利用硬件的加速能力。更多细节可以参考 Llama.cpp 引擎这一章节。

如果你只想安装必要的依赖，接下来是如何操作的详细步骤。

Transformers 引擎

PyTorch(transformers) 引擎支持几乎有所的最新模型，这是 Pytorch 模型默认使用的引擎：

pipinstall"xinference[transformers]"

vLLM 引擎

vLLM 是一个支持高并发的高性能大模型推理引擎。当满足以下条件时，Xinference 会自动选择 vllm 作为引擎来达到更高的吞吐量：

模型格式为 pytorch ， gptq 或者 awq 。
当模型格式为 pytorch 时，量化选项需为 none 。
当模型格式为 awq 时，量化选项需为 Int4 。
当模型格式为 gptq 时，量化选项需为 Int3 、 Int4 或者 Int8 。
操作系统为 Linux 并且至少有一个支持 CUDA 的设备
自定义模型的 model_family 字段和内置模型的 model_name 字段在 vLLM 的支持列表中。

目前，支持的模型包括：

llama-2, llama-3, llama-2-chat, llama-3-instruct
baichuan, baichuan-chat, baichuan-2-chat
internlm-16k, internlm-chat-7b, internlm-chat-8k, internlm-chat-20b
mistral-v0.1, mistral-instruct-v0.1, mistral-instruct-v0.2, mistral-instruct-v0.3
codestral-v0.1
Yi, Yi-1.5, Yi-chat, Yi-1.5-chat, Yi-1.5-chat-16k
code-llama, code-llama-python, code-llama-instruct
deepseek, deepseek-coder, deepseek-chat, deepseek-coder-instruct
codeqwen1.5, codeqwen1.5-chat
vicuna-v1.3, vicuna-v1.5
internlm2-chat
qwen-chat
mixtral-instruct-v0.1, mixtral-8x22B-instruct-v0.1
chatglm3, chatglm3-32k, chatglm3-128k
glm4-chat, glm4-chat-1m
qwen1.5-chat, qwen1.5-moe-chat
qwen2-instruct, qwen2-moe-instruct
gemma-it
orion-chat, orion-chat-rag
c4ai-command-r-v01

安装 xinference 和 vLLM：

pipinstall"xinference[vllm]"

Llama.cpp 引擎

Xinference 通过 llama-cpp-python 支持 gguf 和 ggml 格式的模型。建议根据当前使用的硬件手动安装依赖，从而获得最佳的加速效果。

初始步骤：

pipinstallxinference

不同硬件的安装方式：

Apple M系列

CMAKE_ARGS="-DLLAMA_METAL=on"pipinstallllama-cpp-python

英伟达显卡：

CMAKE_ARGS="-DLLAMA_CUBLAS=on"pipinstallllama-cpp-python

AMD 显卡：

CMAKE_ARGS="-DLLAMA_HIPBLAS=on"pipinstallllama-cpp-python

SGLang 引擎

SGLang 具有基于 RadixAttention 的高性能推理运行时。它通过在多个调用之间自动重用KV缓存，显著加速了复杂 LLM 程序的执行。它还支持其他常见推理技术，如连续批处理和张量并行处理。

初始步骤：

pipinstall'xinference[sglang]'

十、Xinference 环境变量

XINFERENCE_ENDPOINT

Xinference 的服务地址，用来与 Xinference 连接。默认地址是 http://127.0.0.1:9997，可以在日志中获得这个地址。

XINFERENCE_MODEL_SRC

配置模型下载仓库。默认下载源是 “huggingface”，也可以设置为 “modelscope” 作为下载源。

XINFERENCE_HOME

Xinference 默认使用 /.xinference 作为默认目录来存储模型以及日志等必要的文件。其中是当前用户的主目录。可以通过配置这个环境变量来修改默认目录。

XINFERENCE_HEALTH_CHECK_ATTEMPTS

Xinference 启动时健康检查的次数，如果超过这个次数还未成功，启动会报错，默认值为 3。

XINFERENCE_HEALTH_CHECK_INTERVAL

Xinference 启动时健康检查的时间间隔，如果超过这个时间还未成功，启动会报错，默认值为 3。

XINFERENCE_DISABLE_HEALTH_CHECK

在满足条件时，Xinference 会自动汇报worker健康状况，设置改环境变量为 1可以禁用健康检查。

XINFERENCE_DISABLE_VLLM

在满足条件时，Xinference 会自动使用 vLLM 作为推理引擎提供推理效率，设置改环境变量为 1可以禁用 vLLM。

XINFERENCE_DISABLE_METRICS

Xinference 会默认在 supervisor 和 worker 上启用 metrics exporter。设置环境变量为 1可以在 supervisor 上禁用 /metrics 端点，并在 worker 上禁用 HTTP 服务（仅提供 /metrics 端点）

THE END !

文章结束，感谢阅读。您的点赞，收藏，评论是我继续更新的动力。大家有推荐的公众号可以评论区留言，共同学习，一起进步。

你可能感兴趣的:(Transformer专栏,深度学习拓展阅读,语言模型,人工智能,自然语言处理,transformer,llama,算法,chatgpt)

day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
日更50天有什么收益？星湾二宝
坚持在平台上日更50天了，平台也为我生成了日更50天徽章，小开心一下这份坚持。日更50天徽章那坚持50天都有哪些收益呢？收益一，就是最直观的那些钻和贝，我这边确实不太高，但是这些贝足够支撑我保持会员的资格，能够在发文的时候帮助友友们去除广告，方便阅读。钻和贝收益二，文章的收获，日更50天，坚持写作3.7万文字，书写的文字也从开始的流水账/碎碎念逐渐加入自己的思考和观点。以前，一个念头会一晃而过，如
MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
学生把我的课件换成小三认罪书(赵书晴宋诗月)全集阅读_学生把我的课件换成小三认罪书最新章节阅读_赵书晴宋诗月(学生把我的课件换成小三认罪书)全本免费在线阅读_(学生把我的课件换成小三认罪书)完结... 笔趣阁热门小说
学生把我的课件换成小三认罪书(赵书晴宋诗月)全集阅读_学生把我的课件换成小三认罪书最新章节阅读_赵书晴宋诗月(学生把我的课件换成小三认罪书)全本免费在线阅读_(学生把我的课件换成小三认罪书)完结版免费在线阅读_学生把我的课件换成小三认罪书(赵书晴宋诗月)完整版免费阅读_(学生把我的课件换成小三认罪书)全章节免费在线阅读主角配角：赵书晴宋诗月简介：我和赵京立去了民政局提交了申请因为离婚冷静期，还要再
读张萌萌姐《从受欢迎到被需要》第一章读书总结韩静_Han
我是@张萌-萌姐#从受欢迎到被需要#读书会10班的书记官韩静我们的领读者是@郝美-菱这是今天的读书总结通过第一章的阅读，对高情商和自我介绍有了新的认知。思考题复盘：“我是谁，我需要什么，我能提供什么”【我是谁】我叫韩静，在房地产行业工作5年，现担任行政经理一职，是一位个子小却很坚强很拼的女生。【我能提供什么】️用自己减重26斤的经验帮助需要的人健康减肥️能提供房地产购房等方面的知识和问题️早起陪伴
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
最佳好女婿赵倩王城(精彩热门小说)最佳好女婿赵倩王城&全集目录免费阅读海边书楼
最佳好女婿赵倩王城(精彩热门小说)最佳好女婿赵倩王城&全集目录免费阅读主角：赵倩王城简介：女人叫赵倩，三十八岁，很漂亮，----阅读全文小说内容请翻阅文章最底部---王城根本没有想到，女友的妈妈在自乐的时候，叫的竟然是自己的名字。女人叫赵倩，三十八岁，很漂亮，腰很细，腿很长，王城有些怪异赵倩为什么会放过自己，但赵倩没有发怒，却也让王城长长的舒了一口气，坐到沙发上点了根烟抽了起来。“王城，什么时候回
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
在人间(阿伟林秀芳柳娇娇)全本免费在线阅读_人间乐事全文阅读《人间芳韵》一米文库2
在人间(阿伟林秀芳柳娇娇)全本免费在线阅读_人间乐事全文阅读《人间芳韵》主角配角：阿伟林秀芳柳娇娇小说别名：在人间、人间乐事、人间芳韵简介：和美艳寂寞的小姨上山，不小心被她女儿看到……关注微信公众号【一米文库】回复书号【1017】即可阅读小说【在人间】全文内容！！！【戳我继续阅读】“嗯~~阿伟，你好强壮……”芳姨喝多了酒，被我搀扶着艰难的往卧室走去。她身上香喷喷的，温香软玉靠在我身上，性感的红唇几
青云官道庄岩柳琴免费完结版小说_已完结小说推荐青云官道(庄岩柳琴) d036fb3b3d05
《青云官道》主角：庄岩柳琴，简介：小科员庄岩，因一纸调研报告被副市长赏识，本以为能够就此走上人生巅峰，结果副市长就被双规！不过庄岩非但没有被牵连，反而拿着副市长留下的东西，不仅抱得美人，还平步青云，扶摇而上九万里！关注微信公众号【夏至文馆】去回复个书号【1190】即可阅读小说【青云官道】全文内容！！！小庄，现在几点了？”富丽堂皇的客厅里，一个身穿旗袍的美妇紧张的来回的踱步！“夫人，11点57。”站
语文教学反思 ——一单元测试一抹_绿茶香
我喜欢上语文课，现在最开心的时刻也就是课上那45分钟了。它可以让我和孩子们骑上骏马驰骋在知识的草原上，可以让我们乘着巨轮在书籍的海洋里任意航行……周三举行了一单元测试，今晚一单元的所有内容暂时告一段落。对于这单元我有如下思考：本单元的主题词是“读书”，几篇课文都是围绕着读书来编排的。里面有讲读书乐趣的，讲读书方法的，还有孩子们第一次接触的访谈录等。微笑班级从一年级下学期就开始阅读“闲书”，所以教学
替身贵妃将我扒光沉塘，暴君杀红了眼陆知白李双儿全本免费小说阅读_最新完本小说替身贵妃将我扒光沉塘，暴君杀红了眼(陆知白李双儿) 多多文馆
《替身贵妃将我扒光沉塘，暴君杀红了眼》主角：陆知白李双儿简介：我是贫门农女，也是暴君爱而不得的白月光。为逼我入宫，他将我满村屠尽！暴君在后宫建了一座水晶殿，将我禁锢其中。他日日宠幸我，直至寻到一个与我七分相似的替身，方才淡了兴致。他将替身封为贵妃，千娇万宠一言可戏诸侯。贵妃恃宠生娇，趁着暴君出宫巡视，带着一群人闯进水晶殿。“本宫马上就要受封为后，今天就来清理后宫！”她在我脸上刻奴字，挑断我的手筋脚
听覃杰007写作精进课第五天分享心得曹端春
早上听覃老大直播007写作精进课程第五天，获益良多。关于写作的黄金三法：多读，多写，多动，确实说到了写作的真谛。一，多读，扩大阅读面，精读相关经典作家的经典作品，逐步构建自己的知识体系；阅读方面推荐指读法，这是聪明人用的笨办法，读本离眼睛远些，可让视野更开阔些，能提高30％的速度；二，多写，象高手一样靠汗水写作，写不出来硬写，找准自己的定位，在一个行业内了解100个关键词，输出糸列文章，并且多分享
我不想再当知识的搬运工楚煜楚尧
因为学校课题研究的需要，这个暑假我依然需要完成一本书的阅读笔记。我选的是管建刚老师的《习课堂十讲》。这本书，之前我读过，所以重读的时候，感到很亲切，摘抄起来更是非常得心应手。20页，40面，抄了十天，终于在今天大功告成了。这对之前什么事都要一拖再拖的我来说，是破天荒的改变。我发现至从认识小尘老师以后，我的确发生了很大的改变。遇到必须做却总是犹豫不去做的事，我学会了按照小尘老师说的那样，在心里默默数
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
[spring6: Mvc-网关]-源码解析
推荐阅读：[spring6:Mvc-函数式编程]-源码解析GatewayServerMvcAutoConfiguration@AutoConfiguration(after={HttpClientAutoConfiguration.class,RestTemplateAutoConfiguration.class,RestClientAutoConfiguration.class,FilterAu
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
量子计算解决气候变化：科学家找到了新方法大力出奇迹985 量子计算
气候变化已成为全球面临的严峻挑战，传统计算方法在应对与之相关的复杂问题时存在诸多局限。而量子计算作为新兴技术，为解决气候变化难题带来曙光。本文深入剖析科学家利用量子计算应对气候变化的新方法。量子计算凭借独特的量子比特与量子特性，在加速气候模型计算、优化模型参数、预测极端天气事件等方面展现出巨大优势。同时，在可再生能源整合、电网管理、碳捕获等实际应用场景中也发挥着重要作用。尽管目前面临硬件和算法等方
已完结小说--《破产后，上门老公成了我的金主》唐安然贺知州--全文免费阅读兔子爱阅读
已完结小说--《破产后，上门老公成了我的金主》唐安然贺知州--全文免费阅读主角：唐安然贺知州简介：想了你很久了......”夜色里，男人肆无忌惮的吻着我。他是我的上门老公。一次醉酒，我被他睡了，事情闹得很大。于是我这个金贵的千金小姐不得不让他这个落魄小子入赘我们家，成为我的老公。因为心里的不甘，我屡屡羞辱他，作践他，对他非打即骂。可他从不生气，俨然一副温顺贤良的模样。而就在我慢慢喜欢上他时，他却向
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite