AI专题精讲

FocalNet：焦点调制网络

摘要

我们提出了焦点调制网络（简称 FocalNets），在该网络中，自注意力（self-attention，SA）被完全替换为焦点调制模块，用于建模视觉中的 token 交互。焦点调制由三个组件组成：（i）焦点上下文化（focal contextualization），通过一组深度可分离卷积层实现，用于从短程到长程编码视觉上下文；（ii）门控聚合（gated aggregation），选择性地将上下文聚合到每个查询 token 的调制器中；（iii）逐元素仿射变换（element-wise affine transformation），将调制器注入查询中。大量实验证明，FocalNets 表现出非凡的可解释性（如图1所示），并在图像分类、目标检测和分割任务中，以相似的计算成本超越了 SoTA 的 SA 架构（如 Swin 和 Focal Transformers）。具体而言，tiny 和 base 规模的 FocalNets 在 ImageNet-1K 上分别达到 82.3% 和 83.9% 的 top-1 准确率。在以 224² 分辨率于 ImageNet-22K 上预训练后，分别在 224² 和 384² 分辨率微调时可达到 86.5% 和 87.3% 的 top-1 准确率。在使用 Mask R-CNN [29] 进行目标检测时，1× 训练的 FocalNet base 相比于 Swin 对应模型高出 2.1 个点，且已超过使用 3× 训练策略的 Swin（49.0 对 48.5）。在使用 UPerNet [90] 进行语义分割时，单尺度下的 FocalNet base 比 Swin 高出 2.4，在多尺度下也优于 Swin（50.5 对 49.7）。使用大型 FocalNet 和 Mask2former [13]，我们在 ADE20K 语义分割中达到了 58.5 的 mIoU，在 COCO 全景分割中达到了 57.9 的 PQ。使用巨型 FocalNet 和 DINO [106]，我们在 COCO minival 和 test-dev 上分别实现了 64.3 和 64.4 的 mAP，在更大规模的注意力模型（如 Swinv2-G [53] 和 BEIT-3 [84]）之上建立了新的 SoTA。这些令人振奋的结果表明，focal modulation 很可能正是视觉任务中所需要的关键模块。

1 引言

Transformers [79] 最初是为自然语言处理（NLP）提出的，自从开创性的 Vision Transformer（ViT）[22] 出现以来，已成为计算机视觉中的主流架构。其在图像分类 [75, 82, 89, 54, 108, 78]、目标检测 [3, 120, 114, 18]、分割 [80, 86, 14] 及其他任务 [45, 112, 4, 9, 81, 41] 中表现出了强大的潜力。在 Transformers 中，self-attention（SA）可以说是其成功的关键，因为它能实现依赖输入的全局交互，而卷积操作则限制在局部区域内，使用共享卷积核进行交互。尽管 SA 拥有上述优势，其效率问题仍受到广泛关注，尤其是在处理高分辨率输入时，其复杂度随视觉 token 数量呈二次增长。

为了解决这个问题，已有许多工作通过 token 粗化 [82]、窗口注意力 [54, 78, 108]、动态 token 选择 [60, 98, 59]，或混合方法 [95, 15] 提出了多种 SA 变体。与此同时，还有不少模型通过引入（深度可分离）卷积来增强 SA，以便在更好感知局部结构的同时捕捉长距离依赖关系 [89, 25, 94, 23, 21, 40, 7, 20]。

本工作旨在回答一个基础性的问题：是否存在比 SA 更优的方法，用于建模依赖输入的长距离交互？我们从对当前高级 SA 设计的分析入手。在图2左侧，我们展示了 ViTs [22] 和 Swin Transformer [54] 中常用的（基于窗口的）注意力机制，该机制在红色 query token 与其周围橙色 token 之间执行注意力操作。为了产生输出，SA 需要进行密集的 query-key 交互（红色箭头），随后是同样密集的 query-value 聚合（黄色箭头），这些都涉及 query 与空间上分布广泛的 token（上下文特征）之间的运算。然而，是否有必要执行如此密集的交互与聚合？

在本工作中，我们采用一种替代方法：首先围绕每个 query 焦点式地聚合上下文，然后用聚合的上下文自适应地调制 query。如图2右侧所示，我们可以简单地对输入应用与 query 无关的焦点聚合操作（如深度卷积），以在不同粒度层次上生成汇总的 token。随后，这些汇总 token 被自适应地聚合为一个 modulator，最后注入到 query 中。这种改进仍然可以实现依赖输入的 token 交互，但通过将聚合从各个 query 中解耦，大大简化了交互过程，从而使交互仅基于少量特征而变得轻量化。

我们的方法受到 focal attention [95] 的启发，后者通过多层次聚合来捕捉细粒度和粗粒度的视觉上下文。但我们的方法在每个 query 位置提取 modulator，并在 query 与 modulator 的交互上采用了更简单的方式。我们将这一新机制称为 Focal Modulation，并以此构建了一个无需注意力的架构：Focal Modulation Network，简称 FocalNet。

最后，我们在图像分类、目标检测和分割任务上进行了大量实验，结果显示我们的 FocalNet 在计算成本相当的情况下，持续且显著地超越 SoTA 的 SA 架构。值得注意的是，FocalNet 在使用 tiny 和 base 模型规模时，分别实现了 82.3% 和 83.9% 的 top-1 准确率，其吞吐量分别与 Swin 和 Focal Transformer 相当或翻倍。在 ImageNet-22K 上以 224² 分辨率预训练后，FocalNet 在 224² 和 384² 分辨率微调时分别实现了 86.5% 和 87.3% 的准确率，与 Swin 相比具有相当或更优的性能。

这一优势在迁移到密集预测任务时尤为明显。在 COCO [49] 上的目标检测任务中，我们的 tiny 和 base FocalNet 分别在 Mask R-CNN 1× 设置下实现了 46.1 和 49.0 的 box mAP，超过 Swin 在 3× 设置下的表现（46.0 和 48.5 的 box mAP）。在 ADE20k [118] 上的语义分割任务中，使用 base FocalNet 在单尺度评估中实现了 50.5 的 mIoU，优于 Swin 在多尺度评估中的表现（49.7 的 mIoU）。基于预训练的大型 FocalNet，我们在 ADE20K 上实现了 58.5 的 mIoU，在 COCO 全景分割任务中基于 Mask2former [12] 实现了 57.9 的 PQ。使用巨型 FocalNet 和 DINO [106]，我们在 COCO 的 minival 和 test-dev 上分别实现了 64.3 和 64.4 的 mAP，超越了如 Swinv2-G [53] 和 BEIT-3 [84] 等更大型的基于注意力的模型，在 COCO 上建立了新的 SoTA。请见图3中的视觉对比以及实验部分中的详细结果。

最后，我们在与 ViTs 相同的单体布局下应用了 Focal Modulation，并清晰展示了其在不同模型规模下的优越性。

2 相关工作

Self-attention（自注意力）
Transformer [79] 首次在 Vision Transformer（ViT）[22] 中引入到视觉任务中，通过将图像划分为一系列视觉 token。ViT 中的 self-attention（SA）策略在训练过程中使用优化的配方 [22, 75]，其性能已经超过了现代卷积神经网络（ConvNets），如 ResNet [30]。之后，提出了多尺度架构 [5, 82, 94]、轻量级卷积层 [89, 25, 46]、局部 self-attention 机制 [54, 108, 15, 95] 和可学习的注意力权重 [101]，这些方法都旨在提升性能并支持高分辨率输入。更多的综合性综述可见 [38, 27, 38]。我们的 focal modulation 与 SA 有显著不同，主要体现在：首先从不同粒度的层次聚合上下文，然后调制各个 query token，从而实现一种无需注意力的 token 交互机制。在上下文聚合方面，我们的方法受 focal attention [95] 启发。然而，focal modulation 中的上下文聚合是在每个 query 位置执行的，而不是在目标位置进行，并且是通过调制而非注意力进行处理。这些机制上的差异大大提高了效率和性能。另一个相关的工作是 Poolformer [100]，它使用池化操作来总结局部上下文，并通过简单的减法调整个别输入。尽管 Poolformer 在效率上表现不错，但在性能上却落后于像 Swin 这样的流行视觉 Transformer。正如我们所展示的，捕捉不同层次的局部结构是至关重要的。

MLP 架构
视觉 MLP 可以分为两类：（i）全局混合 MLP，如 MLP-Mixer [72] 和 ResMLP [74]，通过空间级别的投影进行视觉 token 之间的全局通信，并通过各种技术增强，如门控、路由和傅里叶变换 [51, 58, 70, 71]；（ii）局部混合 MLP，通过采样附近的 token 进行交互，使用空间位移、排列和伪核混合 [99, 32, 48, 8, 26]。最近，MixShift-MLP [113] 结合了局部和全局交互，类似于 focal attention [95] 的思想。MLP 架构和我们的 focal modulation 网络都不依赖于注意力。然而，focal modulation 通过多层次的上下文聚合自然地捕捉短距离和长距离的结构，因此在精度和效率的权衡上表现更好。

卷积
卷积神经网络（ConvNets）是深度神经网络在计算机视觉领域复兴的主要驱动力。自从 VGG [63]、InceptionNet [67] 和 ResNet [30] 出现以来，该领域发展迅速。聚焦于卷积网络效率的代表性工作包括 MobileNet [33]、ShuffleNet [111] 和 EfficientNet [69]。另一类工作则致力于将全局上下文融入到卷积网络中，以弥补其不足，如 SE-Net [35]、Non-local Network [85]、GCNet [2]、LR-Net [34] 和 C3Net [97] 等。引入动态操作是增强卷积网络的另一种方式，例如 Involution [43] 和 DyConv [10]。近年来，卷积神经网络也通过两个方面“反击”：（i）卷积层与 SA 结合并带来了显著的性能提升 [89, 25, 46, 23]，或反之 [76]；（ii）通过使用类似的数据增强和正则化策略，ResNet 缩小了与 ViT 的差距 [88]，并且将 SA 替换为（动态）深度卷积 [28, 55] 也能稍微超越 Swin。我们的 focal modulation 网络也利用了深度卷积作为微架构，但通过引入多层次的上下文聚合和依赖输入的调制，超越了传统卷积网络。我们将展示这一新模块在性能上远超原始的卷积网络。

3 焦点调制网络

3.1 从 Self-Attention 到 Focal Modulation

给定一个视觉特征图 $\mathbf{X} \in \mathbb{R}^{H \times W \times C}$ 作为输入，一个通用的编码过程为每个视觉 token（查询） $\pmb { x } _ { i } \in \mathbb { R } ^ { C }$ 生成一个特征表示 $\pmb{y}_i \in \mathbb{R}^{C}$ ，通过与其周围环境（例如，邻近的 tokens）交互的过程 $\mathcal{T}$ 和在上下文上的聚合过程 $\mathcal{M}$ 。

Self-Attention（自注意力）
Self-Attention 模块使用后聚合过程，公式为：
$\pmb { y } _ { i } = \mathcal { M } _ { 1 } ( \mathcal { T } _ { 1 } ( \pmb { x } _ { i } , \pmb { X } ) , \pmb { X } )\quad(1)$

其中，聚合 $\mathcal{M}_1$ 是在计算查询和目标之间的注意力得分（通过交互 $\mathcal{T}_1$ ）后，基于上下文 $\mathbf{X}$ 进行的。

Focal Modulation（焦点调制）
相比之下，Focal Modulation 通过一个早期的聚合过程生成精细的表示 $\bf y }_i$ ，公式为：
$\pmb { y } _ { i } = T _ { 2 } ( \mathcal { M } _ { 2 } ( i , \mathbf { X } ) , \pmb { x } _ { i } ) \quad(2)$
在这里，上下文特征首先使用 $\mathcal{M}_2$ 在每个位置 $i$ 聚合，然后查询通过 $\mathcal{T}_2$ 与聚合后的特征进行交互，形成最终的表示 $\bf y }_i$ 。

通过比较式（1）和式（2），我们可以看到以下几点：
(i) Focal Modulation 的上下文聚合操作 $\mathcal{M}_2$ 通过共享操作符（例如，深度卷积）进行上下文计算，从而减少计算量；而 Self-Attention 中的聚合操作 $\mathcal{M}_1$ 则更加计算密集，因为它需要对不可共享的注意力得分进行求和，或者在不同查询之间进行求和；
(ii) 交互过程 $\mathcal{T}_2$ 是一个轻量级的操作，仅涉及 token 和其上下文之间的交互，而 Self-Attention 中的交互过程 $\mathcal{T}_1$ 涉及计算 token 之间的注意力得分，其复杂度是二次的。

基于式（2），我们将我们的 Focal Modulation 实现为：
$\pmb { y } _ { i } = q ( \pmb { x } _ { i } ) \odot m ( i , \pmb { X } )\quad(3)$
其中， $q(\cdot)$ 是查询投影函数， $\odot$ 是逐元素相乘操作。 $m(\cdot)$ 是上下文聚合函数，其输出被称为调制器（modulator）。图 4(a) 和 (b) 比较了 Self-Attention 和 Focal Modulation。所提出的 Focal Modulation 具有以下有利特性：

平移不变性：由于 $q(\cdot)$ 和 $m(\cdot)$ 始终围绕查询 token $i$ 进行计算，且不使用位置嵌入，因此调制操作对输入特征图 $\mathbf{X}$ 的平移具有不变性。
显式输入依赖性：调制器是通过 $m(\cdot)$ 计算的，该过程通过聚合目标位置 $i$ 周围的局部特征来进行，因此我们的 Focal Modulation 显式地依赖于输入。
空间和通道特异性：目标位置 $i$ 作为 $m(\cdot)$ 的指针使得调制具有空间特异性。逐元素相乘操作使得调制具有通道特异性。
解耦的特征粒度： $q(\cdot)$ 保留了个别 tokens 的最精细信息，而 $m(\cdot)$ 提取了更粗的上下文信息。它们在调制过程中解耦，但通过调制结合在一起。

接下来，我们将详细描述式（3）中 $m(\cdot)$ 的实现。

3.2 通过 m(·) 的上下文聚合

已经证明，短距离和长距离的上下文对视觉建模都很重要[95, 21, 55]。然而，单一的大接收域聚合不仅在时间和内存上计算开销较大，而且还会破坏局部的精细结构，而这些局部结构对于密集预测任务尤其重要。受到[95]的启发，我们提出了一种多尺度分层上下文聚合方法。如图4©所示，聚合过程包括两个步骤：分层上下文化以从局部到全局范围提取不同粒度的上下文，以及门控聚合以将不同粒度级别的所有上下文特征压缩到调节器中。
步骤1：分层上下文化。
给定输入特征图 X，我们首先通过一个线性层将其投影到一个新的特征空间中，得到 $\mathbf { Z } ^ { 0 } =f _ { z } ( \mathbf { X } ) \in \mathbb { R } ^ { H \times W \times C } .$ 。然后，使用一系列 L 个深度卷积堆叠，获得上下文的分层表示。在焦点层 $\ell \in \{ 1 , . . . , L \}$ ，输出 $\bf Z } ^ { \ell }$ 由以下公式得出：
$\mathbf { Z } ^ { \ell } = f _ { a } ^ { \ell } ( \mathbf { Z } ^ { \ell - 1 } ) \triangleq \mathsf { G e L U } ( \mathsf { D W C o n v } ( \mathbf { Z } ^ { \ell - 1 } ) ) \in \mathbb { R } ^ { H \times W \times C }\quad(4)$

温馨提示：
阅读全文请访问"AI深语解构" FocalNet：焦点调制网络

英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
重复文件清理工具，附免费链接 mixiumixiu 其他
链接:https://pan.baidu.com/s/1s_Zx1eHp5Y-XnbbGldIgvw?pwd=kjex提取码:kjex复制这段内容后打开百度网盘手机App，操作更方便哦
【三桥君】AI技术发展下，单智能体局限性凸显，如何通过MCP和A2A协议实现智能体团队协作转变？
你好，我是✨三桥君✨本文介绍>>一、引言在AI技术突飞猛进的今天，单智能体的局限性正日益暴露，而智能体（AIAgents）协作已然成为不可逆转的趋势。你是否曾思考过，如何通过MCP和A2A协议实现智能体从单兵作战到团队协作的革命性转变？本文三桥君将深入探讨MCP和A2A协议的核心功能与优势，帮助你全面理解智能体协作的无限可能。二、A2A与MCP协议作用MCP（ModelControlProtoco
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc