AI专题精讲

Nystromformer：一种基于 Nyström 方法的自注意力近似算法

1. 摘要

Transformer 已经成为广泛自然语言处理任务中的强大工具。推动 Transformer 展现出卓越性能的一个关键组件是 self-attention 机制，它对每个 token 编码了其他 token 的影响或依赖关系。虽然 self-attention 机制具有诸多优势，但其在输入序列长度上的二次复杂度限制了其在较长序列上的应用 —— 这是当前社区积极研究的一个主题。

为了解决这一限制，我们提出了 Nystromformer —— 一个在序列长度方面具有良好可扩展性的模型。我们的方法基于将 Nyström 方法应用于标准 self-attention 的近似，从而将其复杂度降低为 $O (n)$ 。Nystromformer 的可扩展性使其能够应用于包含上千个 token 的长序列。

我们在 GLUE 基准和 IMDB 评论等下游任务中，以标准序列长度进行了评估，发现 Nystromformer 的性能与标准 self-attention 可比，有时甚至略优。在长序列任务的 Long Range Arena（LRA）基准中，Nystromformer 相较于其他高效 self-attention 方法表现更优。

我们的代码已开源：https://github.com/mlpen/Nystromformer

2. 引言

基于 Transformer 的模型，如 BERT（Devlin 等，2019）和 GPT-3（Brown 等，2020），在自然语言处理（NLP）领域取得了巨大成功，在机器翻译（Vaswani 等，2017）、自然语言推理（Williams, Nangia, and Bowman，2018）、文本复述（Dolan and Brockett，2005）、文本分类（Howard and Ruder，2018）、问答系统（Rajpurkar 等，2016）以及许多其他任务中都达到了最先进的性能（Peters 等，2018；Radford 等，2018）。

Transformer 的一个核心特性是 self-attention 机制（Vaswani 等，2017），它允许每个 token 的表示来自所有其他 token 的组合。Self-attention 支持整个序列中 token 对之间的交互，并被证明非常有效。

尽管 self-attention 机制具有上述优点，它也成为了效率上的主要瓶颈，因为其在内存和时间上的复杂度为 $O(n^2)$ ，其中 $n$ 是输入序列的长度。这导致在训练大型 Transformer 模型时需要非常高的内存和计算资源。例如，训练一个 BERT-large 模型（Devlin 等，2019）在单张 Tesla V100 GPU 上需要 4 个月（相当于在一个 4x4 TPU pod 上训练 4 天）。此外， $O(n^2)$ 的复杂度使得训练包含长序列（如 $n = 2048$ ）的大型 Transformer 成本高昂，难以承受。

为了解决这一挑战，最近一些工作提出了在处理长序列输入时避免二次成本的策略。例如，Dai 等（2019）提出了在内存和计算效率之间进行权衡的方案；Child 等（2019）、Kitaev, Kaiser 和 Levskaya（2019）将 self-attention 的复杂度分别降低为 $\sqrt{n})$ 和 $\log n)$ ；而 Shen 等（2018b）、Katharopoulos 等（2020）和 Wang 等（2020）通过不同的近似策略将复杂度降低为 $O (n)$ ，每种方法都有其优点和局限性。

在本文中，我们提出了一种在内存和时间上都为 $O (n)$ 的 self-attention 近似方法。我们提出的模型 Nystromformer 能够在输入序列长度 $n$ 上实现线性扩展。这一性能的实现得益于著名的 Nyström 方法，我们将其重新设计用于 self-attention 的近似。具体而言，我们的 Nystromformer 算法使用 landmark（或 Nyström）点 来重构 self-attention 中的 softmax 矩阵，从而避免了直接计算 $\times n$ 的 softmax 矩阵。我们证明，这种方式能够很好地近似真实的 self-attention。

为了评估我们的方法，我们采用 Transformer 的迁移学习设定，模型首先在大规模语料库上以语言建模目标进行预训练，然后使用监督数据在目标任务上进行微调（Devlin 等，2019；Liu 等，2019；Lewis 等，2020；Wang 等，2020）。仿照 BERT 的做法（Devlin 等，2019；Liu 等，2019），我们在 English Wikipedia 和 BookCorpus（Zhu 等，2015）上使用掩码语言建模目标预训练我们的模型，并观察到与 BERT 基线相似的表现。

随后，我们在 GLUE 基准（Wang 等，2018）和 IMDB 评论数据集（Maas 等，2011）上微调预训练模型，并在准确率和效率两个方面将我们的结果与 BERT 进行比较。在所有任务中，我们的模型在保持与原始 BERT 相近性能的同时，显著提升了速度。

最后，我们在 Long Range Arena（LRA）基准中的长序列任务上评估了我们的模型。Nystromformer 在多个任务中相较于近期高效 self-attention 方法（包括 Reformer（Kitaev 等，2019）、Linformer（Wang 等，2020）和 Performer（Choromanski 等，2020））表现更优，平均准确率高出约 3.4%。我们认为，这项工作是实现资源高效 Transformer 的重要一步。

3. 相关工作

我们简要回顾了与本研究相关的高效 Transformer、线性化 Softmax 核函数及 Nyström 类方法的研究。

高效 Transformer。
已有多种策略被提出以提升 Transformer 的内存效率，包括权重剪枝（Michel, Levy 和 Neubig，2019）、权重分解（Lan 等，2020）、权重量化（Zafrir 等，2019）和知识蒸馏（Sanh 等，2019）。此外，(Clark 等，2019) 中提出了新的预训练目标；(Lample 等，2019) 中使用了 product-key attention；而 (Dai 等，2019) 提出的 Transformer-XL 模型展示了如何减少总体计算需求。

在 (Child 等，2019) 中，作者通过稀疏分解 attention 矩阵，将长序列生成建模的复杂度从二次降低到 $O(n\sqrt{n})$ ；在 (Kitaev, Kaiser 和 Levskaya，2019) 中，Reformer 模型利用 locality-sensitive hashing（LSH）将复杂度进一步降低到 $\log n)$ ，其前提是假设 key 和 query 需要相同，从而减少了整体的点积操作次数。

最近，(Wang 等，2020) 提出的 Linformer 模型利用 Johnson-Lindenstrauss 引理中的随机投影，将复杂度降至 $O (n)$ ，引入了线性投影步骤。(Beltagy, Peters 和 Cohan，2020) 提出的 Longformer 模型通过局部窗口 attention 和任务驱动的全局 attention，在处理长文档时实现了 $O (n)$ 的复杂度；BIGBIRD（Zaheer 等，2020）则采用稀疏 attention 机制。

还有其他提升优化器效率的方法，如 micro-batching（Huang 等，2019）和梯度检查点（gradient checkpointing，Chen 等，2016）。与我们的方法并行发展的是 Performer 模型（Choromanski 等，2020），其利用正交随机特征来近似 softmax attention 核函数，并将复杂度降低到 $O (n)$ 。

线性化 Softmax。
在 (Blanc 和 Rendle，2018) 中，提出了一种自适应采样 softmax 方法，结合核函数采样以加速训练。该方法在每次训练步骤中仅对部分类别进行采样，基于线性点积近似。在 (Rawat 等，2019) 中，Random Fourier Softmax（RF-softmax）方法利用随机傅里叶特征从近似 softmax 分布中高效采样，用于归一化嵌入表示。

(Shen 等，2018b；Katharopoulos 等，2020) 提出的 Transformer 中 softmax attention 的线性化方法，是通过启发式方式将 key 和 query 分离，基于线性点积进行近似。虽然这种方法非常有趣，但在某些情况下对 self-attention 中 softmax 矩阵的近似误差可能较大。另外，(Bello，2021) 中提出的 lambda layers 也可以被视为一种高效的相对位置 attention 机制。

Nyström 类方法

Nyström 类方法通过对矩阵的列进行采样，以实现对原始矩阵的近似。Nyström 方法（Baker，1977）最初是为了解析带有简单求积公式的积分方程而提出的离散化方法，至今仍被广泛用于通过给定的列子集来近似 kernel 矩阵（Williams 和 Seeger，2001）。许多变种已被提出以改进基础的 Nyström 近似方法，例如：

使用 k-means 的 Nyström 方法（Zhang, Tsang 和 Kwok，2008；Zhang 和 Kwok，2010）
随机化 Nyström 方法（Li, Kwok 和 Lu，2010）
带有谱偏移（spectral shift）的 Nyström 方法（Wang 等，2014）
使用伪 landmark 的 Nyström 方法、原型方法（Wang 和 Zhang，2013；Wang, Zhang 和 Zhang，2016）
fast-Nys 方法（Si, Hsieh 和 Dhillon，2016）
MEKA 方法（Si, Hsieh 和 Dhillon，2017）
集成 Nyström 方法（ensemble Nystrom，Kumar, Mohri 和 Talwalkar，2009）

在 (Nemtsov, Averbuch 和 Schclar，2016) 中，Nyström 方法被扩展以处理一般矩阵（而非对称矩阵）。(Musco 和 Musco，2017) 提出了 RLS-Nystrom 方法，该方法通过递归采样加速 landmark 点的选取。(Fanuel, Schreurs 和 Suykens，2019) 开发了 DAS（确定性自适应采样）和 RAS（随机自适应采样）算法，以增强 landmark 选择的多样性。

与我们的方法最相关的是 (Wang 和 Zhang，2013；Musco 和 Musco，2017)。这些方法设计用于一般矩阵近似（这与我们的设定高度一致），其策略是仅采样部分列和行。然而，直接将这些方法应用于近似 self-attention 中使用的 softmax 矩阵，并不能直接降低计算复杂度，其原因在于：

即使只访问 softmax 矩阵的一部分列或行，也必须先计算完整矩阵的所有元素，再进行 softmax 操作。而计算这些元素本身就需要二次复杂度。

尽管如此，受到“使用列的子集重构完整矩阵”这一核心思想的启发，我们提出了一种 针对 softmax 矩阵量身定制的 Nyström 近似方法，该方法具有 $O (n)$ 的复杂度，用于高效近似 self-attention。

4. 基于 Nyström 的线性 Transformer

在本节中，我们首先简要回顾 self-attention，然后讨论 Nyström 方法用于 self-attention 中 softmax 矩阵近似的基本思想，最后将该思想调整以实现我们提出的结构。

4.1 Self-Attention

什么是 self-attention？Self-attention 计算的是特征表示的加权平均，其权重与表示对之间的相似度成正比。形式上，对于一个包含 $n$ 个 token、维度为 $d$ 的输入序列： $\in \mathbb{R}^{n \times d}$

通过三个矩阵 $W_Q \in \mathbb{R}^{d \times d_q}$ 、 $W_K \in \mathbb{R}^{d \times d_k}$ 和 $W_V \in \mathbb{R}^{d \times d_v}$ 进行投影，从而提取特征表示 $Q$ 、 $K$ 和 $V$ ，分别被称为 query、key 和 value，其中通常令 $d_k = d_q$ 。于是，输出表示为：

$XW_Q, \quad K = XW_K, \quad V = XW_V\quad(1)$

接着上文，self-attention 可以写成如下形式：
$\operatorname { s o f t m a x } \left( { \frac { Q K ^ { T } } { \sqrt { d _ { q } } } } \right) V \quad(2)$
其中，softmax 表示对每一行进行归一化的 softmax 函数。因此，softmax 矩阵 $S$ 中的每一个元素都依赖于同一行中的所有其它元素。

Self-Attention 的计算代价 Self-Attention 机制需要计算 $n^2$ 个 token 对之间的相似度得分，因此在时间和内存上都具有 $O(n^2)$ 的复杂度。由于这种对输入长度 $n$ 的二次依赖，self-attention 的实际应用通常被限制在较短的序列（例如 $\lt 1000$ ）上。这一点正是我们提出一种资源高效的 self-attention 模块的主要动机。

4.2 自注意力中 Softmax 矩阵的 Nyström 近似方法

我们工作的起点是使用广泛用于矩阵近似的 Nyström 方法（Williams and Seeger 2001；Drineas and Mahoney 2005；Wang 和 Zhang 2013），以降低 Transformer 中 self-attention 的计算开销。我们基于 Wang 和 Zhang（2013）的方法，描述了使用 Nyström 方法近似 self-attention 中 softmax 矩阵的策略及其挑战：通过采样一部分列和行来近似整个矩阵。

设 self-attention 中使用的 softmax 矩阵为： $\text{softmax} \left( \frac{QK^T}{\sqrt{d_q}} \right) \in \mathbb{R}^{n \times n}$ ，我们可以将 $S$ 表示为：

$\text{softmax} \left( \frac{QK^T}{\sqrt{d_q}} \right) = \begin{bmatrix} A_S & B_S \\ F_S & C_S \end{bmatrix} \quad \text{(3)}$

其中：

$A_S \in \mathbb{R}^{m \times m}$ 是从 $S$ 中采样得到的子矩阵（包含 $m$ 行和 $m$ 列），被称为样本矩阵；
$B_S \in \mathbb{R}^{m \times (n - m)}$ ；
$F_S \in \mathbb{R}^{(n - m) \times m}$ ；
$C_S \in \mathbb{R}^{(n - m) \times (n - m)}$ 。

4.3 Nyström 方法的求积技术

矩阵 $S$ 可以通过 Nyström 方法的基本求积技术进行近似。其第一步是对样本矩阵 $A_S$ 进行奇异值分解（SVD）： $A_S = U \Lambda V^T$ ，其中 $\in \mathbb{R}^{m \times m}$ 为正交矩阵， $\Lambda \in \mathbb{R}^{m \times m}$ 为对角矩阵。根据 Wang 和 Zhang（2013）提出的“out-of-sample”列近似策略，可以使用从 $S$ 中抽取的 $m$ 列和 $m$ 行重建其 Nyström 近似形式：

$\hat { S } = \left[ { \cal A } _ { S } \quad \quad { \cal B } _ { S } \atop { \cal F } _ { S } { \cal A } _ { S } ^ { + } { \cal B } _ { S } \right] = \left[ { \cal A } _ { S } \atop { \cal F } _ { S } \right] { \cal A } _ { S } ^ { + } \left[ { \cal A } _ { S } \quad { \cal B } _ { S } \right]\quad(4)$

其中 $A_S^{+}$ 表示 $A_S$ 的 Moore-Penrose 伪逆。 $C_S$ 被近似为 $F_S A_S^{+} B_S$ 。这说明 $\times n$ 的矩阵 $S$ 可以通过从 $S$ 中采样 $m$ 行（即 $A_S$ 和 $B_S$ ）和 $m$ 列（即 $A_S$ 和 $F_S$ ）来构造 Nyström 近似 $\hat{S}$ 。

用于 Softmax 矩阵的 Nyström 近似

接下来，我们简要讨论如何用标准 Nyström 方法构造 self-attention 中 softmax 矩阵的 out-of-sample 近似。

对于给定的 query $q_i$ 和 key $k_j$ ，我们定义：

$K_K(q_i) = \text{softmax} \left( \frac{q_i K^T}{\sqrt{d_q}} \right)$
$\mathrm { s o f t m a x } \left( \frac { Q k _ { j } ^ { T } } { \sqrt { d _ { q } } } \right)$

其中 $K_K(q_i) \in \mathbb{R}^{1 \times n}$ ， $K_Q(k_j) \in \mathbb{R}^{n \times 1}$ 。我们可以构造

$\phi_K(q_i) = \Lambda^{- \frac{1}{2}} V^T [K_K^T(q_i)]_{m \times 1}$

$\phi_Q(k_j) = \Lambda^{- \frac{1}{2}} U^T [K_Q(k_j)]_{m \times 1}$

其中 $[\cdot]_{m \times 1}$ 表示先计算完整的 $\times 1$ 向量再取前 $m$ 行。
当 $\phi_K(q_i)$ 和 $\phi_Q(k_j)$ 可得时，标准 Nystrom 近似的 $\hat { S }$ 的元素为
$\hat{S}_{ij} = \phi_K(q_i)^T \phi_Q(k_j), \quad \forall i = 1, \ldots, n;\ j = 1, \ldots, n \tag{5}$

矩阵形式为

$\hat{S} = \left[\text{softmax} \left(\frac{QK^T}{\sqrt{d_q}}\right)\right]_{n \times m} A_S^+ \left[\text{softmax} \left(\frac{QK^T}{\sqrt{d_q}}\right)\right]_{m \times n} \tag{6}$

其中 $[\cdot]_{n \times m}$ 表示从 $\times n$ 矩阵中选取 $m$ 列， $[\cdot]_{m \times n}$ 表示从中选取 $m$ 行。该表示对应于式（4）在 self-attention 中 softmax 矩阵近似的应用。式（4）中的 $_ { F S } ^ { A _ { S } } \bigg ]$ 对应于（6）中的第一个 $\times m$ 矩阵， $A_S\ B_S]$ 对应于（6）中的第二个 $\times m$ 矩阵。矩阵形式的更多细节可见补充材料。
Nystrom 近似的关键挑战。在式（4）和（6）中，即使近似只需要访问 softmax 矩阵的一部分列（即 $_ { F S } ^ { A _ { S } } \bigg ]$ ），仍需计算全部 $QK^T$ 的元素，这是因为 softmax 是逐行归一化的。计算 softmax 矩阵中的任意元素都需要该行中所有元素指数的总和作为分母。因此，计算 $_ { F S } ^ { A _ { S } } \bigg ]$ 必须访问完整的 $QK^T$ ，如图 1 所示，这使得直接应用 Nystrom 近似效率不高。

通过 Nystrom 方法实现线性化自注意力
我们现在将 Nystrom 方法应用于对完整的 softmax 矩阵 S 进行近似计算。基本思路是利用来自键 K 和查询 Q 的地标点 $\tilde{K}$ 和 $\tilde{Q}$ ，从而在不访问完整 $QK^T$ 的情况下，导出一种高效的 Nystrom 近似。当地标点数量 $m$ 远小于序列长度 $n$ 时，我们的 Nystrom 近似在内存和时间两个方面都能实现关于输入序列长度的线性扩展。

温馨提示：
阅读全文请访问"AI深语解构" Nystromformer：一种基于 Nyström 方法的自注意力近似算法

英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
重复文件清理工具，附免费链接 mixiumixiu 其他
链接:https://pan.baidu.com/s/1s_Zx1eHp5Y-XnbbGldIgvw?pwd=kjex提取码:kjex复制这段内容后打开百度网盘手机App，操作更方便哦
【三桥君】AI技术发展下，单智能体局限性凸显，如何通过MCP和A2A协议实现智能体团队协作转变？
你好，我是✨三桥君✨本文介绍>>一、引言在AI技术突飞猛进的今天，单智能体的局限性正日益暴露，而智能体（AIAgents）协作已然成为不可逆转的趋势。你是否曾思考过，如何通过MCP和A2A协议实现智能体从单兵作战到团队协作的革命性转变？本文三桥君将深入探讨MCP和A2A协议的核心功能与优势，帮助你全面理解智能体协作的无限可能。二、A2A与MCP协议作用MCP（ModelControlProtoco
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri