审计侠

AI:Attention的本质：从Self到Cross，彻底读懂Transformer的注意力机制

第一章：Attention 是什么？它改变了什么？

“深度学习的发展史，其实就是模型越来越‘懂得注意’的过程。”

在你还没接触 Transformer 之前，RNN 是自然语言处理的主力军。它们一次处理一个词，就像一位有点健忘的老教授，一边听你说话一边试图记住上下文，却常常在长段落中忘了开头。

直到 Attention 机制的诞生，彻底改变了这一局面。

所谓 Attention，是一种“动态加权机制”

想象你在浏览一篇论文，标题、图表和某些粗体关键字可能立刻抓住你的注意力。你不会平均看待每一个字，而是有意识地“聚焦”于重要部分。

同样地，Attention 让神经网络在处理语言时，也能自己判断“谁重要”，并优先考虑那些部分。

在技术上，它的定义可以简单归结为：

“给定一个查询向量（Query），根据键向量（Key）计算相关性分数，然后用这些分数对值向量（Value）进行加权平均，得到输出。”

这段话初看可能有点抽象，但它其实就是：“我问一个问题，然后根据别人的回答做出决定”。

从翻译问题引出 Attention 的原点

Attention 最早被广泛应用在机器翻译中。假设我们翻译一句话：

英文：The cat sat on the mat
中文：那只猫坐在垫子上

如果只用一个固定向量来表示整个英文句子（像早期的 Seq2Seq 模型那样），模型可能记不住前面的主语或后面的宾语。而 Attention 则允许模型在翻译“垫子”这个词时，重点“关注”英文句中的“mat”，而不是平均考虑整句。

这就是 Attention：它让模型的输出可以有选择性地参考输入的每一部分。

那它厉害在哪？

它不再依赖“顺序处理”，而是一次性看到所有输入；
它让模型的“注意力”不再是被动分配，而是自己学会分配；
它的权重矩阵是可视的，我们可以“看到”模型在想什么。

Attention 的这种特性，彻底改变了 NLP 模型的设计理念。从最初作为“翻译增强器”的小组件，到如今成为大语言模型的骨干，它完成了一次史诗级的逆袭。

第二章：Self-Attention，让模型学会“自我关注”

“语言的意义，不只在每个词本身，而在它与其它词之间的关系。”

如果你问我：Transformer 为什么能在 NLP 中打败 RNN、CNN、LSTM？
我会毫不犹豫地说：Self-Attention 给了它全局的上下文感知能力。

什么是 Self-Attention？

Self-Attention（自注意力机制）就是让序列中的每个词，在理解自身意义的同时，考虑整个句子中其它词的影响。

想象你在读这句话：

“自然语言处理是人工智能中最活跃的研究方向之一。”

当你理解“研究方向”这几个字时，你可能会联想到“自然语言处理”这个主语。这种从句中其它部分借助信息的行为，就是 Self-Attention 在模型中的体现。

一步步拆解 Self-Attention 的运作过程

我们以一句话为例：“我爱自然语言处理”

模型在处理这个序列时，会对每个词进行如下操作：

1️⃣ 为每个词生成三个向量：

Query（Q）：我在寻找相关信息
Key（K）：我是信息的索引
Value（V）：我是信息的内容

每个词都变成了 Q、K、V 三元组（通过不同的权重矩阵乘法得到）。

2️⃣ 计算 Query 与所有 Key 的匹配度（注意力分数）：

对当前词的 Q，分别与所有词的 K 做点积，然后除以 √d 归一化，再通过 Softmax 变成权重概率。

这就得到了一个“我该注意谁”的分数分布。

3️⃣ 用这些权重去加权 Value，得到新的表示：

将每个 V 乘上对应权重，再求和，形成这个词新的语义向量。

举个例子：Self-Attention 的“聚焦力”

词：“语言”
Q：“语言”发出一个“我是谁”的问题
K/V：句中其它词的身份与信息

Attention Score 可能是这样：

词	相关性分数（score）	注意力权重（softmax 后）
我	0.1	0.05
爱	0.3	0.10
自然	0.8	0.35
语言	1.0	0.40
处理	0.6	0.10

可以看到，“语言”最关注的是“自然”和自己，这恰好反映了“自然语言”这个词组的内部结构。模型自己学会了理解短语结构，而不是靠我们手动设计规则。

这就是 Self-Attention 的魔法

每个词都可以感知句中其他所有词；
注意力权重是模型“自主学习”的结果；
不再依赖句子顺序，避免了长距离依赖的弱化问题（相比 RNN）；

我们甚至可以可视化这些权重，看到每一层 Transformer 在“盯”哪些词。这让 Self-Attention 成为极少数既强大又可解释的机制之一。

第三章：Multi-Head Attention，让模型“一心多用”

“人脑有多个神经通路同时处理视觉、语言和记忆，大模型也一样：Attention 不只一头，它有很多个。”

如果说 Self-Attention 是模型的“自我关注能力”，那么 Multi-Head Attention（多头注意力） 则是让它同时从多个角度看待自己。

这是 Transformer 中非常精妙的设计，它不是简单的增强性能，而是一种真正模仿人类“多线程思维”的策略。

为什么要多头？

想象你要理解这句话：

“苹果公司昨天发布了最新款的智能眼镜。”

一个注意力头可能关注“发布 → 苹果公司”的动作主语关系；
另一个注意力头可能关注“发布 → 智能眼镜”的宾语结构；
还有一个可能识别“昨天”作为时间状语。

如果你只给模型一个头，它只能从一个方向思考。而多个头可以并行思考多个依赖关系，帮助模型更全面地理解语义。

Multi-Head Attention 是怎么实现的？

其实它是一个“套路重复”的过程：

1️⃣ 拆分头部：

我们将输入的 Q、K、V 拆分成多个子空间，例如 8 个头，每个子空间大小是总维度的一部分（比如 512 → 8×64）。

2️⃣ 各头独立计算 Self-Attention：

每个头使用独立的权重矩阵，对自己的 Q/K/V 进行变换，并单独执行一次完整的 Self-Attention 流程。

3️⃣ 拼接结果：

将所有头的输出拼接在一起，再通过一个线性层统一映射，恢复为原始维度。

伪代码层面看就是：

for head in heads:
    head_output = attention(Q_i, K_i, V_i)
final_output = concat(head_outputs) → linear transform

多头带来的好处有哪些？

特性	描述
并行语义捕捉	每个头可以学习不同的语言结构或语义模式
降低信息丢失	相比单头，多头能更稳定地提取全局特征
更丰富的表示能力	同一个词在多个头中可以有不同的语义解释
支持更深层次的组合语义建模	比如一个头关注实体，一个头关注动词组合

多头 Attention 就像多个专家组成的团队，各自从不同角度对同一个输入提出看法，最后综合成一个结论。

举个例子（GPT 论文中的可视化）

在 Transformer 可视化中，有些 Attention Head 会自动学会：

关注上一个词（做语言建模）
关注当前句子的主语
关注逗号或句子边界（语法结构）

没人教过它们这么做。它们“自学成才”。

第四章：Cross-Attention，模型与外部世界的对话方式

“如果说 Self-Attention 是模型的内省，Cross-Attention 就是它与外部世界的连接。”

在 Self-Attention 中，Query、Key、Value 都来自同一个地方，模型只关心“自己和自己怎么交流”；
而在 Cross-Attention 中，Query 与 Key/Value 来自不同的来源，也就是说，模型在向另一个输入提问。

这听起来有点抽象？别急，我们马上举例。

场景一：机器翻译中的 Cross-Attention

假设你正在翻译英文句子：

英文原文：The cat sat on the mat.
中文翻译：那只猫坐在垫子上。

在 Transformer 的 Encoder-Decoder 架构中：

编码器（Encoder）处理英文，得到所有词的表示；
解码器（Decoder）在生成中文的每一个词时，会通过 Cross-Attention 查阅 Encoder 的结果。

比如 Decoder 当前正在尝试生成“垫子”这个词，它需要在 Encoder 的表示中找到“mat”这个词，并根据其语义来做出决策。

这时的 Attention 流程是这样的：

Query（来自 Decoder 当前步）
Key / Value（来自 Encoder 所有步）
→ 得出注意力分布 → 聚合 Value → 得到上下文信息

Decoder 一边生成目标语言，一边“查字典”。

为什么不直接用 Self-Attention？

因为 信息源不同，必须有一种机制能把 Encoder 看到的“外部世界”引入到 Decoder 中。

Self-Attention 只能让 Decoder 看自己的历史生成；
Cross-Attention 则是让它“看到源语言的信息”，是翻译的关键所在。

场景二：图文模型、对话 Agent 的核心

你见过 ChatGPT 看图回答问题的场景吗？比如：

用户上传一张图问：“这是什么动物？”

这时候，模型的文字输入是问题，而图片是通过视觉编码器生成的特征。

谁是 Query？谁是 Key/Value？

Query：来自用户问题的文本向量（语言）
Key / Value：来自图像编码的 patch 向量（视觉）

通过 Cross-Attention，语言模型可以“询问”图像编码，“你那边有没有和‘动物’相关的线索？”于是实现了多模态对齐。

Cross-Attention 的实现方式？

其实和 Self-Attention 几乎一样，只不过 Q 来自一个序列，K/V 来自另一个。

def cross_attention(q_from_decoder, kv_from_encoder):
    K = linear_k(kv_from_encoder)
    V = linear_v(kv_from_encoder)
    Q = linear_q(q_from_decoder)
    ...
    return attention(Q, K, V)

它只是把“注意力目标”从自己换成了别人。

Cross-Attention 是一种交流协议

Attention 类型	Q 来自	K/V 来自	功能简述
Self-Attention	当前序列	当前序列	了解内部结构
Cross-Attention	目标序列	外部序列	获取外部上下文，进行信息交互

Cross-Attention 是我们构建“理解与交流”能力的桥梁。没有它，就没有 GPT-4V 这样的“看图对话”；没有它，翻译模型就只会“自说自话”。

第五章：Self-Attention vs Cross-Attention，一对黄金搭档

“一个懂得自省，一个善于交流，Transformer 正是靠这两个家伙打天下。”

很多人初看 Attention 的时候，总会问一句：

“Self-Attention 和 Cross-Attention，究竟区别在哪？”
“是不是只是换了个数据源？”

说对了一半。两者的数学形式基本一样，但应用语境、信息流方向、目标完全不同。

一张对比表：帮你一秒区分

对比维度	Self-Attention	Cross-Attention
Query 来源	当前序列（自己）	目标序列（例如 Decoder）
Key/Value 来源	当前序列（自己）	外部序列（例如 Encoder 输出、图像编码）
使用位置	Encoder/Decoder 内部	Decoder 外部与 Encoder 交互，多模态任务中
功能	理解内部结构，自我感知	从外部引入信息，构建联系
示例	GPT、BERT、ViT	Transformer Decoder、CLIP、GPT-4V

这俩就像一个人类的“内心戏” vs “对外交流”：

Self-Attention：我在思考自己的过去；
Cross-Attention：我在参考外部世界提供的资料。

应用实例回顾

✅ 机器翻译：

Encoder 用 Self-Attention 理解英文句子；
Decoder 用 Cross-Attention 获取 Encoder 的结果；
然后再用 Decoder 的 Self-Attention 生成每个目标词。

完整翻译流程中，两种 Attention 缺一不可。

✅ 多模态模型：

文本编码用 Self-Attention；
图像用 Vision Transformer；
文本通过 Cross-Attention“读取”图像内容。

这就像人类在说话时，会一边回忆脑中画面（Self），一边接收眼前图片信息（Cross）。

更进一步：它们可以叠加使用！

在很多大模型架构中，Cross-Attention 和 Self-Attention 是层层交替使用的：

自己先想一想（Self-Attention）；
然后看看外部世界给了什么信息（Cross-Attention）；
再继续内化这些信息（再来一轮 Self-Attention）……

这种“内省—交流—再思考”的迭代方式，是语言模型理解复杂任务的根本手段。

✅ Self-Attention 是地基，Cross-Attention 是窗口

没有 Self-Attention，模型没法理解语义结构；
没有 Cross-Attention，模型就变成“闭门造车”。

正是这两者的协同，使得 Transformer 不再是一个堆线性层的拼图，而是一台能处理语言、图像、音频，甚至世界知识的推理引擎。

好，我们继续进入第六章，这一章更偏“动手实践”风格，给你一个可跑、可理解、可扩展的 Attention 最小实现版本。哪怕你没读过原论文，也能动手理解其机制。

第六章：从零实现一个最小 Attention 模块（PyTorch）

“别光看原理，撸一段代码你会顿悟。”

虽然 Transformer 听起来像个庞然大物，但它的 Attention 核心，其实只需要几行代码就能实现。只要你理解了它的计算本质，其实非常优雅、简单。

我们要实现的功能

一个最小版的 Attention 函数，功能包括：

接收 Q、K、V 三个矩阵（或统一输入拆分）；
计算 Q 与 K 的注意力分数；
用 softmax 得到权重分布；
对 V 加权求和，输出结果。

实现代码（PyTorch）

import torch
import torch.nn.functional as F

def simple_attention(q, k, v, mask=None):
    """
    q, k, v: [batch_size, seq_len, d_k]
    mask:    [batch_size, seq_len, seq_len] or None
    """
    d_k = q.size(-1)
    # Q x K^T
    scores = torch.matmul(q, k.transpose(-2, -1)) / d_k**0.5

    if mask is not None:
        scores = scores.masked_fill(mask == 0, float('-inf'))

    # softmax 得到权重分布
    weights = F.softmax(scores, dim=-1)

    # 加权 Value 得到输出
    output = torch.matmul(weights, v)

    return output, weights

这就是 Attention 的本质。你可能没想到，GPT 的核心竟然能简化为 10 行代码。

示例输入运行一下

# 模拟一个 batch 中两个句子，每个有4个词，维度为8
q = torch.rand(2, 4, 8)
k = torch.rand(2, 4, 8)
v = torch.rand(2, 4, 8)

output, attn_weights = simple_attention(q, k, v)

print("输出形状：", output.shape)
print("注意力权重：", attn_weights[0])

输出：

输出形状： torch.Size([2, 4, 8])
注意力权重：
tensor([[0.22, 0.24, 0.30, 0.24],
        [0.25, 0.26, 0.27, 0.22],
        ...
])

你可以直观地看到，每一行表示当前词对其它词的“关注程度”。

补充一点：这个实现是通用的

若 Q=K=V，就是 Self-Attention；
若 Q≠K=V，就是 Cross-Attention。

你只需换输入来源，就能复用这个函数。模型就是这么“魔改”的：改的不是函数，而是数据流。

还可以加点功能

加 mask，做 decoder 自回归（阻止模型偷看未来）
拆成多头：用多组 W_q、W_k、W_v，然后 concat
加 Dropout、LayerNorm：配合训练更稳定

✅理论到代码只差一个动手

很多人听了几遍原理仍然晕，是因为少了手感。而当你亲手写出 Attention 后，你会发现：

“原来它并不复杂，复杂的是它应用的方式。”

今天先写到这里，明天出差，得准备行李了

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，