DATA无界

AI大语言模型学习笔记之三：协同深度学习的黑魔法 - GPU与Transformer模型

Transformer模型的崛起标志着人类在自然语言处理（NLP）和其他序列建模任务中取得了显著的突破性进展，而这一成就离不开GPU（图形处理单元）在深度学习中的高效率协同计算和处理。

Transformer模型是由Vaswani等人在2017年提出的，其核心思想是自注意力机制（self-attention mechanism），它在处理序列数据时能够捕捉长距离依赖关系，从而在NLP等任务中取得了优异的性能。

而GPU（图形处理单元）在这一突破性进展中发挥了重要作用。深度学习模型的训练通常需要大量的计算资源，而传统的中央处理单元（CPU）由于硬件架构的差异和并行处理性能的限制，在处理需要大量矩阵乘法和其他张量操作的高度并行深度学习任务时速度较慢。

而图形处理单元（GPU）是专门设计用于高度并行计算的专用芯片，特别适合加速深度学习任务。由于Transformer模型具有大量的参数，会对大规模的数据进行大量的高速并行计算和训练，GPU的并行处理能力就为大模型的训练提供了巨大的加速，因此更适合深度学习工作负载，使研究人员和工程师能够充分利用GPU的性能进行模型训练。

在训练大规模的Transformer模型时，使用GPU可以大幅缩短训练时间，加速模型的研发和部署过程。

因此，Transformer模型在NLP和序列建模任务中的成功与GPU的协同处理密不可分，为深度学习领域的发展和应用带来了显著的影响。

那么，在进行Transformer模型的深度学习任务时，GPU是如何运作的呢？下面我尝试通过一个简单的例子看看是否能够说明各个部件是如何协同工作的。

GPU在Transformer中的角色

Transformer 模型是一种基于自注意力机制的深度神经网络架构，其庞大的参数量和复杂的计算要求对计算机的计算能力的要求非常高。

我们知道目前使用的PC电脑或者服务器主要的计算处理模块都是CPU（中央处理单元），平常用来玩玩游戏、听听音乐、看电影、刷个剧不在话下，用来做专业设计、剪辑短视频、编辑文档、打印文件等工作也是得心应手。

之所以PC能干这么多不同的事情，主要是因为普通电脑的CPU（中央处理单元）在其架构设计时主要注重了多用途性能和通用的计算能力。CPU被设计成适用于各种任务，包括通用计算、图形界面处理、文件管理、音视频编码解码等。

而当我们进行 AI 深度学习任务时就不一样了。

深度学习的崛起引入了大规模的神经网络和复杂的模型结构，这导致了更多的参数和更复杂的计算图，通常涉及到大规模的矩阵乘法和张量运算，为了提升计算速度，这些操作通常是多个运算并行进行的，对计算机的并行能力提出了很高的要求。

诸如ChatGPT和GPT-4这样最先进的 AI 生成式预训练大语言模型涉及上万亿到上百万亿的参数和海量的数据，通常需要构建及其庞大的 AI GPU Cluster 集群才能满足计算、训练和推理需求，对 GPU 的计算能力要求更是堪称天花板级别的。

传统CPU虽然具有一些多核心，而且每个核心挺强的，但是数量确实少了点，难以满足深度学习大规模并行计算的需求。与此不同，现代GPU专注于大规模并行计算，拥有许多小型处理单元，使得它们在处理深度学习任务时更为高效。

就拿英特尔（Intel）和英伟达（NVIDIA）2023年各自发布的最新一代架构和核心处理器：
Intel® Xeon® Platinum 8593Q 和 NVIDIA H100 Tensor Core GPU 来说，核心数量和浮点运算性能对比如下：

处理器	核心数量	FP64 FLOPS	FP32 FLOPS	TF32 FLOPS
Intel Xeon 8593Q CPU	64 核128 线程	5.04 TFLOPS (每秒5.04万亿次)	4.96 TFLOPS (每秒4.96万亿次)	4.94 TFLOPS (每秒4.94万亿次)
NVIDIA H100 GPU	18432 个 CUDA 核心 576个Tensor张量核心	60 TFLOPS (每秒60万亿次)	60 PFLOPS (每秒60万亿次)	1000 PFLOPS(每秒1000万亿次)

其中，FP64 表示双精度浮点运算，FP32 表示单精度浮点运算，TF32 表示混合精度浮点运算。

从上面的表格可以看出，NVIDIA H100 GPU 在 FP64 和 FP32 两个精度下的每秒浮点运算次数都比 Intel Xeon 8593Q 高出一个数量级（10倍）还要多，在 TF32 精度下的每秒浮点运算次数高出了约200多倍。这意味着 NVIDIA H100 GPU 在浮点计算方面具有明显的优势。

而传统的 CPU 架构在面对 AI 深度学习这种大数据量高并发张量计算时可能就显得力不从心，因为它们的设计更注重于处理多样化且频繁切换的任务,而非大规模数据的并行计算。

另外，深度学习框架和库通常会使用针对GPU设计的特定指令集和特殊优化，而这些优化使得GPU处理器更好地与深度学习任务协同工作。相较之下，CPU在这方面的优化可能比较有限，导致在同样进行深度学习任务时性能较慢。

因此，GPU 处理器在 Transformer 模型中的角色主要体现在其强大的并行计算能力，使得处理大规模、高度并行的深度学习任务变得高效和可行。这为深度学习在一系列自然语言处理（NLP）大模型和其他序列建模任务中的成功进展提供了重要的计算基础。

并行化的自注意力机制

Transformer中的自注意力机制（Self-Attention）是其核心组成部分之一，用于建立输入序列中每个元素与其他元素之间的关联。

为了更好的理解Transformer中的自注意力机制（Self-Attention），让我从一个简单的例子开始。假设你说了一句话：“我爱北京天安门”。我们想知道这句话中的每个词与其他词的关系。

在传统的自然语言处理（NLP）模型中，会将这句话的每个词转换为一个向量，然后使用这些向量来计算词与词之间的关系。例如，我们可以计算“我”与“爱”之间的关系。

在注意力计算（Attention Computation）中，查询向量 ( q ) 与输入序列 ( H = [h_1, h_2, …, h_n] ) 之间的计算用于权重分配，以便更加关注输入序列中与查询相关的部分。在机器翻译任务中，尤其是基于 Seq-to-Seq 模型的机器翻译任务，查询向量 ( q ) 通常是解码器（Decoder）端前一个时刻的输出状态向量。

我们考虑一个简化的注意力计算过程，其中使用了点积注意力（Dot-Product Attention）的形式：

$\text{Attention}(q, H) = \text{Softmax}\left(\frac{q \cdot H^T}{\sqrt{d}}\right) \cdot H \$

其中，( · ) 表示矩阵乘法， $H^T） \$ 表示输入序列的转置， $\ （\sqrt{d} ） \$ 用于缩放，以防止点积的数值过大。Softmax 函数用于将点积的结果转化为权重分布。

在机器翻译中，( q ) 可以是解码器的前一个时刻的隐藏状态，而 ( H ) 是编码器的所有隐藏状态。这样，计算得到的注意力权重将反映出解码器当前时刻对编码器各个时刻隐藏状态的关注程度。

通过将查询向量 ( q ) 与输入序列 ( H ) 进行点积计算，并使用 Softmax 函数生成权重分布，注意力机制使得模型能够自动关注输入序列中与当前解码器状态相关的部分，这对于更好地捕捉输入和输出序列之间的关联关系非常有帮助。

但是，这种方法存在一个问题。它假设每个词与其他词的关系都是相同的。例如，它假设“我”与“爱”的关系与“爱”与“北京”的关系相同。

自注意力机制（self-Attention）可以解决这个问题。它允许模型根据每个词的上下文来计算词与词之间的关系。

在我们的例子中，自注意力机制可以计算“我”与“爱”之间的关系，同时考虑“北京”和“天安门”这两个词。例如，它可以发现“我”与“爱”之间的关系更强，因为它们都是动词。

在自注意力机制中，采用了查询-键-值（Query-Key-Value）的机制，其中查询向量（Query vector）可以根据输入信息进行生成，而不是事先确定。

BERT（Bidirectional Encoder Representations from Transformers）是一个使用自注意力机制的预训练模型，下面让我们简要讨论BERT中的自注意力机制。

在上图中，我们有输入信息
$H = [h_1, h_2] \$
其中蓝色矩阵的每一行代表一个对应的输入向量。此外，图中还有三个矩阵
$W_q, W_k, W_v \$
它们负责将输入信息 ( H ) 依次转换到相应的查询空间
$Q = [q_1, q_2] \$
键空间
$K = [k_1, k_2] \$
值空间
$V = [v_1, v_2] \$
$\begin{align*} [q_1 = h_1W_q, q_2 = h_2W_q] & \Rightarrow Q = HW_q \\ [k_1 = h_1W_k, k_2 = h_2W_k] & \Rightarrow K = HW_k \\ [v_1 = h_1W_v, v_2 = h_2W_v] & \Rightarrow V = HW_v \\ \end{align*}$

在获得输入信息在不同空间的表示 ( Q, K, ) 和 ( V ) 后，我们以 ( h_1 ) 为例，计算这个位置的一个 attention 输出向量 ( \text{context}_1 )，它代表在这个位置模型应该重点关注的内容，如图3所示。

可以看到，在获得原始输入 ( H ) 在查询空间、键空间和值空间的表示 ( Q, K, ) 和 ( V ) 后，计算 ( q_1 ) 在 ( h_1 ) 和 ( h_2 ) 的分数 ( s_{11} ) 和 ( s_{12} )，这里的分数计算采用的是点积操作。

然后将分数进行缩放并使用 softmax 进行归一化，获得在 ( h_1 ) 这个位置的注意力分布： ( a_{11} ) 和 ( a_{12} )，它们代表模型当前在 ( h_1 ) 这个位置需要对输入信息 ( h_1 ) 和 ( h_2 ) 的关注程度。最后，根据该位置的注意力分布对 ( v_1 ) 和 ( v_2 ) 进行加权平均，获得最终在 ( h_1 ) 这个位置的 Attention 向量 ( \text{context}_1 )。

同理，可以获得第2个位置的 Attention 向量 ( \text{context}_2 )，或者继续扩展输入序列获得更多的 ( \text{context}_i )，原理都是一样的。

讨论到这里，相信你已经知道什么是注意力机制了，但为了更正式一点，我重新组织一下注意力机制的计算过程。

自注意力机制的计算过程可以分为以下几个步骤：

将每个词转换为一个向量。
计算每个词与其他词之间的相似度。
使用相似度来计算每个词的注意力权重。
使用注意力权重来加权每个词的向量。

最终，每个词都会得到一个加权后的向量，这个向量包含了该词与其他词的关系。

假设当前有输入信息 ( H = [h_1, h_2, …, h_n] )，我需要使用自注意力机制获取每个位置的输出

$\text{context} = [\text{context}_1, \text{context}_2, ..., \text{context}_n]$
首先，需要将原始输入映射到查询空间 ( Q )、键空间 ( K ) 和值空间 ( V )，相关计算公式如下：

$\begin{align*} Q & = HW_q = [q_1, q_2, ..., q_n] \\ K & = HW_k = [k_1, k_2, ..., k_n] \\ V & = HW_v = [v_1, v_2, ..., v_n] \\ \end{align*}$

接下来，计算每个位置的注意力分布，并将相应结果进行加权求和：

$\text{context}_i = \sum_{j=1}^n \text{softmax}(s(q_i, k_j)) \cdot v_j$

其中 ( s(q_i, k_j) ) 是经过上述点积、缩放后的分数值。

最后，为了加快计算效率，可以使用矩阵计算的方式，一次性计算出所有位置的 Attention 输出向量：

$\text{context} = \text{softmax}(QK^T/\sqrt{d})V$

这就是自注意力机制（self-Attention）的原理。

在进行自注意力计算时，GPU处理器的并行计算能力就可以大显身手了。以一个批次大小为64的例子为例，GPU处理器能够同时计算64个样本中每个样本的自注意力，加速整个模型的训练过程。

# 伪代码示例：Transformer中的自注意力计算
import torch
import torch.nn.functional as F

def self_attention(Q, K, V):
    attention_scores = torch.matmul(Q, K.transpose(-2, -1)) / torch.sqrt(Q.size(-1))
    attention_weights = F.softmax(attention_scores, dim=-1)
    output = torch.matmul(attention_weights, V)
    return output

# 在GPU上进行自注意力计算
Q_gpu = Q.to('cuda')
K_gpu = K.to('cuda')
V_gpu = V.to('cuda')

output_gpu = self_attention(Q_gpu, K_gpu, V_gpu)

这里，Q、K、V是输入序列的查询、键和值的表示，通过GPU上的矩阵乘法和softmax计算，同时处理多个样本的注意力权重。

多头注意力的并行化

Transformer模型中还引入了多头注意力机制，通过并行计算多个注意力头，提高了模型的表示能力。GPU处理器的并行计算能力极大地加速了多头注意力的计算，每个注意力头都可以在不同的GPU核心上独立计算。

# 伪代码示例：Transformer中的多头注意力计算
class MultiHeadAttention(torch.nn.Module):
    def __init__(self, num_heads, hidden_size):
        # 初始化多个注意力头
        self.attention_heads = [self_attention(Q, K, V) for _ in range(num_heads)]

    def forward(self, input):
        # 并行计算多个注意力头
        outputs = [attention_head(input) for attention_head in self.attention_heads]
        # 合并多个头的输出
        output = torch.cat(outputs, dim=-1)
        return output

# 在GPU上进行多头注意力计算
multihead_attention_gpu = MultiHeadAttention(num_heads=8, hidden_size=256).to('cuda')
output_gpu = multihead_attention_gpu(input_gpu)

在上述示例中，每个注意力头的计算可以独立地在GPU上进行，最后再通过GPU处理器的并行计算能力将它们合并。

CUDA流的优化

GPU通过CUDA流式处理的机制实现了高效的计算，这在Transformer模型的训练中尤为重要。例如，当进行反向传播时，GPU能够异步执行计算任务，从而实现数据的流水线处理，极大地提升了大模型的整体训练效率。

# 伪代码示例：反向传播过程中的CUDA流处理
loss.backward()
optimizer.step()

# 在GPU上异步执行计算任务
torch.cuda.synchronize()

上述代码中，反向传播和优化步骤进行了异步执行，通过torch.cuda.synchronize()等待计算完成，确保了计算的正确性。

GPU在Transformer 大模型中的协同计算处理任务中功不可没，其在架构和功能设计中体现出的强大的并行计算、流式处理和多头注意力的优势，堪称黑魔法，为AI 大模型的深度学习任务提供了强大的堪称黑魔法般的加持。

通过以上的例子来理解 GPU 在 Transformer 模型中的运行和处理机制，我们能够更加深入地体会深度学习和大语言模型这一魔法舞台的精彩。

正是在GPU的协同处理的魔法加持下，Transformer模型才得以在自然语言处理等领域创造出一系列令人瞩目的成果，极大地推进了诸如ChatGPT、Claude、Gemini、LLama、Vicuna 等杰出的生成式 AI 大模型的研究进展和部署应用。

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
车载诊断架构 ---面向售后的DTC应该怎么样填写？汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列 EV（电动汽车）常规知识必备架构面向售后的DTC 车载诊断架构 OEM怎么掌握软件开发能力车载通信网络槪述 android ZEVonUDS-J1979
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
四百八十九章. 春晓客栈鲁易寒巨木擎天
邓林他们在打量别人的时候，而别人，自然也是在打量他们了。邓林就看见在这大堂里，散散啦啦的有四个人在，其中两个，只是僵直站立，眼眶中燃烧着橙色骨火的骷髅，而另外两个坐着的，才是眼眶中点燃黄色魂火的骨族人。这两个骨族人中的一个，在邓林他们刚一进来的时候，就把注意力都放在了伊莲娜娜的身上，似乎在确认着什么，当看到伊莲娜娜冲着自己点了点头以后，他有些激动的走过来几步，口中说道：“真的是伊莲娜娜公主殿下？您
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
善吃五色五味，女人更妖娆，想漂亮享受健康美味吃起来余老师讲健康
善吃五色五味，女人更妖娆我们所说的五色五味是指具有赤、青、黄、白、黑五种颜色以及酸、辛、甘、苦、咸五种味道的食物。其实五味和五色与人体的五脏对应，养生必养五脏，通过五味、五色的食物可以调养人的容颜。一、赤色、苦味入心——养颜，面色红润有句话这么说，“会吃的女人更漂亮，贪吃的女人变糟粕。”经过科学、合理搭配的五色五味饮食，就是最天然、最安全的美容药方。赤色——抗衰老，增强免疫力，改善血液循环。赤色即
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
《自控力》P158 迷糊笑
作者：凯利•麦格尼格尔图片发自App金句：众多研究显示，自我批评会降低积极性和自控力，而且也是最容易导致抑郁的因素。它不仅耗尽了“我要做”的力量，还耗尽了“我想要”的力量。相反，自我同情则会提升积极性和自控力，比如，在压力和挫折面前支持自己、对自己好一些。感想：我当年抑郁是不是也是因为这样？图片发自App
D124:如何训练独立思考力？大栗子_
当我们要判断一个理论或者思想是否正确，需要有三个层次，分别是体验、解释和分析。首先看体验。很多时候，我们会相信“听上去、感觉是对的”的事情。我们之前讲的太空笔的故事之所以大多数人都认为是对的，就是有一些看似真实的关键词，比如美国，NASA，设计等，这些词看起来非常权威，但是离我们又遥远，这时候我们的大脑就会放松警惕了。于是，我们毫不犹豫就接受了。说到这里，你有没有发现之前的电视广告中的各种高让我们
心脏猝死姜地主
什么是猝死？猝死就是平时身体健康、或貌似健康的患者，在出乎意料的短时间内，因自然疾病而突然死亡。猝死基本上都在1小时之内死亡。因为实在太快了，80%的死亡都发生在医院之外，连抢救的机会都没有。猝死是一件非常令人震惊的、对日常生活有极大冲击力的事。一个人昨天还好端端的，还热情洋溢地发朋友圈，今天可能突然就没了。2018年，吉祥三宝里的父亲，蒙古族歌手布仁巴雅尔就是突发心脏病去世，享年58岁。麻醉界有
人不能两次踏进同一条河流就是源
这是古希腊学家赫拉克利特的名言，在我原先看来就是万事万物都在不断的变化，强调事物的运动性。可后来了解到他还有个徒弟更深的进行了解读，人哪怕一次也不能踏进同一条河流，因为当你踏进的时候，已经不是你最初想的那天河流了。这确实也说明了事物无时无刻不在运动，可感觉毫无意义，如果一切都这样去算，那么每一秒甚至每一个更加微小的时间上都会有一个不同的结论，这根本无法指明生活的方向和解决困顿，只会让人更加困顿。这
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

AI大语言模型学习笔记之三：协同深度学习的黑魔法 - GPU与Transformer模型

GPU在Transformer中的角色

并行化的自注意力机制

多头注意力的并行化

CUDA流的优化

你可能感兴趣的:(大语言模型,AI人工智能,人工智能,深度学习,语言模型,nlp,gpu算力)