视言

深度神经网络的不确定性（上）

摘要

基本的神经网络不能提供确定性估计，或者存在过度或过低的置信度，也就是说，校准得很糟糕。而不确定度至关重要的来源分为可还原的模型不确定度与不可还原的数据不确定度。本文充分讨论了基于deterministic neural networks, Bayesian neural networks, ensemble of neural networks, and test-time data augmentation的不确定性建模。对于一个实际应用，我们讨论了不同的不确定性度量，神经网络的校准方法，并给出了现有基线和可用实现的概述。

深度神经网络不确定性的起因

神经网络的非线性函数表示：
$f_\theta: \mathbb{X} \rightarrow \mathbb{Y} \qquad f_\theta(x)=y~.$

有限数据集：
$\mathcal{D}=(\mathcal{X}, \mathcal{Y})=\{x_n,y_n\}_{n=1}^N\subseteq \mathbb{D}~.$

我们考虑从自然环境中的原始信息到网络预测的四个步骤及其对应的不确定度，即：
1）数据获取过程
2）DNN构建过程
3）用于推断的模型
4）预测不确定度的模型
这四个步骤包含一些不确定性和错误的潜在来源，再一次影响神经网络的最后输出。
我们认为引起DNN预测不确定性的5个最重要的起因是：

真实世界环境的可变性；
测量系统固有的错误；
DNN模型结构规范的错误
DNN训练过程的错误
未知数据的错误

A.数据获取

假设 $\omega$ 表示现实世界一只鸟， $x$ 表示鸟的图片， $y$ 表示鸟的label。在测量过程中，可能遇到随机噪声，信息发生损失。下面建模 $x$ 的随机性：
$x\vert\omega \sim p_{x\vert \omega}~.$

等效地，对应的目标变量y也可以推出：
$y\vert\omega \sim p_{y\vert \omega}~.$

神经网络在基于 $N$ 个现实世界情境 $\omega_1,...,\omega_N$ 得到的 $x|\omega_i$ and $y|\omega_i$ 有限数据集上训练：
$\mathcal{D}=\{x_i, y_i\}_{i=1}^N~.$

在收集训练数据时，有两个因素会引起在这个数据上训练神经网络时的不确定性。
首先采样空间应该被训练数据充分覆盖，需要考虑不在 $x_i$ 中出现的新样本 $x^*$ ，因此诞生了第一个产生不确定性的因素。

因素1：真实世界情况的变化性
大部分的真实世界环境是高度可变的，几乎不断受到变化的影响。这些变化影响例如温度、光照、混乱、物理对象的大小和形状等参数。环境的变化也会影响目标的表达，例如雨后的植物和旱灾后的植物看起来是很不一样的。当真实世界的情况和训练集相比发生改变时，就叫分布偏移。神经网络对于分布的平移是敏感的，这会导致神经网络性能的巨大变化。

因素1：真实世界情况的变化性

大部分的真实世界环境是高度可变的，几乎不断受到变化的影响。这些变化影响例如温度、光照、混乱、物理对象的大小和形状等参数。环境的变化也会影响目标的表达，例如雨后的植物和旱灾后的植物看起来是很不一样的。当真实世界的情况和训练集相比发生改变时，就叫分布偏移。神经网络对于分布的平移是敏感的，这会导致神经网络性能的巨大变化。

第二个因素是基于测量系统，对样本和对应目标之间的相关性有直接的影响。测量系统生成的用于描述 $\omega_i$ 的 $x_i$ 和 $y_i$ 可能没有包含足够的信息来学习从 $x_i$ 到 $y_i$ 直接的映射。也就是说可能存在高度不同的信息 $w_i$ 和 $w_j$ （例如城市和森林）却有着非常类似的相应的测量 $x_i$ 与 $x_j$ （例如温度）或者类似的对应目标 $y_i$ 与 $y_j$ （例如都把样本标注成森林的噪声）。这直接导致了第二个不确定性因素。

因素2：测量系统的错误和噪声
测量本身就可能成为神经网络预测不确定性的来源。这可能是由测量中的限制性信息引起的，例如图像分辨率，或没有测量反例，或不够充分的信息模态。而且这可能是由噪声引起的，例如传感器噪声，因为移动或者机械应力引起的测量不精确。再进一步，错误的标签也是不确定性来源，它可以被视作测量系统中的错误和噪声。它作为标注噪声将通过训练阶段降低正样本的置信度而影响模型。

因素2：测量系统的错误和噪声

测量本身就可能成为神经网络预测不确定性的来源。这可能是由测量中的限制性信息引起的，例如图像分辨率，或没有测量反例，或不够充分的信息模态。而且这可能是由噪声引起的，例如传感器噪声，因为移动或者机械应力引起的测量不精确。再进一步，错误的标签也是不确定性来源，它可以被视作测量系统中的错误和噪声。它作为标注噪声将通过训练阶段降低正样本的置信度而影响模型。

B.深度神经网络设计与训练

DNN的设计包含了神经网络的显示建模以及它的随机训练过程。神经网络设计和训练引入的问题结构假设称为归纳偏置。我们在架构配置 s 中总结了关于网络结构（参数量，层，激活函数等）和训练过程（优化算法，正则化，增广等）的所有建模者决策。网络架构定义给出了第三个神经网络不确定性的因素：

因素3：模型架构错误
一个神经网络的架构对性能有直接的影响，因此对于预测的不确定度也一样。例如参数的数量影响记忆容量，会导致训练数据的欠拟合和过拟合。关于神经网络的确定度，我们知道越深的网络对于他们的softmax输出会过度自信，就是说他们在最高概率概率分数的类别上预测的的概率太高。

对于一个给定的网络架构 $s$ 和一个训练数据集 $D$ ，神经网络的训练是一个随机过程，因此神经网络的结果 $f_\theta$ 是基于一个随机变量，
$\theta\vert D, s \sim p_{\theta|D,s}.$

这个过程的随机是由于随机数据顺序，随机初始化，或者作为增广的随机正则化，或者dropout。神经网络的loss是高度非线性的，训练过程的随机性通常会导致不同的局部最优解 $\theta^\star$ 即不同的模型。另外，batch size，learning rate，training epochs都会影响训练导致不同模型结果。依赖于实际任务，这些模型能够在单个样本的预测中差异很大，甚至在整个模型性能上产生差异。这种对训练过程的敏感度直接导致了神经网络预测不确定性的第四个因素：

因素4：训练过程错误
一个神经网络的训练过程需要定义许多参数（batch size, optimizer, learning rate, stopping criteria, regularization, 等等）以及训练过程中发生的随机决策（batch生成和权重初始化）。所有的这些决策影响了局部最优，因此不太可能两个训练过程得到同样的模型参数。训练数据集如果在数据分布中存在单一区域的不平衡或低覆盖率，也会引入网络学习参数的不确定性，正如在数据获取中已经描述的那样。这可以通过应用数据增强来增加多样性，或者通过平衡单个类或区域对损失函数的影响来缓解。

因素4：训练过程错误

一个神经网络的训练过程需要定义许多参数（batch size, optimizer, learning rate, stopping criteria, regularization, 等等）以及训练过程中发生的随机决策（batch生成和权重初始化）。所有的这些决策影响了局部最优，因此不太可能两个训练过程得到同样的模型参数。训练数据集如果在数据分布中存在单一区域的不平衡或低覆盖率，也会引入网络学习参数的不确定性，正如在数据获取中已经描述的那样。这可以通过应用数据增强来增加多样性，或者通过平衡单个类或区域对损失函数的影响来缓解。

因为训练过程是基于给定的训练数据集 $D$ ，数据获取过程的错误（例如label噪声）就会导致训练过程的错误。

C.推理

推理描述了一个新的样本 $x^*$ 通过神经网络得到的预测 $y^*$ 。这是网络是为一个特定任务训练的。如果采样的样本不是这个任务的，那就会引起错误，成为不确定性的来源。

因素5：未知数据引起的错误
特别是在分类任务中，一个从 $W_1$ 世界衍生样本训练出的神经网络也有能力处理 $W_2$ 世界衍生的样本。例如在猫和狗图片上训练出来的网络接收到鸟的样本。在这里，不确定性的来源不在于数据获取过程，因为我们假设一个世界只包含一个预测任务的可行输入。尽管实际结果可能等价于传感器上有太多的噪声或传感器完全故障，但这里考虑的数据代表一个有效的样本，但用于不同的任务或领域。

因素5：未知数据引起的错误

特别是在分类任务中，一个从

W_1

世界衍生样本训练出的神经网络也有能力处理

W_2

世界衍生的样本。例如在猫和狗图片上训练出来的网络接收到鸟的样本。在这里，不确定性的来源不在于数据获取过程，因为我们假设一个世界只包含一个预测任务的可行输入。尽管实际结果可能等价于传感器上有太多的噪声或传感器完全故障，但这里考虑的数据代表一个有效的样本，但用于不同的任务或领域。

D.预测性不确定度建模

建模器主要感兴趣的是传播到预测 $y^*$ 的不确定度，就是所谓的预测不确定度。已知样本 $x^*$ 下预测 $y^*$ 的条件概率分布为
$p(y^*|x^*) = \int_\Omega p(y^*|\omega)p(\omega|x^*)d\omega \tag{RealDIST}$

而最大后验估计为
$y^* = \arg \max_y p(y | x^*)~. \tag{RealMAP}$

因为建模是基于不可见的隐变量 $\omega$ ，所以一般都是基于一个包含N个样本及其目标的训练数据集 $D=\{x_i, y_i\}_{i=1}^N$ 做一个近似表示。这样对一个新的样本 $x^*$ ，上面两个公式对应的分布和MAP估计，在已知的样本上可通过下面两式预测：
$p(y^*\vert x^*) = \int_D p(y^*\vert \mathcal{D},x^*) \tag{DIST}$
与
$y^* = \arg \max_y p(y | \mathcal{D},x^*)~. \tag{MAP}$

通常情况下 $(D I ST)$ 式给定的分布是未知的，只能根据 $D$ 中给定的数据估计。对于这种估计，神经网络为许多任务和应用形成了一个非常强大的工具。
神经网络的预测会遇到数据相关错误以及模型相关错误，因此与 $y^*$ 有关的预测不确定性通常分为数据不确定性（也叫统计或者偶然不确定度）和模型不确定性（也叫系统或认知不确定性）。在基础研究上，一种额外的显式的分布不确定性建模用于建模训练数据分布未覆盖区域样本的不确定性。
1）模型和数据不确定性：模型不确定性涵盖了模型缺陷、训练过程中的错误、模型结构能力不足、缺乏未知样本的知识或者训练数据覆盖问题等。
与此相反，数据不确定性与直接来源于数据的不确定性有关。数据不确定性是由用一个数据样本去表示真实世界以及用 $(R e a l D I ST)$ 式表示分布的信息损失引起的。例如，在回归任务中，输入和目标测量的噪声引起数据不确定性使得网络无法正确学习。在分类任务中，样本没有包含足够的信息来100%确认一个类别，在预测时就会引起数据不确定性。信息损失是测量系统的问题，比如用某个分辨率的图像像素去表示真实世界的信息，或者标注过程中引起的错误。考虑上述5个神经网络预测的不确定性因素，模型不确定性覆盖因素I,III,IV,V，数据不确定度与II相关。而模型不确定度理论上可以通过优化结构、学习过程或训练数据来降低，数据不确定度是无法解释的。因此，dnn有能力处理不确定性输入，有能力消除或量化模型不确定度以及给出一个数据不确定度的正确预测，对于大量真实世界的任务以及安全性很重要的应用是至关重要的。
贝叶斯框架提供了一个推出深度学习不确定度的实用工具。在贝叶斯建模中，模型不确定度被形式化为模型参数 $\theta$ 上的概率分布，而数据不确定度被形式化为给定参数模型 $f_\theta$ 时模型输出 $y^*$ 的概率分布。预测 $y^*$ 的分布预测如下：
$p(y^*|x^*, D)=\int\underbrace{p(y^*\vert x^*,\theta)}_{\text{Data}}\underbrace{p(\theta\vert D)}_{\text{Model}}d\theta~. \tag{DMPred}$

$p(\theta|D)$ 是模型参数上的后验分布，描述了给定训练数据集D训出的模型参数的不确定度。后验分布通常是不容易计算的。而ensemble方法通过学习许多不同的参数设置和多个结果模型的平均来近似，贝叶斯推理使用贝叶斯法则重写为：
$p(\theta|D) = \frac{p(D|\theta)p(\theta)}{p(D)}~. \tag{BayesRule}$

$p(\theta)$ 称为模型参数的先验分布，因为它除了 $\theta$ 的通用知识其他信息都不考虑。 $p(D|\theta)$ 表示D中数据的分布是通过一个模型参数 $\theta$ 预测出来的似然度。许多损失函数都是受到似然函数启发或相关。损失函数旨在最大化log-likelihood（在一个假设分布上），例如交叉熵或平均平方误差。
甚至有了 $(B a yes R u l e)$ 的重写， $(D MP re d)$ 给定的预测分布依然很难解决。为了克服这个问题，许多不同的方法被提出来近似预测分布。

2）分布不确定性：依赖用于量化 $y^*$ 不确定度的方法，预测性分布可进一步分解为数据的、分布的以及模型的部分：
$p(y^*|x^*, D)=\int\int \underbrace{p(y\vert \mu)}_{\text{Data}}\underbrace{p(\mu\vert x^*,\theta)}_{\text{Distributional}}\underbrace{p(\theta\vert D)}_{\text{Model}}d\mu d\theta~. \tag{DDMPred}$

$(DD MP re d)$ 中分布的部分表示实际网络输出的不确定度，例如分类任务可能是一个狄利克雷分布，它是给定softmax输出下分类分布上的分布。这种方式建模的分布不确定度是输入分布的一个变化引起的不确定度，而模型不确定度是由构建和训练dnn的过程引起的不确定度。如 $(DD MP re d)$ 所示，模型不确定度影响了分布不确定度的估计，分布不确定度影响了数据不确定度的估计。
下图是数据、模型、分布不确定度的可视化：

E.不确定性分类

根据输入数据的domain，预测不确定度可以分为三种主要类型。

in-domain不确定度
in-domain不确定度表示与“从训练数据分布一致的分布采样的输入”相关的不确定度。in-domain不确定度源于深度神经网络不能解释in-domain样本(由于缺乏in-domain知识)。从建模者的视角，in-domain不确定度是由设计错误（模型不确定度）以及手头问题的复杂度(数据不确定度)引起的。从in-domain不确定性起源出发，可能通过增加训练数据集或者训练过程可以缓解。
domain-shift 不确定度
domain-shift不确定度表示从一个与训练数据分布有偏移的分布中获得输入的不确定度。这样的分布偏移是由于训练数据收敛不充分以及真实世界固有的可变性导致的。domain-shift可能由于DNN无法解释训练时可见样本外的域偏移样本而增加不确定性。一些造成domain偏移不确定度的错误是可以被建模的，因此也能降低。例如遮挡样本就能通过神经网络的学习来减少遮挡引起的domain shift不确定性。然后，如果不能建模所有引起domain shift的错误，例如移动噪声，那还是很困难。从一个建模者的视角，domain-shift不确定性是由外部或者环境因素引起的，可以通过在训练数据集上覆盖偏移的domain来降低。
out-of-domain 不确定度
out-of-domain的不确定度表示来自未知数据子空间的输入相关的不确定度。未知数据的分布和训练分布不同且相距甚远。DNN虽然可以从domain-shift样本中学到in-domain的知识，但无法从out-of-domain样本中学到。例如，domain-shift不确定描述的现象就像狗的模糊图像，out-of-domain不确定度描述的是学习了分类猫和狗却用来预测鸟。out-of-domain不确定度来源于对out-of-domain知识的匮乏。从建模者的视角，ouf-of-domain不确定度是输入样本引起的，网络并不想在缺乏充分训练样本时给出一个预测。

模型不确定度捕捉到了dnn由于缺乏in-domain或者out-of-domain知识而不知道的东西，因此它捕捉了所有in-dmain，domain-shift和out-of-domain不确定度。相比而言，数据不确定度捕捉了由训练数据自然属性导致的in-domain不确定度，例如样本重叠和系统标注噪声。

下一篇：深度神经网络的不确定性（中）

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
别再讲道理啦，对方听不进去的方所
我之前写过一篇叫做《你总妄想改变他人》，然后就有朋友跟我说，有一些方法可以改变他人之类的。嗯，是这样，但是任何具体的问题，都要限定好语境，描述清楚前提条件，然后再表达观点，我的这位朋友的说法就犯了一刀切的错误，这样并不能让讨论正常展开（这篇我得先给她看看，不然可能会挨揍）。好了，hhhh，谁让她不能写文章呢，我就来再说一说吧。我前面说过，我们在学到一个道理、学会一种方法之后，总是迫不及待地想要去与
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
ARM 和 AMD 架构的区别 m0_69576880 arm开发 windows 架构
ARM架构和AMD架构是两种不同的计算机处理器架构，它们有以下几个主要区别：设计出发点、兼容性、性能特点、市场定价。设计出发点：①ARM构架：ARM架构最初是为嵌入式系统设计的，旨在提供低功耗和高效能的解决方案。它主要应用于移动设备、嵌入式系统和物联网设备②AMD架构：AMD架构是基于x86架构的扩展，旨在提供与Intel架构兼容的处理器。它主要用于台式机、服务器和工作站等计算机系统。兼容性：AR
Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
氧惠官方邀请码333777，氧惠邀请码怎么获得？氧惠邀请码有什么套路？知行导师
问：氧惠邀请码怎么获得？答：氧惠官方邀请码333777返点高佣金高真的高。问：氧惠邀请码有什么套路？答：氧惠官方邀请码333777返点高佣金高真的高。氧惠APP汇聚各大主流电商和生活服务平台优惠，展示全网全品类商品，满足网购爱好者对品质好货与极致性价比的追求，并同时享受大平台购物权益保障。满足用户日常吃喝玩乐衣食住行的聚合APP，独特的商业模式，响应国家号召，为实现全民共富而努力奋斗。氧惠邀请码3
深入理解汇编语言子程序设计与系统调用网安spinage 汇编语言开发语言汇编算法
本文将全面解析汇编语言中子程序设计的核心技术以及系统调用的实现方法，涵盖参数传递的多种方式、堆栈管理、API调用等关键知识点，并提供实际案例演示。一、子程序设计：参数传递的艺术1.寄存器传参：高效简洁.386.modelflat,stdcalloptioncasemap:none.dataxdd5;定义变量ydd6sumdd?.code;函数定义：addxy1addxy1procpushebpmo
【老房翻新】92平轻奢简约风，将和谐之美融入空间！没人比我更懂装修
在客厅空间中，设计师于冷静的空间基调中选用了层次感丰富的黄蓝色作为主要跳色，搭配黑白纹理的地毯与单椅，为空间增加了时尚摩登的气息。艺术感的单品突出点亮了空间，绿植的点缀、留白的软饰则增强了空间的呼吸性。点击此处添加图片说明文字点击此处添加图片说明文字设计师力求使每一处的设立都在空间中达到相互间的呼应与制衡，将艺术的跃动之美赋于空间之上，也将空间的和谐之美融于生活之中。点击此处添加图片说明文字点击此
京东家电年销售额是去年的1300%，主要来自于他.... Shanshan小课堂
经过大半个月角逐纠缠，时间终于来到6月18日，618全球年中购物节迎来最高潮。作为国内最大的家电零售平台，京东家电从18日0点开始，便开启了飞速狂奔的模式，仅8分钟销售额就突破20亿元!展现出强劲的增长势头与家电主场的王者霸气的同时，也让各家电品牌实现了爆发式增长，美的、海尔、格力、奥克斯均在3分钟内突破1亿元大关。在今年的618中，除了消费者已经熟悉的网购形式外，线上线下联动的融合模式、社交电商
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
D2早课与活力链接亲爱的lingling
宇宙法则是：关注什么，什么就会变大。所以时刻关注自己在想什么，听什么，看什么！感恩今天早晨醒来的第一个意识是，真好，美好的一天开始了，我要越来越漂亮。起床做感恩冥想，呼吸法，喝一杯白开水，贴牛奶面膜。谢谢真我，感觉真好！感恩今天芳哥哥做的爱心早餐，给我煎了鸡蛋，谢谢芳哥的付出。谢谢！感恩我能够越来越清晰自己要做什么，越来越清楚知道自己想要的是什么，更加宁静与喜悦。今天早晨我听到我的高级智慧的声音，
Java 队列 tryxr java 开发语言队列
队列一般用什么哪种结构实现队列的特性数据入队列时一定是从尾部插入吗数据出队列时一定是从头部删除吗队列的基本运算有什么队列支持随机访问吗队列的英文表示什么是队列队列从哪进、从哪出队列的进出顺序队列是用哪种结构实现的Queue和Deque有什么区别Queue接口的方法Queue中的add与offer的区别offer、poll、peek的模拟实现如何利用链表实现队列如何利用顺序表实现队列什么叫做双端队列
与羊有关的诗句胡天寿01
1.《初春汉中漾舟》（孟浩然）羊公岘山下，神女汉皋曲。雪罢冰复开，春潭千丈绿。轻舟恣来往，探玩无厌足。波影摇妓钗，沙光逐人目。倾杯鱼鸟醉，联句莺花续。良会难再逢，日入须秉烛。2.《边头作》（李端）邠郊泉脉动，落日上城楼。羊马水草足，羌胡帐幕稠。射雕过海岸，传箭怯边州。事归朝将，今年又拜侯。3.《出境游山》(王勃)源水终无路，山阿若有人。羊先动石，走兔欲投巾。4.《按覆后归睦州，赠苗侍御》（刘长卿）
5G-RAN与语义通信RAN 一去不复返的通信er 智简网络&语义通信 5G 人工智能语义通信
1️⃣RAN协议栈与TCP/IP五层协议栈的对应关系a.物理层（TCP/IP）↔PHY（RAN）对应关系：5GNRRAN的物理层直接对应TCP/IP的物理层。功能对比：TCP/IP物理层：负责比特流的物理传输，如通过电缆、光纤或无线介质传输信号。RAN物理层：处理无线信号的调制、编码、信道估计和传输（如OFDM、LDPC编码）。在5GNR中，物理层负责将数据映射到无线信道（如PDSCH、PUSCH
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓