云淡风轻~~

深入哈希函数：SHA-256的数学之旅

上次我们聊了哈希是干啥的，说它是个"单向搅拌机"。那今天，咱们就把这台搅拌机的盖子掀开，看看里面的齿轮和刀片（也就是数学原理）到底是怎么工作的。

我们拿大名鼎鼎的 SHA-256 来开刀。放心，这篇文章不是让你去当数学家，而是用一个开发者的视角，去理解我们每天都在用的工具，它背后那些精妙的设计。

老规矩，先上警告：理解原理是为了更好地使用它，而不是让你自己去实现一个！ 专业的事交给密码学家，我们负责把它用对。

宏观视角：Merkle–Damgård 结构

在我们一头扎进 SHA-256 的细节之前，得先了解大部分哈希函数（包括 MD5、SHA-1、SHA-256）的通用设计蓝图——Merkle–Damgård 结构。

这结构思想很简单：既然我一次性处理不了无限长的数据，那我把它切成一块一块的，不就行了？

它就像一个链式反应炉：

把你的输入数据（比如"hello world"）切成固定大小的块（Block）。
定义一个初始的哈希值（IV - Initial Value），这可以看作是反应炉的"种子"。
把第一个数据块和"种子"一起扔进一个叫做"压缩函数（Compression Function）"的黑盒里。
这个黑盒会输出一个新的哈希值。
把这个新的哈希值作为新的"种子"，和下一个数据块一起，再次扔进那个黑盒里。
如此循环，直到最后一个数据块被处理完毕。
最后输出的那个哈希值，就是你整个数据的最终哈希结果。

初始哈希值

压缩函数

数据块1

中间哈希值1

压缩函数

数据块2

中间哈希值2

压缩函数

数据块n

最终哈希值

这个结构的核心就是那个"压缩函数"。SHA-256 的所有魔法，都发生在这个函数里。

SHA-256 的解剖过程

现在，我们正式开始解剖 SHA-256。

第一步：消息填充（Padding）

反应炉要求每个数据块大小都得一样，SHA-256 要求是 512 位（64 字节）。可我们的输入数据千奇百怪，怎么办？

填充！ 规则如下：

在你的原始数据末尾，先补一个 1。
然后，一直补 0，直到消息的总长度距离"512的倍数"只差 64 位为止。
最后这 64 位，用来存放你原始数据的长度（用二进制表示）。

举个例子，假设我们要哈希字符串 “abc”。

“abc” 的 ASCII 编码是 01100001 01100010 01100011，共 24 位。
补 1：变成 25 位。
补 0：我们需要补到 512 - 64 = 448 位。所以要补 448 - 25 = 423 个 0。
补长度：最后 64 位，填入原始长度 24 的二进制。

这样一来，任何长度的输入，都会被处理成一个或多个精确的 512 位数据块。这个填充方案确保了不同长度的原始消息，不会产生相同的填充后消息。

第二步：初始化哈希值（H）

还记得上面说的"种子"吗？SHA-256 的"种子"是 8 个 32 位的整数，我们称之为 H0 到 H7。

H0 = 0x6a09e667
H1 = 0xbb67ae85
H2 = 0x3c6ef372
H3 = 0xa54ff53a
H4 = 0x510e527f
H5 = 0x9b05688c
H6 = 0x1f83d9ab
H7 = 0x5be0cd19

这些"魔法数字"可不是随便拍脑袋想的。它们是自然界最纯粹的 8 个素数（2, 3, 5, 7, 11, 13, 17, 19）的平方根的小数部分，取前 32 位。这么做的目的是为了消除任何可能的后门或人为偏见，保证其初始状态的"随机性"。
备注：其实也不是说只能是这个8个数字而已。其实主要是为了表明来源，密码学中的常数如果没有来源会被认为是后门。

第三步：处理数据块（核心压缩函数）

终于到了最核心的部分。对于每一个 512 位的数据块，SHA-256 会执行一个包含 64 "轮"计算的循环。

在循环开始前，会先初始化 8 个"工作变量"，用当前的哈希值（对于第一个块，就是初始 H 值）来赋值：
a, b, c, d, e, f, g, h = H0, H1, H2, H3, H4, H5, H6, H7

然后，开始 64 轮的"搅拌"：

1. 消息调度（Message Schedule）

首先，SHA-256 不会直接用 512 位的数据块，而是会把它扩展成 64 个 32 位的"字"（word），我们称之为 W[0] 到 W[63]。

前 16 个字 W[0] 到 W[15] 就是把 512 位数据块直接切开得到的。
后面的 48 个字 W[16] 到 W[63] 是通过一个公式，由前面的字生成的：
W[t] = σ1(W[t-2]) + W[t-7] + σ0(W[t-15]) + W[t-16]

这里的 σ0 和 σ1 是一些"小魔法"，它们包含了按位**循环右移（ROTR）和右移（SHR）**操作。

σ0(x) = ROTR(x, 7) ^ ROTR(x, 18) ^ SHR(x, 3)
σ1(x) = ROTR(x, 17) ^ ROTR(x, 19) ^ SHR(x, 10)
(注：^ 是异或 XOR)

这个过程的目的是制造雪崩效应。输入的微小变化，会通过这个扩展过程，迅速扩散到整个消息调度数组中。

2. 64 轮循环

接下来就是长达 64 轮的循环。在每一轮（我们称之为第 t 轮），都会进行如下计算：

T1 = h + Σ1(e) + Ch(e, f, g) + K[t] + W[t]
T2 = Σ0(a) + Maj(a, b, c)

h = g
g = f
f = e
e = d + T1
d = c
c = b
b = a
a = T1 + T2

是不是看着有点头大？我们拆解一下里面的"大魔法"：

W[t]: 上一步消息调度中生成的第 t 个字。
K[t]: 第 t 轮的常量。和初始 H 值一样，这些也是"魔法数字"，来自前 64 个素数的立方根的小数部分。它们为每一轮的计算引入了不同的扰动。
Σ0(a) 和 Σ1(e): 又是两个循环移位和异或的组合，目的是进一步混淆数据。
- Σ0(a) = ROTR(a, 2) ^ ROTR(a, 13) ^ ROTR(a, 22)
- Σ1(e) = ROTR(e, 6) ^ ROTR(e, 11) ^ ROTR(e, 25)
Ch(e, f, g): “Choose” 函数。Ch(e, f, g) = (e AND f) ^ ((NOT e) AND g)。如果 e 的某一位是 1，则结果的对应位取 f 的，否则取 g 的。这引入了非线性。
Maj(a, b, c): “Majority” 函数。Maj(a, b, c) = (a AND b) ^ (a AND c) ^ (b AND c)。对每一位看 a, b, c 中哪一个（0 或 1）占多数，结果就取哪个。同样是为了引入非线性。

为什么要做这些奇怪的操作？

所有这些眼花缭乱的移位、异或、与非操作，核心目的只有一个：混淆（Confusion）与扩散（Diffusion）。

混淆：让密钥（在这里是输入数据）和最终密文（哈希值）之间的关系变得尽可能复杂。Ch、Maj 等非线性函数是主力。
扩散：输入数据的任何一点微小改动，都能迅速地、大范围地影响到输出的每一位。这就是所谓的"雪崩效应"。各种循环移位 ROTR 就是干这个的。

这 64 轮疯狂"搅拌"之后，我们得到了 8 个新的 a, b, c, d, e, f, g, h 值。

第四步：更新哈希值

循环结束后，将这一轮计算得到的"工作变量"和该数据块处理之前的"哈希值"进行相加（模 2^32 加法）：

H0 = H0 + a
H1 = H1 + b
...
H7 = H7 + h

好了，一个数据块处理完毕。这个新生成的 H0 到 H7，将作为下一个数据块的"种子"，重复第三步。

第五步：生成最终结果

当所有的数据块都被处理完毕后，最后得到的 H0 到 H7 这 8 个 32 位整数，按顺序拼接在一起，就形成了最终的 256 位 SHA-256 哈希值。

大功告成！

终极问题：为什么我们找不到碰撞？

在理解了 SHA-256 的内部构造后，一个非常核心的问题浮出水面：“既然哈希函数的输入是无限的，输出是有限的，那必然存在碰撞。为什么我们还说它是安全的，而且找不到碰撞呢？”

这是一个绝佳的问题，它触及了哈希函数安全性的根基。要回答它，我们得从两个层面来看：理论层面和现实层面。

理论上：碰撞必然存在（鸽巢原理）

首先，一个残酷但必须承认的事实是：哈希碰撞是 100% 存在的。

这可以用一个我们初中就学过的数学知识来解释，叫"鸽巢原理"（Pigeonhole Principle）：如果你有 10 只鸽子，但只有 9 个鸽巢，那么无论你怎么放，至少有 1 个鸽巢里得挤着 2 只或更多的鸽子。

我们把这个原理套在 SHA-256 上：

鸽巢（输出空间）：SHA-256 的输出长度是固定的 256 位。所以，它能产生的不同哈希值的总数是 2^256 个。这是一个天文数字，但它是有限的。
鸽子（输入空间）：哈希函数的输入可以是任意长度的数据。字符串 “a”、“b”、“hello world”、一部电影、整个互联网的数据…… 输入的可能性是无限的。

好了，现在我们用一个有限的鸽巢，去装无限的鸽子。结果不言而喻：必然会有无数个不同的输入，最终挤在同一个哈希值的"鸽巢"里。

所以，从理论上讲，绝对存在 x != y，但 sha(x) = sha(y)。我们管这种情况叫做"碰撞"（Collision）。

现实中：为什么你就是找不到它

既然碰撞必然存在，那为什么我们还每天放心地用着它，并认为它是安全的？

答案是：因为从理论上的"存在"，到实际上的"找到"，中间隔着一道名为"计算上不可行"的天堑。

这道天堑，就是由 SHA-256 内部那些复杂的设计精心构建的。我们刚刚拆解的那些眼花缭乱的操作，就是为了达到这个目的：

1. 雪崩效应（Avalanche Effect）

这是最核心的一点。一个设计良好的哈希算法，输入的任何一点微小变化（哪怕只改动 1 个 bit），都会导致输出结果天翻地覆、完全不同（理想情况下会有一半的 bit 位发生反转）。

这意味着什么？

没有规律可循：你无法通过观察 hash("abc") 和 hash("abd") 的结果，来推测如何修改输入才能让它们的哈希值更"接近"。两个结果之间看起来是完全随机的关系。
无法"逼近"目标：寻找碰撞不是一个可以逐步优化的过程。你不能像猜数字游戏那样，根据"大了"或"小了"来调整下一次猜测。每一次尝试都是一次独立的、全新的"盲猜"。

这让寻找碰撞变成了一场纯粹的、暴力的、运气差到极点的"抽奖"。

2. 非线性操作（Non-linearity）

我们刚刚分析过的 Ch (Choose) 和 Maj (Majority) 函数是关键。如果整个哈希过程都是线性的（比如只有加法、异或、移位），那密码学家就可以构建一套巨大的线性方程组，然后用计算机"解方程"的方式来找到碰撞。

但这些非线性函数的引入，彻底打乱了这种可能性。它让整个系统变得无法用简单的数学方程来描述和求解。就好像你没法通过分析一块蛋糕的成分，来精确反推出烤箱的温度和烘焙时间一样。

3. 生日攻击（Birthday Attack）与恐怖的 2^128

黑客们也不是只会"盲猜"。他们能用的最有效的寻找碰撞的捷径，叫做"生日攻击"。

这个名字来源于"生日悖论"：一个 23 人的房间里，有两个人同一天生日的概率就超过了 50%。这比直觉要高得多。

应用到哈希碰撞上：我们不需要尝试 2^256 次才能找到一个碰撞。根据概率学，我们只需要计算大约 sqrt(2^256) = 2^128 个不同输入的哈希值，就有很大概率在这些结果中找到一对碰撞。

2^128 次！这看起来比 2^256 小多了，对吧？

但它依然是个无法想象的数字。这么说吧：

假设你拥有当前地球上最强的算力，用全世界所有的计算机一起来算。要想完成 2^128 次 SHA-256 计算，所需要的时间，可能比宇宙的年龄（约 138 亿年）还要长得多得多。

这就是我们说它"计算上不可行"（Computationally Infeasible）的真正含义。它在理论上可行，但在可预见的未来，以人类已知的任何技术，都无法完成。

总结

我们再回顾一下这趟旅程：

打包行李（填充）：把任意长度的数据，按照严格规定打包成一或多个 512 位的行李箱。
设定起点（初始H值）：拿出密码学家给我们的、源于素数平方根的"魔法数字"作为起点。
循环搅拌（压缩函数）：对每一个行李箱，都用一套包含 64 道工序的复杂流程（消息调度、移位、异或、非线性函数）进行搅拌，并把搅拌结果和上一轮的结果混合。
得出终点（最终哈希）：当所有行李箱都搅拌完毕，最后输出的结果就是最终的哈希值。

这套流程被设计得如此复杂和精妙，充满了各种非线性和扩散操作，目的就是为了让它成为一个真正的"单向"过程，让任何试图从结果反推输入的努力，都淹没在计算量的汪洋大海之中。

而正是因为这种"计算上不可行"的特性，我们才能在理论上承认碰撞必然存在的同时，在现实中放心地依赖 SHA-256 来确保数据的完整性。我们不是在和数学博弈，我们是在和宇宙的物理定律、能量和时间本身博弈。

现在，当你再在代码里调用 sha256(data) 时，希望你能会心一笑，因为你已经知道了这台"搅拌机"内部的秘密。

扩展

如果你想亲眼看看哈希的计算过程，其实有一个在线可视化网站：https://sha256algorithm.com/，可以提供 sha256的全过程展示，非常的直观。
如果你想要看具体的算法实现，可以看这个：https://zhuanlan.zhihu.com/p/94619052

day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
量子计算解决气候变化：科学家找到了新方法大力出奇迹985 量子计算
气候变化已成为全球面临的严峻挑战，传统计算方法在应对与之相关的复杂问题时存在诸多局限。而量子计算作为新兴技术，为解决气候变化难题带来曙光。本文深入剖析科学家利用量子计算应对气候变化的新方法。量子计算凭借独特的量子比特与量子特性，在加速气候模型计算、优化模型参数、预测极端天气事件等方面展现出巨大优势。同时，在可再生能源整合、电网管理、碳捕获等实际应用场景中也发挥着重要作用。尽管目前面临硬件和算法等方
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
算法刷题-动态规划之背包问题
1.背包问题之01（4.30）题目描述小明有一个容量为VV的背包。这天他去商场购物，商场一共有NN件物品，第ii件物品的体积为wiwi，价值为vivi。小明想知道在购买的物品总体积不超过VV的情况下所能获得的最大价值为多少，请你帮他算算。输入描述输入第11行包含两个正整数N,VN,V，表示商场物品的数量和小明的背包容量。第2∼N+12∼N+1行包含22个正整数w,vw,v，表示物品的体积和价值。1
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
顺时针旋转N * N 的矩阵忆杰算法 Python 矩阵 python 算法
顺时针旋转题目描述数据范围实现逻辑代码实现题目描述有一个NxN整数矩阵，请编写一个算法，将矩阵顺时针旋转90度。给定一个NxN的矩阵，和矩阵的阶数N,请返回旋转后的NxN矩阵。数据范围0852789963'''#第N列逆序后变成第N行#或者是第i行变成第N-i-1列代码实现classSolution:#列转换为行defline2Row(self,mat,n):arr=[]forlineinrang
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
【经典面试题】【JVM与性能调优】垃圾回收算法（标记-清除算法/复制算法/标记-整理算法/CMS/G1/ZGC）本本本添哥归档 -Inbox1 001 -基础开发能力面试题目汇总 jvm 算法
JVM自动管理内存，当对象不再被引用时，垃圾回收器（GarbageCollector）会自动释放这些对象占用的内存。标记-清除算法（Mark-Sweep）：标记垃圾再清除，会产生碎片。复制算法（Copying）：将存活对象复制到新区域，适合新生代，无碎片但浪费空间。标记-整理算法（Mark-Compact）：标记后将存活对象移到一端，清除另一端，适合老年代。分代收集算法（GenerationalC
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
CMS垃圾回收器+G1垃圾回收器+ZGC垃圾回收器详解及对比 weixin_43751710 jvm java 算法
一、CMS收集器CMS(ConcurrentMarkSweep)收集器是一种以获取最短回收停顿时间为目标的收集器，是一款针对老年代的垃圾回收器，一般和Parallel回收器（一款新生代回收器，是使用复制算法的收集器，又是并行的多线程收集器，收集时会Stoptheworld）配合使用。1.工作过程从名字（包含“MarkSweep”）上就可以看出CMS收集器是基于标记-清除算法实现的，它的运作整个过程
负载均衡-加权随机算法 BP白朴 Nginx 负载均衡 java 算法服务器
负载均衡-加权随机算法由于访问概率大致相同，所以如果部分服务器性能不一致的话，容易导致性能差的服务器压力过大，所以要根据服务器性能不一致的情况，给性能好的服务器多处理请求，给差的少分配请求（能者多劳）所以就需要在随机算法的基础上给每台服务器设置权重，延伸为加权随机算法1、将应用服务器集群的IP存到Map里,每个IP对应有一个权重2、创建一个List,来将所有权重下的IP存到list里面如：192.
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
CMS垃圾回收器和G1垃圾回收器区别_g1cms垃圾回收器区别 2401_89191885 jvm
该类所有的实例都已经被回收，也就是Java堆中不存在该类的任何实例；加载该类的ClassLoader已经被回收；该类对应的java.lang.Class对象没有在任何地方被引用，无法在任何地方通过反射访问该类的方法。3.常见的垃圾回收算法1、Mark-Sweep（标记-清除算法）：（1）思想：标记清除算法分为两个阶段，标记阶段和清除阶段。标记阶段任务是标记出所有需要回收的对象，清除阶段就是清除被标
【数据结构】--ArrayList与顺序表 bubu__ 数据结构数据结构
文章目录1.线性表2.顺序表3.ArrayList简介4.MyArrayList的实现5.ArrayList使用5.1ArrayList的构造5.2ArrayList常见操作5.3ArrayList的遍历5.4ArrayList的扩容机制6.ArrayList的具体使用6.1简单的洗牌算法6.2杨辉三角1.线性表线性表（linearlist）是n个具有相同特性的数据元素的有限序列。线性表是一种在实
分布式全局唯一ID生成：雪花算法 vs Redis Increment，怎么选？
雪花算法vsRedisIncrement：分布式全局唯一ID生成方案深度对比在分布式系统开发中，“全局唯一ID”是绕不开的核心问题。无论是分库分表的数据库设计、订单编号的唯一性保证，还是日志追踪的链路标识，都需要一套可靠的ID生成方案。今天我们就来聊聊两种主流方案——雪花算法（Snowflake）和RedisIncrement，并从原理、特性到适用场景，帮你理清如何选择。同时，我们还将对比其他常见
数据结构2-集合类ArrayList与洗牌算法
文章目录★引言：一.MyArrayList模拟实现（一）IList（二）MyArrayList（1）add(Tdata)（2）add(intpos,Tdata)（3）IllgalPosException（4）indexOf(ObjecttoFind)（5）contains(ObjecttoFind)（6）get(intpos)（7）set(intpos,Tvalue)（8）remove(Objec
【春招笔试真题】饿了么2025.03.07-算法岗真题春秋招笔试突围最新互联网春秋招试题合集算法代理模式
第一题：数据特征最大化1️⃣：找出数组中的最大元素，返回其平方难度：简单这是一道技巧性题目，乍看需要枚举所有子数组计算异或和和最大公约数。但通过分析可以发现，对任意单元素子数组，其异或值和最大公约数都是元素本身，因此乘积是元素的平方。可以证明，最大元素的平方就是整个问题的最优解。时间复杂度O(n)。第二题：同质接龙字符串1️⃣：记忆化搜索+动态规划2️⃣：使用状态编码降低存储复杂度难度：中等这道题
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

深入哈希函数：SHA-256的数学之旅

宏观视角：Merkle–Damgård 结构

SHA-256 的解剖过程

第一步：消息填充（Padding）

第二步：初始化哈希值（H）

第三步：处理数据块（核心压缩函数）

第四步：更新哈希值

第五步：生成最终结果

终极问题：为什么我们找不到碰撞？

理论上：碰撞必然存在（鸽巢原理）

现实中：为什么你就是找不到它

总结

扩展

你可能感兴趣的:(哈希算法,算法)