向来痴_

论文阅读-在分布式数据库环境中对哈希算法进行负载均衡基准测试

论文名称：Benchmarking Hashing Algorithms for Load Balancing in a Distributed Database Environment

摘要

现代高负载应用使用多个数据库实例存储数据。这样的架构需要数据一致性，并且确保数据在节点之间均匀分布很重要。负载均衡被用来实现这些目标。

几乎所有负载均衡系统的核心都是哈希算法。自经典一致性哈希引入以来，已经为此目的设计了许多算法。

负载均衡器的一个目的是确保存储集群的可扩展性。在节点添加或移除期间尽可能少地转移数据记录对整个系统的性能至关重要。负载均衡器中的哈希算法对这一过程影响最大。

在本文中，我们通过模拟和真实系统实验评估了几种用于负载均衡的哈希算法。为了评估算法性能，我们开发了一个基于Unidata MDM的基准测试套件——一个适用于各种主数据管理（MDM）应用的可扩展工具包。在评估中，我们采用了三个标准——产生的分布的均匀性、移动的记录数量和计算速度。根据我们实验的结果，我们创建了一个表格，在该表格中，每种算法根据上述标准进行了评估。

关键词：一致性哈希 · 数据库 · 基准测试。

1 引言

随着任何组织的增长，其企业数据资产的体积也随之上升。解决这一架构问题有两种常见方法[22]：垂直扩展和水平扩展。垂直扩展侧重于提高单个服务器的能力，而水平扩展涉及向集群添加机器。为了实现水平扩展，数据库表必须被水平分割成部分（分片），这些分片存储在不同的服务器节点上。

水平扩展有几个显著优势，例如通过改变集群大小灵活调整存储量的可能性。另一个优势是通过在服务器之间复制数据来处理数据丢失的能力。因此，出现了分布式数据存储的需求。

分布式存储的一个重要组成部分是负载均衡器——一种决定哪个特定服务器将存储数据实体（例如记录、表的一部分等）的机制。评估负载均衡器的标准有几个。首先，服务器上的数据分布应尽可能接近均匀。接下来，如果集群大小发生变化，移动的数据实体数量必须接近最优。最后，负载均衡器的计算成本不应该高。

为了计算分配给给定数据实体的分片，负载均衡器使用哈希算法。自90年代以来，已经专门为平衡不同类型的负载（如网络连接管理、分布式计算优化和数据存储平衡）设计了许多哈希算法。

专注于大数据量存储和处理的研究领域之一是主数据管理[1,19]（MDM）。它围绕主数据的概念——结合了对组织内业务运营重要的对象，如库存、客户和员工。MDM的主要目标是统一、协调和确保企业主数据的完整性。

在本文中，我们比较了几种哈希算法，并评估了它们对负载均衡问题的适用性。我们通过模拟和真实测试对它们进行了实验性评估。对于后者，我们使用了Unidata平台[10] —— 一个具有分布式存储能力的开源MDM工具包。根据我们实验的结果，我们创建了一个表格，在该表格中，根据上述标准对每种算法进行了评估。

本文的结构如下。在第2节中，我们描述了一些现有的负载均衡算法，定义了MDM领域的几个术语，并回顾了Unidata存储架构。然后在第3节中，我们描述了进行的实验，并在第4节中讨论了取得的结果。我们在第6节总结了本文。

2 背景和相关工作

在本节中，我们描述了那些我们将要基准测试的现有哈希算法，由于我们的最后一系列实验是在真实系统上运行的，我们还提供了系统本身、其目的和使用的数据模式的一般描述。

这项研究涉及两个研究领域，它们都有丰富的研究成果——负载均衡和哈希算法。前者有大量的调查描述了数十项工作。例如，考虑研究[8]，它引用了许多更多类似的调查。不幸的是，这些调查只使用一些高级标准（例如，适应性、静态或动态、抢占性等）对覆盖的方法进行分类。它们没有对调查的算法进行实验评估。原因是这样的调查范围太广，它们审查的研究属于许多不同的领域，进行这样的评估将极其困难。同时，工业界对特定领域最佳方法感兴趣，答案只能通过实证找到。

转向哈希，我们必须提到一个非常全面的调查[3]，它描述了许多哈希方法，并提出了一个算法分类。然而，关于数据导向哈希的部分旨在数据结构和机器学习，而不是负载均衡。我们在研究中考虑的哈希算法集合在这项调查中不存在。

因此，我们的工作填补了现有研究中的空白。

2.1 考虑的方法

让我们从用于数据平衡的哈希算法开始。每个考虑的负载均衡器都将其哈希函数应用于某些传入的数据实体，因此我们称应用的结果为一个键。负载均衡器的目的是将每个键与代表一个整数编号（id）的分片之一匹配。在本文中，我们考虑了几种哈希方法：

线性哈希是最古老的算法之一。除了经典版本[2]外，还有许多修改版本，如LH*[18]、LHM[14]、LHG[16]、LHS[15]、LHSA[13]和LH*RS[17]。这个算法家族的核心思想是计算键除以系统中分片数量的余数。因此，它们适用于解决具有固定分片数量的问题，这在我们的案例中是一个缺点。在我们的工作中，我们采用了用于PostgreSQL3分区的版本。
一致性哈希。最初，这个算法[9]被设计用于计算机网络的负载平衡。如今，它似乎是平衡许多不同类型负载的最流行方法。例如，像AWS DynamoDB[4]和Cassandra[11]这样的分布式系统使用一致性哈希进行分区和复制。这种方法基于在一个环上选择随机点，这是一个表示分片和数据实体为点的循环实数段。表示键的点被分配给顺时针最近的分片。为了确保数据均匀分布，每个分片由几个点表示。注意，这种方法的设计允许在只移动最优数量记录的情况下更改分片数量。
Rendezvous。类似于一致性哈希，这种方法[21]也是为了优化网络负载而开发的。对于给定的键，算法为每个分片计算成本函数的值，并将键分配给值最高的分片。添加或移除分片时，Rendezvous也不会移动额外的记录。
RUSH[6]被开发用于在磁盘集群中存储数据。它有两个修改版：RUSHR和RUSHT[7]。RUSH的作者专注于改进集群大小变化时数据分布的均匀性，因此，算法基于以下原则：每次更改集群大小时，使用一个特殊函数来决定哪些对象应该被移动以平衡系统。
Maglev是谷歌为Web服务负载均衡器开发的算法[5]。Maglev的目标是改善数据均匀性（与一致性哈希相比）并导致“最小干扰”，例如，如果分片集合变化，数据记录可能会被发送到它们之前所在的同一个分片。它被提出作为一致性哈希的一种新类型，在这种哈希中，环被替换为一个查找表，通过该查找表可以将键分配给一个分片。查找表的大小应该大于可能的分片数量以降低碰撞率。平均建议的查找时间是O(Mlog(M))，其中M是查找表的大小。
Jump是谷歌的另一个负载均衡器[12]。其作者将其呈现为一致性哈希的优越版本，它“不需要存储，更快，并且在将键空间均匀划分到桶中做得更好”。Jump仅为分片编号生成[0; #shards]范围内的值，因此添加新分片很快。然而，删除一个中间分片将导致许多记录重新哈希。运行Jump需要O(log(N))时间，其中N是分片数量。
AnchorHash。根据作者的说法，AnchorHash[20]是一种“保证最小干扰、平衡、高查找率、低内存占用和资源添加及移除后快速更新时间的哈希技术”。AnchorHash与其他讨论的算法的一个显著区别是它存储了一些关于系统之前状态的信息。

每篇提出新哈希算法的论文只将其与少数其他此类算法进行了比较。据我们所知，没有专门的比较这些算法应用于水平扩展问题的。同时，确保水平扩展的高性能是工业界需求的紧迫问题。因此，有必要评估所有这些算法并研究它们对这个问题的适用性。

2.2 基本定义

为了理解负载均衡器将被评估的数据存储的特点，有必要介绍一些MDM术语：

金记录。MDM的主要问题之一是为给定实体编译和维护“单一真相版本”[1]，例如人、公司、订单等。为了实现这一目标，MDM系统必须从许多数据源（特定组织的信息系统）中汇总信息，形成一个干净、一致的实体，称为金记录。
有效期是实体信息有效的时间间隔。每个金记录可能存在几个有效期。查询数据时应考虑这一事实。有两个时间维度：事件的时间和此新信息版本引入系统的时间。这导致了一种特殊的存储方案来管理这些信息。

2.3 系统架构

MDM系统是信息管理系统的一个特殊类别[10]。它们的特点对平台存储架构和数据处理提出了要求。

首先，必须支持存储对象的版本控制。因此，描述存储对象的数据资产具有有效期，查询数据时应考虑这些有效期。

其次，删除操作只能由管理员执行，而用户只能将数据实体标记为已删除。这是为了避免信息丢失并确保正确的版本控制支持所必需的。有时，这种数据处理语义有法律要求。这种架构模式通常被称为墓碑删除。

第三，应提供溯源。这意味着任何系统操作都应该是可追踪的。例如，必须有一种方法可以在每次操作后回滚所有记录的更改。

所提出的方法基于以下四个表，其中三个代表实体：

Etalon存储金记录本身的元数据。
Origin存储与记录源系统相关的元数据。
Vistory（版本历史）是origin的有效期，反过来可能有修订。
外部键是一个表，用于从Unidata存储的其他部分访问数据。

这些表之间的关系如图1所示。空心箭头表示的链接表示“共享”（继承）属性，实心箭头显示PK-FK（主键-外键）关系。表属性的详细描述可以在[10]中找到。

3 评估

为了选择最适合负载均衡问题的哈希算法，我们进行了实验评估。

3.1 实验设置

实验使用以下硬件和软件配置进行：

硬件：LENOVO E15，16GiB RAM，Intel(R) Core(TM) i7-10510U CPU @ 4.90GHz，TOSHIBA 238GiB KBG40ZNT。
软件：Ubuntu 20.04.4 LTS，Postgres 11.x，JDK 11.x，Tomcat 7.x，Elasticsearch 7.6.x。

某些算法有影响其性能的参数：

对于一致性哈希，为每个分片选择了16个点。这个数字是通过实验选出的，作为哈希速度和初始分布均匀性之间的折衷。
对于Maglev，查找表大小设置为10^3。与一致性哈希类似，这个数字是通过实验选出的。注意，这个值在重新平衡过程中很重要，但对于查找不是。
对于AnchorHash，我们将|A|（算法处理的桶的数量）设置为最大分片数量的两倍（即64），正如原始论文[20]中推荐的。

3.2 结果

为了评估负载均衡算法，我们定义了三个评价标准，并按其重要性降序排列：

产生的数据分布的均匀性。
在添加或移除分片期间记录的冗余移动。
查找速度。

为了选择最佳算法，我们进行了三项实验。首先，在Google Colab中进行了负载均衡模拟实验（使用Python）。这一步是为了进行算法性能的初步浅层评估。具体操作如下：首先生成了10K条记录，并通过哈希函数分配到32个分片中。因此，均匀分布将导致每个分片有312条记录。之后，计划移除8个分片，并强制系统重新平衡数据。因此，均匀分布应该导致每个分片有416条记录。这个过程针对每个考虑的负载均衡器（哈希函数）运行。

十次这样的实验的平均值如表1所示。表的第一列包含分片计算的平均时间，第二和第三列分别展示了重新平衡前后分配给分片的记录的方差。最后一列显示了实际移动的记录数量与最优数量的比率。

基于实验结果，我们决定由于未能满足所有三个标准，排除RUSHR进一步考虑。我们还排除了Jump，因为重新平衡的质量较差。

我们的下一个实验涉及Unidata平台，该平台是用Java实现的。为了验证先前获得结果的一致性和可转移性，我们决定在平台内重新评估分片id计算时间。因此，第二个实验也是在分片中分配10K记录。测量的平均值如下：

线性哈希 — 808ns
一致性哈希 — 2419ns
Rendezvous — 5945ns
Maglev — 807ns
AnchorHash — 2015ns

可以看出，算法运行时间的顺序与之前的实验相比没有变化。因此，我们可以得出结论，切换编程语言并未影响之前实验的结果，我们可以继续使用Unidata平台。

第三个实验使用部署的Unidata平台进行。其存储配置如下：四个Docker节点，每个节点上有八个分片的PostgreSQL。我们生成了10K个外部键和标准作为工作负载。实验的思路如下：依次移除三个节点，然后以类似方式再添加回来。

评估的结果显示在以下图表中。每个重新平衡步骤花费的总时间显示在图2中，移动的标准数量显示在图3中。我们省略了外部键的这样的图表，因为它基本上是相同的（是1:1映射）。每个步骤中分片之间数据分布显示在图4和图5中。

这个实验让我们得出以下结论：

一致性哈希、Rendezvous和AnchorHash移动的记录数量比线性哈希少超过50%。
在前两个重新平衡步骤中，Maglev移动的记录数量大约与线性哈希相同，但在最后两个步骤中，Maglev移动的记录数量显著减少，并接近其他三种方法。
线性哈希、Rendezvous、Maglev和AnchorHash分布数据足够均匀，但一致性哈希在分片体积上有显著差异。

4 讨论

现在让我们讨论每种考虑的算法与第3节定义的标准的一致性。

线性哈希在分片中的记录分布适当且查找速度高，但在每次重新平衡时会移动高达80%的记录，因此这种方法不符合我们的标准。然而，线性哈希可以应用于分片数量固定的系统中。
一致性哈希在移动最优数量的记录时具有可接受的查找时间，但数据分布极不均匀。应优先选择分布更均匀的方法。为了提高分布质量，可以增加环上每个分片的点数，但这将减慢查找速度。
Rendezvous在数据重新平衡和分布方面是最佳的，但查找时间最长。由于查找速度是优先级最低的标准，因此这种方法适合我们。
RUSHR不满足所有三个标准，因此不适合我们的目标。
Maglev提供快速查找和相对均匀的分布，但在某些情况下，它可以移动超过50%的所有记录（见图3上的水平线）。因此，Maglev适用于分片数量固定的系统。
Jump移动的记录数量最多（表1），因此也不适用。
AnchorHash到目前为止似乎是赢家，因为它满足了所有要求。

根据所有三项实验的结果，我们创建了一个表格，在其中列出了所有评估的算法（表2）。我们根据我们的三个标准对它们进行了评估，并按三个质量等级——低、中、高——分配了评级。

从表中可以明显看出，有两个获胜的算法——Maglev和AnchorHash，它们未能达到最佳重新平衡质量（移动记录的数量）或最高查找速度。

AnchorHash均匀地分布数据，移动了最优数量的记录，其查找时间也足够短。Rendezvous也符合第一和第二标准，但其查找时间是AnchorHash的两倍多。这两种方法适用于频繁添加或移除分片的系统。

另一方面，Maglev的查找速度是Rendezvous的两倍多，因此它适用于静态系统，类似于Jump和线性哈希。

一致性哈希似乎对两种类型的系统都有效，但其主要缺点是分片之间的数据分布不均匀。

RUSHR被证明是所有算法中最差的。

5 致谢

我们想感谢Anna Smirnova在准备本文中的帮助。

6 结论和未来工作

在本文中，我们研究了几种哈希算法，并评估了它们在分布式数据库中平衡数据的适用性。为此，我们进行了模拟和真实实验。真实实验使用Unidata平台进行，这是一个用于构建MDM解决方案的开源工具包。在这些实验中，我们采用了三个适用性标准，即产生的数据分布的均匀性、移动记录的数量和计算成本。

实验表明，在七种考虑的算法中有两个明确的赢家——AnchorHash和Maglev。另外两个，线性哈希和Jump，可能也有一些适用性。

扩展本文的几个可能方向。首先，我们注意到随机数生成器对某些算法的行为有一定影响。在当前的论文中，我们为所有算法固定了它，但探索这种影响可能是值得的。其次，研究改变算法参数的影响可能会很有趣。在本文中，我们使用了默认的或推荐的参数，但仔细调整可能会产生积极的结果。

Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
Redis + Caffeine 实现高效的两级缓存架构周童學 Java 缓存 redis 架构
Redis+Caffeine实现高效的两级缓存架构引言在现代高并发系统中，缓存是提升系统性能的关键组件之一。传统的单一缓存方案往往难以同时满足高性能和高可用性的需求。本文将介绍如何结合Redis和Caffeine构建一个高效的两级缓存系统，并通过三个版本的演进展示如何逐步优化代码结构。项目源代码：github地址、gitee地址两级缓存架构概述两级缓存通常由本地缓存（如Caffeine）和分布式缓
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
HikariCP调试日志深度解析：生产环境故障排查完全指南
HikariCP调试日志深度解析：生产环境故障排查完全指南更新时间：2025年7月4日|作者：资深架构师|适用版本：HikariCP5.x+|难度等级：中高级前言在生产环境中，数据库连接池往往是系统性能的关键瓶颈。HikariCP作为当前最流行的Java连接池，其调试日志包含了丰富的运行时信息，能够帮助我们快速定位和解决各种连接池相关问题。本文将深入解析HikariCP的日志体系，提供一套完整的故
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
Redis 分布式锁深度解析：过期时间与自动续期机制爱恨交织围巾分布式事务 redis 分布式数据库微服务学习 go
Redis分布式锁深度解析：过期时间与自动续期机制在分布式系统中，Redis分布式锁的可靠性很大程度上依赖于对锁生命周期的管理。上一篇文章我们探讨了分布式锁的基本原理，今天我们将聚焦于一个关键话题：如何通过合理设置过期时间和实现自动续期机制，来解决分布式锁中的死锁与锁提前释放问题。一、为什么过期时间是分布式锁的生命线？你的笔记中提到"服务挂掉时未删除锁可能导致死锁"，这正是过期时间要解决的核心问题
Gerapy爬虫管理框架深度解析：企业级分布式爬虫管控平台 Python×CATIA工业智造爬虫分布式 python pycharm
引言：爬虫工程化的必然选择随着企业数据采集需求指数级增长，传统单点爬虫管理模式面临三重困境：管理效率瓶颈：手动部署耗时占开发总时长的40%以上系统可靠性低：研究显示超过65%的爬虫故障源于部署或调度错误资源利用率差：平均爬虫服务器CPU利用率不足30%爬虫管理方案对比：┌───────────────┬─────────────┬───────────┬───────────┬──────────
修改gitlab默认的语言 Victor刘 gitlab
文章目录网上的方法1.采用数据库触发器的方法2.登录pg库2.1查看表2.2创建function2.3创建触发器2.4修改历史数据网上的方法网上修改/opt/gitlab/embedded/service/gitlab-rails/config/application.rb的方法，我试了，没生效，没进一步研究1.采用数据库触发器的方法2.登录pg库su-gitlab-psqlpsql-h/var/
负载均衡-加权随机算法 BP白朴 Nginx 负载均衡 java 算法服务器
负载均衡-加权随机算法由于访问概率大致相同，所以如果部分服务器性能不一致的话，容易导致性能差的服务器压力过大，所以要根据服务器性能不一致的情况，给性能好的服务器多处理请求，给差的少分配请求（能者多劳）所以就需要在随机算法的基础上给每台服务器设置权重，延伸为加权随机算法1、将应用服务器集群的IP存到Map里,每个IP对应有一个权重2、创建一个List,来将所有权重下的IP存到list里面如：192.
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
数据库基础概念梳理 22:30Plane-Moon 数据库
1.数据存储类型表(Table):存储结构化数据的标准方式，数据以行和列的形式组织，具有固定的格式。非结构化数据(UnstructuredData):如音频、视频、图片、文本文档等，其格式不固定，不易直接用表存储。2.SQL的核心优势SQL尤其擅长处理和操作存储在表中的结构化数据。2.1数据类型约束(DataTypeConstraints):定义列可存储的数据种类。整数类型:TINYINT(1字节
2025最新系统 Git 教程（七）（完结）嘿rasa 2025最新教程系列 git
第4章分布式Git4.1分布式Git-分布式工作流程你现在拥有了一个远程Git版本库，能为所有开发者共享代码提供服务，在一个本地工作流程下，你也已经熟悉了基本Git命令。你现在可以学习如何利用Git提供的一些分布式工作流程了。这一章中，你将会学习如何作为贡献者或整合者，在一个分布式协作的环境中使用Git。你会学习为一个项目成功地贡献代码，并接触一些最佳实践方式，让你和项目的维护者能轻松地完成这个过
SQL笔记纯干货 AI入门修炼 oracle 数据库 sql
软件：DataGrip2023.2.3，phpstudy_pro,MySQL8.0.12目录1.DDL语句（数据定义语句）1.1数据库操作语言1.2数据表操作语言2.DML语句（数据操作语言）2.1增删改2.2题2.3备份表3.DQL语句（数据查询语言）3.1查询操作3.2题一3.3题二4.多表详解4.1一对多4.2多对多5.多表查询6.窗口函数7.拓展:upsert8.sql注入攻击演示9.拆表
分布式全局唯一ID生成：雪花算法 vs Redis Increment，怎么选？
雪花算法vsRedisIncrement：分布式全局唯一ID生成方案深度对比在分布式系统开发中，“全局唯一ID”是绕不开的核心问题。无论是分库分表的数据库设计、订单编号的唯一性保证，还是日志追踪的链路标识，都需要一套可靠的ID生成方案。今天我们就来聊聊两种主流方案——雪花算法（Snowflake）和RedisIncrement，并从原理、特性到适用场景，帮你理清如何选择。同时，我们还将对比其他常见
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
构建高效的物流车辆定位管理系统体制教科书
本文还有配套的精品资源，点击获取简介：物流车辆定位管理系统利用信息技术提高物流效率和安全性。通过集成GPS技术进行实时车辆追踪和监控，它提供及时的货物运送和异常处理。系统的关键技术包括GPS车辆定位、C#编程语言、数据库管理、车辆管理、在途情况监控、预警与通知、数据分析与报告、用户界面设计、安全性与隐私保护以及系统集成。这些要素共同保障物流流程的高效、安全和智能化。1.物流车辆定位管理系统的应用与
Spring Security OAuth2.0在分布式系统中的安全实践
引言分布式系统架构下，安全认证与授权面临跨服务、高并发、多租户等挑战。SpringSecurity与OAuth2.0的结合为微服务安全提供了标准化解决方案。分布式系统中的安全挑战跨服务身份认证的复杂性令牌管理的可扩展性问题多租户场景下的权限隔离需求防止CSRF、XSS等常见攻击SpringSecurityOAuth2.0核心架构授权服务器设计@EnableAuthorizationServer配置
Spring AI Alibaba 快速入门指南（适合初学者）会飞的架狗师 AI spring 人工智能 java
如果你是刚接触AI开发或Spring框架的初学者，不用担心，本指南会用简单易懂的语言带你一步步了解并使用SpringAIAlibaba。一、什么是SpringAIAlibaba（小白也能懂）简单来说，SpringAIAlibaba就是一个“工具包”，它把阿里巴巴的AI技术（比如通义千问大模型、向量数据库等）和大家常用的Spring框架“打包”到了一起。**打个比方：**就像你想做蛋糕（开发AI应用
【Spring WebFlux】为什么 Spring 要拥抱响应式会飞的架狗师 Spring WebFlux spring java 后端
在现代分布式系统中，响应式系统已成为应对高并发、低延迟需求的核心方案。但构建响应式系统并非易事——它需要框架级别的支持来解决异步处理、资源调度、背压控制等底层问题。作为Java生态中最具影响力的框架，Spring对响应式的支持并非偶然，而是技术演进的必然选择。本文将从响应式系统的构建挑战出发，剖析Spring拥抱响应式的底层逻辑。一、响应式系统的构建困境：现有方案的局限性响应式系统的核心诉求是在有
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，