大大蚊子

Debezium发布历史97

原文地址： https://debezium.io/blog/2020/11/04/streaming-vitess-at-bolt/

欢迎关注留言，我是收集整理小能手，工具翻译，仅供参考，笔芯笔芯.

Bolt 的 Vitess 直播
十一月 4, 2020 作者： Kewei Shang, Ruslan Gibaiev
维特斯
这篇文章最初出现在Bolt Labs Engineering 博客上。

传统上，MySQL 已用于为Bolt 的大部分后端服务提供支持。我们设计模式时将它们分成不同的 MySQL 集群。每个 MySQL 集群都包含一个数据子集，并由一个主节点和多个复制节点组成。

一旦数据持久化到数据库，我们就使用Debezium MySQL Connector捕获数据更改事件并将其发送到 Kafka。这为我们提供了一种简单可靠的方式来在后端微服务之间传达更改。

维特斯在博尔特
Bolt 在过去几年中大幅增长，写入 MySQL 的数据量也随之增加。手动数据库分片已经成为一个相当昂贵且持久的过程，并且容易出错。因此我们开始评估更具可扩展性的数据库，其中之一就是Vitess。Vitess是一个基于MySQL的开源数据库集群系统，并为其提供水平可扩展性。它起源于 YouTube 并经过实际检验，后来开源并被 Slack、Github、JD.com 等公司用来为其后端存储提供支持。它将重要的 MySQL 功能与 NoSQL 数据库的可扩展性结合在一起。

Vitess 提供的最重要的功能之一是其内置分片。它允许数据库通过以对后端应用程序逻辑透明的方式添加新分片来水平增长。对于您的应用程序来说，Vitess 就像一个巨大的单一数据库，但实际上数据在幕后被划分为多个物理分片。对于任何表，都可以选择任意列作为分片键，所有插入和更新都将由 Vitess 本身无缝定向到适当的分片。

下图 1说明了后端服务如何与 Vitess 交互。在较高级别上，服务通过负载均衡器连接到无状态 VTGate 实例。每个 VTGate 都将 Vitess 集群的拓扑缓存在其内存中，并将查询重定向到正确的分片以及分片内正确的 VTablet（及其底层 MySQL 实例）。更多关于 VTablet 的内容写在下面。
图片来自于原文

图 1.Vitess 架构。参考： https: //www.planetscale.com/vitess

Vitess 提供的其他有用功能包括：

故障转移（又称重新父子关系）对于客户来说既简单又透明。客户端仅与 VTGate 通信，VTGate 透明地负责新主节点的故障转移和服务发现。

它会自动重写可能导致数据库性能下降的“有问题”查询。

它具有缓存机制，可以防止重复查询同时到达底层 MySQL 数据库。只有一个查询将到达数据库，其结果将被缓存并返回以回答重复的查询。

它有自己的连接池，消除了MySQL连接的高内存开销。因此，它可以轻松地同时处理数千个连接。

连接超时和事务超时可以配置。

进行重新分片操作时，它的停机时间最少。

下游 CDC 应用程序可以使用其 VStream 功能从 Vitess 读取更改事件。

流媒体 Vitess 选项
捕获数据变化并将其发布到 Apache Kafka 的能力是 Bolt 采用 Vitess 的要求之一。我们考虑过几种不同的选择。

选项 1：使用 Debezium MySQL 连接器
应用程序连接到 Vitess VTGate 以发送查询。VTGate支持MySQL协议并具有SQL解析器。您可以使用任何 MySQL 客户端（例如 JDBC）连接到 VTGate，VTGate 将您的查询重定向到正确的分片并将结果返回给您的客户端。

然而，VTGate 并不等于 MySQL 实例，它而是各种 MySQL 实例的无状态代理。为了让 MySQL 连接器接收更改事件，Debezium MySQL 连接器需要连接到真实的 MySQL 实例。更明显的是，VTGate 还存在一些已知的兼容性问题，这使得连接到 VTGate 与 MySQL 不同。

另一种选择是使用 Debezium MySQL Connector 直接连接到不同分片的底层 MySQL 实例。它有其优点和缺点。

一个优点是，对于未分片的键空间（Vitess 的数据库术语），MySQL 连接器可以继续正常工作，我们不需要包含额外的逻辑或特定实现。它应该工作得很好。

最大的缺点之一是重新分片操作会变得更加复杂。例如，原始MySQL实例的GTID在重新分片时会发生变化，MySQL连接器依赖于GTID才能正常工作。我们还认为，将 MySQL 连接器直接连接到每个底层 MySQL 实例违背了 Vitess 操作简单性的目的，因为每次重新分片时都必须添加（或删除）新的连接器。更不用说这样的操作会导致 Kafka 代理内部的数据重复。

选项 2：使用 JDBC 源连接器
我们还考虑过使用JDBC Source Connector。它允许将任何支持 JDBC 驱动程序的关系数据库中的数据获取到 Kafka 中。因此，它与Vitess VTGate兼容。它也有其优点和缺点。

优点：

它与 VTGate 兼容。

它可以更好地处理 Vitess 重新分片操作。在重新分片操作期间，读取会简单地自动重定向（由 VTGate）到目标分片。它不会生成任何重复项或丢失任何数据。

缺点：

它是基于轮询的，这意味着连接器按定义的时间间隔（通常每隔几秒）轮询数据库以查找新的更改事件。这意味着与 Debezium MySQL 连接器相比，我们的延迟会高得多。

其偏移量由表的增量主键或表的时间戳列之一管理。如果我们使用时间戳列作为偏移量，则必须为每个表创建时间戳列的二级索引。这对我们的后端服务增加了更多限制。如果我们使用增量主键，我们将错过行更新的更改事件，因为主键根本没有更新。

JDBC 连接器创建的主题名称不包括表的架构名称。使用topic.prefix连接器配置意味着我们每个模式都有一个连接器。在 Bolt，我们有大量的模式，这意味着我们需要创建大量的 JDBC 源连接器。

在 Bolt，我们的下游应用程序已经设置为使用 Debezium 的数据格式和主题命名约定，例如，我们需要将下游应用程序的解码逻辑更改为新的数据格式。

不捕获行删除。

选项 3：使用 VStream gRPC
VTGate 公开了一个名为 VStream 的 gRPC 服务。它是一种服务器端流媒体服务。任何 gRPC 客户端都可以订阅VStream服务，以从底层 MySQL 实例获取连续的更改事件流。VStream发出的更改事件与底层MySQL实例的MySQL二进制日志具有类似的信息。单个 VStream 甚至可以订阅给定键空间的多个分片，这使其成为构建 CDC 工具的相当方便的 API。

在幕后，如图2所示，VStream 从多个VTablet读取更改事件，每个分片一个 VTablet。因此，它不会从给定分片的多个 VTablet 发送重复项。每个 VTablet 都是其 MySQL 实例的代理。典型的拓扑将包括一个主 VTablet 及其相应的 MySQL 实例，以及多个副本 VTablet，每个副本都是其自己的副本 MySQL 实例的代理。VTablet 从其底层 MySQL 实例获取更改事件，并将更改事件发送回 VTGate，VTGate 又将更改事件发送回 VStream 的 gRPC 客户端。

当订阅VStream服务时，客户端可以指定VGTID和平板电脑类型（例如MASTER，REPLICA）。VGTID 告诉 VStream 开始发送更改事件的位置。本质上，VGTID 包括（键空间、分片、分片 GTID）元组的列表。Tablet 类型告诉我们从每个分片中的哪个 MySQL 实例（主实例或副本实例）读取更改事件。
图片来自于原文

图 2.VStream 架构。参考： https: //vitess.io/docs/concepts/vstream

使用 VStream gRPC 的一些优点包括：

这是从 Vitess 接收更改事件的简单方法。Vitess 的文档中还建议使用 VStream 构建下游 CDC 流程。

VTGate 隐藏了连接到各种源 MySQL 实例的复杂性。

它具有较低的延迟，因为更改事件一旦发生就会立即传输到客户端。

更改事件不仅包括插入和更新，还包括删除。

最大的优点之一可能是更改事件包含每个表的架构。因此，您不必担心提前获取每个表的架构（例如，通过解析 DDL 或查询表的定义）。

更改事件包含 VGTID，CDC 进程可以存储该 VGTID 并将其用作下次重新启动 CDC 进程的位置的偏移量。

同样重要的是，VStream 旨在与 Vitess 操作（例如重新分片和移动表）良好配合。

也有一些缺点：

尽管它包含表模式，但仍然缺少一些重要信息。例如，Enum和Set列类型尚未提供所有允许的值。不过，这应该在下一个主要版本（Vitess 9）中修复。

由于 VStream 是一项 gRPC 服务，因此我们无法开箱即用地使用 Debezium MySQL Connector。然而，用其他语言实现 gRPC 客户端非常简单。

考虑到所有因素，我们决定使用 VStream gRPC 来捕获来自 Vitess 的更改事件，并基于 Debezium 的所有最佳实践来实现我们的 Vitess 连接器。

Vitess 连接器深入研究和开源
在我们决定实现 Vitess 连接器之后，我们开始研究各种 Debezium 源连接器（MySQL、Postgres、SQLServer）的实现细节，以借鉴一些想法。几乎所有这些都是使用通用的连接器开发框架来实现的。因此很明显，我们应该在其基础上开发 Vitess 连接器。鉴于我们是 MySql Connector 的非常活跃的用户，并且我们从它的开源中受益，因为它允许我们为它贡献我们自己所缺少的东西。因此，我们决定回馈社区，并在 Debezium 的保护下开源 Vitess 源连接器代码库。请随时在Debezium Connector Vitess了解更多信息。我们欢迎并重视任何贡献。

在较高级别上，如下所示，连接器实例是在 Kafka Connect 工作线程中创建的。在撰写本文时，您有两种选择来配置连接器以从 Vitess 读取数据：

选项 1（推荐）：

如图3所示，每个连接器捕获特定键空间中所有分片的更改事件。如果键空间未分片，连接器仍然可以从键空间中的唯一分片捕获更改事件。当连接器第一次启动时，它会从键空间中所有分片的当前 VGTID 位置读取。由于它订阅了所有分片，因此它不断捕获所有分片的更改事件并将其发送到 Kafka。它自动支持Vitess Reshard操作，不存在数据丢失，也不重复。
图片来自于原文

图 3. 每个连接器订阅特定键空间的所有分片

选项2：

如图4所示，每个连接器实例捕获来自特定键空间/分片对的更改事件。连接器实例从 VTCtld gRPC（另一个 Vitess 组件）获取密钥空间/分片对的初始（当前）VGTID 位置。每个连接器实例独立地使用它获得的 VGTID 订阅 VStream gRPC，并持续捕获来自 VStream 的更改事件并将其发送到 Kafka。为了支持Vitess Reshard操作，您需要更多的手动操作。
图片来自于原文

图 4. 每个连接器订阅特定密钥空间的一个分片

在内部，每个连接器任务使用 gRPC 线程不断接收来自 VStream 的更改事件，并将事件放入内部阻塞队列中。连接器任务线程从队列中轮询事件并将其发送到 Kafka，如图5所示。
图片来自于原文

图 5. 每个连接器任务的内部工作原理

复制挑战
在我们实施 Vitess Connector 并深入挖掘 Vitess 的同时，我们也意识到了一些挑战。

维特斯·雷沙德
当连接器配置为订阅给定键空间的所有分片时，Vitess 连接器支持 Vitess Reshard 操作。VStream 发送一个 VGTID，其中包含所有分片的分片 GTID。Vitess 重新分片对用户是透明的。完成后，Vitess 将发送新分片的 VGTID。因此，连接器将在重新分片后使用新的 VGTID。但是，您需要确保在进行重新分片操作时连接器已启动并正在运行。特别是在删除旧分片之前请检查连接器的偏移主题是否具有新的 VGTID。这是因为，如果旧分片被删除，VStream将无法识别旧分片中的VGTID。

如果您决定为每个连接器订阅一个分片，则该连接器不会为 Vitess 重新分片提供开箱即用的支持。支持重新分片的一种手动解决方法是为每个目标分片创建一个新连接器。例如，一个用于commerce/-80分片的新连接器，以及另一个用于commerce/80-分片的新连接器。请记住，因为它们是新连接器，所以默认情况下会创建新主题，但是，您可以使用Debezium 逻辑主题路由器将记录路由到相同的 Kafka 主题。

偏移管理
VStream 在其响应中包含 VGTID 事件。我们将VGTID保存为Kafka偏移主题中的偏移量，因此当连接器重新启动时，我们可以从保存的VGTID开始。但是，在极少数情况下，当事务包含大量行时，VStream 会将更改事件批处理为多个响应，并且只有最后一个响应具有 VGTID。在这种情况下，我们没有收到的每个更改事件的 VGTID。我们有几种选择来解决这个特定问题：

我们可以将所有更改事件缓冲在内存中，并等待包含 VGTID 的最后一个响应到达。因此，所有事件都将具有与其关联的正确 VGTID。一些缺点是，在将事件发送到 Kafka 之前，我们会有更高的延迟。此外，由于缓冲，内存使用量可能会增加很多。缓冲还增加了逻辑的复杂性。我们也无法控制 VStream 发送给我们的事件数量。

我们可以使用我们拥有的最新 VGTID，这是来自先前 VStream 响应的 VGTID。如果连接器在处理如此大的事务时发生故障并重新启动，它将从上一个 VStream 响应的 VGTID 重新启动，从而重新处理一些事件。因此，它具有至少一次事件传递语义，并且期望下游是幂等的。由于大多数事务都不够大，因此大多数 VStream 响应都会在响应中包含 VGTID，因此出现重复的可能性很低。最后，我们选择这种方法是因为它的至少一次交付保证和设计简单性。

模式管理
VStream 的响应还包括一个FIELD事件。这是一个特殊事件，包含受影响行的表的架构。例如，假设我们有 2 个表，A并且B。如果我们向表中插入几行A，则FIELD事件将仅包含表A的架构。VStream 足够智能，只FIELD在必要时才包含事件。例如，当 VStream 客户端重新连接时，或者当表的架构更改时。

旧版本的VStream仅包含列类型（例如Integer，Varchar），没有附加信息，例如该列是否是主键，该列是否有默认值，Decimal类型的小数位数和精度，Enum类型的允许值等。

VStream 的较新版本 (Vitess 8) 开始在每一列中包含更多信息。这将帮助连接器更准确地反序列化某些类型，并在发送到 Kafka 的更改事件中拥有更精确的模式。

未来的开发工作
我们可以使用VStream的API从最新的VGTID位置开始流式传输，而不是从VTCtld gRPC获取初始VGTID位置。这样做将消除对 VTCtld 的依赖。

我们尚不支持从更改事件中自动提取主键。目前，默认情况下，发送到 Kafka 的所有更改事件都具有null作为键，除非message.key.columns指定连接器配置。Vitess 最近在 VStream FIELD 事件中添加了每一列的标志，这使我们能够很快实现此功能。

添加对初始快照的支持，以在流式传输更改之前捕获所有现有数据。

概括
MySQL 已用于为 Bolt 的大部分后端服务提供支持。由于数据量和操作复杂性的大幅增长，Bolt 开始评估 Vitess 的可扩展性和重新分片等内置功能。

为了从 Vitess 捕获数据更改，就像我们使用 Debezium MySQL Connector 所做的那样，我们考虑了一些选项。最终，我们基于通用的 Debezium 连接器框架实现了自己的 Vitess Connector。在实施 Vitess 连接器时，我们遇到了一些挑战。例如，支持Vitess重新分片操作、偏移量管理和模式管理。我们思考了应对挑战的方法以及我们制定的解决方案。

我们还收到了多个社区对该项目的相当大的兴趣，我们决定在 Debezium 的保护下开源Vitess Connector 。请随时了解更多信息，我们欢迎并重视任何贡献。

什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
K8S 常用命令全解析：高效管理容器化集群恩爸编程 docker kubernetes 容器 k8s常用命令 k8s有哪些常用命令 k8s命令有哪些 K8S常用命令有哪些
K8S常用命令全解析：高效管理容器化集群一、引言Kubernetes（K8S）作为强大的容器编排平台，其丰富的命令行工具（kubectl）为用户提供了便捷的方式来管理集群中的各种资源。熟练掌握K8S常用命令对于开发人员和运维人员至关重要，能够有效提高容器化应用的部署、监控与维护效率。本文将详细介绍一些K8S常用命令及其使用案例。二、基础资源操作命令（一）kubectlcreate功能：用于创建K8
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
HikariCP调试日志深度解析：生产环境故障排查完全指南
HikariCP调试日志深度解析：生产环境故障排查完全指南更新时间：2025年7月4日|作者：资深架构师|适用版本：HikariCP5.x+|难度等级：中高级前言在生产环境中，数据库连接池往往是系统性能的关键瓶颈。HikariCP作为当前最流行的Java连接池，其调试日志包含了丰富的运行时信息，能够帮助我们快速定位和解决各种连接池相关问题。本文将深入解析HikariCP的日志体系，提供一套完整的故
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
修改gitlab默认的语言 Victor刘 gitlab
文章目录网上的方法1.采用数据库触发器的方法2.登录pg库2.1查看表2.2创建function2.3创建触发器2.4修改历史数据网上的方法网上修改/opt/gitlab/embedded/service/gitlab-rails/config/application.rb的方法，我试了，没生效，没进一步研究1.采用数据库触发器的方法2.登录pg库su-gitlab-psqlpsql-h/var/
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
数据库基础概念梳理 22:30Plane-Moon 数据库
1.数据存储类型表(Table):存储结构化数据的标准方式，数据以行和列的形式组织，具有固定的格式。非结构化数据(UnstructuredData):如音频、视频、图片、文本文档等，其格式不固定，不易直接用表存储。2.SQL的核心优势SQL尤其擅长处理和操作存储在表中的结构化数据。2.1数据类型约束(DataTypeConstraints):定义列可存储的数据种类。整数类型:TINYINT(1字节
SQL笔记纯干货 AI入门修炼 oracle 数据库 sql
软件：DataGrip2023.2.3，phpstudy_pro,MySQL8.0.12目录1.DDL语句（数据定义语句）1.1数据库操作语言1.2数据表操作语言2.DML语句（数据操作语言）2.1增删改2.2题2.3备份表3.DQL语句（数据查询语言）3.1查询操作3.2题一3.3题二4.多表详解4.1一对多4.2多对多5.多表查询6.窗口函数7.拓展:upsert8.sql注入攻击演示9.拆表
大数据精准获客并实现高转化的核心思路和实现方法 2401_88470328 大数据精准获客数据分析数据挖掘大数据需求分析 big data
大数据精准获客并实现高转化的核心思路和实现方法大数据精准获客并实现高转化的核心思路和实现方法在当今信息爆炸的时代，企业如何通过海量的数据精准获取潜在客户，并提高转化率，已经成为营销策略中的关键环节。大数据精准获客的核心思路在于数据驱动、多渠道触达以及优化转化路径，从而实现高效的市场推广和客户转化。数据驱动原理和机制数据驱动的核心在于通过分析用户行为数据，挖掘潜在客户的需求和喜好，从而制定更加精准的
一地鸡毛—一个中年男人的日常2021241 随止心语所自欲律
2021年8月31日，星期二，阴有小雨。早起5:30，跑步10公里。空气清新，烟雨朦胧，远山如黛，烟雾缭绕，宛若仙境。空气中湿气很大，朦胧细雨拍打在脸上，甚是舒服，跑步的人明显减少。早上开会，领导说起逐年大幅度下滑的工作业绩，越说越激动，说得脸红脖子粗。开完会又讨论了一下会议精神，心情也有波动，学习热情不高。心里还有一个大事，是今日大数据分析第1次考试，因自己前期没学，而且计算机编程方面没有任何基
Docker ℡余晖^ 黑马点评项目相关问题和笔记 docker eureka 容器
在黑马点评项目中，在谈到Redisson解决redis的主从一致性问题时，弹幕提到了Docker，本文来简单了解一下Docker，我的初步理解运维是维护多个集群的稳定，那它和VM虚拟机的区别又是什么？，如果要更深入地理解与学习（运维工程师），可以到b站搜索专门的课程（SpringCloud）。一、Docker是什么？重新理解“容器化”的本质1.1Docker的定义Docker是一个开源的容器化平台
分布式全局唯一ID生成：雪花算法 vs Redis Increment，怎么选？
雪花算法vsRedisIncrement：分布式全局唯一ID生成方案深度对比在分布式系统开发中，“全局唯一ID”是绕不开的核心问题。无论是分库分表的数据库设计、订单编号的唯一性保证，还是日志追踪的链路标识，都需要一套可靠的ID生成方案。今天我们就来聊聊两种主流方案——雪花算法（Snowflake）和RedisIncrement，并从原理、特性到适用场景，帮你理清如何选择。同时，我们还将对比其他常见
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
构建高效的物流车辆定位管理系统体制教科书
本文还有配套的精品资源，点击获取简介：物流车辆定位管理系统利用信息技术提高物流效率和安全性。通过集成GPS技术进行实时车辆追踪和监控，它提供及时的货物运送和异常处理。系统的关键技术包括GPS车辆定位、C#编程语言、数据库管理、车辆管理、在途情况监控、预警与通知、数据分析与报告、用户界面设计、安全性与隐私保护以及系统集成。这些要素共同保障物流流程的高效、安全和智能化。1.物流车辆定位管理系统的应用与
Spring AI Alibaba 快速入门指南（适合初学者）会飞的架狗师 AI spring 人工智能 java
如果你是刚接触AI开发或Spring框架的初学者，不用担心，本指南会用简单易懂的语言带你一步步了解并使用SpringAIAlibaba。一、什么是SpringAIAlibaba（小白也能懂）简单来说，SpringAIAlibaba就是一个“工具包”，它把阿里巴巴的AI技术（比如通义千问大模型、向量数据库等）和大家常用的Spring框架“打包”到了一起。**打个比方：**就像你想做蛋糕（开发AI应用
Java朴实无华按天计划从入门到实战（强化速战版-66天）岫珩 Java 后端 java 开发语言学习 Java 时间安排学习计划
致敬读者感谢阅读笑口常开生日快乐⬛早点睡觉博主相关博主信息博客首页专栏推荐活动信息文章目录Java朴实无华按天计划从入门到实战（强化速战版-66天）1.基础（18）1.1JavaSE核心（5天）1.2数据库与SQL（5天）1.3前端基础（8天）2.进阶（17天）2.1JavaWeb核心（5天）2.2Mybatis与Spring全家桶（6天）2.3中间件入门（4天）2.4实践项目（2天）3.高阶（1
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
小白学习mysql 阿什么名字不会重复呢 mysql 数据库大数据人工智能
推荐自学网站不用下载本地环境带自测头歌https://www.educoder.net✅适合基础小白的MySQL简单实用学习计划总学习时间建议：10~14天，每天1小时左右即可最终目标：掌握基础SQL操作，能完成简单项目需求第1阶段：认识数据库与环境搭建（1~2天）你需要学会：•数据库是什么？SQL是什么？•安装MySQLServer+Navicat（推荐用Navicat可视化工具）✅推荐学习内容
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

Debezium发布历史97

你可能感兴趣的:(debezium,CDC,FlinkCDC,数据库,运维,大数据)