大大蚊子

Debezium发布历史84

原文地址： https://debezium.io/blog/2020/02/25/lessons-learned-running-debezium-with-postgresql-on-rds/

欢迎关注留言，我是收集整理小能手，工具翻译，仅供参考，笔芯笔芯.

在 Amazon RDS 上使用 PostgreSQL 运行 Debezium 的经验教训
二月 25, 2020 作者：阿什哈尔·哈桑
AWS Postgres RDS
在这篇博文中，我们将讨论印度领先的供应链服务公司Delhivery如何使用 Debezium 为许多不同的业务用例提供支持，包括驱动事件驱动的微服务、提供数据集成以及将运营数据移动到用于实时分析和报告的数据仓库。我们还将看看我们在集成 Debezium 时犯的早期错误以及我们如何解决这些错误，以便任何未来的用户都可以避免它们，讨论我们面临的更具挑战性的生产事件之一，以及 Debezium 如何帮助确保我们可以在没有任何数据的情况下恢复损失。最后，我们讨论 Debezium 为我们提供了哪些价值、我们认为还有改进空间的领域以及 Debezium 如何适应我们未来的目标。

Debezium 在 Delhivery
我们在物流领域工作，因此我们编写的大多数软件都专注于货物的状态变化、跟踪位置更新、收集实时数据并对其做出反应。在任何软件架构中最常见的地方就是数据库。我们主要在 MongoDB 等文档数据库和关系数据库系统（特别是 PostgreSQL）中维护所有交易数据，以用于组织内的不同服务。需要对所有不同数据源的事务数据进行高效且近乎实时的分析，以便获得洞察并了解组织的运作方式并做出数据驱动的决策。

为了实现上述目标，我们使用 Debezium 对事务数据执行变更数据捕获，使其在我们选择的消息代理 Kafka 中可用。一旦 Kafka 中的数据可用，我们就可以执行以下一项或全部操作：

跨不同关系表的变更流执行流式联接或数据丰富（甚至可能来自不同的数据库或服务。例如，使用行程和车辆数据丰富货运）

从变更流创建域事件以供下游服务使用（例如，使用来自三个不同变更流的订单、发货和产品信息创建聚合消息）

将变更流数据移动到数据湖中以允许灾难恢复或重放部分数据

复杂的事件处理，以生成实时指标和强大的仪表板（例如，运输中物品的实时计数、每个区域内的平均行程时间等）

Debezium 通过提供通用平台和框架来连接我们现有的数据源（如 MongoDB、PostgreSQL 或 MySQL），使上述所有用例成为可能，并且非常容易构建。

本文将分享我们在 AWS RDS（AWS 的托管数据库服务）上使用 Debezium 的经验，希望有助于传授我们在此过程中获得的一些知识，并记录如何跳过 PostgreSQL 的 WAL 中的不可解析记录，直到DBZ-1760得到修复（已实施并计划在下一个 Debezium 1.1 预览版中发布）。

以下是一个简短的架构概述，展示了 Debezium 所支持的一些用例和通用数据平台。
图片来自于原文

图 1. 当前架构

但实现上述目标是一个迭代过程，需要进行大量的实验和反复试验。

Debezium 与 AWS RDS 上的 PostgreSQL
现在我们将讨论在 AWS RDS 上运行 Debezium 和 PostgreSQL 的一些经验教训。我们不会重点讨论如何在 RDS 上开始使用 Debezium 和 PostgreSQL，因为PostgreSQL 连接器的文档对此进行了详细记录。

得到教训
我们首先创建一个概念验证，其目标是监听单个 PostgreSQL 数据库中 3 个不同表的更改，并在下游创建两个视图，一个作为三个表的联接，另一个视图包含作为跟踪的聚合指标时间序列。连接和聚合都是使用Kafka Streams实现的，因为与其他流处理框架相比，它更容易设置和学习。由于 Debezium 已经提供了功能非常丰富的Docker 容器映像，因此我们对其进行了稍微扩展，并决定将该服务作为容器在 AWS 的 Elastic Container Service（容器编排服务）上运行。

当我们刚开始时，我们犯了一些错误。我们错误的所有解决方案现在都记录在 Debezium 文档中，但它们都列在一起，以便更容易避免它们。

我们最初使用wal2json插件，该插件导致连接器在提交大型事务（序列化形式使用的内存多于可用 Java 堆空间的事务）时遇到OutOfMemoryError 。因此我们的建议是：

在 PostgreSQL < 10 上，使用wal2json_streaming插件以避免大型事务出现OutOfMemoryError。

在 PostgreSQL >= 10 上，使用pgoutput插件。

我们正在生成启用模式的 JSON 消息；这会创建比需要更大的 Kafka 记录，特别是在架构更改很少的情况下。因此，我们决定通过设置key.converter.schemas.enabled和来禁用消息模式，value.converter.schemas.enabled以false显着减少每个有效负载的大小，从而节省网络带宽和序列化/反序列化成本。唯一的缺点是我们现在需要在外部模式注册表中维护这些消息的模式。

我们正在观察一些使用 Base64 编码数据的数据类型。如文档所述，这是 NUMERIC 列的默认值，但对于消费者来说可能很难处理。为了转换为更容易解析的格式，但会损失一些准确性，我们按照文档配置了数据类型特定属性。具体来说，设置decimal.handling.mode为string以字符串形式接收 NUMERIC、DECIMAL 和等效类型（例如“3.14”），并设置hstore.handling.mode为json以 JSON 字符串形式接收 HSTORE 列。

始终确保基本的卫生检查，例如数据库磁盘使用情况、事务日志磁盘使用情况以及用于读写操作的网络和磁盘带宽。未针对数据库上的事务日志磁盘使用情况设置警报。我们在 RDS 指标TransactionLogsDiskUsage和OldestReplicationSlotLag上添加了警报，以便在事务日志磁盘使用量增加到阈值以上或复制槽开始滞后时向我们发出警报 - 这意味着 Debezium 可能已经死亡。

我们没有在 Debezium 中启用心跳。以下情况需要使用心跳来控制WAL磁盘空间消耗：

受监控的数据库中有许多更新，但只有极少量与受监控的表和/或模式相关。我们通过设置启用心跳来处理这种情况heartbeat.interval.ms。

PostgreSQL 实例包含多个数据库，其中受监控的数据库与其他数据库相比流量较低。由于 WAL 被实例中的所有数据库共享，因此它会不断积累数据，这些数据在 Debezium 读取之前无法删除。但由于高流量数据库不受监控，Debezium 无法与数据库进行通信，以便删除 WAL 文件以回收磁盘空间。为了解决这种情况，我们通过使用以下查询定期更新在受监控数据库中创建的表中的单行来触发“心跳”事件：

CREATE TABLE IF NOT EXISTS heartbeat (id SERIAL PRIMARY KEY, ts TIMESTAMP WITH TIME ZONE);
INSERT INTO heartbeat (id, ts) VALUES (1, NOW()) ON CONFLICT(id) DO UPDATE SET ts=EXCLUDED.ts;
由于这是将 Debezium 与 PostgreSQL 结合使用时出现的常见用例，因此在DBZ-1815中创建了一个问题来跟踪此问题。

具有 JSONB 列的表的吞吐量严重降低。调试后，我们能够确认原因是 Debezium 频繁刷新架构，因为复制消息中不存在 TOAST 列。schema.refresh.mode通过更改为解决了此问题columns_diff_exclude_unchanged_toast，并已记录在案。

我们观察到一些 RDS 实例大小的数据库连接上频繁出现 EOF 错误。我们仍然不确定原因，但初步调查表明该问题仅发生在附加了 PgBouncer 的实例（即使未通过 PgBouncer 连接）或较小尺寸的实例（AWS t2/t3 系列）上。

我们最初为每个 PostgreSQL 数据库（而不是每个主机）使用一个 Debezium 连接器，但后来改为为每个团队使用一个连接器。不为每个 PostgreSQL 实例运行单个连接器的主要原因是工作负载隔离。任何执行批量数据更新或删除或计划外架构迁移的团队只会影响他们自己的 Debezium 连接器，而不是整个 PostgreSQL 实例，因为 Debezium 根据配置的数据库和/或架构白名单和黑名单在其末尾过滤事件。我们正在尝试找出此配置中可能存在的问题，但尚未发现任何问题。迁移到每个团队设置单个连接器还减少了有关配置更改的大量管理开销，因为在为任何更改创建发布计划时，我们不再需要在多个团队之间进行协调。尽管单个数据库上的多个复制槽确实会增加开销，但我们可以在每个数据库主机上使用大约 6 到 10 个槽时正常运行，而不会产生任何明显的性能影响。

生产事故
正如每个软件开发项目所常见的那样，我们确实遇到了一些问题，在这里我们详细讨论其中一个更困难的问题。但由于 Debezium 专注于确保数据一致性，我们能够在没有任何数据丢失的情况下进行恢复。

我们下面讨论的问题已经在 Debezium 1.0 中修复，您应该尽快更新。

通常跳过此类不可处理事件的新功能已作为PR#1271合并到核心 Debezium 框架中，并将成为下一个 Debezium 1.1 预览版的一部分。

开发人员经常未能做到的两件事是正确的日期时间处理和软件版本升级。这两种情况各自都会导致问题，但当两者同时出现时，事情就会变得困难。我们最近遇到了这样的问题并提供了一种处理方法。我们将从一些背景知识开始，解释为什么这个问题首先出现。

PostgreSQL 的日期/时间类型文档指出 TIMESTAMP 类型的范围可以从4713 BC到294276 AD。在 Debezium 0.10 之前，存在一些关于日期时间溢出的问题，例如DBZ-1255和DBZ-1205 等太远的未来日期。

Bug 及其处理
要解决上述问题，您需要有一个足够远的未来日期。如果您不使用 ISO8601 或纪元时间并且自定义日期时间格式化程序中存在错误，则可以获得一个。

因此，该错误是由应用程序将包含20200 年的日期时间值写入 Debezium 监控的表之一触发的，这导致 Debezium 抛出异常，因为我们仍在生产中运行 0.9。

不幸的是，我们的日志模式警报那天不起作用，并且错误默默地跳过了我们，直到高复制滞后警报响起。在检查日志后，我们确实找出了问题的根源以及问题的价值。不幸的是，日志没有告诉问题出在哪个表中（提示 - 可以成为有价值的贡献）以及哪一列包含有问题的值。幸运的是，只监控了四个表，每个表都有两个 TIMESTAMPTZ 列，并且很容易查询这些表中的违规值以找到实际记录。

快速阅读源代码后，我们发现这种情况发生在大于 9999 的任何年份，因此我们查询数据库以检查是否存在任何其他此类值。值得庆幸的是，不存在其他值。到目前为止，我们心里已经有了一个明确的计划：

停止Debezium

更正数据以供记录

以某种方式让 Debezium 跳过无法解析的记录

向数据库添加验证以确保暂时不会跳过这些值

将 Debezium 升级到 1.0

但我们陷入了上面的第三步，因为我们找不到与 MySQLevent.deserialization.failure.handling.mode连接器相同的选项。

Debezium 和 PostgreSQL 如何跟踪偏移量
PostgreSQL 中的每个更改记录都有一个位置，可以使用称为日志序列号 (LSN) 的值来跟踪该位置。PostgreSQL 将其表示为两个十六进制数——逻辑xLog和段。Debezium 将其表示为该值的十进制表示形式。实际的转换实现可以在 PostgreSQL 的 JDBC 驱动程序中看到。

Debezium 定期将最后处理的 LSN 和事务 ID 写入 Kafka Connect 偏移主题，并推进复制槽以匹配它。启动时，Debezium 使用 Kafka Connect 偏移主题中的最后一条记录将复制槽回退到继续流式更改之前描述的位置。这意味着要更改 Debezium 在 WAL 中获取数据的位置，需要更改 Debezium 在 Kafka Connect 偏移量主题中的跟踪信息以及 PostgreSQL 中的服务器端。

跳过不可解析的事件
我们能够使用上述信息通过执行以下步骤来使 Debezium 跳过无法解析的事件：

停止 Debezium 以使复制槽处于非活动状态。

通过运行检查 Debezium 是否已停止侦听复制槽SELECT * FROM pg_replication_slots WHERE slot_name = ‘’;。该active列应该是f.

检查 Debezium 的 offsets 主题中的最后一条消息并记下该lsn键的值。例如。1516427642656。

使用以下 Java 代码，使用 PosgtreSQL 的 Java 驱动程序将 LSN 的长表示形式转换为十六进制格式：

import org.postgresql.replication.LogSequenceNumber;

class Scratch {
public static void main(String[] args) {
LogSequenceNumber a = LogSequenceNumber.valueOf(1516427642656L);
System.out.println(a.asString());
}
}
使用来查看从 WAL 到上面的 LSN 的更改SELECT pg_logical_slot_peek_changes(’’, ‘’, 1)。这是我们要跳过的复制更改，因此请确保这是您要跳过的记录。确认后，进行下一步。

通过使用跳过 1 次更改来推进复制槽SELECT pg_logical_slot_get_changes(’’, NULL, 1)。这将消耗复制槽的 1 次更改。

使用下一个 LSN 和 TxId 将消息发布到 Debezium 的偏移主题。lsn通过向和都添加 1，我们能够成功地使其工作txId。

再次部署 Debezium，它应该会跳过该记录。

结论
为什么是黛比修姆？
最后，我们想强调 Debezium 为我们解决的问题。

处理任何数据时最关心的问题之一是数据一致性，Debezium 帮助我们避免双重写入并维护 RDBMS 和 Kafka 之间的数据一致性，这使得更容易确保所有后续层的数据一致性。

Debezium 支持低开销的变更数据捕获，现在我们最终默认为所有正在创建的新数据源启用 Debezium。

Debezium 对各种数据源（特别是 PostgreSQL、MySQL 和 MongoDB）的支持帮助我们提供了执行数据集成的标准技术和平台。不再需要编写自定义代码来连接每个数据源。

Debezium 的开源特性在早期被证明非常有用，它确保我们能够自己发送针对一些错误的补丁，而不必要求某人优先考虑问题。由于它是开源的，因此周围有一个不断增长的社区，可以帮助您找出问题并提供一般指导。查看Debezium 网站上的此页面，了解许多精彩的社区贡献内容。

挑战
话虽如此，上述 Debezium 仍然是一个相当年轻的项目，并且有一些值得改进的领域（以及您以代码、设计、想法、文档甚至博客文章的形式做出的贡献）：

零停机高可用性。Debezium 依赖 Kafka Connect 框架来提供高可用性，但它不提供类似于热备实例的功能。关闭现有连接器和启动新实例需要时间 - 这对于某些用例来说可能是可以接受的，但在其他用例中是不可接受的。请参阅BlaBlaCar 的这篇博客文章，了解相关讨论及其解决方案。

支持除 Kafka 之外的其他数据接收器。在某些情况下，您可能希望将事件从数据库直接移动到 API、不同的数据存储或不同的消息代理。但由于 Debezium 目前是在 Kafka Connect 之上编写的，因此它只能将数据写入 Kafka。Debezium 确实提供了一个嵌入式引擎，您可以将其用作库来使用 Java 应用程序中的更改事件。请参阅有关嵌入 Debezium 的文档。如果您最终确实围绕 Debezium 编写了不同的适配器以将数据移动到不同的目的地，请考虑将其开源，这样您既可以从额外的维护人员中受益，也可以通过解决新的用例而使社区受益。

用于编写任何新的 CDC 实现的通用框架。我们特别有一个在 AWS DynamoDB 上执行 CDC 的用例。我们可以重用 Debezium 核心框架并仅编写 DynamoDB 特定部分，而不是从头开始编写自定义 Kafka Connector。这将有助于防止错误，因为许多现有流程和边缘情况可能已经得到处理。围绕此主题正在进行的工作是重构所有现有 Debezium 连接器以使用通用框架，从而更轻松地编写新的自定义连接器。有关如何实现的示例，请查看Debezium 孵化器存储库。

项目的问题跟踪器已经跟踪了一些小烦恼 - 特别是DBZ-1760（跳过不可解析的记录）、DBZ-1263（更新现有连接器的表白名单）、DBZ-1723（失败时重新连接到数据库）、DBZ-823 （并行快照）。

未来范围
我们确实为未来计划了一些任务，以改进有关 Debezium 和 Kafka Connect 的现有工作流程。

升级到 Debezium v1.0。Debezium 最近发布了第一个 1.0 版本，其中包含许多新功能，包括对 CloudEvents 格式的支持，我们希望为整个组织的所有数据提供统一的消息格式。

尝试使用发件箱模式进行可靠的微服务数据交换中记录的发件箱设计模式，以统一应用程序事件和数据更改事件。发件箱模式还提供了微服务系统中跨服务边界的事务保证——这是每个人都希望在基于事件的微服务架构中实现的。

设置Apache Atlas集成以自动创建数据源并跟踪 Atlas 中的数据沿袭，以帮助数据治理和可发现性。

编写并开源 AWS DynamoDB CDC 连接器作为 Debezium 连接器。由于我们也使用 AWS DynamoDB，因此我们需要提供与其他数据源在 CDC 方面使用的相同功能。为此，我们正在使用 Debezium 作为框架编写 DynamoDB CDC 连接器。这项工作仍处于早期阶段，计划作为开源连接器发布。

总的来说，我们首先分享了我们的业务用例，并讨论了 Debezium 如何帮助我们解决这些问题。然后，我们详细介绍了如何在生产环境中运行 Debezium，以便在 AWS RDS 上的 PostgreSQL 上执行 CDC，并讨论了我们在开始时犯的错误以及如何解决这些错误。正如软件工程中常见的那样，我们一路上确实遇到了生产事件，并分享了我们从该事件中学到的经验教训，希望它们对更广泛的社区有用。

还要非常感谢审阅这篇文章的人，包括Gunnar Morling、Kapil Bharati和Akash Deep Verma。

进一步阅读
Debezium 文档和存储库
Debezium PostgreSQL 连接器文档

Debezium 与 Amazon RDS 上的 PostgreSQL

Debezium 嵌入式引擎

Debezium 孵化器连接器 - Cassandra、IBM DB2

外部文档
卡夫卡流

PostgreSQL 日期/时间数据类型

JDBC 驱动程序中的 PostgreSQL LSN 转换

博客和文章
从整体流式传输数据：构建高度可靠的 CDC 堆栈

使用发件箱模式进行可靠的微服务数据交换

相关问题
开放式问题
DBZ-1760 - 添加选项以跳过无法处理的事件

DBZ-1263 - 允许在创建连接器后更新 table.whitelist

DBZ-1815 - Postgres 连接器心跳应该选择将心跳更改写回数据库

已解决的问题
DBZ-1255 - Debezium 预计年份不会大于 9999

DBZ-1205 - Postgres 连接中的时间戳溢出

什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
K8S 常用命令全解析：高效管理容器化集群恩爸编程 docker kubernetes 容器 k8s常用命令 k8s有哪些常用命令 k8s命令有哪些 K8S常用命令有哪些
K8S常用命令全解析：高效管理容器化集群一、引言Kubernetes（K8S）作为强大的容器编排平台，其丰富的命令行工具（kubectl）为用户提供了便捷的方式来管理集群中的各种资源。熟练掌握K8S常用命令对于开发人员和运维人员至关重要，能够有效提高容器化应用的部署、监控与维护效率。本文将详细介绍一些K8S常用命令及其使用案例。二、基础资源操作命令（一）kubectlcreate功能：用于创建K8
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
HikariCP调试日志深度解析：生产环境故障排查完全指南
HikariCP调试日志深度解析：生产环境故障排查完全指南更新时间：2025年7月4日|作者：资深架构师|适用版本：HikariCP5.x+|难度等级：中高级前言在生产环境中，数据库连接池往往是系统性能的关键瓶颈。HikariCP作为当前最流行的Java连接池，其调试日志包含了丰富的运行时信息，能够帮助我们快速定位和解决各种连接池相关问题。本文将深入解析HikariCP的日志体系，提供一套完整的故
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
修改gitlab默认的语言 Victor刘 gitlab
文章目录网上的方法1.采用数据库触发器的方法2.登录pg库2.1查看表2.2创建function2.3创建触发器2.4修改历史数据网上的方法网上修改/opt/gitlab/embedded/service/gitlab-rails/config/application.rb的方法，我试了，没生效，没进一步研究1.采用数据库触发器的方法2.登录pg库su-gitlab-psqlpsql-h/var/
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
数据库基础概念梳理 22:30Plane-Moon 数据库
1.数据存储类型表(Table):存储结构化数据的标准方式，数据以行和列的形式组织，具有固定的格式。非结构化数据(UnstructuredData):如音频、视频、图片、文本文档等，其格式不固定，不易直接用表存储。2.SQL的核心优势SQL尤其擅长处理和操作存储在表中的结构化数据。2.1数据类型约束(DataTypeConstraints):定义列可存储的数据种类。整数类型:TINYINT(1字节
SQL笔记纯干货 AI入门修炼 oracle 数据库 sql
软件：DataGrip2023.2.3，phpstudy_pro,MySQL8.0.12目录1.DDL语句（数据定义语句）1.1数据库操作语言1.2数据表操作语言2.DML语句（数据操作语言）2.1增删改2.2题2.3备份表3.DQL语句（数据查询语言）3.1查询操作3.2题一3.3题二4.多表详解4.1一对多4.2多对多5.多表查询6.窗口函数7.拓展:upsert8.sql注入攻击演示9.拆表
大数据精准获客并实现高转化的核心思路和实现方法 2401_88470328 大数据精准获客数据分析数据挖掘大数据需求分析 big data
大数据精准获客并实现高转化的核心思路和实现方法大数据精准获客并实现高转化的核心思路和实现方法在当今信息爆炸的时代，企业如何通过海量的数据精准获取潜在客户，并提高转化率，已经成为营销策略中的关键环节。大数据精准获客的核心思路在于数据驱动、多渠道触达以及优化转化路径，从而实现高效的市场推广和客户转化。数据驱动原理和机制数据驱动的核心在于通过分析用户行为数据，挖掘潜在客户的需求和喜好，从而制定更加精准的
一地鸡毛—一个中年男人的日常2021241 随止心语所自欲律
2021年8月31日，星期二，阴有小雨。早起5:30，跑步10公里。空气清新，烟雨朦胧，远山如黛，烟雾缭绕，宛若仙境。空气中湿气很大，朦胧细雨拍打在脸上，甚是舒服，跑步的人明显减少。早上开会，领导说起逐年大幅度下滑的工作业绩，越说越激动，说得脸红脖子粗。开完会又讨论了一下会议精神，心情也有波动，学习热情不高。心里还有一个大事，是今日大数据分析第1次考试，因自己前期没学，而且计算机编程方面没有任何基
Docker ℡余晖^ 黑马点评项目相关问题和笔记 docker eureka 容器
在黑马点评项目中，在谈到Redisson解决redis的主从一致性问题时，弹幕提到了Docker，本文来简单了解一下Docker，我的初步理解运维是维护多个集群的稳定，那它和VM虚拟机的区别又是什么？，如果要更深入地理解与学习（运维工程师），可以到b站搜索专门的课程（SpringCloud）。一、Docker是什么？重新理解“容器化”的本质1.1Docker的定义Docker是一个开源的容器化平台
分布式全局唯一ID生成：雪花算法 vs Redis Increment，怎么选？
雪花算法vsRedisIncrement：分布式全局唯一ID生成方案深度对比在分布式系统开发中，“全局唯一ID”是绕不开的核心问题。无论是分库分表的数据库设计、订单编号的唯一性保证，还是日志追踪的链路标识，都需要一套可靠的ID生成方案。今天我们就来聊聊两种主流方案——雪花算法（Snowflake）和RedisIncrement，并从原理、特性到适用场景，帮你理清如何选择。同时，我们还将对比其他常见
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
构建高效的物流车辆定位管理系统体制教科书
本文还有配套的精品资源，点击获取简介：物流车辆定位管理系统利用信息技术提高物流效率和安全性。通过集成GPS技术进行实时车辆追踪和监控，它提供及时的货物运送和异常处理。系统的关键技术包括GPS车辆定位、C#编程语言、数据库管理、车辆管理、在途情况监控、预警与通知、数据分析与报告、用户界面设计、安全性与隐私保护以及系统集成。这些要素共同保障物流流程的高效、安全和智能化。1.物流车辆定位管理系统的应用与
Spring AI Alibaba 快速入门指南（适合初学者）会飞的架狗师 AI spring 人工智能 java
如果你是刚接触AI开发或Spring框架的初学者，不用担心，本指南会用简单易懂的语言带你一步步了解并使用SpringAIAlibaba。一、什么是SpringAIAlibaba（小白也能懂）简单来说，SpringAIAlibaba就是一个“工具包”，它把阿里巴巴的AI技术（比如通义千问大模型、向量数据库等）和大家常用的Spring框架“打包”到了一起。**打个比方：**就像你想做蛋糕（开发AI应用
Java朴实无华按天计划从入门到实战（强化速战版-66天）岫珩 Java 后端 java 开发语言学习 Java 时间安排学习计划
致敬读者感谢阅读笑口常开生日快乐⬛早点睡觉博主相关博主信息博客首页专栏推荐活动信息文章目录Java朴实无华按天计划从入门到实战（强化速战版-66天）1.基础（18）1.1JavaSE核心（5天）1.2数据库与SQL（5天）1.3前端基础（8天）2.进阶（17天）2.1JavaWeb核心（5天）2.2Mybatis与Spring全家桶（6天）2.3中间件入门（4天）2.4实践项目（2天）3.高阶（1
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
小白学习mysql 阿什么名字不会重复呢 mysql 数据库大数据人工智能
推荐自学网站不用下载本地环境带自测头歌https://www.educoder.net✅适合基础小白的MySQL简单实用学习计划总学习时间建议：10~14天，每天1小时左右即可最终目标：掌握基础SQL操作，能完成简单项目需求第1阶段：认识数据库与环境搭建（1~2天）你需要学会：•数据库是什么？SQL是什么？•安装MySQLServer+Navicat（推荐用Navicat可视化工具）✅推荐学习内容
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

Debezium发布历史84

你可能感兴趣的:(debezium,CDC,FlinkCDC,数据库,运维,大数据)