lifallen

Flink 状态管理设计详解：StateBackend、State、RocksDB和Namespace

为什么需要 `StateBackend`？—— 职责分离原则

我们可以用一个银行的例子来类比：

State (如 ValueState, ListState) 就像是你的银行卡。
AbstractKeyedStateBackend 就像是银行的整个后台系统（包括总服务器、数据库、风控系统、会计系统等）。

你不能直接用一张塑料卡片去操作你的钱，你需要把卡片插入 ATM 机或交给柜员，由他们背后的银行系统来完成真正的存取款、转账等操作。

AbstractKeyedStateBackend 的存在正是为了实现这种职责分离：

State 接口的职责（银行卡）：

定义用户交互的契约：提供一组简单、清晰的 API 给用户使用，比如 value(), update(), add(), clear()。它只关心“做什么”，不关心“怎么做”。

AbstractKeyedStateBackend 的职责（银行系统）：

它是一个庞大而复杂的“状态引擎”，负责所有底层的、与具体实现相关的脏活累活。

生命周期管理：负责所有状态的创建、初始化和销毁 (dispose)。
持久化与容错（核心）：实现快照 (snapshot) 和恢复逻辑。这是 Flink 实现 Exactly-Once 的基石。单个 State 对象自身无法完成复杂的分布式快照。
物理存储交互：它才是真正与 RocksDB、堆内存（Heap）等物理存储打交道的组件。它管理着数据库连接、Column Family、读写选项等。
Key/Namespace 管理：管理 keySerializer，计算当前 key 属于哪个 Key Group (KeyGroupRangeAssignment)，处理不同 namespace 下的状态隔离。
中央缓存与优化：如您所见，它内部有 lastName 和 lastState 这样的缓存机制，用于优化对同一状态的连续访问。
应用横切关注点（AOP）：它是一个中心化的工厂，可以在创建 State 时，统一应用 TTL、Metrics 监控等功能。

看 getOrCreateKeyedState 这段代码，它完美地展示了 StateBackend 作为“工厂”和“管理者”的角色：

// ... existing code ...
    @Override
    @SuppressWarnings("unchecked")
    public  S getOrCreateKeyedState(
            final TypeSerializer namespaceSerializer, StateDescriptor stateDescriptor)
            throws Exception {
// ... existing code ...
        InternalKvState kvState = keyValueStatesByName.get(stateDescriptor.getName());
        if (kvState == null) {
            if (!stateDescriptor.isSerializerInitialized()) {
                stateDescriptor.initializeSerializerUnlessSet(executionConfig);
            }
            // 这里是关键：一个装饰器链条
            // Backend作为工厂，负责创建原始State，并用TTL、Metrics等功能进行包装
            kvState =
                    MetricsTrackingStateFactory.createStateAndWrapWithMetricsTrackingIfEnabled(
                            TtlStateFactory.createStateAndWrapWithTtlIfEnabled(
                                    namespaceSerializer, stateDescriptor, this, ttlTimeProvider),
                            this,
                            stateDescriptor,
                            latencyTrackingStateConfig,
                            sizeTrackingStateConfig);
            keyValueStatesByName.put(stateDescriptor.getName(), kvState);
            publishQueryableStateIfEnabled(stateDescriptor, kvState);
        }
        return (S) kvState;
    }
// ... existing code ...

结论：如果直接使用 State，就意味着每一个 State 对象都需要自己实现一套完整的快照、恢复、缓存、物理存储交互逻辑。这将导致代码极度冗余、混乱且难以维护。AbstractKeyedStateBackend 将这些公共的、复杂的底层逻辑全部收敛，使得 State 对象可以保持为一个轻量级的、只关注业务逻辑的句柄。

State 反过来引用 Backend，这并非传统意义上需要避免的耦合，而是一种委托（Delegation）。我们来梳理一下这个流程：

创建：Backend 创建了一个具体的 State 实现类（比如 RocksDBValueState）。
持有引用：在创建 RocksDBValueState 时，Backend 会把自身的引用 (this) 传递给 RocksDBValueState 的构造函数。因此，这个 State 实例从诞生起就知道“是谁创造了我”、“我应该向谁汇报”。

比如update

    public void update(V value) throws IOException {
        if (value == null) {
            clear();
            return;
        }

        try {
            backend.db.put(
                    columnFamily,
                    writeOptions,
                    serializeCurrentKeyWithGroupAndNamespace(),
                    serializeValue(value));
        } catch (RocksDBException e) {
            throw new IOException("Error while adding data to RocksDB", e);
        }
    }

虽然直接调用了 backend.db.put(...)，但我们仔细分析一下它所需要的所有参数，就会发现委托模式的本质依然存在：

columnFamily: 这个 ColumnFamilyHandle 是从哪里来的？它是在 RocksDBValueState 被创建时，由 backend 传入的。State 自己不管理 Column Family 的生命周期。
writeOptions: 这个 WriteOptions 对象同样是 backend 的成员变量，由 backend 统一配置和管理。
serializeCurrentKeyWithGroupAndNamespace(): 这是最关键的一步。这个方法内部需要：
- backend.getCurrentKey(): 获取当前正在处理的 Key。
- backend.getCurrentKeyGroupIndex(): 计算 Key Group。
- getNamespaceSerializer(): 获取 Namespace 序列化器。
- backend.getKeySerializer(): 获取 Key 序列化器。这些核心的上下文信息和组件（序列化器），全部是由 backend 提供的。State 对象本身是无状态的（stateless in terms of context），它不知道当前在为哪个 key 工作，必须向 backend 查询。
serializeValue(value): 这个方法内部需要 getValueSerializer()，而这个序列化器也是在创建时由 backend 提供的。

所以，即使 State 执行了最后那一下 put 操作，它也像一个“一线工人”，虽然亲手把螺丝拧上去了，但这个螺丝（value）、螺丝刀（writeOptions）、图纸（columnFamily）以及拧在哪个位置（key 和 namespace），全部是由 backend 这个“车间主任”提供的。

这是一种更细粒度的委托：State 被委托了“如何将序列化好的 key 和 value 放入指定的 Column Family”这个具体的执行逻辑，但它依然将“获取所有执行前提条件（上下文、资源、配置）”这项更重要的职责委托给了 backend。

Subtask、RocksDB 实例、窗口和 Namespace 的关系

Operator 的一个 Subtask 实例对应一个独立的 RocksDB 实例。

让我们把这个关系链梳理清楚：

一个 Flink Job：可以包含多个 Operator（map, filter, keyBy 等）。
一个 Operator：可以有多个并行的 Subtask 实例（并行度决定）。
一个 Subtask 实例：运行在一个 TaskManager 的一个 Slot 中。
一个 RocksDBKeyedStateBackend 实例：每个有状态的 Subtask 实例都会创建一个自己的 RocksDBKeyedStateBackend 对象。
一个 RocksDB 数据库实例：每个 RocksDBKeyedStateBackend 都会在 TaskManager 的本地磁盘上创建一个独立的 RocksDB 数据库目录和实例（db 对象）。

所以，如果你的一个 window 操作的并行度是 10，那么就会有 10 个 Subtask，对应 10 个 RocksDBKeyedStateBackend 实例，进而在不同的 TaskManager 上创建 10 个独立的 RocksDB 数据库。它们之间物理隔离，互不干扰。

那么窗口和 Namespace 是什么关系？

在一个 Subtask 内部（也就是在一个 RocksDB 实例内部），Namespace 是用来在逻辑上区分不同窗口的状态的。

mergeNamespaces 就是最好的例子。当会话窗口需要合并时：

source namespaces 就是旧的、待合并的窗口的标识符。
target namespace 就是合并后的新窗口的标识符。

这些 namespace 和用户的 key 组合在一起，构成了 RocksDB 中真正的 key。

总结：

物理隔离：不同的 Subtask 通过拥有各自独立的 RocksDB 实例来实现物理隔离。
逻辑隔离：在同一个 Subtask（同一个 RocksDB 实例）内部，不同的窗口（或其它需要隔离的场景，如 ProcessFunction 中的不同 Timer）通过 namespace 来实现逻辑隔离。

所有 State 如何共享 DB 并互相区分？—— Column Family

在一个 RocksDBKeyedStateBackend 内部，所有不同名称的 State（比如你在一个 ProcessFunction 中定义了 ValueState、ListState 和 MapState）是共享同一个 RocksDB 实例的。

那它们的数据是如何区分，不会混在一起的呢？答案是：列族（Column Family）。

Column Family 是 RocksDB 中用于隔离数据的逻辑命名空间，可以把它想象成关系型数据库中的一张张独立的表。

我们来看 RocksDBKeyedStateBackend.java 中的关键实现：

当一个 State 首次被创建时，RocksDBKeyedStateBackend 会为它做两件事：

创建一个新的 Column Family：每个 StateDescriptor 的唯一名称（stateDesc.getName()）会被用来命名一个新的 Column Family。
注册元信息：将这个 State 的名称、序列化器信息以及它对应的 ColumnFamilyHandle 存储在一个 Map 中，也就是 kvStateInformation。

// ... existing code ...
    /**
     * Information about the k/v states, maintained in the order as we create them. This is used to
     * retrieve the column family that is used for a state and also for sanity checks when
     * restoring.
     */
    private final LinkedHashMap kvStateInformation;
// ... existing code ...

当具体的 State 对象（如 RocksDBValueState）执行读写操作时，它会从 backend 获取自己专属的 ColumnFamilyHandle，并将其作为参数传递给 db.get()、db.put() 或 db.merge() 等方法。

// RocksDBValueState.java 中的 value() 方法
byte[] valueBytes = backend.db.get(columnFamily, serializeCurrentKeyWithGroupAndNamespace());

这样一来，虽然所有的 State 都在同一个 db 对象上操作，但由于它们使用了不同的 columnFamily，数据就被天然地隔离在了不同的“表”里，绝不会互相干扰。

这种设计的优势是什么？

资源共享：所有 Column Family 共享同一个 MemTable、Write-Ahead-Log (WAL)、Block Cache 等核心 RocksDB 资源。这大大减少了内存开销和管理成本，而不是为每个 State 都启动一个完整的 DB 实例。
原子写入：可以通过 WriteBatch 实现跨多个 Column Family 的原子写入，这对于保证 Flink 复杂操作的原子性至关重要。
统一快照：可以对整个 RocksDB 实例（包含所有 Column Family）进行一次统一的、物理一致性的快照，极大地简化了 Checkpoint 的实现。

`ColumnFamilyDescriptor`

ColumnFamilyDescriptor 是 RocksDB Java API 的一部分，它本质上是一个列族（Column Family）的描述符，包含了创建列族所需的名称和配置选项 (ColumnFamilyOptions)。

在 Flink 中，ColumnFamilyDescriptor 的构建主要通过 RocksDBOperationUtils.createColumnFamilyDescriptor 这个静态方法来完成。

我们来看一下这个方法的实现：

RocksDBOperationUtils.java

// ... existing code ...
    public static ColumnFamilyDescriptor createColumnFamilyDescriptor(
            RegisteredStateMetaInfoBase metaInfoBase,
            Function columnFamilyOptionsFactory,
            @Nullable RocksDbTtlCompactFiltersManager ttlCompactFiltersManager,
            @Nullable Long writeBufferManagerCapacity) {

        byte[] nameBytes = metaInfoBase.getName().getBytes(ConfigConstants.DEFAULT_CHARSET);
        Preconditions.checkState(
                !Arrays.equals(RocksDB.DEFAULT_COLUMN_FAMILY, nameBytes),
                "The chosen state name 'default' collides with the name of the default column family!");

        ColumnFamilyOptions options =
                createColumnFamilyOptions(columnFamilyOptionsFactory, metaInfoBase.getName());

        if (ttlCompactFiltersManager != null) {
            ttlCompactFiltersManager.setAndRegisterCompactFilterIfStateTtl(metaInfoBase, options);
        }

        if (writeBufferManagerCapacity != null) {
            // It'd be great to perform the check earlier, e.g. when creating write buffer manager.
            // Unfortunately the check needs write buffer size that was just calculated.
            sanityCheckArenaBlockSize(
                    options.writeBufferSize(),
                    options.arenaBlockSize(),
                    writeBufferManagerCapacity);
        }

        return new ColumnFamilyDescriptor(nameBytes, options);
    }
// ... existing code ...

从代码中我们可以清晰地看到构建 ColumnFamilyDescriptor 的步骤：

获取列族名称:
- 从传入的 RegisteredStateMetaInfoBase 对象中获取 State 的名称 (metaInfoBase.getName())。
- 将这个名称转换为字节数组 (byte[] nameBytes)。这是因为 RocksDB 的原生 API 使用字节数组来标识列族。
- 这里有一个检查，确保 State 的名称不是 "default"，以避免与 RocksDB 的默认列族冲突。
创建列族配置 (ColumnFamilyOptions):
- 调用 createColumnFamilyOptions 方法，这个方法会使用 columnFamilyOptionsFactory 来生成一个 ColumnFamilyOptions 实例。
- 这个 columnFamilyOptionsFactory 正是我们在 EmbeddedRocksDBStateBackend 中看到的那个函数：stateName -> resourceContainer.getColumnOptions()。它为每个 State 提供了基础的列族配置。
（可选）配置 TTL 压缩过滤器:
- 如果 ttlCompactFiltersManager 不为 null，会检查当前 State 是否配置了 TTL（Time-to-Live，生存时间）。
- 如果配置了 TTL，它会为这个列族的 ColumnFamilyOptions 设置一个特定的压缩过滤器（Compaction Filter），这个过滤器会在 RocksDB 的后台压缩过程中自动清理过期的数据。
（可选）内存检查:
- 如果传入了 writeBufferManagerCapacity，会进行一个健全性检查，确保 arenaBlockSize 的配置是合理的。
实例化 ColumnFamilyDescriptor:
- 最后，使用前面准备好的列族名称字节数组和配置好的 ColumnFamilyOptions 对象，通过 new ColumnFamilyDescriptor(nameBytes, options) 来创建一个新的 ColumnFamilyDescriptor 实例并返回。

综上所述，一个 ColumnFamilyDescriptor 对象主要包含以下两个核心信息：

列族名称 (Column Family Name):
- 以 byte[] 数组的形式存储。
- 这个名称直接来源于 Flink State 的 StateDescriptor 中定义的名字。例如，new ValueStateDescriptor<>("my-state", String.class) 中的 "my-state"。
列族选项 (Column Family Options):
- 一个 org.rocksdb.ColumnFamilyOptions 对象。
- 这个对象包含了该列族所有详细的配置参数，例如：
  - Merge Operator: 用于处理 ListState、AggregatingState 等需要合并操作的状态。
  - Write Buffer Size: 写缓冲区大小。
  - Compression Type: 压缩算法（如 Snappy, LZ4）。
  - Compaction Filter: 压缩过滤器，如用于实现 TTL 的过滤器。
  - 以及其他大量控制 RocksDB 行为的底层参数。

这个 ColumnFamilyDescriptor 对象随后会被传递给 db.createColumnFamily() 方法，RocksDB 会根据其中的名称和配置信息，在数据库实例中创建一个新的、隔离的列族。

Namespace 可以自己随意指定类型和值吗？

答案是：是的，几乎可以。

任意的类型 (Type)：在 Flink 的状态接口定义中，命名空间（Namespace）是一个泛型参数 N，例如 InternalKvState。这意味着理论上你可以使用任何 Java/Scala 类型作为 Namespace 的类型，比如 String, Long, Integer，甚至是自定义的 POJO 对象。

唯一的硬性要求是：Flink 必须知道如何序列化和反序列化你的 Namespace 类型。你需要为该类型提供一个 TypeSerializer。对于 Long, String 等基础类型，Flink 会自动推断并使用内置的序列化器。对于自定义的 POJO，你需要确保它符合 Flink 的 POJO 规范，或者手动创建一个 TypeSerializer。
任意的值 (Value)：一旦确定了 Namespace 的类型，你就可以在代码中通过调用 state.setCurrentNamespace(namespace) 来传入该类型的任意实例作为当前操作的命名空间。

这正是你之前实现的 NamespacedStateListView 的核心思想：将用户的 UID（无论是 Long 还是 String 类型）作为 namespace 的值，从而为每个 UID 创建了一个逻辑上独立的 ListState。

AbstractRocksDBState.java 文件中的 setCurrentNamespace 方法就证明了这一点：
```
// ... existing code ...
/** The current namespace, which the next value methods will refer to. */
private N currentNamespace;
// ... existing code ...
@Override
public void setCurrentNamespace(N namespace) {
    this.currentNamespace = namespace;
}
// ... existing code ...
```
这个方法简单地将传入的 namespace 对象赋值给内部的 currentNamespace 字段，后续的状态操作（如 get, add, clear）都会使用这个字段来构建最终存储到 RocksDB 的 key。

和 KeyedStream，Window 的关系

这里需要分开来看：

与 `KeyedStream` 的关系：强依赖关系

必须在 KeyedStream 上使用：所有带 Namespace 的状态（InternalKvState）都属于Keyed State。你必须先通过 dataStream.keyBy(...) 将数据流转换成 KeyedStream，然后才能在下游的算子（如 ProcessFunction）中使用这些状态。
原因：Flink 的状态是根据 keyBy 指定的 Key (K) 来进行分区和管理的。Namespace (N) 只是在某个特定 Key (K) 的状态内部做的进一步划分。可以理解为一种二级索引或子分区。没有 keyBy 提供的一级分区，Namespace 就无从谈起。

与 `Window` 的关系：没有必然关系，窗口是 Namespace 的一种应用场景

窗口是 Namespace 的使用者，而非前提：可以把窗口（Window）看作是 Flink 框架自身对 Namespace 机制的一种自动化应用。当你使用窗口操作时（例如 .window(TumblingEventTimeWindows.of(...))），Flink 会自动地：
1. 为每一个窗口实例（比如 [00:00:05, 00:00:10) 这个时间窗口）创建一个 TimeWindow 对象。
2. 在处理属于该窗口的数据时，自动调用 setCurrentNamespace()，并将这个 TimeWindow 对象作为 namespace 传入。这样，窗口内的所有状态计算就被天然地隔离在了这个 TimeWindow 命名空间下。
可以完全脱离窗口使用 Namespace：在一个普通的 KeyedProcessFunction 中，完全没有使用任何窗口操作，而是通过手动调用 setCurrentNamespace(uid) 来实现了自定义的状态划分。这赋予了超越窗口框架的、更细粒度的状态管理能力。

概念	与 Namespace 的关系	解释
KeyedStream	强依赖	必须先 `keyBy`得到 `KeyedStream`。`Namespace`是在 `Key`内部的二级分区。
Window	无直接依赖	窗口是 `Namespace`机制的一个高级应用。你可以用窗口，也可以不用窗口，直接在 `ProcessFunction`中手动控制 `Namespace`。

所以，可以自定义 Namespace 的类型和值，并且这个机制可以独立于 Flink 的窗口（Window）功能来使用，只要你的操作是建立在 KeyedStream 之上即可。

window设置NameSpace

负责调用 setCurrentNamespace 的是窗口算子（WindowOperator）。WindowOperator 的工作流程是：

接收到一条数据。
调用 WindowAssigner 的 assignWindows 方法，获取这条数据所属的窗口列表。
遍历这个窗口列表。
对于列表中的每一个窗口，先调用 state.setCurrentNamespace(window) 将当前状态的上下文切换到这个窗口。
然后，再对该窗口的状态进行更新（比如累加、添加元素等）。

我们可以从工程代码中找到清晰的证据：

在 WindowOperator.java 中，你可以看到这个完整的逻辑：

// ... existing code ...
    public void processElement(StreamRecord record) throws Exception {
// ... existing code ...
        timestamp = TimeWindowUtil.toUtcTimestampMills(timestamp, shiftTimeZone);

        // 1. 调用 assigner 获取窗口列表
        // the windows which the input row should be placed into
        Collection affectedWindows = windowFunction.assignStateNamespace(inputRow, timestamp);
        boolean isElementDropped = true;
        // 2. 遍历窗口列表
        for (W window : affectedWindows) {
            isElementDropped = false;

            // 3. 为每个窗口设置 Namespace
            windowState.setCurrentNamespace(window);
            // 4. 更新状态
            RowData acc = windowState.value();
            if (acc == null) {
                acc = windowAggregator.createAccumulators();
            }
            windowAggregator.setAccumulators(window, acc);

            if (RowDataUtil.isAccumulateMsg(inputRow)) {
                windowAggregator.accumulate(inputRow);
            } else {
                windowAggregator.retract(inputRow);
            }
            acc = windowAggregator.getAccumulators();
            windowState.update(acc);
        }
// ... existing code ...

另一个例子在处理 Python UDAF 的算子中也可以看到同样的设计模式：

StreamArrowPythonGroupWindowAggregateFunctionOperator.java

// ... existing code ...
    public void bufferInput(RowData input) throws Exception {
// ... existing code ...
        // 1. 调用 assigner 获取窗口列表
        // Given the timestamp and element, returns the set of windows into which it
        // should be placed.
        elementWindows = windowAssigner.assignWindows(input, timestamp);
        // 2. 遍历窗口列表
        for (W window : elementWindows) {
            if (RowDataUtil.isAccumulateMsg(input)) {
                // 3. 为每个窗口设置 Namespace
                windowAccumulateData.setCurrentNamespace(window);
                // 4. 更新状态
                windowAccumulateData.add(input);
            } else {
                windowRetractData.setCurrentNamespace(window);
                windowRetractData.add(input);
            }
        }
    }
// ... existing code ...

你可能感兴趣的:(Flink,flink,大数据,数据库,java,apache,分布式)

移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
IK分词初心myp
实现简单的分词功能，智能化分词添加依赖配置：4.10.4org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-analyzers-common${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucenel
实时数据流计算引擎Flink和Spark剖析程小舰 flink spark 数据库 kafka hadoop
在过去几年，业界的主流流计算引擎大多采用SparkStreaming，随着近两年Flink的快速发展，Flink的使用也越来越广泛。与此同时，Spark针对SparkStreaming的不足，也继而推出了新的流计算组件。本文旨在深入分析不同的流计算引擎的内在机制和功能特点，为流处理场景的选型提供参考。（DLab数据实验室w.x.公众号出品）一.SparkStreamingSparkStreamin
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
包含日志获取webshell 陈望_ning
日志文件关闭：Apache目录下的httpd.conf文件#ErrorLog"logs/error.log"#CustomLog"logs/access.log"common加#号为注释不产生日志文件如果去掉#将会在Apache/logs/目录下产生日志文件linux:access_logerror_logwindows:access.logerror.logaccess_log每一行记录了一次网
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
Java 队列 tryxr java 开发语言队列
队列一般用什么哪种结构实现队列的特性数据入队列时一定是从尾部插入吗数据出队列时一定是从头部删除吗队列的基本运算有什么队列支持随机访问吗队列的英文表示什么是队列队列从哪进、从哪出队列的进出顺序队列是用哪种结构实现的Queue和Deque有什么区别Queue接口的方法Queue中的add与offer的区别offer、poll、peek的模拟实现如何利用链表实现队列如何利用顺序表实现队列什么叫做双端队列
JVM 内存分配与回收策略：从对象创建到内存释放的全流程
在JVM的运行机制中，内存分配与回收策略是连接对象生命周期与垃圾收集器的桥梁。它决定了对象在堆内存中的创建位置、存活过程中的区域迁移，以及最终被回收的时机。合理的内存分配策略能减少GC频率、降低停顿时间，是优化Java应用性能的核心环节。本文将系统解析JVM的内存分配规则、对象晋升机制，以及实战中的内存优化技巧。一、对象优先在Eden区分配：新生代的“临时缓冲区”大多数情况下，Java对象在新生代
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
Redis + Caffeine 实现高效的两级缓存架构周童學 Java 缓存 redis 架构
Redis+Caffeine实现高效的两级缓存架构引言在现代高并发系统中，缓存是提升系统性能的关键组件之一。传统的单一缓存方案往往难以同时满足高性能和高可用性的需求。本文将介绍如何结合Redis和Caffeine构建一个高效的两级缓存系统，并通过三个版本的演进展示如何逐步优化代码结构。项目源代码：github地址、gitee地址两级缓存架构概述两级缓存通常由本地缓存（如Caffeine）和分布式缓
微信公众号回调java_处理微信公众号消息回调 weixin_39607620 微信公众号回调java
1、背景在上一节中，咱们知道如何接入微信公众号，可是以后公众号会与咱们进行交互，那么微信公众号如何通知到咱们本身的服务器呢？咱们知道咱们接入的时候提供的url是GET/mp/entry，那么公众号以后产生的事件将会以POST/mp/entry发送到咱们本身的服务器上。html2、代码实现，此处仍是使用weixin-java-mp这个框架实现一、引入weixin-java-mpcom.github.
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
Java8 Stream流的sorted()的排序【正序、倒序、多字段排序】 Tony666688888 java windows 开发语言
针对集合排序，java8可以用Stream流的sorted()进行排序。示例Bean以下我们会使用这个Bean来做示例。publicclassOrder{privateStringweight;privateDoubleprice;privateStringdateStr;//忽略getter、setter、构造方法、toString}字段排序首先是比较器Comparator，形式如下：Compa
用代码生成艺术字：设计个性化海报的秘密
本文围绕“用代码生成艺术字：设计个性化海报的秘密”展开，先概述代码生成艺术字在海报设计中的独特价值，接着介绍常用的代码工具（如HTML、CSS、JavaScript等），详细阐述从构思到实现的完整流程，包括字体样式设计、动态效果添加等，还分享了提升艺术字质感的技巧及实际案例。最后总结代码生成艺术字的优势，为设计师提供打造个性化海报的实用指南，助力提升海报设计的独特性与吸引力，符合搜索引擎SEO标准
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str