gongyuandaye

CMU15-445-Spring-2023-Project #4 - 前置知识（lec15-20）

Lecture #15_ Concurrency Control Theory

Motivation

并发控制：如何避免同时更新记录时出现race？
耐久性问题（恢复）：断电时如何确保状态正确？

Transactions

事务是指在共享数据库上执行一个或多个操作序列（如 SQL 查询），以执行某些高级功能。它们是 DBMS 中变化的基本单位。事务必须是原子性的。
处理事务的简单方法是使用单个 Worker 一次执行一个事务。为了执行事务，DBMS 会复制整个数据库文件，并在新文件中进行事务更改。如果事务成功，新文件就会成为当前数据库文件。如果事务失败，DBMS 就会丢弃新文件，事务中的任何更改都不会被保存。这种方法速度很慢，因为它不允许并发事务，而且每次事务都需要复制整个数据库文件。
更好的方法是允许独立事务并发执行。
事务的范围仅限于数据库内部。它不能对外部世界进行更改，因为它不能回滚这些更改。

Definitions

从形式上看，数据库可以表示为一组固定的命名数据对象（A、B、C、…）。这些对象可以是属性、元组、页、表，甚至是数据库。
事务是对这些对象的一系列读写操作（即 R(A)、W(B)）。
事务的边界由客户端定义。在 SQL 中，事务以 BEGIN 命令开始。事务的结果是 COMMIT 或 ABORT。对于 COMMIT，要么将事务的所有修改保存到数据库中，要么由 DBMS 改写并终止事务。对于 ABORT，事务的所有更改都会被撤销，就像事务从未发生过一样。终止可能是自己造成的，也可能是 DBMS 造成的。
用于确保数据库正确性的标准由 ACID 构成。原子性（atomicity，或称不可分割性）、一致性（consistency）、隔离性（isolation，又称独立性）、持久性（durability）。

ACID: Atomicity

DBMS 保证事务是原子性的。事务要么执行所有操作，要么不执行任何操作。
Logging：记录 DBMS 记录所有操作，以便在事务中止时撤销操作。DBMS 在内存和磁盘中都保存有撤销记录。
Shadow Paging：DBMS 为事务修改的页面制作副本，事务对这些副本进行修改。只有当事务提交时，页面才会可见。这种方法在运行时通常比基于日志的 DBMS 慢。不过，这样做的一个好处是，如果只有单线程，就不需要日志记录，因此当事务修改数据库时，写入磁盘的次数就会减少。这也使恢复变得简单，因为只需删除未提交事务的所有页面即可。

ACID: Consistency

一致性意味着数据库在逻辑上是正确的。应用程序对数据提出的所有问题（即查询）都会返回逻辑上正确的结果。一致性有两个概念：数据库一致性和事务一致性。

ACID: Isolation

DBMS 为事务提供了一种错觉，即它们是单独在系统中运行的，这相当于一个以串行顺序执行事务的系统。但为了获得更好的性能，DBMS 必须交错执行并发事务的操作，同时保持隔离的假象。

Concurrency Control
- DBMS 在运行时如何决定多个事务操作的适当交错；
- 悲观：DBMS 假定事务会发生冲突，因此首先不会让问题出现；
- 乐观：DBMS 假定事务之间的冲突很少发生，因此会选择在事务提交后处理冲突；
- DBMS 执行操作的顺序称为执行时间表。我们希望在确保输出 "正确 "的同时，交错执行事务以最大限度地提高并发性。并发控制协议的目标是生成一个等同于某种串行执行的执行计划；
- 如果两个操作是针对不同事务的，而且是在同一个对象上执行的，并且至少有一个操作是写入操作，那么这两个操作之间就会发生冲突；

可序列化有两种类型：冲突和视图。

Conflict Serializability
- 如果两个计划涉及相同事务的相同操作，并且每一对冲突操作在两个计划中的排序方式相同，那么这两个计划表就是冲突等价的；
- 我们可以通过交换不冲突的操作来验证计划是否可冲突序列化，直到形成序列计划。对于有很多事务的计划表来说，这种方法成本太高。验证计划表的更好方法是使用依赖关系图（优先级图，类似拓扑）。
View Serializability
- 视图可序列化是一种较弱的可序列化概念，它允许所有可冲突序列化的计划表和 “盲写”（即在不先读取值的情况下执行写操作）。

ACID: Durability

已提交事务的所有更改在崩溃或重启后必须是持久的。DBMS 可以使用日志记录或shadow paging来确保所有更改都是持久的。这通常需要将已提交事务存储在非易失性内存中。

Lecture #16_ Two-Phase Locking.md

Transaction Locks

需要一种方法来即时保证正确性。数据库管理系统使用锁为事务动态生成可序列化的执行计划。DBMS 包含一个集中式锁管理器，由它决定事务是否可以获取锁。
重要的是，lock不同于 B+ 树中使用的latch。latch保护DBMS内部数据结构不受并发线程的影响，而lock则保护数据库中的值不受并发事务的影响。例如，在 B+ 树中，只需在扫描中对单个叶子节点加latch，但如果一个事务尝试扫描叶子，而另一个事务尝试写入两个任意值，那么叶子扫描就需要lock整个表，而不仅仅是当前叶子。

Shared Lock (S-LOCK)：共享锁允许多个事务同时读取同一个对象。如果一个事务持有共享锁，那么另一个事务也可以获得相同的共享锁。
Exclusive Lock (X-LOCK)：独占锁允许一个事务修改一个对象。该锁可防止其他事务对该对象加锁（S-LOCK 或 X-LOCK）。同一时间只能有一个事务持有独占锁。

Two-Phase Locking

两阶段锁定（2PL）是一种悲观的并发控制协议，它使用锁来决定是否允许事务临时访问数据库中的对象。该协议无需提前知道事务将执行的所有查询。
第 1 阶段——Growing：在增长阶段，每个事务都会向 DBMS 的锁管理器申请所需的锁，锁管理器会批准/拒绝这些锁请求；
第 2 阶段——Shrinking：事务释放第一个锁后立即进入收缩阶段。在收缩阶段，事务只允许释放锁，不允许获取新锁。
2PL 本身就足以保证冲突的可序列性。它生成的时间表的优先级图是非回环的。但它容易受到级联中止的影响，即一个事务中止后，另一个事务必须回滚，从而造成浪费。
2PL 仍会出现脏读，也可能导致死锁。
如果一个事务写入的任何值在第一个事务提交之前永远不会被另一个事务读取或覆盖，那么这个计划就是严格的。strong strict 2PL 是 2PL 的一种变体，其中事务只在提交时释放锁。
这种方法的优点是 DBMS 不会发生级联中止。DBMS 还可以通过恢复已修改元组的原始值来回溯已中止事务的更改。不过限制了并发性。

Deadlock Handling

死锁是一个事务等待彼此释放锁的循环。在 2PL 中，有两种处理死锁的方法：检测和预防。

死锁检测
- 为了检测死锁，DBMS会创建一个等待图，其中事务是节点，如果事务 Ti 正在等待事务 Tj 释放锁，则存在一条从 Ti 到 Tj 的有向边。系统会定期检查等待图中的循环；
- 当 DBMS 检测到死锁时，它会选择一个 “受害者” 事务中止，以打破循环。受害者事务是重新启动还是中止，取决于应用程序如何调用它。选择考虑多个事务属性（时间戳、最少/最多查询）；
- 在选择要中止的受害事务后，DBMS 还可以决定在多大程度上回滚事务的更改。它既可以回滚整个事务，也可以只回滚足够的查询来打破死锁；
死锁预防
- 当一个事务试图获取另一个事务持有的锁（这可能会导致死锁）时，DBMS会杀死其中一个事务。为了实现这一点，会给事务分配优先级（可能基于时间戳，时间越长的事务优先级越高）；
- Wait-Die：如果请求事务的优先级高于当前事务，它就等待。否则，它将中止（死亡）；
- Wound-Wait：如果请求事务的优先级高于持有事务，则持有事务中止并释放锁。否则，请求事务等待；

Lock Granularities

如果一个事务要更新 10 亿个数据元组，就必须向 DBMS 的锁管理器申请 10 亿个锁，速度会很慢，因为事务在获取/释放锁时，必须在锁管理器的内部锁表数据结构中获取锁。
相反，如果一个事务只需要读取一个值，却锁定了整个表，那么并行性的机会就会减少。为了处理这种权衡，DBMS 使用锁层次结构来同时处理不同粒度级别的锁。
当一个事务为该层次结构中的一个对象获取锁时，它隐式地获取了其所有子对象的锁，因此单写锁无法获取任何元组锁。但是，如果表上没有锁，则允许在不同的元组上使用多个元组级锁，从而实现并行性。
重要的是，如果一个事务使用元组级锁，它就需要告知其他事务不能抓取页面级锁（或更高级别的锁），因为这会产生冲突。

Intention-Shared (IS)：表示在较低层次使用共享锁进行显式锁定；
Intention-Exclusive (IX)：表示在较低层次使用独占或共享锁进行显式锁定；
Shared+Intention-Exclusive（SIX）：允许多个事务同时读取数据，但当有事务有意向修改（独占锁）时，其他事务必须等待，以确保数据的一致性；

Lecture #17_ Timestamp Ordering Concurrency Control.

Timestamp Ordering Concurrency Control

Timestamp Ordering（T/O）是乐观的并发控制协议，数据库管理系统假定事务冲突很少发生。DBMS 不要求事务在获准读/写数据库对象前获得锁，而是使用时间戳来确定事务的序列化顺序。
DBMS 可以使用系统时钟作为时间戳，但在夏令时等边缘情况下会出现问题。另一种方法是使用逻辑计数器，但这种方法存在溢出问题，以及在多台机器的分布式系统中维护计数器的问题。此外，还有结合使用的混合方法。

Basic Timestamp Ordering (BASIC T/O)

基本时间戳排序协议（BASIC T/O）允许在不使用锁的情况下读写数据库对象。取而代之的是，每个数据库对象 X 都会被标记上一次对该对象成功执行读取（记为 R-TS(X)）或写入（记为 W-TS(X)）的事务的时间戳。DBMS 会为每次操作检查这些时间戳。如果一个事务试图以违反时间戳排序的方式访问一个对象，该事务将被中止并重新启动。基本假设是，违反时间戳顺序的情况很少发生，因此重新启动的情况也很少发生。
对于读操作，TS需要和W-TS(X)比较，然后更新为TS和R-TS(X)的最大值。
对于写操作，TS需要和R-TS(X)、W-TS(X)比较。
对写操作的一种优化是，如果 TS < W-TS(X)，DBMS 可以忽略写操作，允许事务继续，而不是中止并重新启动。这就是 Thomas Write Rule。
问题：每次读取对象都需要写入时间戳；将数据复制到事务工作区和更新时间戳的开销很高；长期运行的事务可能会处于饥饿状态；在高并发系统中会受到时间戳分配瓶颈的影响；允许不可恢复的计划。

Optimistic Concurrency Control (OCC)

乐观并发控制（OCC）是另一种乐观并发控制协议，它也使用时间戳来验证事务。当冲突数量较少时，OCC 效果最佳。这是当所有事务都是只读的，或者事务访问的是不相关的数据子集。
在 OCC 中，DBMS 为每个事务创建一个私有工作区。事务的所有修改都会应用到该工作区。读取的任何对象都会复制到工作区，写入的任何对象都会复制到工作区并在那里修改。任何事务都无法读取其他事务在其私有工作区中所做的修改。
OCC 包括三个阶段：

读取阶段：在此，DBMS 跟踪事务的read/write set，并将其写入内容存储在私有工作区中。
验证阶段：当事务提交时，检查它是否与其他事务冲突（RW或WW）。这通过时间戳排序完成。
写入阶段：如果验证成功，将私有工作区的更改应用到数据库。否则，将中止并重新启动事务。

问题：将本地数据复制到事务私有工作区的开销很大；验证/写入阶段的瓶颈；与其他协议相比，终止可能会造成更多浪费，因为只有在事务已经执行之后才会发生。

Isolation Levels

序列化允许忽略并发问题，但强制执行序列化可能会导致并行性过低，从而限制性能。
隔离级别控制一个事务受其他并发事务影响的程度。
异常：

脏读：读取未提交的数据。
不可重复读：重做读取会检索到不同的结果。
幻读：插入或删除会导致相同范围扫描查询的不同结果

Isolation Levels (Strongest to Weakest)

SERIALIZABLE: 无幻读，所有读取均可重复，并且无脏读
- Possible implementation: Index locks + Strict 2PL
REPEATABLE READS：可能会有幻读
- Possible implementation: Strict 2PL
READ-COMMITTED：可能会发生幻读和不可重复读
- Possible implementation: Strict 2PL for exclusive locks, immediate release of shared locks after a read
READ-UNCOMMITTED：所有异常情况都可能发生
- Possible implementation: Strict 2PL for exclusive locks, no shared locks for reads

两种其他isolation level：

CURSOR STABILITY：在REPEATABLE READS和READ-COMMITTED之间，防止丢失更新的异常情况，IBM DB2默认的isolation level。
SNAPSHOT ISOLATION：确保事务中进行的所有读取都会看到事务启动时存在的数据库的一致快照，仅当事务的写入不与自该快照以来进行的任何并发更新发生冲突时，事务才会提交。

Lecture #18_ Multi-Version Concurrency Control

Multi-Version Concurrency Control

多版本并发控制（MVCC）是一个比并发控制协议更大的概念。它涉及 DBMS 设计和实施的方方面面。MVCC 是 DBMS 中使用最广泛的方案。
使用 MVCC 时，DBMS 会在数据库中维护单个逻辑对象的多个物理版本。当事务写入对象时会创建该对象的新版本。事务读取对象时，会读取事务开始时存在的最新版本。
MVCC 的基本概念/优点是写入器不会阻塞写入器，读取器不会阻塞读取器。这意味着，当其他事务读取旧版本时，一个事务可以修改对象。
使用 MVCC 的一个优势是，只读事务可以读取数据库的一致快照，而无需使用任何类型的锁。此外可以轻松支持time-travel query，即在其他时间点的状态查询。
基于 MVCC 的典型数据库设计包括：
1.有一个版本控制存储区，存储同一逻辑对象的不同版本。

当事务开始时，数据库管理系统会（通过复制事务状态表）对数据库进行快照。
DBMS 使用快照来确定哪些版本的对象对事务可见
MVCC 有四个重要的组成： 1.并发控制协议 2.版本存储 3.垃圾回收 4.索引管理
快照隔离是指在事务启动时为事务提供一致的数据库快照。快照中的数据值只包括已提交事务中的值，事务在完成之前与其他事务完全隔离。写入内容保存在事务的私有工作区中，或与事务元数据一起写入存储中，只有在事务成功提交后才会被数据库看到。

Version Storage

DBMS 使用元组的指针字段为每个逻辑元组创建一个版本链，该版本链实质上是一个按时间戳排序的版本链表。这样，DBMS 就能在运行时找到特定事务可见的版本。
方法 1：Append-Only Storage
逻辑元组的所有物理版本都存储在同一个表空间中。每次更新只需将元组的新版本追加到表中并更新版本链。版本链可以从最旧到最新排序，这需要在查找时遍历版本链；也可以从最新到最旧排序，这需要为每个新版本更新索引指针。
方法 2：Time-Travel Storage
DBMS 维护一个单独的time-travel table，用于存储元组的旧版本。每次更新时，DBMS 都会将元组的旧版本复制到time-travel table中，并用新数据覆盖主表中的tuple。主表中tuple的指针指向time-travel table中的过去版本。
**方法 #3：Delta Storage

**DBMS 只在所谓的delta存储段中存储delta或tuple之间的变化，而不是整个过去的tuple。然后，事务可以通过迭代 deltas 来重新创建旧版本。这导致写入速度比时间旅行存储更快，但读取速度较慢。

Garbage Collection

DBMS 需要从数据库中删除可回收的物理版本。如果没有活动事务可以 "看到 "该版本，或者该版本是由一个已中止的事务创建的，那么该版本就是可回收的。
方法 #1：Tuple-level GC
DBMS 直接检查元组，从而找到旧版本。有两种方法可以实现这一目的：

Background Vacuuming：独立线程定期扫描表，查找可回收版本。一个简单的优化方法是维护一个 “脏页面bitmap”，它可以跟踪哪些页面在上次扫描后被修改过。这样，线程就可以跳过没有更改的页面。
Cooperative Cleaning：工作线程在遍历版本链时识别可回收版本。如果数据未被访问，则永远不会被清理。

**方法 2：Transaction-level GC

**每个事务负责跟踪自己的旧版本，这样 DBMS 就不必扫描tuple。每个事务都维护自己的读/写集，当事务完成时，垃圾回收器就能利用它来确定要回收哪些tuple。DBMS 会确定已完成事务创建的所有版本何时不再可见。

Index Management

所有主键索引总是指向版本链头。DBMS 更新主键索引的频率取决于系统是否会在更新元组时创建新版本。
二级索引的管理更为复杂。有两种处理方法
方法 1：逻辑指针
DBMS 为每个元组使用一个固定的标识符，该标识符不会改变。这就需要一个额外的间接层，将逻辑标识符映射到元组的物理位置。然后，元组的更新只需更新间接层中的映射即可。
方法 2：物理指针
DBMS 使用版本链头的物理地址。这就需要在版本链头更新时更新每个索引。

Lecture #19_ Logging Schemes

Crash Recovery

恢复算法是确保数据库一致性、事务原子性和故障后耐用性的技术。当数据库崩溃时，内存中所有尚未提交到磁盘的数据都有可能丢失。恢复算法的作用是防止崩溃后信息丢失。
每个恢复算法都包括两个部分：

正常事务处理期间的操作，以确保 DBMS 能够从故障中恢复。
故障后的操作，以将数据库恢复到确保原子性、一致性和持久性的状态。

恢复算法中使用的关键原语是 UNDO 和 REDO。

UNDO：消除未完成或已中止事务的影响的过程。
REDO：重新应用已提交事务的影响以保证持久性的过程。

Storage Types

易失：DRAM、SRAM
非易失：HDD、SDD
稳定存储：不存在，只能近似

Failure Classification

由于 DBMS 根据底层存储设备分为不同的组件，因此 DBMS 需要处理多种不同类型的故障。其中一些故障可以恢复，而另一些则无法恢复。

Transaction Failures
- 当事务出错而必须中止时，就会发生事务失败。逻辑错误（完整性、违反约束）和内部状态错误（死锁）是导致事务失败的两类错误。
System Failures
- 系统故障是指托管 DBMS 的底层软件或硬件出现意外故障。崩溃恢复协议必须考虑到这些故障。
- 软件故障：DBMS 执行出现问题（如未捕获的除以零异常），系统不得不停止运行。
- 硬件故障：DBMS 所在计算机崩溃（如电源插头被拔掉）。我们假设非易失性存储内容不会因系统崩溃而损坏。这被称为 "故障停止 "假设，可简化流程恢复。
Storage Media Failure
- 存储介质故障是物理存储设备损坏时发生的不可修复故障。当存储介质发生故障时，必须从存档版本恢复 DBMS。DBMS 无法从存储故障中恢复，需要人工干预。
- 不可修复的硬件故障：磁头崩溃或类似的磁盘故障会破坏全部或部分非易失性存储。假定破坏是可检测的。

Buffer Pool Management Policies

一旦 DBMS 告知它已提交事务，任何事务的更改都是持久的。
如果事务中止，则部分更改不会持久。
**窃取策略（STEAL）**决定了事务能否将属于不同事务的未提交更改写入磁盘（覆写已提交）。
**强制策略（FORCE）**决定了 DBMS 是否要求在允许事务提交（即向客户机返回提交消息）之前，在非易失性存储中进行事务的所有更新。
强制写入更容易恢复，因为所有更改都会被保留，但运行时性能较差。
最容易实施的缓冲池管理策略叫做 “NO-STEAL + FORCE”。在这种策略中，DBMS 永远不必撤消已中止事务的更改，因为这些更改没有写入磁盘；也永远不必重做已提交事务的更改，因为在提交时，所有更改都会被保证写入磁盘。

该方法有个限制就是所有数据必须适用内存。

Shadow Paging

DBMS 在写入时复制页面，维护两个不同版本的数据库：
master：仅包含已提交事务中的更改。
shadow：临时数据库，包含未提交事务的更改。
更新只在影子副本中进行。当事务提交时，影子副本会原子切换成为新的master。旧的master最终会被垃圾回收。这就是 NO-STEAL + FORCE 系统的一个例子。
数据库根指向主页表，而主页表又指向磁盘上的页面（所有这些页面都包含已提交数据）。更新事务发生时，会创建一个影子页表，指向与主页表相同的页面。对磁盘上的临时空间进行修改后，影子表就会更新。要完成提交，数据库根指针将重定向到影子表，影子表将成为新的主表。

影子分页的一个缺点是复制整个页表的成本很高。实际上，需要复制的只是树中通向更新叶节点的路径，而不是整个树。此外，影子分页的提交开销也很高。提交时，除了需要刷新页表和根节点外，还需要刷新每个更新的页面。这会导致数据碎片化，还需要进行垃圾回收。另一个问题是，影子分页每次只支持一个写入事务或批量事务。

Journal File

当事务修改页面时，DBMS 会将原始页面复制到一个单独的日志文件，然后再覆盖主版本。重启后，如果存在日志文件，DBMS 就会恢复它，以撤销未提交事务的更改。

Write-Ahead Logging

通过 write-ahead logging，DBMS 会在对磁盘页面进行更改之前，将对数据库所做的所有更改记录在日志文件（稳定存储）中。日志中包含的信息足以在数据库崩溃后执行必要的撤销和重做操作来恢复数据库。DBMS 必须将与数据库对象所做更改相对应的日志文件记录写入磁盘，然后才能将该对象刷新到磁盘。WAL 是 STEAL + NO-FORCE 系统的一个示例。

在shadow paging中，DBMS 需要对磁盘上的随机非连续页面执行写入操作。write-ahead logging 允许 DBMS 将随机写入转换为顺序写入，以优化性能。因此，几乎所有 DBMS 都使用WAL，因为它具有最快的运行时性能。但 DBMS 使用 WAL 的恢复时间比shadow paging慢，因为它必须重放日志。
DBMS 首先将事务的所有日志记录分阶段保存在易失性存储器中。然后，与更新页面相关的所有日志记录都会被写入非易失性存储空间，然后页面本身才会在非易失性存储空间中被覆盖。在所有日志记录都写入稳定存储器之前，事务不会被视为已提交。
当事务开始时，为每个事务向日志写入记录，以标记其起点。
当事务结束时，向日志写入记录，并确保在向应用程序返回确认之前刷新所有日志记录。
每个日志条目都包含对单个对象的更改进行倒带或重放所需的信息：

DBMS 必须将事务的所有日志条目刷新到磁盘上，然后才能向外界宣布事务已成功提交。系统可以使用 "分组提交" 优化功能，将多个日志刷新分批进行，以减少开销。日志刷新要么在日志缓冲区已满时进行，要么在连续刷新之间间隔足够长的时间后进行。
在日志结构 DBMS 中，事务日志记录被写入一个名为 MemTable 的内存缓冲区。当该缓冲区满时，它就会被刷新到磁盘上。这种方法仍然需要一个独特的WAL。这是因为 WAL 的刷新通常比 MemTable 的刷新更频繁，而且 WAL 可能包含未提交的事务。在从崩溃中恢复时，WAL 用于重新创建内存中的 MemTable。

Logging Schemes

物理日志：

记录对数据库中特定位置所做的字节级更改。
Example: git diff

逻辑日志：

记录事务执行的高级操作。
不一定仅限于一页。
与物理日志记录相比，逻辑日志记录需要写入的数据更少，因为每条记录可以在多个页面上更新多个tuple。不过，恢复需要更长的时间，因为必须重新执行每个事务。
Example: The UPDATE, DELETE, and INSERT queries invoked by a transaction.

生理日志：

混合方法，日志记录以单个页面为目标，但不指定页面的数据组织。也就是说，根据页面中的槽号来识别tuple，而不指定更改在页面中的具体位置。因此，DBMS可以在日志记录写入磁盘后重新组织页面。
最常用。

Checkpoints

基于 WAL 的 DBMS 的主要问题是日志文件会一直增长。崩溃后，DBMS 必须重放整个日志，如果日志文件很大，这可能需要很长时间。因此，DBMS 可以在所有缓冲区刷新到磁盘上时设置checkpoint。
阻塞检查点实现：

DBMS 停止接受新事务，等待所有活动事务完成。
将当前驻留在主内存中的所有日志记录和脏块刷新到稳定存储区。
向日志写入条目并刷新到稳定存储区。

Lecture #20_ Database Crash Recovery

@# Crash Recovery

DBMS 依靠其恢复算法来确保数据库的一致性、事务原子性和故障后的持久性。每种恢复算法都由两部分组成：

在正常事务处理期间采取的行动，以确保 DBMS 能够从故障中恢复。
故障发生后采取的行动，以将数据库恢复到可确保事务的原子性、一致性和持久性的状态。

语义恢复和隔离算法（Algorithms for Recovery and Isolation Exploiting Semantics ARIES）是 IBM 在 20 世纪 90 年代初为 DB2 系统开发的一种恢复算法。

WAL：在将数据库更改写入磁盘之前，任何更改都会记录在稳定存储器的日志中（STEAL + NO-FORCE）
redo时回溯历史记录：重新启动时，回溯操作并将数据库恢复到崩溃前的准确状态。
记录撤消过程中的更改：将撤消操作记录到日志中，确保在重复出现故障时不会重复操作。

WAL Records

WAL记录扩展了 DBMS 的日志记录格式，使其包含一个全局唯一的日志序列号 (LSN)。

每个 WAL 都有一个 LSN 计数器，每一步都会递增。页面还会保存一个 pageLSN 和一个 recLSN，后者存储了导致页面变脏的第一条日志记录。flushedLSN 是指向最后写入磁盘的 LSN 的指针。MasterRecord 指向最后一次成功通过的检查点。

Normal Execution

每个事务都会调用一系列读取和写入操作，然后提交或终止。恢复算法必须具备这种事件序列。
事务提交时，DBMS 会首先将 COMMIT 记录写入内存中的日志缓冲区。然后，DBMS 会将包括事务 COMMIT 记录在内的所有日志记录刷新到磁盘。请注意，这些日志刷新是顺序同步写入磁盘的。每个日志页可以有多个日志记录。一旦 COMMIT 记录安全地存储在磁盘上，DBMS 就会向应用程序返回事务已提交的确认信息。稍后，数据库管理系统会向日志写入一条特殊的 TXN-END 记录。这表明系统中的事务已完全结束，不会再有任何日志记录。这些 TXN-END 记录用于内部记账，不需要立即刷新。

中止事务是 ARIES 撤消操作的一个特例，只适用于一个事务。日志记录中会增加一个名为 prevLSN 的字段。它与事务的前一个 LSN 相对应。DBMS 使用这些 prevLSN 值来维护每个事务的链接列表，这样就能更方便地在日志中查找其记录。此外，还引入了补偿日志记录（compensation log record，CLR），描述了撤消前一条更新记录的操作。它包含更新日志记录的所有字段，外加 undoNext 指针（即下一个要撤销的 LSN）。DBMS 将 CLR 添加到日志中，就像添加其他记录一样，但它们永远不需要被撤销。要中止事务，DBMS 首先会在内存的日志缓冲区中添加一条 ABORT 记录。然后以相反的顺序撤销事务的更新，以消除它们对数据库的影响。对于每次撤销的更新，DBMS 都会在日志中创建 CLR 条目并恢复旧值。在撤销所有已中止事务的更新后，数据库管理系统会写入 TXN-END 日志记录。

Checkpointing

DBMS 会定期checkpoint，将缓冲池中的脏页面写入磁盘。这样做的目的是尽量减少恢复时需要重放的日志内容。

Blocking Checkpoints
- 会停止事务和查询的执行，以确保向磁盘写入一致的数据库快照。
Slightly Better Blocking Checkpoints
- DBMS 会记录检查点开始时的内部系统状态。
- 活动事务表 (ATT)：ATT 表示 DBMS 中正在运行的事务的状态。DBMS 完成事务的提交/中止流程后，事务条目就会被删除。
- 脏页面表 (DPT)：DPT 包含缓冲池中被未提交事务修改的页面信息。每个脏页面都有一个包含 recLSN 的条目（即首先导致页面变脏的日志记录的 LSN）。
- 总体而言，ATT 和 DPT 的作用是帮助 DBMS 通过 ARIES 恢复协议恢复数据库崩溃前的状态。
Fuzzy Checkpoints
- 模糊检查点是指 DBMS 允许其他事务继续运行。这就是 ARIES 在其协议中使用的方式。
- DBMS 使用额外的日志记录来跟踪检查点边界。和

ARIES Recovery

ARIES 协议的三个阶段：

Analysis：读取 WAL 以识别缓冲池中的脏页面和崩溃时的活动事务。在分析阶段结束时，ATT 会告诉 DBMS 崩溃时哪些事务处于活动状态。DPT 会告诉 DBMS 哪些脏页面可能没有存入磁盘。
- 从通过数据库MasterRecord LSN 找到的最后一个检查点开始。
Redo：从日志中的适当点开始重复所有操作。
- 此阶段的目标是让 DBMS 重复历史记录，重建崩溃前的状态。DBMS 会从 DPT 中包含最小 recLSN 的日志记录开始向前扫描。对于具有给定 LSN 的每条更新日志记录或 CLR，DBMS 都会重新应用更新。
- 要redo操作，DBMS 会在日志记录中重新应用更改，然后将受影响页面的 pageLSN 设置为该日志记录的 LSN。在重做阶段结束时，为所有状态为 COMMIT 的事务写入 TXN-END 日志记录，并将其从 ATT 中删除。
Undo：撤销崩溃前未提交的事务操作。
- 在最后一个阶段，DBMS 会撤销崩溃时处于活动状态的所有事务。
- DBMS 会使用 lastLSN 按 LSN 倒序处理事务，以加快遍历速度。在反向更新事务的过程中，DBMS 会为每次修改向日志写入 CLR 条目。
- 一旦最后一个事务被成功中止，DBMS 就会清空日志，然后准备开始处理新事务。

你可能感兴趣的:(Linux服务器编程,数据库,cmu15445,笔记)

日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
【花了N长时间读《过犹不及》，不断练习，可以越通透】君君Love
我已经记不清花了多长时间去读《过犹不及》，读书笔记都写了42页，这算是读得特别精细的了。是一本难得的好书，虽然书中很多内容和圣经吻合，我不是基督徒，却觉得这样的文字值得细细品味，和我们的生活息息相关。我是个界线建立不牢固的人，常常愧疚，常常害怕他人的愤怒，常常不懂拒绝，还有很多时候表达不了自己真实的感受，心里在说不嘴里却在说好……这本书给我很多的启示，让我学会了怎样去建立属于自己的清晰的界限。建立
包含日志获取webshell 陈望_ning
日志文件关闭：Apache目录下的httpd.conf文件#ErrorLog"logs/error.log"#CustomLog"logs/access.log"common加#号为注释不产生日志文件如果去掉#将会在Apache/logs/目录下产生日志文件linux:access_logerror_logwindows:access.logerror.logaccess_log每一行记录了一次网
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
第八课: 写作出版你最关心的出书流程和市场分析（无戒学堂复盘）人在陌上
今天是周六，恰是圣诞节。推掉了两个需要凑腿的牌局，在一个手机，一个笔记本，一台电脑，一杯热茶的陪伴下，一个人静静地回听无戒学堂的最后一堂课。感谢这一个月，让自己的习惯开始改变，至少，可以静坐一个下午而不觉得乏味枯燥难受了，要为自己点个赞。我深知，这最后一堂课的内容，以我的资质和毅力，可能永远都用不上。但很明显，无戒学堂是用了心的，毕竟，有很多优秀学员，已经具备了写作能力，马上就要用到这堂课的内容。
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
《感官品牌》读书笔记 1 西红柿阿达
原文:最近我在东京街头闲逛时，与一位女士擦肩而过，我发现她的香水味似曾相识。“哗”的一下，记亿和情感立刻像潮水般涌了出来。这个香水味把我带回了15年前上高中的时候，我的一位亲密好友也是用这款香水。一瞬间，我呆站在那里，东京的街景逐渐淡出，取而代之的是我年少时的丹麦以及喜悦、悲伤、恐惧、困惑的记忆。我被这熟悉的香水味征服了。感想:感官是有记忆的，你所听到，看到，闻到过的有代表性的事件都会在大脑中深深
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
我不想再当知识的搬运工楚煜楚尧
因为学校课题研究的需要，这个暑假我依然需要完成一本书的阅读笔记。我选的是管建刚老师的《习课堂十讲》。这本书，之前我读过，所以重读的时候，感到很亲切，摘抄起来更是非常得心应手。20页，40面，抄了十天，终于在今天大功告成了。这对之前什么事都要一拖再拖的我来说，是破天荒的改变。我发现至从认识小尘老师以后，我的确发生了很大的改变。遇到必须做却总是犹豫不去做的事，我学会了按照小尘老师说的那样，在心里默默数
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
20210517坚持分享53天读书摘抄笔记非暴力沟通——爱自己 f79a6556cb19
让生命之花绽放在赫布·加德纳（HerbGardner）编写的《一千个小丑》一剧中，主人公拒绝将他12岁的外甥交给儿童福利院。他郑重地说道：“我希望他准确无误地知道他是多么特殊的生命，要不，他在成长的过程中将会忽视这一点。我希望他保持清醒，并看到各种奇妙的可能。我希望他知道，一旦有机会，排除万难给世界一点触动是值得的。我还希望他知道为什么他是一个人，而不是一张椅子。”然而，一旦负面的自我评价使我们看
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
HikariCP调试日志深度解析：生产环境故障排查完全指南
HikariCP调试日志深度解析：生产环境故障排查完全指南更新时间：2025年7月4日|作者：资深架构师|适用版本：HikariCP5.x+|难度等级：中高级前言在生产环境中，数据库连接池往往是系统性能的关键瓶颈。HikariCP作为当前最流行的Java连接池，其调试日志包含了丰富的运行时信息，能够帮助我们快速定位和解决各种连接池相关问题。本文将深入解析HikariCP的日志体系，提供一套完整的故
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
Redis 分布式锁深度解析：过期时间与自动续期机制爱恨交织围巾分布式事务 redis 分布式数据库微服务学习 go
Redis分布式锁深度解析：过期时间与自动续期机制在分布式系统中，Redis分布式锁的可靠性很大程度上依赖于对锁生命周期的管理。上一篇文章我们探讨了分布式锁的基本原理，今天我们将聚焦于一个关键话题：如何通过合理设置过期时间和实现自动续期机制，来解决分布式锁中的死锁与锁提前释放问题。一、为什么过期时间是分布式锁的生命线？你的笔记中提到"服务挂掉时未删除锁可能导致死锁"，这正是过期时间要解决的核心问题
08.学习闭环三部曲：预习、实时学习、复习 0058b195f4dc
人生就是一本效率手册，你怎样对待时间，时间就会给你同比例的回馈。单点突破法。预习，实时学习，复习。1、预习：凡事提前【计划】（1）前一晚设置三个当日目标。每周起始于每周日。（2）提前学习。预习法进行思考。预不预习效果相差20％，预习法学会提问。（3）《学会提问》。听电子书。2.实时学习（1）（10％）相应场景，思维导图，快速笔记。灵感笔记。（2）大纲，基本记录，总结篇。3.复习法则，（70％），最
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include