事务 (Transaction) 是数据库管理系统中至关重要的概念,代表一组不可分割的操作序列。事务要么全部成功执行 (提交 - Commit),要么全部失败回滚 (Rollback)。事务的存在是为了在并发访问和系统故障的情况下,维护数据库的数据一致性和可靠性。
事务的本质是为了解决多用户并发访问数据库时,以及系统发生故障时,如何保证数据的正确性和完整性。例如银行转账:
账户 A 余额减少
账户 B 余额增加
这两个操作必须作为一个原子操作执行,要么都成功,要么都失败。事务机制避免了只执行部分操作导致的数据不一致。
ACID 是衡量事务是否可靠的标准:
事务是不可分割的最小工作单元,所有操作要么全部成功,要么全部失败回滚。
机制详解: 通过 Undo Log (回滚日志) 实现。事务执行修改操作前,会将修改前的数据记录到 Undo Log。如果事务执行出错或用户主动回滚,数据库利用 Undo Log 将数据恢复到事务开始前的状态。
应用场景: 银行转账、电商订单创建 (订单主表和订单明细表必须同时成功或失败)。
事务必须保证数据库从一个一致性状态转变到另一个一致性状态。数据必须符合预定义的规则和约束(例如,完整性约束、触发器、应用逻辑等)。
机制详解: 一致性是事务追求的最终目标。原子性、隔离性和持久性都是为了保证一致性。一致性不仅仅是数据库层面的约束,也包括应用层面的业务逻辑。 例如,转账操作不仅要保证原子性,还要保证转账金额不能为负数 (应用逻辑约束)。
应用场景: 库存扣减 (扣减数量不能超过当前库存)、用户账户余额更新 (余额不能小于 0)。
多个并发事务之间相互隔离,一个事务的执行不应该被其他事务干扰。隔离性保证了并发环境下的数据访问正确性。
机制详解: 通过 锁机制 (Locking) 和 多版本并发控制 (MVCC - Multi-Version Concurrency Control) 来实现。
锁机制: 当一个事务需要修改数据时,可以对数据加锁,阻止其他事务同时修改或读取,保证数据访问的排他性。 锁的类型包括共享锁 (Shared Lock - 读锁) 和排他锁 (Exclusive Lock - 写锁)。
MVCC: 为每个事务创建一个数据快照 (Snapshot),事务读取数据时,读取的是快照版本的数据,而不是最新的数据。 这样可以实现读写并发,提高系统并发性能,同时保证一定程度的隔离性。
**版本链:**每行数据包含 DB_TRX_ID(事务 ID)和 DB_ROLL_PTR(回滚指针),通过这两个隐藏字段,将同一行数据的不同版本串联起来,形成一个版本链。
ReadView 生成规则:
隔离级别 | ReadView 生成时机 |
---|---|
READ COMMITTED | 每次 SELECT 时生成 |
REPEATABLE READ | 第一次 SELECT 时生成 |
隔离级别: SQL 标准定义了四种事务隔离级别 (后面会详细介绍)。
应用场景: 电商秒杀活动 (保证库存不会超卖)、多人同时修改同一份文档 (避免数据冲突)。
一旦事务提交成功,其所做的修改就应该永久保存到数据库中,即使系统发生崩溃、断电等故障,数据也不会丢失。
机制详解: 通过 Redo Log (重做日志) 实现。事务提交时,InnoDB 会将事务的所有修改操作先写入 Redo Log 缓冲区,然后将 Redo Log 刷新到磁盘 (先于数据页刷新)。 即使数据库发生崩溃,重启后,MySQL 也可以通过 Redo Log 重放已经提交的事务,将数据恢复到事务提交后的状态。
Redo Log 双写机制:
事务提交时先写入 Log Buffer。
通过 innodb_flush_log_at_trx_commit
控制刷盘策略:
0
:每秒刷盘。
1
:实时刷盘(默认)。
2
:写入 OS 缓存后返回。
应用场景: 支付成功记录 (支付成功后,即使系统崩溃,支付记录也不能丢失)、用户注册信息 (注册成功后,用户信息必须永久保存)。
SQL 标准定义了四种事务隔离级别,从低到高依次为:
隔离级别 | 脏读 (Dirty Read) | 不可重复读 (Non-repeatable Read) | 幻读 (Phantom Read) | 实现机制 |
READ UNCOMMITTED (读未提交) | 可能 | 可能 | 可能 | 无特殊并发控制机制,直接读取最新数据。 |
READ COMMITTED (读已提交) | 不可能 | 可能 | 可能 | MVCC + 锁 (共享锁和排他锁)。读取数据时,总是读取已提交的最新版本。 |
REPEATABLE READ (可重复读) | 不可能 | 不可能 | 可能 (InnoDB 大大缓解) | MVCC + 锁 (共享锁、排他锁、Next-Key Locks)。事务开始时创建 ReadView,事务期间始终使用同一个 ReadView。 |
SERIALIZABLE (串行化) | 不可能 | 不可能 | 不可能 | 强制加锁 (所有读取加共享锁,所有写入加排他锁)。并发事务串行化。 |
脏读: 读取到另一个事务尚未提交的修改。
不可重复读: 同一事务内多次读取同一数据,得到不同结果。
幻读: 同一事务内,相同查询条件多次查询,出现之前不存在或消失的记录。
隔离级别选择建议:
大多数应用场景: READ COMMITTED
或 REPEATABLE READ
。
数据一致性要求较高,并发量适中: REPEATABLE READ
(InnoDB 默认)。
数据一致性要求极高,牺牲并发性能: SERIALIZABLE
。
极少场景: READ UNCOMMITTED
(除非明确知道数据不一致性不会造成严重影响)。
MVCC 是 InnoDB 实现 READ COMMITTED 和 REPEATABLE READ 的核心技术。为每行数据维护多个版本,通过 ReadView,让不同事务在不同时间点看到不同版本,实现读写并发,提高性能,同时保证隔离性。
版本链 (Version Chain): InnoDB 为每行数据维护版本链,记录多个历史版本。通过隐藏字段实现:
DB_TRX_ID
** (事务 ID)* 记录最后一次更新该行的事务 ID。
DB_ROLL_PTR
** (回滚指针)* 指向 Undo Log 中记录的上一个版本的数据。
Undo Log (撤销日志): 记录数据修改前的版本信息,版本链中的DB_ROLL_PTR
指向 Undo Log 中旧版本的数据。Undo Log 存储历史快照。
ReadView (一致性视图): 每个事务执行快照读时生成。ReadView 定义了“当前事务可以看到哪些版本的数据”。包含:
creator_trx_id
****: 创建 ReadView 的事务 ID。
trx_ids
****: 生成 ReadView 时,所有活跃、未提交的事务 ID 列表。
min_trx_id
****: trx_ids
列表中最小的事务 ID。
max_trx_id
****: 预分配给下一个事务的 ID,大于 trx_ids
中最大的事务 ID。
DB_TRX_ID
** == **creator_trx_id**
* 当前事务自己修改,总是可见。
DB_TRX_ID
** < **min_trx_id**
* 版本创建在 ReadView 之前,可见。
DB_TRX_ID
** >= **max_trx_id**
* 版本创建在 ReadView 之后,不可见。
min_trx_id
** <= **DB_TRX_ID**
< **max_trx_id**
*
DB_TRX_ID
** 在 **trx_ids**
中:** 版本创建时事务仍活跃,不可见。
DB_TRX_ID
** 不在 **trx_ids**
中:** 版本创建时事务已提交,可见。
获取ReadView
访问数据
可见性判断
可见则返回
不可见则沿着版本链通过DB_ROLL_PTR
回溯,知道找到可见版本或者回溯到尽头
返回可见版本
锁类型 | 作用范围 | 解决现象 | 加锁示例 |
记录锁 | 单行记录 | 写冲突 | UPDATE users SET age=18 WHERE id=1 |
间隙锁 | 索引记录间的区间 | 幻读 | SELECT * WHERE id>10 AND id<20 FOR UPDATE |
临键锁 | 记录锁+间隙锁 | 幻读+写冲突 | SELECT * WHERE id>10 FOR UPDATE |
插入意向锁 | 插入操作的特殊间隙锁 | 并发插入优化 | INSERT INTO users(id) VALUES(15) |
START TRANSACTION
** 或 **BEGIN**
* 显式开启事务。
COMMIT
****: 提交事务。事务中的所有修改操作将被永久保存到数据库。
ROLLBACK
****: 回滚事务。撤销事务中的所有修改操作,将数据恢复到事务开始之前的状态。
SAVEPOINT savepoint_name
****: 在事务中设置保存点。允许在事务执行过程中回滚到指定的保存点,而不是整个事务回滚。
ROLLBACK TO SAVEPOINT savepoint_name
****: 回滚事务到指定的保存点。
RELEASE SAVEPOINT savepoint_name
****: 删除事务中定义的保存点。
Redo Log(重做日志)是 InnoDB 实现事务持久性 (Durability) 的关键机制。它记录事务对数据页所做的物理修改。即使数据库崩溃,也能通过 Redo Log 重演已提交事务的修改,保证数据不丢失。
核心作用:崩溃恢复 (Crash Recovery)。
Write-Ahead Logging (WAL) 预写式日志:先写日志,后写数据。
Redo Log Buffer (内存缓冲区): 临时存放即将写入磁盘的 Redo Log 记录。
Redo Log Files (磁盘文件): 实际存储 Redo Log 记录的磁盘文件。循环写入,由一组固定大小的文件组成 (例如 ib_logfile0
, ib_logfile1
)。
Log Sequence Number (LSN) 日志序列号: 单调递增的字节偏移量,标识 Redo Log 记录位置。
生成 Redo Log 记录: 事务修改数据页时生成。
写入 Redo Log Buffer: 追加到 Buffer 末尾。
刷新 Redo Log Buffer 到磁盘 (Flush):
事务提交 (由 innodb_flush_log_at_trx_commit
控制)。
Redo Log Buffer 空间不足。
后台线程定期刷新。
Checkpoint 时刷新。
写入 Redo Log Files: 刷新操作将日志顺序写入 Redo Log Files。
innodb_flush_log_at_trx_commit
参数控制 Redo Log Buffer 刷盘策略:
0
****: 最不安全,性能最好。每秒刷新一次。
1
****: 最安全,性能相对较低。事务提交时立即刷新并 fsync
。
2
****: 安全性和性能折中。事务提交时写入 OS 缓存,但不立即 fsync
。
为了避免 Redo Log Files 被写满,InnoDB 引入 Checkpoint 机制。
作用:
缩短数据库恢复时间。
回收 Redo Log 文件空间。
类型:
Sharp Checkpoint
Fuzzy Checkpoint
Undo Log (撤销日志) 用于实现事务的原子性 (Atomicity) 和 MVCC。
双重使命:
事务回滚 (Transaction Rollback): 撤销事务已做的修改。
MVCC: 记录数据修改前的版本,实现非阻塞读。
Undo Log 类型:
Insert Undo Log: 用于 INSERT
操作的回滚。记录新插入记录的主键。
Update Undo Log: 用于 UPDATE
和 DELETE
操作的回滚。记录被修改记录的旧值。
Undo Log 存储结构: 存储在 Undo Tablespace 中。
Rollback Segment (回滚段): Undo Log 存储和管理的基本单元。
每个事务对应一个 Undo 段,包含 1024 个 Undo Slot.
Undo Log 生成过程: 事务执行修改操作时生成。
Purge 线程: 异步清理不再需要的 Undo Log 记录。
事务在电商网站的核心业务中至关重要:
同时向多个表插入数据 (用户表、用户详情表、账户表等),事务保证原子性,防止数据不完整。
涉及库存检查、库存扣减、创建订单记录、生成支付单等多个步骤,事务保证订单创建的完整性和一致性。
涉及订单状态检查、金额验证、状态更新、账户余额变更、支付流水记录等,事务保证支付过程的正确性和资金安全。
商品库存的各种操作 (扣减、增加、锁定、解锁等),事务保证数据一致性,防止超卖、库存数据错乱。
涉及订单状态检查、状态更新、账户余额变更、退款流水记录等,事务保证退款操作的原子性和一致性。
START TRANSACTION;
-- 1. 库存扣减(行锁)
UPDATE inventory SET stock=stock-1
WHERE product_id=1001 AND stock>0;
-- 2. 创建订单记录
INSERT INTO orders(order_id,user_id,product_id)
VALUES('202308080001',123,1001);
-- 3. 支付流水记录
INSERT INTO payment_flow(order_id,amount)
VALUES('202308080001',99.99);
COMMIT;
优化要点:
库存扣减使用乐观锁(version字段)或者 FOR UPDATE
订单表按用户ID分库分表
支付流水异步写入消息队列
-- 协调者(订单服务)
XA START 'order_transaction';
UPDATE orders SET status=1 WHERE order_id=1001;
XA END 'order_transaction';
XA PREPARE 'order_transaction';
-- 参与者(库存服务)
XA START 'stock_transaction';
UPDATE inventory SET stock=stock-1 WHERE product_id=1001;
XA END 'stock_transaction';
XA PREPARE 'stock_transaction';
-- 全局提交
XA COMMIT 'order_transaction';
XA COMMIT 'stock_transaction';
-- 查看运行中事务
SELECT * FROM information_schema.INNODB_TRX
WHERE TIME_TO_SEC(TIMEDIFF(NOW(),trx_started)) > 60;
-- 强制回滚长事务(需super权限)
KILL QUERY [trx_mysql_thread_id];
-- 设置锁超时时间(默认50秒)
SET GLOBAL innodb_lock_wait_timeout=30;
-- 死锁自动检测(默认开启)
SHOW VARIABLES LIKE 'innodb_deadlock_detect';
-- 查看锁等待关系
SELECT * FROM performance_schema.data_lock_waits;
-- 查看当前锁信息
SHOW ENGINE INNODB STATUS\G -- 关注 LATEST DETECTED DEADLOCK 和 TRANSACTIONS 部分
-- 查看事务日志配置
SELECT @@innodb_log_file_size, @@innodb_log_files_in_group; -- Redo Log 文件配置
-- 分析事务性能
SELECT EVENT_NAME, COUNT_STAR, SUM_TIMER_WAIT/1000000 AS wait_ms
FROM performance_schema.events_waits_summary_global_by_event_name
WHERE EVENT_NAME LIKE 'wait/io/innodb%';
-- 查看Undo空间使用
SELECT
tablespace_name,
file_size/1024/1024 AS file_size_mb,
allocated_size/1024/1024 AS allocated_mb
FROM information_schema.FILES
WHERE file_type='UNDO LOG';
-- 定期清理历史版本
OPTIMIZE TABLE large_table; -- 重建表空间
-- 分批次处理(减少Undo积累)
START TRANSACTION;
DELETE FROM order_log WHERE created_at < '2023-01-01' LIMIT 1000;
COMMIT;
-- 循环执行直至完成
操作流程:
全量备份: mysqldump --single-transaction --master-data=2 -uroot -p dbname > backup.sql
恢复步骤:
bash mysql -uroot -p dbname < backup.sql mysqlbinlog --start-position=107 /var/log/mysql/bin.000001 | mysql -uroot -p
三阶段恢复过程:
前滚 (Redo): 通过 Redo Log 重做已提交事务。
回滚 (Undo): 通过 Undo Log 回滚未提交事务。
清理: 清除临时对象,确保数据一致性。
理解 ACID 特性: 深刻理解 ACID 特性是掌握事务的核心。
选择合适的隔离级别: 根据应用场景选择合适的事务隔离级别。REPEATABLE READ
通常是最佳选择。
显式控制事务: 使用 START TRANSACTION
, COMMIT
, ROLLBACK
等语句显式控制事务边界。
事务要尽可能小: 事务范围应尽可能小,只包含必要的数据库操作。
避免长事务: 避免长时间运行的事务。 长事务会占用数据库资源, 降低系统性能, 并可能导致锁等待, 死锁等问题. 如果业务流程确实需要长时间运行,可以考虑将大事务拆分成多个小事务,或者使用其他技术手段 (例如,消息队列、最终一致性) 来解决。
关注事务的性能: 避免过度使用事务,或者不合理地使用事务。在 OLTP 系统中重点优化短事务处理,分布式场景优先考虑柔性事务方案。
监控 Redo Log 和 Undo Log: 监控 Redo Log 的写入速度、刷新频率,Undo Log 的空间使用情况,以及长事务。
金融级系统保持**innodb_flush_log_at_trx_commit=1**
,电商等高并发场景可适当放宽至2以提升吞吐量。
对于需要保存历史版本的特殊场景,可考虑使用Flashback技术或临时关闭自动清理机制。
事务是数据库提供的强大工具,正确理解和使用事务,可以有效保障数据的一致性和可靠性。在电商网站等高并发场景中,事务是不可或缺的核心技术。