在数据库性能优化中,慢SQL 是导致系统响应延迟的常见“元凶”。本文将通过一个真实案例(响应时间从3秒降至500ms),系统化讲解如何利用工具链定位问题、设计优化方案,并最终验证结果。无论你是开发还是DBA,这套方法论都能帮助你快速解决SQL性能问题。
核心作用:捕获执行时间超过阈值的SQL,定位高频慢查询。
-- 开启慢查询日志(MySQL示例)
SET GLOBAL slow_query_log = 'ON';
-- 设置慢查询阈值(单位:秒)
SET GLOBAL long_query_time = 3;
-- 指定日志路径(可选)
SET GLOBAL slow_query_log_file = '/var/log/mysql/mysqld-slow.log';
# 按执行时间排序
cat /var/log/mysql/mysqld-slow.log | more
pt-query-digest /var/log/mysql/mysqld-slow.log > slow_report.txt
输出报告包含:
参考文章:https://cloud.tencent.com/developer/article/1707296
日志中发现一条高频SQL(已做简化处理):
SELECT o.order_id, u.username, p.product_name
FROM orders o
JOIN users u ON o.user_id = u.user_id
JOIN products p ON o.product_id = p.product_id
WHERE o.status = 'pending'
ORDER BY o.create_time DESC
LIMIT 100;
特征:每分钟执行120次,平均耗时3.2秒。
核心作用:解析SQL的索引使用、表扫描方式、执行顺序等。
EXPLAIN SELECT ...; -- 在目标SQL前添加EXPLAIN
字段 | 说明 |
---|---|
type | 访问类型(ALL全表扫描、index全索引扫描、range范围扫描、ref索引查找) |
key | 实际使用的索引(NULL表示未命中) |
rows | 预估扫描行数 |
Extra | 额外信息(Using filesort、Using temporary表示高成本操作) |
执行计划输出:
+----+-------------+-------+------+---------------+------+---------+------+--------+-----------------------------+
| id | select_type | table | type | possible_keys | key | key_len | rows | Extra |
+----+-------------+-------+------+---------------+------+---------+------+--------+
| 1 | SIMPLE | o | ALL | NULL | NULL | NULL | 50万 | Using where; Using filesort |
| 1 | SIMPLE | u | eq_ref| PRIMARY | PRIMARY | 4 | 1 | NULL |
| 1 | SIMPLE | p | eq_ref| PRIMARY | PRIMARY | 4 | 1 | NULL |
+----+-------------+-------+------+---------------+------+---------+------+--------+
诊断结论:
orders
表全表扫描(type=ALL
),扫描50万行。WHERE o.status='pending'
和ORDER BY create_time
未命中索引。Using filesort
(内存或磁盘排序)。核心作用:深入分析优化器决策细节,确认资源消耗瓶颈。
-- 配置跟踪参数
SET SESSION optimizer_trace_max_mem_size = 1000000;
SET SESSION optimizer_trace="enabled=on,end_markers_in_json=on";
-- 执行目标SQL
SELECT......;
-- 获取并格式化跟踪结果
SELECT JSON_PRETTY(trace) FROM information_schema.optimizer_trace\G
-- 关闭跟踪
SET SESSION optimizer_trace="enabled=off";
{
"steps": [
{
"join_execution": {
"select#": 1,
"steps": [
{
"filesort_information": [
{
"direction": "desc",
"table": "`orders`",
"field": "create_time"
}
],
"filesort_priority_queue_optimization": {...},
"filesort_execution": [ ... ],
"filesort_summary": {
"rows": 100000,
"sort_time": "2.1 sec" -- 排序耗时占比高
}
}
]
}
}
]
}
诊断结论:
核心原则:让查询尽可能通过索引定位数据,减少扫描行数。
-- 为orders表添加联合索引
ALTER TABLE orders ADD INDEX idx_status_create_time (status, create_time);
重新执行EXPLAIN
:
+----+-------------+-------+------+---------------+------------------------+---------+------+--------+-----------------------------+
| id | select_type | table | type | possible_keys | key | key_len | rows | Extra |
+----+-------------+-------+------+---------------+------------------------+---------+------+--------+
| 1 | SIMPLE | o | ref | idx_status... | idx_status_create_time | 5 | 1000 | Using index condition |
+----+-------------+-------+------+---------------+------------------------+---------+------+--------+
type=ref
:索引范围扫描,扫描行数从50万降至1000。Using filesort
消失:排序字段create_time
已包含在索引中。拆分复杂JOIN:
-- 使用子查询先过滤orders表
SELECT o.order_id, u.username, p.product_name
FROM (
SELECT order_id, user_id, product_id
FROM orders
WHERE status = 'pending'
ORDER BY create_time DESC
LIMIT 100
) o
JOIN users u ON o.user_id = u.user_id
JOIN products p ON o.product_id = p.product_id;
避免隐式类型转换:
WHERE
条件字段类型与传入值一致(如status
字段为VARCHAR
,避免使用数字)。参数调优:
-- 增大排序缓冲区(会话级调整)
SET sort_buffer_size = 4M;
指标 | 优化前 | 优化后 |
---|---|---|
响应时间 | 3200ms | 480ms |
扫描行数 | 500,000 | 1,000 |
CPU占用 | 80% | 15% |
慢查询日志 → EXPLAIN → OPTIMIZER_TRACE
,形成闭环。WHERE
、ORDER BY
、JOIN
字段。附录