在数据库设计中,有时我们会将 JSON 数据存储在 VARCHAR 或 TEXT 类型字段中。这种方式虽然灵活,但在查询时需要特别注意。本文将详细介绍如何在 MySQL 中有效查询存储为 VARCHAR 类型的 JSON 数据。
当 JSON 数据存储在 VARCHAR 列中时,常见的数据格式如下:
[
{"id":"1905555466980773889","hasPermission":true},
{"id":"1905547884060835841","hasPermission":false}
]
我们需要查询这个 JSON 数组中是否包含特定 ID 的对象。
MySQL 5.7+ 版本提供了丰富的 JSON 处理函数,即使数据类型是 VARCHAR,只要内容是有效的 JSON,我们仍然可以使用这些函数:
JSON_CONTAINS(target, candidate[, path])
: 检查 JSON 文档是否包含特定值JSON_EXTRACT(json_doc, path)
: 从 JSON 文档中提取值JSON_OBJECT(key, val[, key, val]...)
: 创建 JSON 对象JSON_ARRAY(val[, val]...)
: 创建 JSON 数组JSON_VALID(json_doc)
: 验证字符串是否为有效的 JSON查询 JSON 数组中包含特定 ID 的记录:
SELECT * FROM sys_user
WHERE
app_ids IS NOT NULL
AND app_ids != ''
AND JSON_CONTAINS(app_ids, JSON_OBJECT('id', '1905555466980773889'));
SELECT * FROM sys_user
WHERE
app_ids IS NOT NULL
AND app_ids != ''
AND (
JSON_CONTAINS(app_ids, JSON_OBJECT('id', '1905555466980773889'))
OR JSON_CONTAINS(app_ids, JSON_OBJECT('id', '1905547884060835841'))
);
SELECT * FROM sys_user
WHERE
app_ids IS NOT NULL
AND app_ids != ''
AND JSON_OVERLAPS(
app_ids,
JSON_ARRAY(
JSON_OBJECT('id', '1905555466980773889'),
JSON_OBJECT('id', '1905547884060835841')
)
);
SELECT * FROM sys_user
WHERE
app_ids IS NOT NULL
AND app_ids != ''
AND JSON_CONTAINS(
app_ids,
JSON_OBJECT('id', '1905555466980773889', 'hasPermission', true)
);
JSON_CONTAINS 函数在处理 NULL 或空字符串时会报错,所以需要先排除这些情况:
-- 错误做法
SELECT * FROM sys_user WHERE JSON_CONTAINS(app_ids, JSON_OBJECT('id', '123'));
-- 正确做法
SELECT * FROM sys_user
WHERE
app_ids IS NOT NULL
AND app_ids != ''
AND JSON_CONTAINS(app_ids, JSON_OBJECT('id', '123'));
确保 JSON_CONTAINS 的第二个参数结构与目标 JSON 中的结构匹配:
-- 错误做法 (直接传入 ID 字符串)
SELECT * FROM sys_user WHERE JSON_CONTAINS(app_ids, '"1905555466980773889"');
-- 正确做法 (创建与数组元素匹配的对象)
SELECT * FROM sys_user WHERE JSON_CONTAINS(app_ids, JSON_OBJECT('id', '1905555466980773889'));
添加 JSON_VALID 检查确保字段内容是有效的 JSON:
SELECT * FROM sys_user
WHERE
app_ids IS NOT NULL
AND app_ids != ''
AND JSON_VALID(app_ids) = 1
AND JSON_CONTAINS(app_ids, JSON_OBJECT('id', '1905555466980773889'));
LambdaQueryWrapper queryWrapper = new LambdaQueryWrapper<>();
queryWrapper.isNotNull(SysUser::getAppIds)
.ne(SysUser::getAppIds, "")
.apply("JSON_CONTAINS(app_ids, JSON_OBJECT('id', {0}))", "1905555466980773889");
List userList = sysUserMapper.selectList(queryWrapper);
QueryWrapper queryWrapper = new QueryWrapper<>();
queryWrapper.isNotNull("app_ids")
.ne("app_ids", "")
.apply("JSON_VALID(app_ids) = 1")
.apply("JSON_CONTAINS(app_ids, JSON_OBJECT('id', {0}))", "1905555466980773889");
// 如果还要根据权限过滤
queryWrapper.apply("JSON_CONTAINS(app_ids, JSON_OBJECT('id', {0}, 'hasPermission', {1}))",
"1905555466980773889", true);
LambdaQueryWrapper queryWrapper = new LambdaQueryWrapper<>();
queryWrapper.isNotNull(SysUser::getAppIds)
.ne(SysUser::getAppIds, "")
.and(w -> w.apply("JSON_CONTAINS(app_ids, JSON_OBJECT('id', {0}))", "1905555466980773889")
.or()
.apply("JSON_CONTAINS(app_ids, JSON_OBJECT('id', {0}))", "1905547884060835841"));
List userList = sysUserMapper.selectList(queryWrapper);
考虑使用 JSON 类型:如果您的 MySQL 版本是 5.7+,考虑使用原生 JSON 类型代替 VARCHAR,这样可以获得更好的性能和功能支持。
添加索引:虽然无法直接为 JSON 内容创建索引,但可以使用生成的列和函数索引:
ALTER TABLE sys_user ADD COLUMN app_id_extracted JSON
GENERATED ALWAYS AS (JSON_EXTRACT(app_ids, '$[*].id')) VIRTUAL;
ALTER TABLE sys_user ADD INDEX idx_app_id_extracted (app_id_extracted);
定期维护:对于大表,定期 OPTIMIZE TABLE 有助于维护性能。
在 MySQL 中查询 VARCHAR 类型的 JSON 数据时,关键是:
正确使用这些技术可以有效地查询和处理 VARCHAR 中存储的 JSON 数据。