hive sql实现查找商品表名称中包含敏感词的商品

背景

用户上传的商品表一般会包含商品名称,由于这些商品名称是用户自己起的,里面可能包含了敏感词,需要通过sql找出来哪些商品的商品名称包含了敏感词汇

hive sql实现查找商品表名称中包含敏感词的商品

实现思路:

1.商品表和敏感词表进行join时的连接条件设置成name contains 敏感词的形式

2.一般来说join的on条件都只是需要有一个equal等值连接,所以我们每个表设置一个虚拟列,仅仅是为了满足join的on条件有一个等值操作

结果sql如下所示:

SELECT merchandise_const.mid, merchandise_const.name
FROM (
  SELECT mid, name, 'constant_value' AS constant_col FROM merchandise
) AS merchandise_const
JOIN (
  SELECT key, 'constant_value' AS constant_col FROM sensitive
) AS sensitive_const
ON merchandise_const.constant_col = sensitive_const.constant_col
AND merchandise_const.name LIKE CONCAT('%', sensitive_const.key, '%');

这样就可以查找到商品名称中包含了敏感词的商品列表

你可能感兴趣的:(大数据,hive,sql,hadoop)