SQL中实现去重的多种方法

在开发中遇到需要进行数据去重的查询,或删除重复数据的情况,整理如下:

1. distinct关键字

select
    distinct user_id, create_date
from order_info;

2. 分组

select
    user_id,
    create_date
from order_info
group by user_id, create_date;

3. 窗口分区

select
    user_id,
    create_date
from (
	select 
		user_id,
	    create_date,
	    row_number() over (partition by user_id, create_date) rn
	from order_info
) t1
where rn = 1;

over~

你可能感兴趣的:(大数据,sql,数据库,hive)