pandas中groupby和pivot_table(数据透视表)

pivot_table(数据透视表)可以看做是一种高级的groupby功能,下面贴两段代码比较一下:

df=pd.read_csv('2016_sale.csv')


a=pd.pivot_table(df,index=['Category','Buyer','Product'],values=['Qty','Amount'],aggfunc={'Qty':(np.sum),'Amount':(np.sum)})
b=df[['Buyer','Category','Product','Amount','Qty']].groupby(['Category','Buyer','Product']).sum()

a和b的结果是一样的,不过明显a的表达式比较灵活,尤其是当对于不同字段有不同聚合函数时(比如有些要SUM,有些要MEAN,可以自定义)。

你可能感兴趣的:(Python,pandas,python,数据透视表)