Pandas 与 Numpy 中的std() var() 区别

方差(Variance):一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。将各个误差将之平方(而非取绝对值,使之肯定为正数),相加之后再除以总数。公式如下:

 

pandas官方文档对 var() 定义:DataFrame.var(axis=Noneskipna=Nonelevel=Noneddof=1numeric_only=None**kwargs)

 

pandas 默认 ddof=1, 即分母为N-1,这样的样本方差是总体方差的无偏估计。这被称为贝塞尔修正。

 

numpy官方文档var() 定义: numpy.var(aaxis=Nonedtype=Noneout=Noneddof=0keepdims=)

numpy默认 ddof=0, 即分母为N。

 

标准差(又称标准偏差、均方差,英语:Standard Deviation,缩写SD),数学符号σ(sigma),在概率统计中最常使用作为测量一组数值的离散程度之用。标准差定义:为方差开算术平方根,反映组内个体间的离散程度;标准差与期望值之比为标准离差率。

pandas官方文档对 std() 定义:DataFrame.std(axis=Noneskipna=Nonelevel=Noneddof=1numeric_only=None**kwargs)

Pandas 与 Numpy 中的std() var() 区别_第1张图片

numpy.std(aaxis=Nonedtype=Noneout=Noneddof=0keepdims=)

你可能感兴趣的:(Pandas 与 Numpy 中的std() var() 区别)