很多资料的定义有冲突,因此以英文或者英文缩写记忆比较准确。歧义点主要在于关于标准差,标准误差,均方误差的定义,比如:有些地方会将标准误差==标准误,但也有将标准误差==均方根误差,标准误 ≠ \neq =标准误差。
这里我们以标准误差==均方根误差为标准。大家根据具体含义记忆,不要依赖于翻译。
方差(variance,VAR),标准差(standard deviation,SD),标准误(standard error of mean,SEM),标准误差==均方误差(mean-square error,MSE),均方根误差(root mean-square error,RMSE)
方差(variance)和标准差(standard deviation):标准差是方差的平方根( S D = V A R SD=\sqrt{VAR} SD=VAR )含义都是衡量随机变量的离散程度(或数据集的离散程度)。
注意:总体方差和样本方差
总体方差: v a r = 1 n Σ i = 1 n ( x i − μ ) 2 var=\frac{1}{n}\Sigma^n_{i=1}(x_i-\mu)^2 var=n1Σi=1n(xi−μ)2 , i = 1 , 2 , 3 , . . . , n , 其中 μ 为总体均值 i=1,2,3,...,n,其中\mu为总体均值 i=1,2,3,...,n,其中μ为总体均值
样本方差: S 2 = 1 n − 1 Σ i = 1 n ( x i − x ‾ ) 2 S^2=\frac{1}{n-1}\Sigma^n_{i=1}(x_i-\overline{x})^2 S2=n−11Σi=1n(xi−x)2 , i = 1 , 2 , 3 , . . . , n , 其中 x ‾ 为样本均值 i=1,2,3,...,n,其中\overline{x}为样本均值 i=1,2,3,...,n,其中x为样本均值,n-1为自由度
标准误(standard error of mean,SEM 或者 standard error,SE)
因为一般用来描述样本平均值与总体均值的差异(因此是SEM),但也可以衡量其他的样本统计量(因此是SE)和总体参数的差异。
对于样本平均值的标准误: S E M = s n SEM=\frac{s}{\sqrt{n}} SEM=n s
对于样本比例(频率)的标准误: S E = p ( 1 − p ) n SE=\sqrt{\frac{p(1-p)}{n}} SE=np(1−p) 其中, p p p是样本比例(频率)
样本比例举例:
某高校调查了200名学生,其中喜欢体育的有87人,喜欢体育的频率为
43.5%( p = 0.0074 p=0.0074 p=0.0074),计算该样本比例的标准误: S E = ( 0.435 ∗ ( 1 − 0.435 ) ) / 200 = 0.035 SE=\sqrt{(0.435*(1-0.435))/200}=0.035 SE=(0.435∗(1−0.435))/200 =0.035 标准误较小,说明该样本比例比较可靠。
均方误差是一种衡量预测值与实际值之间差异的度量,它反映了预测值与实际值之间的偏差程度。均方误差越小,说明预测值与实际值之间的差异越小,模型的预测能力越强。均方根误差==标准误差,是均方误差的算术平方根。
M S E = 1 N Σ i = 1 N ( P i − T ) 2 MSE=\frac{1}{N}\Sigma^N_{i=1}(P_i-T)^2 MSE=N1Σi=1N(Pi−T)2
R M S E = 1 N Σ i = 1 N ( P i − T ) 2 RMSE=\sqrt{\frac{1}{N}\Sigma^N_{i=1}(P_i-T)^2} RMSE=N1Σi=1N(Pi−T)2
其中 P i 是预测值, T 是实际值 P_i是预测值,T是实际值 Pi是预测值,T是实际值
注意和方差的区别在于,前者是衡量预测值与实际值之间差异,后者是衡量随机变量的变化程度。