线性回归的正态性检验及其诊断问题

  1. 单变量正态检验主要的话包括以下这些
    shapiro.test();#Shapiro-Wilk检验 ,样本量小于5000
    ks.tyest();#Kolmogorov-Smirnov检验,可用于大样本但是要求样本中不能出现相同的值

    library(“nortest”);
    lillie.test() #Kolmogorov-Smirnov检验
    ad.test() #Anderson-Darling正态性检验
    cvm.test() #Cramer-von Mises正态性检验
    pearson.test() #Pearson卡方正态性检验
    sf.test() #Shapiro-Francia正态性检验

   ks.test(da2519$pre, "pnorm")

    One-sample Kolmogorov-Smirnov test

   data:  da2519$pre
   D = 0.98883, p-value < 2.2e-16
   alternative hypothesis: two-sided

Warning message:
In ks.test(da2519$pre, "pnorm") : Kolmogorov - Smirnov检验里不应该有连结

原因是“在样本数据中有相同的值出现。one sample Kolmogorov-Smirnov检验要求待验分布是连续的,而连续分布出现相同值的概率为0。也就是说数据中倘出现相同值,则连续分布的假设不成立,那么这一检验法从理论上讲并不实用。

3.样本不是正态性的原因:可能在取数据的时候,只有单一趋势的样本
由于样本在无限大时,更符合中心极限定理,所以当样本较小时,样本很容易不满足正态性分布。

4.分析模型的回归系数显著,但是可决系数很低,说明模型对因变量的解释力度不强,但是自变量与因变量之间的关系是显著的。

你可能感兴趣的:(R——常见问题)