线性回归笔记——统计学任务4打卡

  1. 参数估计:已知高考成绩服从正态分布,我想来计算2015年某省高考平均分,于是选取了一个样本,利用参数估计的原理来推断该省平均分;
  2. 假设检验: 已知高考成绩每年都是正态分布,去年的平均分是583(μo)方差是45或者已知我们认为的均值是583(μo),今年选取了一个样本,调查结果发现样本平均分594,求证高考平均分到底上升了没,进一步说并考生的水平是否有显著提高(假设试卷难度不变)。
    *这里有个问题:是不是当已知推断目标的时候,也就是知道了我想要证明的结果的时候,再做参数估计意义不大,此时我还想要知道更多的信息,或者证明数据更深层能够反映的问题。所以,其实假设检验就是在区间估计的结果上利用小概率不发生原理进一步做的推断?
  3. 方差分析: 已知某省A、B、C三个市的高考平均分,想要知道各市的考生水平到底有没有显著差异。于是抽取样本100,分别计算对应的市区水平带来的误差(SSA)和抽样统计带来的误差(SSE),比较相对大小从而反推出到底抽样结果的差异是什么因素带来的,以及做出推断的误差是多少
    4 线性回归(方差分析其实是特殊的线性回归),当因变量不是类似市区这样的离散变量时可以使用一元线性回归(对应单因素分析,二元对应双因素以此类推)。例如,想要知道高考成绩和考生体重的关系,或者高考成绩和考生月花销的关系,就可以通过调查统计,整理结果,采用线性回归来验证因素关系。
    *这里又有个问题:理论上来说,可以使用方差分析解决的问题一般都可以使用线性回 归,但是因变量太少(一般选取的组别的level不会太多),所以线性回归误差比较大?什么情况下检验因素关系使用方差分析,什么情况下使用线性回归更好?希望有实际例子。

你可能感兴趣的:(线性回归笔记——统计学任务4打卡)