15、统计学基础:数据描述、推断与分析

统计学基础:数据描述、推断与分析

1. 统计类型概述

在数据分析中,我们常常需要了解数据的各种特征,这就涉及到不同类型的统计方法。主要有参数统计和非参数统计,其中非参数统计中的顺序统计量在很多场景下有着独特的优势。

1.1 顺序统计量

顺序统计量用于指定数据值在有序集合中的位置,它只要求数据值是有序的,因此适用于比参数统计更广泛的数据分布。常见的顺序统计量包括中位数、四分位数等。
- 中位数 :是排序后分布中处于中间位置的值。对于奇数个值的分布,中位数是中间的那个数据值;对于偶数个值的分布,中位数通常是中间两个值的平均值。中位数对异常值具有抗性,相比之下,均值容易受到极端值的影响。例如,对于数据 10, 80, 90, 100, 110, 120, 190 ,均值和中位数都是 100;当最大值变为 1900 时,中位数不变,仍为 100,但均值从 100 增加到 359。
- 四分位数 :将有序分布的值分为四个相等的部分。中位数是第二四分位数,第一四分位数划分出分布的底部 25%,第三四分位数划分出底部 75%。类似地,还有五分位数、十分位数和百分位数等,它们统称为分位数。
- 四分位距(IQR) :是第三四分位数和第一四分位数的差值,用于表示数据的变异性,它指定了以中位数为中心的中间 50% 数据值的范围。IQR 常用于绘制箱线图。

1.2 获取统计信息

对变量的分析应包括数据可视化和基本的汇总统计。以下是获取汇总统计信息的两种方法:
-

你可能感兴趣的:(统计学,数据描述,推断分析)