专栏:科研统计方法实战分享 | 地学/农学人的数据分析工具箱
✍️ 作者:平常心0715
本讲关键词:聚类分析、K-means、层次聚类、样地分类、R实操
聚类分析(Cluster Analysis)是一种无监督学习方法,将样本按其特征的相似性自动划分为若干类。它不依赖预设标签,常用于:
样地类型划分
土壤性质分区
农户行为模式识别
土壤剖面/样点聚合分析等
方法 | 说明 | 适用场景 |
---|---|---|
K-means 聚类 | 将样本划分为 K 个类,基于最小距离 | 变量标准化后,处理大样本 |
层次聚类(Hierarchical) | 按距离/相似性构建树状结构 | 样本较少时效果好,可视化清晰 |
DBSCAN | 密度聚类,不需指定K值 | 空间聚类,识别离群点 |
PAM(k-medoids) | 更鲁棒的 K-means 变体 | 数据中存在离群值时 |
我们将基于如下数据进行演示:
<