多维尺度(Multidimensional scaling,缩写MDS,又译“多维标度”)也称作“相似度结构分析”(Similarity structure analysis),属于多重变量分析的方法之一,是社会学、数量心理学、市场营销等统计实证分析的常用方法。
根据研究对象间的相似性或相异性矩阵,找到一个R维空间,用R维空间中的散点表示所有的研究对象,并保持研究对象之间的相似性或相异性关系。这就是多维尺度分析。
比如:可乐和雪碧像吗?可乐和宝马像吗?
为了更加深入了解多维尺度分析的原理,我们用城市航空距离案例来说明一下
数据反映的是中国12个城市间航空距离的数据,请就此进行MDS分析。
数据集如下
北京 0
合肥 959 0
长沙 1446 641 0
杭州 1200 476 805 0
南昌 1398 450 331 468 0
南京 981 145 799 240 583 0
上海 1178 412 964 176 644 273 0
武汉 1133 345 332 656 343 504 761 0
广州 1967 1105 620 1099 665 1255 1308 873 0
成都 1697 1392 940 1699 1240 1618 1782 1047 1390 0
福州 1681 730 743 519 437 747 678 780 763 1771 0
昆明 2266 1795 1116 2089 1457 1870 2042 1364 1357 711 1959 0
分析--度量--多维尺度
度量水平:
序数:有序变量
区间:连续变量
比率:连续变量(有绝对0的概念)
在spss中,多维尺度唯一把连续型变量分开考虑的模型,因为我们的数据集为两地的实际距离,有绝对0的概念
一般维度都不用调,在2维观察即可,高纬度观察起来会比较困难
在距离选项中,由于我们的数据就为距离,数据形状为下三角矩阵,两地往返距离是一致的,所以选择正对称
结果解释:
前面一大堆文本不用看多少,就看他是否收敛即可
Stress=0.03678, Stress是0到1之间的,近似可以理解成模型剩余的残差,就是不能够被模型解释的部分,越接近0越好
Stress<0.1证明模型效果都蛮好的
RSQ决定系数,也是0到1之间的,越接近1证明模型的解释度越好
下面就是城市在二维空间中的坐标
上面用图形展示出来(多维尺度分析主要看这幅图)
空间图(刺激匹配图)
线性拟合散点图:实测值与预测值的分布,,在一条直线上证明拟合度很高
为了大家能更深了解,再看一个例子
在2004年的一次调查中,我们收集了华东师范大学社会学系某个班的40位大学生对中国九所大学差异性的评分。0分为差异最小,9分为差异最大,从0分到9分差异程度逐渐增加请分析各学校的空间定位关系,以及学生的评价倾向。
分析各学校的空间定位关系以及学生评价倾向
数据集如下
1 2 北京师大 7 0
1 2 南京大学 4 7 0
1 2 中国科大 5 7 6 0
1 2 复旦大学 3 6 4 5 0
1 2 华东师大 6 2 7 7 6 0
1 2 清华大学 4 6 6 5 4 6 0
1 2 上海交大 6 7 6 3 5 6 4 0
1 2 东北师大 7 3 8 8 6 2 8 7 0
2 2 北京大学 0
2 2 北京师大 8 0
2 2 南京大学 2 7 0
2 2 中国科大 3 8 3 0
2 2 复旦大学 1 8 1 3 0
2 2 华东师大 8 1 5 6 5 0
2 2 清华大学 0 7 2 3 2 8 0
2 2 上海交大 2 8 1 2 1 7 2 0
2 2 东北师大 7 1 6 5 6 1 7 7 0
3 2 北京大学 0
3 2 北京师大 2 0
3 2 南京大学 3 4 0
3 2 中国科大 7 6 7 0
3 2 复旦大学 2 4 5 7 0
3 2 华东师大 6 4 5 8 6 0
3 2 清华大学 1 3 4 4 3 8 0
3 2 上海交大 3 4 3 5 2 6 3 0
3 2 东北师大 4 3 5 5 6 5 7 7 0
4 2 北京大学 0
4 2 北京师大 2 0
4 2 南京大学 4 3 0
4 2 中国科大 5 7 6 0
4 2 复旦大学 1 6 5 8 0
4 2 华东师大 6 2 5 9 2 0
4 2 清华大学 7 5 7 7 3 6 0
4 2 上海交大 8 9 8 7 3 5 1 0
4 2 东北师大 3 1 7 9 5 2 5 8 0
5 1 北京大学 0
5 1 北京师大 1 0
5 1 南京大学 2 1 0
5 1 中国科大 5 4 1 0
5 1 复旦大学 1 1 1 2 0
5 1 华东师大 3 1 2 4 1 0
5 1 清华大学 5 5 3 1 4 5 0
5 1 上海交大 5 5 3 1 3 4 1 0
5 1 东北师大 4 2 4 5 5 2 6 4 0
6 1 北京大学 0
6 1 北京师大 4 0
6 1 南京大学 2 7 0
6 1 中国科大 5 5 3 0
6 1 复旦大学 4 1 0 4 0
6 1 华东师大 6 5 4 5 4 0
6 1 清华大学 3 4 2 1 3 5 0
6 1 上海交大 3 7 2 2 1 6 2 0
6 1 东北师大 7 4 7 8 7 2 8 6 0
7 1 北京大学 0
7 1 北京师大 2 0
7 1 南京大学 1 6 0
7 1 中国科大 3 6 2 0
7 1 复旦大学 1 6 1 2 0
7 1 华东师大 7 1 6 6 1 0
7 1 清华大学 0 3 1 2 1 6 0
7 1 上海交大 2 6 2 1 1 9 2 0
7 1 东北师大 8 2 9 9 9 2 6 9 0
8 2 北京大学 0
8 2 北京师大 1 0
8 2 南京大学 2 3 0
8 2 中国科大 1 5 3 0
8 2 复旦大学 2 6 2 2 0
8 2 华东师大 4 1 3 5 4 0
8 2 清华大学 1 8 2 1 1 6 0
8 2 上海交大 1 9 3 3 1 3 2 0
8 2 东北师大 9 2 8 9 8 3 9 9 0
9 2 北京大学 0
9 2 北京师大 2 0
9 2 南京大学 4 2 0
9 2 中国科大 3 1 2 0
9 2 复旦大学 1 2 5 2 0
9 2 华东师大 4 1 4 4 3 0
9 2 清华大学 1 2 6 2 1 5 0
9 2 上海交大 1 3 4 2 1 4 1 0
9 2 东北师大 4 4 4 5 5 2 4 4 0
10 1 北京大学 0
10 1 北京师大 3 0
10 1 南京大学 1 2 0
10 1 中国科大 1 2 0 0
10 1 复旦大学 1 3 0 0 0
10 1 华东师大 7 1 4 3 5 0
10 1 清华大学 0 3 2 1 2 7 0
10 1 上海交大 2 2 1 2 2 3 3 0
10 1 东北师大 9 5 7 6 7 5 9 4 0
11 2 北京大学 0
11 2 北京师大 2 0
11 2 南京大学 3 0 0
11 2 中国科大 4 2 7 0
11 2 复旦大学 3 0 0 5 0
11 2 华东师大 5 1 2 1 1 0
11 2 清华大学 1 5 1 7 1 5 0
11 2 上海交大 4 7 1 7 0 1 1 0
11 2 东北师大 5 2 3 0 7 5 5 7 0
12 北京大学 0
12 北京师大 2 0
12 南京大学 1 3 0
12 中国科大 7 4 5 0
12 复旦大学 2 3 2 6 0
12 华东师大 4 4 4 8 4 0
12 清华大学 3 5 3 4 3 5 0
12 上海交大 4 6 4 4 4 6 3 0
12 东北师大 4 4 5 8 4 2 5 8 0
13 北京大学 0
13 北京师大 3 0
13 南京大学 2 3 0
13 中国科大 3 3 1 0
13 复旦大学 3 2 2 2 0
13 华东师大 4 2 3 3 2 0
13 清华大学 2 3 1 2 2 4 0
13 上海交大 3 4 1 2 2 2 1 0
13 东北师大 4 3 4 3 3 1 4 4 0
14 2 北京大学 0
14 2 北京师大 4 0
14 2 南京大学 4 5 0
14 2 中国科大 3 6 2 0
14 2 复旦大学 2 4 3 5 0
14 2 华东师大 3 3 4 5 3 0
14 2 清华大学 1 7 6 4 1 3 0
14 2 上海交大 4 6 8 3 1 3 3 0
14 2 东北师大 5 2 7 6 8 2 8 7 0
15 2 北京大学 0
15 2 北京师大 5 0
15 2 南京大学 6 6 0
15 2 中国科大 7 8 6 0
15 2 复旦大学 8 8 7 7 0
15 2 华东师大 9 3 6 7 5 0
15 2 清华大学 4 4 7 7 6 6 0
15 2 上海交大 9 8 8 5 6 5 3 0
15 2 东北师大 7 5 7 3 7 5 5 6 0
16 北京大学 0
16 北京师大 6 0
16 南京大学 2 5 0
16 中国科大 3 4 1 0
16 复旦大学 2 4 1 2 0
16 华东师大 8 1 4 4 4 0
16 清华大学 1 6 3 4 3 8 0
16 上海交大 3 4 1 2 1 5 2 0
16 东北师大 9 3 5 5 5 5 5 4 0
17 2 北京大学 0
17 2 北京师大 1 0
17 2 南京大学 4 3 0
17 2 中国科大 2 3 4 0
17 2 复旦大学 3 2 2 2 0
17 2 华东师大 7 1 2 5 3 0
17 2 清华大学 1 1 5 3 2 7 0
17 2 上海交大 3 5 3 2 1 4 2 0
17 2 东北师大 8 2 5 3 5 1 7 7 0
18 2 北京大学 0
18 2 北京师大 3 0
18 2 南京大学 4 2 0
18 2 中国科大 6 5 2 0
18 2 复旦大学 2 3 1 4 0
18 2 华东师大 5 3 5 7 3 0
18 2 清华大学 1 6 5 1 2 7 0
18 2 上海交大 7 8 6 2 4 5 2 0
18 2 东北师大 8 4 8 8 7 9 5 8 0
19 1 北京大学 0
19 1 北京师大 3 0
19 1 南京大学 2 1 0
19 1 中国科大 7 5 7 0
19 1 复旦大学 3 3 1 7 0
19 1 华东师大 4 1 3 9 5 0
19 1 清华大学 7 7 7 1 7 7 0
19 1 上海交大 7 7 7 1 1 7 1 0
19 1 东北师大 4 1 3 7 4 1 7 7 0
20 1 北京大学 0
20 1 北京师大 8 0
20 1 南京大学 0 8 0
20 1 中国科大 5 8 5 0
20 1 复旦大学 0 8 0 3 0
20 1 华东师大 6 1 5 6 7 0
20 1 清华大学 4 7 5 1 4 9 0
20 1 上海交大 5 8 5 1 5 9 1 0
20 1 东北师大 9 2 6 7 6 2 8 8 0
21 2 北京大学 0
21 2 北京师大 5 0
21 2 南京大学 2 4 0
21 2 中国科大 7 8 5 0
21 2 复旦大学 1 5 1 3 0
21 2 华东师大 6 1 7 7 7 0
21 2 清华大学 3 6 3 2 1 6 0
21 2 上海交大 4 7 4 1 2 7 2 0
21 2 东北师大 8 2 8 8 8 2 8 8 0
22 1 北京大学 0
22 1 北京师大 8 0
22 1 南京大学 5 3 0
22 1 中国科大 9 8 8 0
22 1 复旦大学 2 5 3 9 0
22 1 华东师大 9 3 4 6 7 0
22 1 清华大学 1 9 8 9 2 9 0
22 1 上海交大 3 7 6 8 1 8 3 0
22 1 东北师大 7 4 5 6 8 2 9 7 0
23 北京大学 0
23 北京师大 2 0
23 南京大学 1 1 0
23 中国科大 2 0 1 0
23 复旦大学 1 1 0 1 0
23 华东师大 3 1 2 1 2 0
23 清华大学 0 3 1 2 1 3 0
23 上海交大 1 1 0 1 0 2 1 0
23 东北师大 4 2 3 2 3 1 3 3 0
24 2 北京大学 0
24 2 北京师大 5 0
24 2 南京大学 4 6 0
24 2 中国科大 6 7 8 0
24 2 复旦大学 3 5 3 5 0
24 2 华东师大 7 4 4 6 6 0
24 2 清华大学 2 6 4 6 3 5 0
24 2 上海交大 4 6 5 7 4 6 6 0
24 2 东北师大 6 3 6 8 7 4 7 8 0
25 北京大学 0
25 北京师大 7 0
25 南京大学 3 5 0
25 中国科大 5 5 5 0
25 复旦大学 2 7 2 6 0
25 华东师大 7 5 4 5 5 0
25 清华大学 1 8 6 6 6 6 0
25 上海交大 3 6 5 5 2 4 5 0
25 东北师大 7 4 6 6 8 6 6 6 0
26 北京大学 0
26 北京师大 4 0
26 南京大学 2 3 0
26 中国科大 3 3 2 0
26 复旦大学 2 3 1 2 0
26 华东师大 4 2 3 3 3 0
26 清华大学 1 3 2 2 2 3 0
26 上海交大 2 3 2 3 2 3 2 0
26 东北师大 5 2 4 4 3 1 4 4 0
27 2 北京大学 0
27 2 北京师大 3 0
27 2 南京大学 7 6 0
27 2 中国科大 5 7 7 0
27 2 复旦大学 5 4 4 8 0
27 2 华东师大 6 3 5 8 4 0
27 2 清华大学 4 5 6 5 5 6 0
27 2 上海交大 6 7 8 8 6 6 5 0
27 2 东北师大 4 4 6 7 7 5 8 8 0
28 2 北京大学 0
28 2 北京师大 6 0
28 2 南京大学 3 7 0
28 2 中国科大 5 7 4 0
28 2 复旦大学 2 7 3 4 0
28 2 华东师大 7 2 5 6 4 0
28 2 清华大学 2 7 3 3 3 5 0
28 2 上海交大 7 8 5 3 6 6 3 0
28 2 东北师大 9 4 6 7 5 3 7 9 0
29 2 北京大学 0
29 2 北京师大 3 0
29 2 南京大学 1 5 0
29 2 中国科大 2 4 3 0
29 2 复旦大学 3 5 1 3 0
29 2 华东师大 4 2 3 4 3 0
29 2 清华大学 2 3 3 2 2 3 0
29 2 上海交大 3 4 4 2 2 4 2 0
29 2 东北师大 6 4 7 7 6 4 7 8 0
30 2 北京大学 0
30 2 北京师大 6 0
30 2 南京大学 4 7 0
30 2 中国科大 8 8 8 0
30 2 复旦大学 3 8 4 7 0
30 2 华东师大 8 4 5 7 6 0
30 2 清华大学 1 7 4 7 2 7 0
30 2 上海交大 5 7 4 6 1 5 3 0
30 2 东北师大 8 4 6 7 7 3 7 8 0
31 2 北京大学 0
31 2 北京师大 2 0
31 2 南京大学 9 9 0
31 2 中国科大 9 9 9 0
31 2 复旦大学 2 9 9 9 0
31 2 华东师大 9 1 9 9 9 0
31 2 清华大学 0 9 9 9 1 9 0
31 2 上海交大 2 9 9 6 1 9 2 0
31 2 东北师大 9 1 9 9 9 2 7 9 0
32 2 北京大学 0
32 2 北京师大 5 0
32 2 南京大学 2 5 0
32 2 中国科大 6 6 3 0
32 2 复旦大学 2 5 2 3 0
32 2 华东师大 5 2 5 5 5 0
32 2 清华大学 6 6 3 3 6 6 0
32 2 上海交大 6 6 3 3 6 6 2 0
32 2 东北师大 5 2 5 5 5 2 6 6 0
33 2 北京大学 0
33 2 北京师大 2 0
33 2 南京大学 3 5 0
33 2 中国科大 6 7 6 0
33 2 复旦大学 2 5 3 4 0
33 2 华东师大 4 1 4 7 3 0
33 2 清华大学 3 4 6 1 2 6 0
33 2 上海交大 7 6 6 2 2 4 3 0
33 2 东北师大 3 1 4 6 4 1 5 6 0
34 1 北京大学 0
34 1 北京师大 3 0
34 1 南京大学 4 5 0
34 1 中国科大 5 5 4 0
34 1 复旦大学 4 4 4 5 0
34 1 华东师大 7 3 5 6 4 0
34 1 清华大学 2 4 5 2 5 7 0
34 1 上海交大 5 5 4 4 3 5 3 0
34 1 东北师大 4 2 5 6 6 3 4 6 0
35 2 北京大学 0
35 2 北京师大 4 0
35 2 南京大学 3 6 0
35 2 中国科大 4 7 4 0
35 2 复旦大学 4 6 2 3 0
35 2 华东师大 5 2 4 5 3 0
35 2 清华大学 2 7 3 3 3 4 0
35 2 上海交大 4 5 3 3 2 4 2 0
35 2 东北师大 5 3 4 5 4 2 3 4 0
36 1 北京大学 0
36 1 北京师大 4 0
36 1 南京大学 5 5 0
36 1 中国科大 7 7 7 0
36 1 复旦大学 5 5 4 5 0
36 1 华东师大 6 3 5 6 4 0
36 1 清华大学 4 6 5 5 5 5 0
36 1 上海交大 6 7 6 4 5 4 4 0
36 1 东北师大 6 3 6 7 6 3 7 7 0
37 2 北京大学 0
37 2 北京师大 5 0
37 2 南京大学 4 4 0
37 2 中国科大 9 7 4 0
37 2 复旦大学 2 7 2 4 0
37 2 华东师大 5 1 3 5 4 0
37 2 清华大学 9 4 2 3 5 5 0
37 2 上海交大 9 5 2 2 4 4 2 0
37 2 东北师大 5 1 3 5 5 1 5 5 0
38 2 北京大学 0
38 2 北京师大 7 0
38 2 南京大学 3 2 0
38 2 中国科大 3 4 2 0
38 2 复旦大学 2 4 1 3 0
38 2 华东师大 4 1 3 5 3 0
38 2 清华大学 1 6 4 3 3 4 0
38 2 上海交大 3 6 2 2 2 3 2 0
38 2 东北师大 9 2 5 5 4 4 5 5 0
39 2 北京大学 0
39 2 北京师大 5 0
39 2 南京大学 3 7 0
39 2 中国科大 4 7 4 0
39 2 复旦大学 4 5 3 5 0
39 2 华东师大 6 3 4 5 3 0
39 2 清华大学 2 6 2 4 4 6 0
39 2 上海交大 3 7 2 3 3 5 2 0
39 2 东北师大 9 4 8 7 7 4 8 8 0
40 2 北京大学 0
40 2 北京师大 6 0
40 2 南京大学 3 9 0
40 2 中国科大 9 9 9 0
40 2 复旦大学 2 9 4 9 0
40 2 华东师大 9 0 5 9 4 0
40 2 清华大学 3 8 9 5 3 0 0
40 2 上海交大 4 9 9 6 2 8 2 0
40 2 东北师大 9 2 9 9 9 1 9 9 0
由于打分不是原始距离,而是0到9分,当做有序分类变量分析(模型--度量水平--序数)
打开结观察值,建模过程中对于相同结果不同的测量值可以在建模中赋予不同的结果,尽可能达到最优化的效果
度量模型
个别差异化欧几里得距离:不同的人打分考虑不一样,一些人是专业打分,一些人是主观性比较强的打分不一样
允许负的主题权重:有些人打分太离谱,剔除出模型或者逆向选入模型,使模型尽可能达到最优化的效果
结果分析:
每个个体都做了多维尺度分析
40个模型平均得到了Stress及RSQ
二维空间各个学校的坐标
个体如何加权,计算Weird-ness
最终每一个个体的打分权重,负分证明个体打分太离谱
刺激匹配图
散点分类:所有学校散点大致可以被分为三类,即文理综合大学、工科大学和师范类大学。
维度解释
第一维度实际上就是反映了学校类型间的差异
第二个维度应当是反映了学校综合实力的差异。但这种综合实力的对比在不同类间可能不具可比性
散点定位的合理解释与建议
复旦的综合实力应当和北大、南大存在一定差距
中科大出现了受访者心理定位上的偏移
不同个体偏好哪个维度打分(可以存储为新变量作为聚类或结合其他变量建模,会得到更好的结果)
线性拟合散点图:预测值与真实值
平的主题权重:个体权重高低
基于最优尺度的多维尺度分析,先对数据做最优尺度变换
最优尺度变换的基本思路是分析各级别对因变量影响的强弱变化情况,采用一定的非线性变换方法进行反复迭代,从而为原始分类变量的每一个类别找到最佳的量化评分,随后在相应模型中使用量化评分代替原始变量进行后续分析。
加权欧几里得:不同个体打分考虑不一样
结果
Stress:0.09675结果比之前的好很多,但是注意这是经过最优尺度变换的(不用太在意)
D.A.F:类似于决定系数RSQ,模型可解释性,越接近1越好
各个大学的坐标
刺激匹配图
维数权重:个案更倾向于哪个维度
维数权重图:维数权重图形展示
我们通常都是2维考虑的,怎么知道选多少维度好呢?
看碎石图,其实2维已经是最佳,都在陡坡上
其他维度我们也可以看