r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据

原文链接:http://tecdat.cn/?p=23825

最近我们被客户要求撰写关于有限正态混合模型EM算法的研究报告,包括一些图形和统计输出。

简介

本文介绍了基于有限正态混合模型在r软件中的实现,用于基于模型的聚类、分类和密度估计。提供了通过EM算法对具有各种协方差结构的正态混合模型进行参数估计的函数,以及根据这些模型进行模拟的函数。此外,还包括将基于模型的分层聚类、混合分布估计的EM和贝叶斯信息准则(BIC)结合在一起的功能,用于聚类、密度估计和判别分析的综合策略。其他功能可用于显示和可视化拟合模型以及聚类、分类和密度估计结果。

聚类


head(X)
pairs(X)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第1张图片

​
plot(BIC)

​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第2张图片

​

summary(BIC)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第3张图片

summary(mod1, parameters = TRUE)

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第4张图片

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第5张图片

plot(mod1)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第6张图片

table(class, classification)
​

plot(mod1, what = "uncertainty")

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第7张图片

clustICL(X)
summary(ICL)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第8张图片

​

BootstrapLRT(X)

初始化

使用EM算法进行最大似然估计。EM的初始化是使用从聚类层次结构聚类中获得的分区来进行的。

​
 hclust(X, use = "SVD"))

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第9张图片

clustBIC(X, initialization )) # 默认

 

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第10张图片

hc2 

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第11张图片

clustBIC(X, initialization )

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第12张图片

hclust(X, model= "EEE"))

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第13张图片


summary(BIC3)

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第14张图片

通过合并最佳结果来更新BIC。

BIC(BIC1, BIC2, BIC3)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第15张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第16张图片

\
使用随机起点进行单变量拟合,通过创建随机集聚和合并最佳结果获得。


for(j in 1:20)
{
  rBIC <- mclustBIC(
                    initi ))
  BIC <- update(BIC, rBIC)
}

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第17张图片

​
clust(ga, BIC)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第18张图片

分类

EDDA

X <- iris[,1:4]
head(X)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第19张图片

clustDA(X, class,  "EDDA")

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第20张图片


plot(mod2)
​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第21张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第22张图片

MclustDA

​

table(class)

head(X)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第23张图片

clustDA(X, class)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第24张图片


plot(mod3, 2)

​

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第25张图片

​

plot(mod3, 3)
​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第26张图片

交叉验证误差

​
cv(mod2, nfold = 10)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第27张图片


unlist(cv[3:4])

 

cv(mod3, nf = 10)

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第28张图片


unlist(cv[3:4])

密度估计

单变量

clust(acid)

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第29张图片


plot(mod4, "BIC")
​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第30张图片

plot(mod4,  "density", acidity)
 

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第31张图片

​

plot(mod4, "diagnostic",  "cdf")
​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第32张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第33张图片

多变量

clu(faithful)
summary(mod5)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第34张图片


plot(mod5, "BIC")
​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第35张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第36张图片

​
 

plot(mod5, "density",faithful)
 

​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第37张图片

Bootstrap推理

​
summary(boot1, what = "se")

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第38张图片

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第39张图片

summary(boot1, what = "ci")

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第40张图片

 r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第41张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第42张图片


summary(boot4, what = "se")

plot(boot4)
​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第43张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第44张图片

降维

聚类

​

plot(mod1dr,  "pairs")
​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第45张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第46张图片

plot(mod1dr)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第47张图片

plot(mod1dr, "scatterplot")

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第48张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第49张图片

plot(mod1dr)

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第50张图片

分类

​

summary(mod2dr)

plot(mod2d)
​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第51张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第52张图片

plot(mod2dr)
 

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第53张图片

​

summary(mod3dr)

plot(mod3dr)
​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第54张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第55张图片

plot(mod3dr)
 

​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第56张图片

使用调色板

大多数图形都使用默认的颜色。

调色板可以定义并分配给上述选项,具体如下。

options("Colors" = Palette )
Pairs(iris[,-5], Species)

​

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第57张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第58张图片

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第59张图片

\
如果需要,用户可以很容易地定义自己的调色板。

参考文献

Fraley C. and Raftery A. E. (2002) Model-based clustering, discriminant analysis and density estimation, Journal of the American Statistical Association, 97/458, pp. 611-631.


r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据_第60张图片

最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现分析案例实现")

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

你可能感兴趣的:(数据挖掘深度学习机器学习算法)