聚类分析现状

 针对上述问题,一种结合降维技术和聚类算法的解决方案被广泛认可,即先采用降维技术,如主成分分析、局部线性嵌入或核方法等对数据进行降维,再对降维后的特征进行聚类.该方案虽然在一定程度上降低了高维空间的聚类难度,但由于数据降维是独立于聚类任务的,这意味着提取的特征往往并不具备簇类结构.子空间方法则提供另一种很好的思路. 该方法假设高维数据分布于多个低维子空间的组合,通过将高维数据分割到各自所属的本征低维子空间,从而完成聚类. 子空间聚类方法大致分为 5 类,即基于矩阵分解的方法[9-10]、基于代数的方法[11-13]、基于迭代的方法[14-15]、基于统计的方法[16-18]和基于谱聚类的 方 法[19-21]. 其中以稀疏子空间聚类 ( sparsesubspaces clustering,SSC) [20] 和 低 秩 子 空 间 聚 类( low-rank subspaces clustering,LRSC) [21]为代表的谱聚类方法,凭借其完备的理论与突出的性能在同类方法中脱颖而出,成为近年来的研究热点. 然而上述 2 种方案均采用的是浅层模型,由于浅层结构。

你可能感兴趣的:(机器学习,人工智能)