【python数据分析】数据建模之Kmeans聚类

K-means聚类:最常用的机器学习聚类算法,且为典型的基于距离的聚类算法。

  • K均值:基于原型的、划分的距离技术,它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度

Kmeans聚类

案例分析:make_blobs聚类数据生成器

# 导入模块from sklearn.cluster import KMeansfrom sklearn.datasets import make_blobs

# 创建数据x,y_true = make_blobs(n_samples = 300,   # 生成300条数据                     centers = 4,        # 四类数据                     cluster_std = 0.5,  # 方差一致                     random_state = 0)print(x[:5])print(y_true[:5])# n_samples → 待生成的样本的总数。# n_features → 每个样本的特征数。# centers → 类别数# cluster_std → 每个类别的方差,如多类数据不同方差,可设置为[1.

你可能感兴趣的:(python,数据建模,聚类,python,数据分析)