Python生成已分类数据集

1. 代码

from sklearn.datasets import make_blobs#使用make_blobs进行knn分类
from sklearn.neighbors import KNeighborsClassifier#导入KNN分类器
import matplotlib.pyplot as plt#导入画图
from sklearn.model_selection import train_test_split#导入数据集拆分工具
data=make_blobs(n_samples=200,centers=2,random_state=8)
X,y=data
plt.scatter(X[:,0],X[:,1],c=y,cmap=plt.cm.spring,edgecolor='k')
plt.show()

2. 截图

Python生成已分类数据集_第1张图片

3. 知识点

  1. scikit常用数据集数据加载工具
  2. scikit中的make_blobs方法常被用来生成聚类算法的测试数据,直观地说,make_blobs会根据用户指定的特征数量、中心点数量、范围等来生成几类数据,这些数据可用于测试聚类算法的效果。
sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)

Python生成已分类数据集_第2张图片
Python生成已分类数据集_第3张图片

你可能感兴趣的:(机器学习)