Python Scikit-Learn 库简介

本节将向大家介绍 Python 中大名鼎鼎的机器学习工具库 Scikit-Learn。
为了使大家能更加清晰地了解 Scikit-Learn 中的相关功能,我们先对本节要用到的实例数据集 iris 做一个简单的介绍:

1


iris 是机器学习分类研究中常用的一个经典数据集,可以看到,这个数据集包含了鸢尾花萼片与花瓣的长宽信息,并且包含了每一株鸢尾花的种类标记。利用 Seaborn 库,我们可以绘制下列样本特征分布图,来查看样本在不同特征维度下的分布情况:
3

Python Scikit-Learn 库简介_第1张图片
4

为了更方便地使用 Python 中机器学习的相关工具,我们有必要对样本的特征数据与分类标记进行一下划分,将其分别保存为 X_iris 与 y_iris:

Python Scikit-Learn 库简介_第2张图片
5

好了,准备工作已经就绪,现在我们先把这份数据放在一边。为了更好地介绍 Scikit-Learn ,我们先来看一下线性回归模型的构建方法:
我们构建了如下示例数据:

未完待续:课程内容较多,请复制链接通过电脑学习,获得最佳学习效果。 http://datacademy.io/lesson/85
更多课程和文章尽在微信号:「datartisan数据工匠」

Python Scikit-Learn 库简介_第3张图片

你可能感兴趣的:(Python Scikit-Learn 库简介)