sns.load_dataset(“iris“)无法导入,无需下载seaborn到本地的解决方案

最近发现很多机器学习入门教程选择从seaborn中加载鸢尾花(iris)数据集,然而直接运行因为连接问题或本地无对应数据库会带来很多问题,常规的解决方法为从github下载seaborn-data保存到本地,但是操作仍然比较繁琐,且小白可能对于git下载和本地的数据存放形式也不熟悉,这里提供一种替换方法,改为从机器学习库scikitlearn中导入iris数据集,并转换为教程中的dataframe格式,实现和sns.load_dataset(“iris”)完全一致的效果。`

导入python可视化库seaborn,机器学习库sklearn以及数据处理库pandas

import seaborn as sns
from sklearn.datasets import load_iris
import pandas as pd

设置seaborn的绘图主题为whitegrid

sns.set_style(“whitegrid”)

从sklearn加载鸢尾花数据集

iris_dataset = load_iris()

创建特征值DataFrame

iris = pd.DataFrame(
data=iris_dataset.data, # 特征数据 (150x4)
columns=iris_dataset.feature_names # 特征列名
)

添加花种类名称列

iris[‘species’] = [
iris_dataset.target_names[i] # 将数值标签映射为字符串名称
for i in iris_dataset.target
]

显示前5行数据

print(iris.head())`
至此,代码给出的iris和 iris = sns.load_dataset(“iris”) 等效,可以进行后续学习

你可能感兴趣的:(python,机器学习,sklearn)