数据分析可视化复现

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")
df = pd.read_csv("./data/HR.csv")
df = df[df["last_evaluation"]<=1][df["salary"]!="nme"][df["department"]!="sale"]

树状图

sns.countplot(x="salary",data=df)

数据分析可视化复现_第1张图片

sns.countplot(x="salary",hue="department",data=df)

数据分析可视化复现_第2张图片

绘制直方图

f = plt.figure()
f.add_subplot(131)
sns.distplot(df["satisfaction_level"],bins=10)

数据分析可视化复现_第3张图片

f = plt.figure()
f.add_subplot(131)
sns.distplot(df["satisfaction_level"],bins=10,kde=False)

数据分析可视化复现_第4张图片

f = plt.figure()
f.add_subplot(131)
sns.distplot(df["satisfaction_level"],bins=10,hist=False)

数据分析可视化复现_第5张图片

f = plt.figure()
f.add_subplot(131)
sns.distplot(df["satisfaction_level"],bins=10)
f.add_subplot(132)
sns.distplot(df["last_evaluation"],bins=10)
f.add_subplot(133)
sns.distplot(df["average_monthly_hours"],bins=10)

数据分析可视化复现_第6张图片

箱线图

sns.boxplot(y=df["time_spend_company"])

数据分析可视化复现_第7张图片

sns.boxplot(x=df["time_spend_company"],saturation=0.75,whis=3)

数据分析可视化复现_第8张图片

折线图

sub_df = df.groupby("time_spend_company").mean()
sns.pointplot(sub_df.index,sub_df["left"])

数据分析可视化复现_第9张图片

sns.pointplot(x="time_spend_company",y="left",data=df)

数据分析可视化复现_第10张图片

lbs = df["department"].value_counts().index
plt.pie(df["department"].value_counts(normalize=True),labels=lbs,autopct="%1.1f%%")
plt.show()

数据分析可视化复现_第11张图片

lbs = df["department"].value_counts().index 
explodes=[0.1 if i=="sales" else 0 for i in lbs]
plt.pie(df["department"].value_counts(normalize=True),explode=explodes,labels=lbs,autopct="%1.1f%%")
plt.show()

数据分析可视化复现_第12张图片

lbs = df["salary"].value_counts().index 
explodes=[0.1 if i=="low" else 0 for i in lbs]
plt.pie(df["salary"].value_counts(normalize=True),explode=explodes,labels=lbs,autopct="%1.1f%%")
plt.show()

数据分析可视化复现_第13张图片

你可能感兴趣的:(数据科学)