• 可视化主要使用 matplotlib/seaborn
• 数据处理主要使用 pandas
• ️ 数据爬取主要使用 requests
• 本文是我自己在和鲸社区的原创
今天这篇文章将给大家介绍【数据分析汽车之家数据】 案例。
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
#设置全局默认字体 为 雅黑
plt.rcParams['font.family'] = ['Microsoft YaHei']
# 设置全局轴标签字典大小
plt.rcParams["axes.labelsize"] = 14
# 设置背景
sns.set_style("darkgrid",{
"font.family":['Microsoft YaHei', 'SimHei']})
数据下载:查看文章末尾获取。
data = pd.read_excel(r"/home/mw/input/car9730/汽车之家数据.xlsx")
data.head()
输出结果:
# 1. 查看数据集的基本信息
data_info = data.info()
# 2. 描述性统计
descriptive_stats = data.describe()
data_info, descriptive_stats
输出结果:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 24046 entries, 0 to 24045
Data columns (total 27 columns):
标题 24046 non-null object
价格 23641 non-null float64
新车含税价 24037 non-null object
标签 19118 non-null object
表显里程 24046 non-null object
上牌时间 24046 non-null object
挡位 24046 non-null object
排量 24046 non-null object
车辆所在地 24046 non-null object
查看限迁地 24046 non-null object
变速箱 24046 non-n