【Python数分实战】数据分析可视化汽车之家2万多条数据

前言

  • • 可视化主要使用 matplotlib/seaborn

  • • 数据处理主要使用 pandas

  • • ️ 数据爬取主要使用 requests

  • • 本文是我自己在和鲸社区的原创

今天这篇文章将给大家介绍【数据分析汽车之家数据】 案例。

Step 1. 导入模块

import pandas as pd  
import matplotlib.pyplot as plt  
import seaborn as sns  
  
#设置全局默认字体 为 雅黑  
plt.rcParams['font.family'] = ['Microsoft YaHei']   
# 设置全局轴标签字典大小  
plt.rcParams["axes.labelsize"] = 14    
# 设置背景  
sns.set_style("darkgrid",{
   "font.family":['Microsoft YaHei', 'SimHei']})

Step 2. 数据概览

数据下载:查看文章末尾获取

  
data = pd.read_excel(r"/home/mw/input/car9730/汽车之家数据.xlsx")  
  
data.head()  

输出结果:

【Python数分实战】数据分析可视化汽车之家2万多条数据_第1张图片

# 1. 查看数据集的基本信息  
data_info = data.info()  
  
# 2. 描述性统计  
descriptive_stats = data.describe()  
  
data_info, descriptive_stats

输出结果:

<class 'pandas.core.frame.DataFrame'>  
RangeIndex: 24046 entries, 0 to 24045  
Data columns (total 27 columns):  
标题            24046 non-null object  
价格            23641 non-null float64  
新车含税价         24037 non-null object  
标签            19118 non-null object  
表显里程          24046 non-null object  
上牌时间          24046 non-null object  
挡位            24046 non-null object  
排量            24046 non-null object  
车辆所在地         24046 non-null object  
查看限迁地         24046 non-null object  
变速箱           24046 non-n

你可能感兴趣的:(数据分析可视化,python,数据分析,汽车,数据可视化,plotly)