python-pandas数据分析+案例分析

文章目录

  • 前言
  • 一、汽车销售数据可视化分析
    • 1. 各年度汽车总销量及环比,各车类、级别车辆销量及环比
    • 2.车辆销售规模及环比、不同价位车销量及环比
    • 3.各车系、厂商、品牌车销量及环比,市占率及变化趋势
    • 4.品牌、车类、车型、级别的各top销量
  • 二、地质灾害
  • 航空公司客户价值分析
    • 1.原始数据存在少量的缺失值和异常值

前言

一、汽车销售数据可视化分析

1. 各年度汽车总销量及环比,各车类、级别车辆销量及环比

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']#解决中文乱码
plt.rcParams['axes.unicode_minus'] = False  #解决负号乱码

sale_data=pd.read_csv('car_selling_fact.csv',encoding='gbk',
                     parse_dates=['时间'],
                     index_col=0)
print(sale_data.head())

#提取年
sale_data['年份']=sale_data['时间'].dt.year
#计算各年总销量
sale_year=sale_data.groupby('年份')[['销量']].sum()
            销量
年份            
2015  	14594487
2016  	16952990
2017 	17576436
2018  	17568751
2019   	7464071
#计算环比数
sale_year['差分']=sale_year.diff()
            销量          差分
年份                        
2015 	 14594487         NaN
2016  	 16952990   2358503.0
2017  	 17576436    623446.0
2018  	 17568751     -7685.0
2019  	  7464071 -10104680.0
            销量          差分
sale_year['环比']=[None]+list(sale_year['差分'].values[1:]/sale_year['销量'].values[:-1])
print(sale_year)
        销量          差分        环比
年份                                  
2015  14594487         NaN       NaN
2016  16952990   2358503.0  0.161602
2017  17576436    623446.0  0.036775
2018  17568751     -7685.0 -0.000437
2019   7464071 -10104680.0 -0.575151
#画一个柱状图
fig=plt.figure(figsize=(6,4))
ax1=fig.add_subplot(1,1,1)
ax1.bar(sale_year.index,sale_year['销量'])
ax1.set_ylabel

你可能感兴趣的:(python-pandas数据分析+案例分析)