天池红酒数据集分析笔记

Pandas的精度显示设置
pd.set_option(‘precision’,3)
https://www.jianshu.com/p/7f47677788c4?t=1477407037665


seaborn画图模块的使用
https://www.jianshu.com/p/ba60d01a7234
https://www.cnblogs.com/hyan0913/p/11497560.html
箱型图的绘制
https://blog.csdn.net/LuohenYJ/article/details/90677918


plt.style.use(‘ggplot’)
https://blog.csdn.net/you_are_my_dream/article/details/53464662
样式美化
plt.tight_layout()
使图幅紧凑,协调美观
https://www.jianshu.com/p/91bdbf54f94c
如下
这里是使用了plt.tight_layout()这句代码时整个图:
天池红酒数据集分析笔记_第1张图片
这里是注释掉plt.tight_layout()这句代码时的图:可以看到图片挤在一起,甚至有的标签和图重叠了,不美观
天池红酒数据集分析笔记_第2张图片


python中numpy模块下的np.clip()的用法
https://blog.csdn.net/HHTNAN/article/details/79799612
numpy.clip(a, a_min, a_max, out=None)
参数a为数组,a_min,a_max为两个数,这个函数作用是将数组a中小于a_min的替换成a_min,将大于a_max的替换成a_max,返回一个新的np数组,实例如下:

>>> import numpy as np
>>> a = [1,2,3,4,5,6,7,8]
>>> np.clip(a,a_min = 3,a_max = 6)
array([3, 3, 3, 4, 5, 6, 6, 6])
>>> type(np.clip(a,a_min = 3,a_max = 6))

>>>

# 有一个DataFrame结构的df,如求某一列a的值时:
df['a']所得到的时一个Series结构的,带有index索引
而df['a'].values所得到的是一个numpy数组

你可能感兴趣的:(数据分析)