Python数据处理从零开始----第四章(可视化)(9)线性相关曲线

目录

Python数据处理从零开始----第四章(可视化)①Matplotlib包
Python数据处理从零开始----第四章(可视化)②图形和轴
Python数据处理从零开始----第四章(可视化)③散点图和误差棒
Python数据处理从零开始----第四章(可视化)④误差图
Python数据处理从零开始----第四章(可视化)⑤(韦恩图)
Python数据处理从零开始----第四章(可视化)⑥(画布设置)
Python数据处理从零开始----第四章(可视化)⑦(多图合并)
Python数据处理从零开始----第四章(可视化)⑧火山图
Python数据处理从零开始----第四章(可视化)⑨线性相关曲线
Python数据处理从零开始----第四章(可视化)(10)ROC曲线

Python数据处理从零开始----第四章(可视化)(11)多分类ROC曲线

===============================================

R语言之可视化①③散点图+拟合曲线

===============================================
通过python我们可以绘制两个变量的相关图,我所使用的是皮尔森相关,主要的参数是:①r相关系数②P值。一般对P值的评判标准是P< 0.05

简单的相关系数的分类
0.8-1.0 极强相关
0.6-0.8 强相关
0.4-0.6 中等程度相关
0.2-0.4 弱相关
0.0-0.2 极弱相关或无相关
r描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间,若r>0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r<0,表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。r 的绝对值越大表明相关性越强,要注意的是这里并不存在因果关系。

基础拟合曲线绘制

# -*- coding: utf-8 -*-
"""
Created on Mon Nov 19 00:57:53 2018

@author: czh
"""
# In[*]
#导入各种需要的包#
import numpy as np
import matplotlib.pyplot as plt
from scipy import optimize


import seaborn as sns
sns.set()
# In[*]


import seaborn as sns
sns.set(style="darkgrid")

tips = sns.load_dataset("tips")
g = sns.jointplot("total_bill", "tip", data=tips, kind="reg",
                  xlim=(0, 60), ylim=(0, 12), color="m", height=7)




Python数据处理从零开始----第四章(可视化)(9)线性相关曲线_第1张图片

这是通过python语言绘制的线性相关曲线拟合图,感觉比R语言在代码上更简洁,且图片能展示的信息更多。

多分组拟合曲线绘制

# -*- coding: utf-8 -*-
"""
Created on Mon Nov 19 00:57:53 2018

@author: czh
"""
# In[*]
#导入各种需要的包#
import numpy as np
import matplotlib.pyplot as plt
from scipy import optimize


import seaborn as sns
sns.set()
# In[*]
# Load the iris dataset
iris = sns.load_dataset("iris")

# Plot sepal with as a function of sepal_length across days
g = sns.lmplot(x="sepal_length", y="sepal_width",hue='species',
               truncate=True, height=5, data=iris)

# Use more informative axis labels than are provided by default
g.set_axis_labels("Sepal length (mm)", "Sepal width (mm)")

Python数据处理从零开始----第四章(可视化)(9)线性相关曲线_第2张图片

多变量子图拟合曲线绘制

# -*- coding: utf-8 -*-
"""
Created on Wed Dec 26 11:17:56 2018

@author: czh
"""
%reset -f
%clear
# In[*]

from matplotlib import pyplot as plt
import numpy as np
import pandas as pd
import lifelines as ll
from IPython.display import HTML
%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.plotly as py
import plotly.tools as tls   
from plotly.graph_objs import *
import os
from scipy import stats
from lifelines.estimation import KaplanMeierFitter
kmf = KaplanMeierFitter()
from lifelines.statistics import logrank_test
from sklearn.preprocessing import StandardScaler
os.chdir("D:\\Rwork\\third\\Fig2")
# In[*]
# Import Data
df = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/mpg_ggplot2.csv")
df_select = df.loc[df.cyl.isin([4,8]), :]

# Each line in its own column
sns.set_style("white")
gridobj = sns.lmplot(x="displ", y="hwy", 
                     data=df_select, 
                     height=7, 
                     robust=True, 
                     palette='Set1', 
                     col="cyl",
                     scatter_kws=dict(s=60, linewidths=.7, edgecolors='black'))

# Decorations
gridobj.set(xlim=(0.5, 7.5), ylim=(0, 50))
plt.show()
Python数据处理从零开始----第四章(可视化)(9)线性相关曲线_第3张图片

你可能感兴趣的:(Python数据处理从零开始----第四章(可视化)(9)线性相关曲线)