R语言管道操作及绘制数据集对比图和回归线的基础并简单建模

  使用了R语言自带的数据框mtcars,里面包含了各品牌型号的车辆参数信息。可以使用head()函数先查看下数据框信息:

> head(mtcars)
                   mpg cyl disp  hp drat    wt  qsec vs am gear carb
Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

绘制燃油效率分布图:

#使用par函数设置图形边界形状
op <- par(mar = c(10,4,4,2) + 0.1)
#使用barplot()设置绘制条形图,用以展示分类变量或连续变量的分布情况
barplot(mtcars$mpg, names.arg = row.names(mtcars), las = 2, ylab = "FuelEfficiency in Miles per Gallon")

R语言管道操作及绘制数据集对比图和回归线的基础并简单建模_第1张图片

 使用pairs()函数绘制数据集对比图:

pairs(mtcars[1:7], lower.panel = NULL)

 R语言管道操作及绘制数据集对比图和回归线的基础并简单建模_第2张图片

使用管道运算符号%>%(快捷键Shift+Ctrl+M)对数据集中的wt(车辆重量)进行分组,然后计算mpg(每加仑汽油行驶的英里数)的平均值,管道运算是将左边的运算结果以输入的方式传递给右边函数,操作步骤为:

x %>% f() %>% g()

先对x进行f()操作,再对操作结果进行g()操作。

再使用lm函数对response与数据集建模,根据模型,可以得到以下方程:

燃油效率 = 5.344 * 车辆重量 + 37.285

library(tidyverse)

plot(mtcars %>%
  group_by(wt) %>%
  summarise(mpg_avg = mean(mpg)))

mt.model <- lm(formula = mpg ~ wt, data = mtcars)
print(coef(mt.model)[2])
print(coef(mt.model)[1])

R语言管道操作及绘制数据集对比图和回归线的基础并简单建模_第3张图片

你可能感兴趣的:(r语言,开发语言)