Day4-木婉清-初识R-2024.2.1

一、初识R

plot():主要用于绘制折线图,箱型图,直方图等
runif():
默认生成0-1之间的符合正态分布的随机数
在这里插入图片描述
生成了10个0-100之间的随机数字在这里插入图片描述

Day4-木婉清-初识R-2024.2.1_第1张图片
plot(rnorm(50)): rnorm(50)是生成50个随机正态分布的数字作为图形的Y轴,根据此索引找到X,绘制散点图

boxplot(iris S e p a l . L e n g t h   i r i s Sepal.Length~iris Sepal.Length irisSpecies, col = c(“lightblue”, “lightyellow”, “lightpink”))
iris S e p a l . L e n g t h 表示从 i r i s 数据集中提取花瓣长度这一变量, i r i s Sepal.Length 表示从iris数据集中提取花瓣长度这一变量,iris Sepal.Length表示从iris数据集中提取花瓣长度这一变量,irisSpecies 表示从iris数据集中提取鸢尾花的物种这一变量。~ 符号表示将前一个变量(花瓣长度)按照后一个变量(鸢尾花的物种)进行分组
Day4-木婉清-初识R-2024.2.1_第2张图片

二、修改字体大小

Day4-木婉清-初识R-2024.2.1_第3张图片

三、R语言基本操作

(1)管理工作目录(新建项目,项目在文件夹,项目下脚本运行的结果都在这个项目所在文件夹下面)

https://mp.weixin.qq.com/s/G-LXN9P2HVLv9v0cvyFJMA
session:指的是新打开一个R的工作界面/project。翻译为“会话”

Day4-木婉清-初识R-2024.2.1_第4张图片

Day4-木婉清-初识R-2024.2.1_第5张图片
Day4-木婉清-初识R-2024.2.1_第6张图片
Day4-木婉清-初识R-2024.2.1_第7张图片
R project在新文件夹里面

(2)显示当前路径下的列表(类似linux下面的ls,不论是txt还是文件还是啥)

dir()
list.files()

(3)加减乘除

在这里插入图片描述

(4)赋值

在这里插入图片描述

(5)删除变量

Day4-木婉清-初识R-2024.2.1_第8张图片
ls()当前环境下啥也没有
dir()和list.files()是当前路径下所有东西

(6)列出历史命令

Day4-木婉清-初识R-2024.2.1_第9张图片

(7)清空控制台

ctrl+l
Day4-木婉清-初识R-2024.2.1_第10张图片
Day4-木婉清-初识R-2024.2.1_第11张图片

(8)R包

Day4-木婉清-初识R-2024.2.1_第12张图片
tidyverse包是很多包的依赖包 自我理解

四、ggplot2画图进阶

1.mpg
mpg是ggplot内置的一个数据框格式

2.基础作图:

图形映射

ggplot(data= )+mapping(aes())

ggplot(data,aes(x=displ,y=hwy))+
geom_point()
Day4-木婉清-初识R-2024.2.1_第13张图片
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, color = class))
Day4-木婉清-初识R-2024.2.1_第14张图片
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, size = class))
Day4-木婉清-初识R-2024.2.1_第15张图片
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, alpha = class))
(将车型映射给点的透明度)
Day4-木婉清-初识R-2024.2.1_第16张图片
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, shape = class))但是形状只有6种,因此SUV为空Day4-木婉清-初识R-2024.2.1_第17张图片
手动设置图形属性
Day4-木婉清-初识R-2024.2.1_第18张图片
Day4-木婉清-初识R-2024.2.1_第19张图片
点的边界线宽度为3
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, stroke=3),shape = 21)

分面

单因素分面
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_wrap(~ class, nrow = 2)
nrow指定分面后显示几行
ncol指定分面后显示几列
注意~分面依据必须是离散型变量

Day4-木婉清-初识R-2024.2.1_第20张图片
两因素分面,不需要制定行列
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_grid(drv ~ cyl)
Day4-木婉清-初识R-2024.2.1_第21张图片
不想在行/列分面,可以用. 代替
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_grid(. ~ cyl)
Day4-木婉清-初识R-2024.2.1_第22张图片

几何图形

颜色映射3个
ggplot(data = mpg) +
geom_smooth(
mapping = aes(x = displ, y = hwy, color = drv),
show.legend = FALSE #不显示图例
)
Day4-木婉清-初识R-2024.2.1_第23张图片
ggplot(data = mpg) +
geom_smooth(
mapping = aes(x = displ, y = hwy, linetype = drv),
)线形
Day4-木婉清-初识R-2024.2.1_第24张图片
ggplot(data = mpg, mapping = aes(x = displ, y = hwy)) +
geom_point(mapping = aes(color = class)) + #映射点的颜色
geom_smooth(data = filter(mpg, class == “subcompact”),se=FALSE)

#映射平滑线,数据源是mpg里面的subcompact的所有行, se=false不使用标准误差即灰色背景
Day4-木婉清-初识R-2024.2.1_第25张图片

统计变换

每个几何对象函数都有一个默认的统计变换,每个统计变换函数都又一个默认的几何对象
geom_bar-------统计变换--------stat_count--------几何对象-------直方图
ggplot(data = diamonds) +
geom_bar(mapping = aes(x = cut))

ggplot(data = diamonds) +
stat_count(mapping = aes(x = cut)) #两个画出来一样的
Day4-木婉清-初识R-2024.2.1_第26张图片
demo <- tribble(
~cut, ~freq,
“Fair”, 1610,
“Good”, 4906,
“Very Good”, 12082,
“Premium”, 13791,
“Ideal”, 21551
) #新建表格并赋值给demo

ggplot(data = demo) +
geom_bar(mapping = aes(x = cut, y = freq), stat = “identity”) #覆盖默认的统计变换,使用identity。
Day4-木婉清-初识R-2024.2.1_第27张图片
ggplot(data = diamonds) +
geom_bar(mapping = aes(x = cut, y = …prop…, group = 1)) group=1
所有的看做一个整体和为1,纵坐标显示比例
Day4-木婉清-初识R-2024.2.1_第28张图片
Day4-木婉清-初识R-2024.2.1_第29张图片

位置调整–——position**

fill是填充色,color是边框色
ggplot(data = diamonds) +
geom_bar(mapping = aes(x = cut,fill=clarity))
Day4-木婉清-初识R-2024.2.1_第30张图片
ggplot(data = diamonds) +
geom_bar(mapping = aes(x = cut, fill = clarity), position = “fill”)
Day4-木婉清-初识R-2024.2.1_第31张图片
ggplot(data = diamonds, mapping = aes(x = cut, fill = clarity)) +
geom_bar(alpha = 1/5, position = “identity”)
ggplot(data = diamonds, mapping = aes(x = cut, colour = clarity)) +
geom_bar(fill = NA, position = “identity”)
Day4-木婉清-初识R-2024.2.1_第32张图片
position是位置调整功能

并列直方图:
ggplot(data = diamonds) +
geom_bar(mapping = aes(x = cut, fill = clarity), position = “dodge”)
Day4-木婉清-初识R-2024.2.1_第33张图片
把重叠点分开
ggplot(data = mpg) +
geom_jitter(mapping = aes(x = displ, y = hwy))
Day4-木婉清-初识R-2024.2.1_第34张图片
Day4-木婉清-初识R-2024.2.1_第35张图片

坐标系

ggplot(data = mpg, mapping = aes(x = class, y = hwy)) +
geom_boxplot() +
coord_flip() #翻转坐标系
Day4-木婉清-初识R-2024.2.1_第36张图片

ggplot(nz, aes(long, lat, group = group)) +
geom_polygon(fill = “white”, colour = “black”) #geom_polygon是多边形的意思

ggplot(nz, aes(long, lat, group = group)) +
geom_polygon(fill = “white”, colour = “black”) +
coord_quickmap() #为地图设置长宽比
Day4-木婉清-初识R-2024.2.1_第37张图片
Day4-木婉清-初识R-2024.2.1_第38张图片
极坐标
bar <- ggplot(data = diamonds) +
geom_bar(
mapping = aes(x = cut, fill = cut),
show.legend = FALSE,
width = 1
) +
theme(aspect.ratio = 1) + #图形长宽比例为1,正方形
labs(x = NULL, y = NULL) #不显示x,y轴
bar + coord_flip() #翻转坐标
bar + coord_polar() #变成极坐标
Day4-木婉清-初识R-2024.2.1_第39张图片

ggplot(mpg, aes(x = factor(1), fill = drv)) +
geom_bar(width = 1) +
coord_polar(theta = “y”) #theta 参数来确定在哪个轴上应用极坐标转换
Day4-木婉清-初识R-2024.2.1_第40张图片

ggplot(data = diamonds) +
geom_bar(mapping = aes(x = cut, fill = clarity), position = “fill”) +
coord_polar(theta = “y”) #position = “fill” 表示将每个柱状图堆叠,并将它们的高度归一化为1
Day4-木婉清-初识R-2024.2.1_第41张图片

绘图模板

ggplot(data = ) +
(
mapping = aes(),
stat = ,
position =
) +
+

引用https://mp.weixin.qq.com/s/jOIJLpCN4qTznPH0b-qJdw

你可能感兴趣的:(r语言,开发语言)