R语言数据可视化ggplot绘制置信区间与分组绘图技巧

2025-04-01 10:28:20

1. 单组情况

1）构造数据集

x <- 1:10
y <- x^2
ci_l <- x^2 - 0.5 * x
ci_r <- x^2 + 0.5 * x

dat_plot <- data.frame(x, y, ci_l, ci_r)

数据集长下面这样：

    x   y ci_l  ci_r
1   1   1  0.5   1.5
2   2   4  3.0   5.0
3   3   9  7.5  10.5
4   4  16 14.0  18.0
5   5  25 22.5  27.5
6   6  36 33.0  39.0
7   7  49 45.5  52.5
8   8  64 60.0  68.0
9   9  81 76.5  85.5
10 10 100 95.0 105.0

2）绘制置信区间

添加置信区间的核心函数是：geom_ribbon()，并且要注意，先画置信区间，再绘制线条，才能保证线在置信区间的上方。

ggplot(dat_plot, aes(x = x)) +                  # x轴在此处添加，目的为了置信区间与拟合线共享同一个x
  geom_ribbon(aes(ymin = ci_l, ymax = ci_r)) +  # 添加置信区间
  geom_line(aes(y = y))                         # 添加拟合线

（文末会对上面“丑丑”的置信区间进行美化。）

通常情况，所需的图片都是需要分组的，下面我们会进行分组绘制置信区间。

2. 多组情况

我们将会演示两种方式绘制分组情况绘制置信区间：

方法1

1）构造数据集

通常情况下，ggplot需要的向量化构造：

x <- 1:10
y1 <- x^2
ci_l1 <- x^2 - 0.5 * x
ci_r1 <- x^2 + 0.5 * x

y2 <- 20 * log(x)
ci_l2 <- 20 * log(x) - 0.5 * x
ci_r2 <- 20 * log(x) + 0.5 * x

dat_plot <- data.frame(rbind(cbind(x, y1, ci_l1, ci_r1), cbind(x, y2, ci_l2, ci_r2)))
names(dat_plot) <- c("x", "y", "ci_l", "ci_r")
dat_plot$group <- rep(c("G1", "G2"), each = 10)

数据样式：

    x         y     ci_l      ci_r group
1   1   1.00000  0.50000   1.50000    G1
2   2   4.00000  3.00000   5.00000    G1
3   3   9.00000  7.50000  10.50000    G1
4   4  16.00000 14.00000  18.00000    G1
5   5  25.00000 22.50000  27.50000    G1
6   6  36.00000 33.00000  39.00000    G1
7   7  49.00000 45.50000  52.50000    G1
8   8  64.00000 60.00000  68.00000    G1
9   9  81.00000 76.50000  85.50000    G1
10 10 100.00000 95.00000 105.00000    G1
11  1   0.00000 -0.50000   0.50000    G2
12  2  13.86294 12.86294  14.86294    G2
13  3  21.97225 20.47225  23.47225    G2
14  4  27.72589 25.72589  29.72589    G2
15  5  32.18876 29.68876  34.68876    G2
16  6  35.83519 32.83519  38.83519    G2
17  7  38.91820 35.41820  42.41820    G2
18  8  41.58883 37.58883  45.58883    G2
19  9  43.94449 39.44449  48.44449    G2
20 10  46.05170 41.05170  51.05170    G2

2）绘制置信区间

注意，这里分组的关键就是使用 group = 参数。

ggplot(dat_plot, aes(x = x, group = group)) +
  geom_ribbon(aes(ymin = ci_l, ymax = ci_r)) +
  geom_line(aes(y = y))

但是这里的颜色比较吃藕，所以我们改变一下线条的颜色与置信区间的颜色。

非常简单，我们将参数 group = 用 color = 与 fill = 替换即可。值得一提的是，这里的color = 如果加在ggplot()中，添加的就会是拟合线与置信区间外边线两条曲线。若不想要置信区间的外边线， color =写在geom_line()中即可。

此外，还需要注意，绘制置信区间，若线条与区间是相同颜色，一定要修改置信区间的透明度，利用alpha = 进行修改，其范围在0-1之间，并且值越小越透明。

代码如下：

ggplot(dat_plot, aes(x = x, color = group, fill = group)) +
  geom_ribbon(aes(ymin = ci_l, ymax = ci_r), alpha = 0.3) +  # alpha 修改透明度
  geom_line(aes(y = y))

在大多数情况下，我们遇到的多组数据集长下面方法2 这样，我们需要怎么进行绘制呢？下面继续进行讲解：

方法2

1）构造数据集

dat_plot <- data.frame(x, y1, ci_l1, ci_r1, y2, ci_l2, ci_r2) # 基于前文的数据

    x  y1 ci_l1 ci_r1       y2    ci_l2    ci_r2
1   1   1   0.5   1.5  0.00000 -0.50000  0.50000
2   2   4   3.0   5.0 13.86294 12.86294 14.86294
3   3   9   7.5  10.5 21.97225 20.47225 23.47225
4   4  16  14.0  18.0 27.72589 25.72589 29.72589
5   5  25  22.5  27.5 32.18876 29.68876 34.68876
6   6  36  33.0  39.0 35.83519 32.83519 38.83519
7   7  49  45.5  52.5 38.91820 35.41820 42.41820
8   8  64  60.0  68.0 41.58883 37.58883 45.58883
9   9  81  76.5  85.5 43.94449 39.44449 48.44449
10 10 100  95.0 105.0 46.05170 41.05170 51.05170

2）绘制置信区间

面对上述这种数据格式，我们处理起来也十分简单，我们只需要在对应的aes() 函数中，写清楚对应的分组名称即可。

color = 与 fill = 一定要写在 aes() 里面！！！
color = 与 fill = 一定要写在 aes() 里面！！！
color = 与 fill = 一定要写在 aes() 里面！！！

重要的事情说三遍，具体代码如下所示：

ggplot(dat_plot, aes(x = x)) +
  geom_ribbon(aes(ymin = ci_l1, ymax = ci_r1, fill = "G1"), alpha = 0.3) +
  geom_ribbon(aes(ymin = ci_l2, ymax = ci_r2, fill = "G2"), alpha = 0.3) +
  geom_line(aes(y = y1, color = "G1")) +
  geom_line(aes(y = y2, color = "G2"))

但这样的置信区间还比较丑，下面我们给出一个略微美化的版本，并在代码中进行注释，说明每个函数的用意。

3）美化

ggplot(dat_plot, aes(x = x)) +
  geom_ribbon(aes(ymin = ci_l1, ymax = ci_r1, fill = "G1", color = "G1"),
              alpha = 0.3, linetype = 2) +        # linetype = 2 表示置信区间描边线为虚线
  geom_ribbon(aes(ymin = ci_l2, ymax = ci_r2, fill = "G2", color = "G2"),
              alpha = 0.3, linetype = 2) +
  geom_line(aes(y = y1, color = "G1")) +
  geom_line(aes(y = y2, color = "G2")) +
  theme_bw(base_family = "Times") +
  theme(panel.grid = element_blank(),
    legend.position = "top",                      # legend 置顶
    panel.border = element_blank(),
    text = element_text(family = "STHeiti"),      # Mac 系统中中文绘图
    plot.title = element_text(hjust = 0.5)) +     # 标题居中
  labs(x = "y", y = "x", title = "分组置信区间",
       color = "", fill = "")                      # 将置信区间与拟合线的 legend 合并，并且不要 legend 的小标题

想学习更多 ggplot 美化绘图的技巧，可以参考下述链接：

ggplot2：初次见面，请多多关照！

以上就是R语言数据可视化ggplot绘制置信区间与分组绘图技巧的详细内容，更多关于ggplot绘制置信区间与分组绘图的资料请关注我们其它相关文章！

使用R语言绘制棒棒糖图火柴杆图教程

目录使用原生ggplot方法 1)生成数据使用ggpubr包中的ggdotchart() 参考使用原生ggplot方法最容易也是最简单想到的方法是直接使用ggplot2包进行更新,这里需要使用ggplot本身的特性,通过图层叠加的方式,进行最终棒棒糖图的展现.(宽度极窄的柱状图配合散点图即可呈现) 1)生成数据下面我们的展示均以此份数据为例: library(ggplot2) # Load data data("mtcars") dfm <- mtcars # Conv
R语言使用ggplot绘制画中画细节放大的方法

目录 1. 载入相关包 2. 数据生成 3. 基础绘图 4. 放大效果 5. 绘图美化其他方法当我们在利用ggplot绘图时,当遇到一些量纲相差过大,或者一些图的某些点排布密集时,需要将细节部分进行放大,这时我们就需要采用画中画的方式,或者将统计图的细节在旁边进行放大. 下面我们就来一步一步讲解如何将图中的细节进行放大(核心为ggforce包).话不多说,先上最终效果图(以2019年双十一数据拟合为例): 1. 载入相关包 library(ggplot2) # 绘图核心 library(ti
R语言-如何给直方图加标签

看代码吧~ hist(data$MEDV,col="grey")#可以看到目标数据的总体分布 legend(35,170,c("min:5","median:21.2","mean:22.51","max:50"),fill=c("lightblue","wheat")) 补充:R语言作图--histogram(直方图) 最近小仙同学很是烦恼,本以为自己已经掌握了gg
使用R语言绘制散点图结合边际分布图教程

目录 1. 使用ggExtra结合ggplot2 1)传统散点图 2)密度函数 3)直方图 4)箱线图(宽窄的显示会有些问题) 5)小提琴图(会有重叠,不建议使用) 6)密度函数与直方图同时展现 2. 使用cowplot与ggpubr 1)重绘另一种散点图 2)有缝拼接 3)无缝拼接参考主要使用ggExtra结合ggplot2两个R包进行绘制.(胜在简洁方便)使用cowplot与ggpubr进行绘制.(胜在灵活且美观) 下面的绘图我们均以iris数据集为例. 1. 使用ggExtra结合gg
R语言数据可视化ggplot绘制置信区间与分组绘图技巧

目录 1. 单组情况 1)构造数据集 2)绘制置信区间 2. 多组情况方法1 1)构造数据集 2)绘制置信区间方法2 1)构造数据集 2)绘制置信区间 3)美化 1. 单组情况 1)构造数据集 x <- 1:10 y <- x^2 ci_l <- x^2 - 0.5 * x ci_r <- x^2 + 0.5 * x dat_plot <- data.frame(x, y, ci_l, ci_r) 数据集长下面这样: x y ci_l ci_r 1 1 1 0.5 1.5
R语言数据可视化ggplot添加左右y轴绘制天猫双十一销售图

目录构造数据集绘制散点修改两坐标轴信息本文是以天猫双十一销量与增长率为例,原始的数据可以参考上一篇文章:用 ggplot 重绘天猫双十一销售额图,这里不再作过多的介绍. 同时整个的天猫双十一的销售额数据分析可以关注:天猫双十一"数据造假"是真的吗? 老规矩,先上最终成果(两张图只是颜色的差别): 上图左边 y 轴表示增长率的刻度,右边 y 轴表示销售额的数据,我们将两者在同一张图上进行展现.其实将两个统计图在同一个坐标系中呈现不算是这个绘图的难点,其真正的难点在与刻度的变换以及
R语言数据可视化绘制Circular bar plot实现环形柱状图

目录 Step1. 绘图数据的准备 Step2. 绘图数据的读取 Step3.绘图所需package的调用 Step4.绘图环形柱状图排好序的环形柱状图调整颜色注意事项不知不觉,距离小仙上次发文已经过去五个多月了.R语言作图系列的更新频率跟理想中的一月一次差别有点忒大了,不得不让小仙陷入深深的反思,对于时间的规划也有了一些新的感悟.不知道大家有没有跟我一样的感受啊,举些例子:放学.下班或者放假之后先把学习任务扔在一边,心想着,我先玩会游戏,等会玩够了再做:网上看到一篇干货满满的文章,先
R语言数据可视化分析天猫双十一销售额增长率

目录最近和小伙伴一起探索了一下双十一后闹得沸沸扬扬的一篇文章:"淘宝2009-2018年历年双十一销售额数据造假".原文作者使用初中阶段学过的抛物线,就将每年的销售额增长趋势拟合得非常完美. (如果大家想学习如何画出上述的图像,可参见前面一篇博客:用 ggplot 重绘天猫双十一销售额图) 同时在知乎上,这个问题也成功上了当时的热搜榜,各路大神云集,也发表了很多很有意思的观点: 如何看待有人质疑淘宝双十一数据造假,并在4月份成功预测今年销售额为2680亿? 看了很多大神的文章后,自己
R语言数据可视化包ggplot2画图之散点图的基本画法

目录前言下面以一个简单的例子引入: 首先介绍第一类常用的图像类型:散点图给原始数据加上分类标签: 按z列分类以不同的颜色在图中画出散点图: 按z列分类以不同的形状在图中画出散点图: 多面化(将ABC三类分开展示): 自定义颜色: 添加拟合曲线: 更换主题 : 总结前言 ggplot2的功能很强大,并因为其出色的画图能力而闻名,下面来介绍一下它的基本画图功能,本期介绍散点图的基本画法. 在ggplot2里,所有图片由6个基本要素组成: 1. 数据(Data) 2. 层次(Layers),包
R语言数据可视化学习之图形参数修改详解

1.图形参数的修改par()函数我们可以通过使用par()函数来修改图形的参数,其调用格式为par(optionname=name, optionname=name,-).当par()不加参数时,返回当前图形参数设置的列表:par(no.readonly=T)将生成一个可以修改当前参数设置的列表.注意以这种方式修改参数设置,除非参数再次被修改,否则一直执行此参数设置. 例如现在想画出mtcars数据集中mpg的折线图,并用虚线代替实线,并将两幅图排列在同一幅图里,代码及图形如下: > opar
R语言数据可视化绘图Dot plot点图画法示例

目录 Step1. 绘图数据的准备 Step2. 绘图数据的读取 Step3.绘图所需package的安装.调用 Step4.绘图添加平均值添加误差线今天要给大家介绍的是点图(Dot plot),点图展示的数据比较简单,但胜在好看啊. 作图数据如下: Step1. 绘图数据的准备首先要把你想要绘图的数据调整成R语言可以识别的格式,建议大家在excel中保存成csv格式. Step2. 绘图数据的读取 data<-read.csv("your file path", hea
R语言数据可视化绘图Slope chart坡度图画法

目录 Step1. 绘图数据的准备 Step2. 绘图数据的读取 Step3. 绘图所需package的安装.调用 Step4. 绘图今天小仙给大家分享一下Slope chart(坡度图)的画法,我在paper中看到的图是这样的这个图的意思大概是Nasal Tissue比Brochial Tissue的ACE2表达量高(ACE2就是新冠病毒的受体啦) .为了复刻这张图,小仙捏造了一组差不多的数据,竟然感觉比原图好看! 废话不多说,进入正题. Step1. 绘图数据的准备首先要把你想要绘图的
R语言数据可视化tidyr与ggplot2多个变量分层展示举例实现

目录每个变量的密度分布情况思考 tidyr ggplot2进行绘图在R语言普通的绘图中,使用par()参数可以在一张图上实现不同变量的子图.如果我们想要用ggplot2实现,则需要整理我们的原始数据,这通常是非常麻烦的,这时就需要用到我们的tidyr来帮助我们绘图. 可能说上面一段话不是很容易理解,下面我们来举个栗子. 每个变量的密度分布情况 y1 <- rnorm(20) y2 <- rnorm(20) dat <- data.frame(y1, y2) 现有的数据集: y1 y
R语言数据可视化绘图bar chart条形图实现示例

时光飞逝,岁月如梭,转眼又是一年过去了,本小仙怎么还是一事无成呢! 转念一想,这种事也不是一次两次了,再多一个又何妨,哈哈! 回归正题,今天就给大家介绍下直方图(histogram)的“好兄弟”——条形图(bar chart).假设小仙同学现在要帮一家书店用图形展示2018年最受大家欢迎的书目,数据如下图. 条形图画出来还挺好看,可是跟小仙想象中的可不一样.明明我的数据是按照销量从高到低排列的,为什么画出来却是按照字母顺序排列的呢? 使用了对因子进行排序的函数reorder()之后,就变成了下图