R语言数据可视化包ggplot2画图之散点图的基本画法

目录
  • 前言
  • 下面以一个简单的例子引入:
  • 首先介绍第一类常用的图像类型:散点图
    • 给原始数据加上分类标签:
    • 按z列分类以不同的颜色在图中画出散点图:
    • 按z列分类以不同的形状在图中画出散点图:
    • 多面化(将ABC三类分开展示):
    • 自定义颜色:
    • 添加拟合曲线:
    • 更换主题 :
  • 总结

前言

ggplot2的功能很强大,并因为其出色的画图能力而闻名,下面来介绍一下它的基本画图功能,本期介绍散点图的基本画法。

在ggplot2里,所有图片由6个基本要素组成:

1. 数据(Data)

2. 层次(Layers),包含两种元素:几何元素(Geometrics)与统计转换(Statistical transformations)。

几何元素指的是你想画的图形,如点,线,或多边形等。

统计转换指的是你想画的统计描述,如均数,标准差或可信区间等。

3. 刻度(Scales), 通常指几何元素(如点或者线)的大小,颜色和形状等。

4. 坐标系统(A coordinate system), 通常指的是x轴与y轴。

5. 多面化(Faceting),简单的说,就是可以将一个图片分成多个小的亚图片。

6. 主题 (Theme),此要素可以控制非数据与非统计部分的内容,如背景颜色,字体大小等。

下面以一个简单的例子引入:

library(ggplot2)#导入ggplot包
#使用mtcars数据做一个散点图
ggplot(data = mtcars,            # 要素1:数据
       aes(x = wt, y = mpg,
       colour = factor(cyl))) +  # 要素3:刻度
       geom_point() +            # 要素2:几何元素(点)
       coord_cartesian() +       # 要素4:坐标轴
       facet_wrap(~ cyl) +       # 要素5:分面化
       theme_bw()                # 要素6:主题

其中mtcars数据概况如下:

首先介绍第一类常用的图像类型:散点图

#载入ggplot2
library(ggplot2)
#建立数据集,横坐标为1:100,纵坐标为服从标准正态分布的随机数
x <- seq(1,100,length=100)
y <- rnorm(100,mean=0,sd=1)
data <- data.frame(x=x,y=y)
#作散点图
ggplot(data, aes(x=x, y=y)) +
  geom_point()

给原始数据加上分类标签:

x <- seq(1,100,length=100)
y <- rnorm(100,mean=0,sd=1)
z <- c(rep("A",30),rep("B",30),rep("C",40))
z <- sample(z,100)
data <- data.frame(x=x,y=y,z=z)

数据概况如下:

按z列分类以不同的颜色在图中画出散点图:

ggplot(data, aes(x=x, y=y,color=z)) +
  geom_point()

按z列分类以不同的形状在图中画出散点图:

ggplot(data, aes(x=x, y=y,shape=z)) +
  geom_point()

多面化(将ABC三类分开展示):

ggplot(data, aes(x=x, y=y,color=z)) +
  geom_point()+
  facet_wrap(~z)+
  theme(legend.position = "none")

若不加

theme(legend.position = "none")

这一段代码,显示的图表如下:

可以看出不加这一段代码侧边栏显示图例,但显然这个图例是多余的,因此我们一般去掉

自定义颜色:

ggplot(data, aes(x=x, y=y,color=z)) +
  geom_point()+
  facet_wrap(~z)+
  theme(legend.position = "none")+
  scale_colour_manual(values = c("purple", "red", "black")) 

添加拟合曲线:

x <- seq(1,50,length=50)
y <- rnorm(50,mean=0,sd=5)
z <- c(rep("A",20),rep("B",15),rep("C",15))
z <- sample(z,50)
data <- data.frame(x=x,y=2*x-y,z=z)#这里构造的数据集大致服从y=2x
ggplot(data, aes(x=x, y=y)) +
  geom_point()+
  geom_smooth()#添加拟合曲线,默认的形式是局部回归,所以拟合出的线条是曲线。

因为geom_smooth()默认的形式是局部回归,所以拟合出的线条是曲线,阴影区域为置信区间。

这里也可以用其他模型拟合,如线型模型:

ggplot(data, aes(x=x, y=y)) +
  geom_point()+
  geom_smooth(method = "lm", se = FALSE)

(se = FALSE:去除置信区间)

更换主题 :

ggplot(data, aes(x=x, y=y)) +
  geom_point()+
  theme_test()

总结

到此这篇关于R语言数据可视化包ggplot2画图之散点图的基本画法的文章就介绍到这了,更多相关R语言ggplot2散点图画法内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • R语言ggplot2设置图例(legend)的操作大全

    目录 基本箱线图(带有图例) 移除图例 修改图例的内容 颠倒图例的顺序 隐藏图例标题 修改图例中的标签 修改data.frame的factor 修改标题和标签的显示 修改图例的框架 设置图例的位置 隐藏斜线 总结 本文在 http://www.cookbook-r.com/Graphs/Scatterplots_(ggplot2)/ 的基础上加入了自己的理解 图例用来解释图中的各种含义,比如颜色,形状,大小等等, 在ggplot2中aes中的参数(x, y 除外)基本都会生成图例来解释图形, 比

  • R语言 使用ggplot2绘制好看的分组散点图

    我们以iris数据集为例,该数据集包括花萼的长度和宽度,花瓣的长度和宽度,以及物种,如下图: 本文我们要绘制不同物种下花萼的长度和宽度的分布情况,以及二者之间的相关性关系. 1. 首先载入ggplot2包, library(ggplot2) 2. 然后进行ggplot(data = NULL, mapping = aes(), ..., environment = parent.frame())绘制,在绘制中第一个参数是数据,第二个参数是数据映射,是绘制的全局变量,其中包含的参数有x,y,col

  • R语言ggplot2之图例的设置

    引言 图例的设置包括移除图例.改变图例的位置.改变标签的顺序.改变图例的标题等. 移除图例 有时候你想移除图例,使用 guides(). library(ggplot2) p <- ggplot(PlantGrowth, aes(x=group, y=weight, fill=group)) + geom_boxplot() p + guides(fill=FALSE) 改变图例的位置 我们可以用theme(legend.position=-)将图例移到图表的上方.下方.左边和右边. p <-

  • R语言 ggplot2改变柱状图的顺序操作

    如下所示: library(ggplot2) library(ggthemes) dt = data.frame(obj = c('A','D','B','E','C'), val = c(2,15,6,9,7)) dt$obj = factor(dt$obj, levels=c('D','B','C','A','E')) ## 设置柱条的顺序 p = ggplot(dt, aes(x = obj, y = val, fill = obj, group = factor(1))) + geom_

  • R语言数据可视化包ggplot2画图之散点图的基本画法

    目录 前言 下面以一个简单的例子引入: 首先介绍第一类常用的图像类型:散点图 给原始数据加上分类标签: 按z列分类以不同的颜色在图中画出散点图: 按z列分类以不同的形状在图中画出散点图: 多面化(将ABC三类分开展示): 自定义颜色: 添加拟合曲线: 更换主题 : 总结 前言 ggplot2的功能很强大,并因为其出色的画图能力而闻名,下面来介绍一下它的基本画图功能,本期介绍散点图的基本画法. 在ggplot2里,所有图片由6个基本要素组成: 1. 数据(Data) 2. 层次(Layers),包

  • R语言数据可视化绘图Dot plot点图画法示例

    目录 Step1. 绘图数据的准备 Step2. 绘图数据的读取 Step3.绘图所需package的安装.调用 Step4.绘图 添加平均值 添加误差线 今天要给大家介绍的是点图(Dot plot),点图展示的数据比较简单,但胜在好看啊. 作图数据如下: Step1. 绘图数据的准备 首先要把你想要绘图的数据调整成R语言可以识别的格式,建议大家在excel中保存成csv格式. Step2. 绘图数据的读取 data<-read.csv("your file path", hea

  • R语言数据可视化绘图Slope chart坡度图画法

    目录 Step1. 绘图数据的准备 Step2. 绘图数据的读取 Step3. 绘图所需package的安装.调用 Step4. 绘图 今天小仙给大家分享一下Slope chart(坡度图)的画法,我在paper中看到的图是这样的 这个图的意思大概是Nasal Tissue比Brochial Tissue的ACE2表达量高(ACE2就是新冠病毒的受体啦) .为了复刻这张图,小仙捏造了一组差不多的数据,竟然感觉比原图好看! 废话不多说,进入正题. Step1. 绘图数据的准备 首先要把你想要绘图的

  • R语言数据可视化ggplot绘制置信区间与分组绘图技巧

    目录 1. 单组情况 1)构造数据集 2)绘制置信区间 2. 多组情况 方法1 1)构造数据集 2)绘制置信区间 方法2 1)构造数据集 2)绘制置信区间 3)美化 1. 单组情况 1)构造数据集 x <- 1:10 y <- x^2 ci_l <- x^2 - 0.5 * x ci_r <- x^2 + 0.5 * x dat_plot <- data.frame(x, y, ci_l, ci_r) 数据集长下面这样: x y ci_l ci_r 1 1 1 0.5 1.5

  • R语言数据可视化ggplot添加左右y轴绘制天猫双十一销售图

    目录 构造数据集 绘制散点 修改两坐标轴信息 本文是以天猫双十一销量与增长率为例,原始的数据可以参考上一篇文章:用 ggplot 重绘天猫双十一销售额图,这里不再作过多的介绍. 同时整个的天猫双十一的销售额数据分析可以关注:天猫双十一"数据造假"是真的吗? 老规矩,先上最终成果(两张图只是颜色的差别): 上图左边 y 轴表示增长率的刻度,右边 y 轴表示销售额的数据,我们将两者在同一张图上进行展现.其实将两个统计图在同一个坐标系中呈现不算是这个绘图的难点,其真正的难点在与刻度的变换以及

  • R语言数据可视化绘制Circular bar plot实现环形柱状图

    目录 Step1. 绘图数据的准备 Step2. 绘图数据的读取 Step3.绘图所需package的调用 Step4.绘图 环形柱状图 排好序的环形柱状图 调整颜色 注意事项 不知不觉,距离小仙上次发文已经过去五个多月了.R语言作图系列的更新频率跟理想中的一月一次差别有点忒大了,不得不让小仙陷入深深的反思,对于时间的规划也有了一些新的感悟.不知道大家有没有跟我一样的感受啊,举些例子:放学.下班或者放假之后先把学习任务扔在一边,心想着,我先玩会游戏,等会玩够了再做:网上看到一篇干货满满的文章,先

  • R语言数据可视化学习之图形参数修改详解

    1.图形参数的修改par()函数 我们可以通过使用par()函数来修改图形的参数,其调用格式为par(optionname=name, optionname=name,-).当par()不加参数时,返回当前图形参数设置的列表:par(no.readonly=T)将生成一个可以修改当前参数设置的列表.注意以这种方式修改参数设置,除非参数再次被修改,否则一直执行此参数设置. 例如现在想画出mtcars数据集中mpg的折线图,并用虚线代替实线,并将两幅图排列在同一幅图里,代码及图形如下: > opar

  • R语言数据可视化分析天猫双十一销售额增长率

    目录 最近和小伙伴一起探索了一下双十一后闹得沸沸扬扬的一篇文章:"淘宝2009-2018年历年双十一销售额数据造假".原文作者使用初中阶段学过的抛物线,就将每年的销售额增长趋势拟合得非常完美. (如果大家想学习如何画出上述的图像,可参见前面一篇博客:用 ggplot 重绘天猫双十一销售额图) 同时在知乎上,这个问题也成功上了当时的热搜榜,各路大神云集,也发表了很多很有意思的观点: 如何看待有人质疑淘宝双十一数据造假,并在4月份成功预测今年销售额为2680亿? 看了很多大神的文章后,自己

  • R语言数据可视化tidyr与ggplot2多个变量分层展示举例实现

    目录 每个变量的密度分布情况 思考 tidyr ggplot2进行绘图 在R语言普通的绘图中,使用par()参数可以在一张图上实现不同变量的子图.如果我们想要用ggplot2实现,则需要整理我们的原始数据,这通常是非常麻烦的,这时就需要用到我们的tidyr来帮助我们绘图. 可能说上面一段话不是很容易理解,下面我们来举个栗子. 每个变量的密度分布情况 y1 <- rnorm(20) y2 <- rnorm(20) dat <- data.frame(y1, y2) 现有的数据集: y1 y

  • R语言数据可视化绘图Lollipop chart棒棒糖图

    目录 Step1.绘图数据的准备 Step2.绘图数据的读取 Step3.绘图所需package的调用 Step4.因子水平排序 Step5.绘图 今天给大家分享的是Lollipop chart(棒棒糖图)的画法.棒棒糖图的用途跟条形图的用法类似,只是看起来更加美观一些,图表形式更加丰富(数据不够.拿图来凑,啥也不能阻止我优秀 ). 为了跟之前画的柱状图更好的比较,今天画图使用了相同的数据. 作图思路:棒棒糖图实际上是在散点图的基础上增加了辅助线. 不过在作图过程中还是遇到了和之前一样的问题,数

随机推荐