R语言实现漂亮的ROC图效果

目录
  • 1.读取数据
  • 2.AUC和CI的计算
  • 3.利用ggplot2绘图
  • 4.合并多个ROC曲线结果

pROC是一个专门用来计算和绘制ROC曲线的R包,目前已被CRAN收录,因此安装也非常简单,同时该包也兼容ggplot2函数绘图,本次就教大家怎么用pROC来快速画出ROC图。在医学领域主要用于判断某种因素对于某种疾病的诊断是否有诊断价值。什么是ROC曲线和AUC,以及如何去看ROC曲线的结果,可以这样总结:ROC曲线呢,其实就是每个对应的cutoff值都有一个对应的真阳性率(纵坐标)和假阳性率(横坐标),比如选择了10个cutoff值,那就相当于有个10个点,把这些点连成一条线就是ROC曲线。AUC值就是ROC曲线下的面积,一般认为AUC值在0.7~1之间,模型预测的结果才有效。TPR(真阳性率) = TP(真阳)/(TP(真阳) + FN(假阴)),FPR(假阳性率) = FP(假阳) / (FP(假阳) + TN(真阴))。 比如下面的一个模型预测后的数据结果:

上图中如果选cutoff值为0.5时
TPR = 5 /(5 + 0)= 1,
FPR = 2 / (2 + 3) = 0.4,
预测的准确性 = (TP + TN )/ 总的样本数 = (5 + 3)/10 = 0.8

好了,话不多说,我们直接上代码

1.读取数据

library(openxlsx)
ROC <- read.xlsx("ROC曲线.xlsx")

2.AUC和CI的计算

library(pROC)
## roc的计算,可以一次性批量计算a、b、c三组数据
res<-roc(outcome~a+b+c,data=ROC,aur=TRUE,
         ci=TRUE, # 显示95%CI
         # percent=TRUE, ##是否需要以百分比显示
         levels=c('group1','group2'),direction=">" #设置分组方向
         )
## 平滑曲线的ROC结果
smooth<-roc(outcome~a+b+c,data=ROC,aur=TRUE,
         ci=TRUE, # 显示95%CI
         # percent=TRUE, ##是否需要以百分比显示
         smooth=TRUE,
         levels=c('group1','group2'),direction=">" #设置分组方向
         )

显示非平滑ROC曲线的结果

res
Call:
roc.formula(formula = outcome ~ a, data = ROC, aur = TRUE, ci = TRUE,     levels = c("group1", "group2"), direction = ">")
Data: a in 40 controls (outcome group1) > 32 cases (outcome group2).
Area under the curve: 0.7328
95% CI: 0.6171-0.8485 (DeLong)
$b
Call:
roc.formula(formula = outcome ~ b, data = ROC, aur = TRUE, ci = TRUE,     levels = c("group1", "group2"), direction = ">")

Data: b in 40 controls (outcome group1) > 32 cases (outcome group2).
Area under the curve: 0.8234
95% CI: 0.7303-0.9165 (DeLong)
$c
Call:
roc.formula(formula = outcome ~ c, data = ROC, aur = TRUE, ci = TRUE,     levels = c("group1", "group2"), direction = ">")

Data: c in 40 controls (outcome group1) > 32 cases (outcome group2).
Area under the curve: 0.9242
95% CI: 0.8679-0.9805 (DeLong)

3.利用ggplot2绘图

library(ggplot2)
pa<- ggroc(smooth$a,
       legacy.axes = TRUE # 将X轴改为0-1,(默认是1-0)
       )+
   geom_segment(aes(x = 0, xend = 1, y = 0, yend = 1),
                color="darkgrey", linetype=4)+
 theme_bw() +# 设置背景
 ggtitle('a-ROC')
pb<- ggroc(smooth$b, legacy.axes = TRUE)+geom_segment(aes(x = 0, xend = 1, y = 0, yend = 1), color="darkgrey", linetype=4)+theme_bw() +ggtitle('b-ROC')
pc<- ggroc(smooth$c, legacy.axes = TRUE)+geom_segment(aes(x = 0, xend = 1, y = 0, yend = 1), color="darkgrey", linetype=4)+theme_bw() +ggtitle('c-ROC')
cowplot::plot_grid(pa,pb,pc,labels = "AUTO",nrow = 1)

4.合并多个ROC曲线结果

ggroc(smooth, legacy.axes = TRUE)+
    geom_segment(aes(x = 0, xend = 1, y = 0, yend = 1), color="darkgrey", linetype=4)+
    theme_bw()+ggtitle('ROC')+ggsci::scale_color_lancet()+
    annotate("text",x=0.75,y=0.125,label=paste("a-AUC = ", round(res$a$auc,3)))+
    annotate("text",x=0.75,y=0.25,label=paste("b-AUC = ", round(res$b$auc,3)))+
    annotate("text",x=0.75,y=0.375,label=paste("c-AUC = ", round(res$c$auc,3)))

到此这篇关于R语言实现漂亮的ROC图的文章就介绍到这了,更多相关R语言 ROC图内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • 用R语言绘制ROC曲线的实例讲解

    1 roc曲线的意义 ROC曲线就是用来判断诊断的正确性,最理想的就是曲线下的面积为1,比较理想的状态就是曲线下的面积在0.8-0.9之间,0.5的话对实验结果没有什么影响. 如图: 2代码部分 install.packages("pROC") install.packages("ggplot2") library(pROC) library(ggplot2) #建立曲线 data(aSAH) rocobj1<-roc(aSAHo u t c o m e ,

  • 详解R语言中生存分析模型与时间依赖性ROC曲线可视化

    R语言简介 R是用于统计分析.绘图的语言和操作环境.R是属于GNU系统的一个自由.免费.源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具. 人们通常使用接收者操作特征曲线(ROC)进行二元结果逻辑回归.但是,流行病学研究中感兴趣的结果通常是事件发生时间.使用随时间变化的时间依赖性ROC可以更全面地描述这种情况下的预测模型. 时间依赖性ROC定义 令 Mi为用于死亡率预测的基线(时间0)标量标记. 当随时间推移观察到结果时,其预测性能取决于评估时间 t.直观地说,在零时间测量的标记值应该

  • R语言利用caret包比较ROC曲线的操作

    说明 我们之前探讨了多种算法,每种算法都有优缺点,因而当我们针对具体问题去判断选择那种算法时,必须对不同的预测模型进行重做评估. 为了简化这个过程,我们使用caret包来生成并比较不同的模型与性能. 操作 加载对应的包与将训练控制算法设置为10折交叉验证,重复次数为3: library(ROCR) library(e1071) library("pROC") library(caret) library("pROC") control = trainControl(

  • R语言逻辑回归、ROC曲线与十折交叉验证详解

    自己整理编写的逻辑回归模板,作为学习笔记记录分享.数据集用的是14个自变量Xi,一个因变量Y的australian数据集. 1. 测试集和训练集3.7分组 australian <- read.csv("australian.csv",as.is = T,sep=",",header=TRUE) #读取行数 N = length(australian$Y) #ind=1的是0.7概率出现的行,ind=2是0.3概率出现的行 ind=sample(2,N,rep

  • R语言实现漂亮的ROC图效果

    目录 1.读取数据 2.AUC和CI的计算 3.利用ggplot2绘图 4.合并多个ROC曲线结果 pROC是一个专门用来计算和绘制ROC曲线的R包,目前已被CRAN收录,因此安装也非常简单,同时该包也兼容ggplot2函数绘图,本次就教大家怎么用pROC来快速画出ROC图.在医学领域主要用于判断某种因素对于某种疾病的诊断是否有诊断价值.什么是ROC曲线和AUC,以及如何去看ROC曲线的结果,可以这样总结:ROC曲线呢,其实就是每个对应的cutoff值都有一个对应的真阳性率(纵坐标)和假阳性率(

  • R语言开发之输出折线图的操作

    线形图是通过在多个点之间绘制线段来连接一系列点所形成的图形,这些点按其坐标(通常是x坐标)的值排序,并且它通常用于识别数据趋势. 在R中的通过使用plot()函数来创建线形图,语法如下: plot(v,type,col,xlab,ylab) 参数描述如下: v - 是包含数值的向量. type - 取值"p"表示仅绘制点,"l"表示仅绘制线条,"o"表示仅绘制点和线. xlab - 是x轴的标签. ylab - 是y轴的标签. main - 是图

  • R语言编程学习绘制动态图实现示例

    在讨论级数时,可能需要比对前 n n n项和的变化情况,而随着 n n n的递增,通过动态图来反映这种变化会更加直观,而通过R语言绘制动态图也算是一门不那么初级的技术,所以在此添加一节,补充一下R语言的绘图知识. 绘图需要用到ggplot2,为多张图加上时间轴则需要用到gganimate,为了让这些动态图片被渲染,需要用到av.此外,ggplot2绘图需要输入的数据格式为tibble. install.packages("ggplot2") install.packages("

  • R语言绘制数据可视化小提琴图画法示例

    目录 Step1. 绘图数据的准备 Step2. 绘图数据的读取 Step3. 绘图所需package的安装.调用 Step4. 绘图 小提琴图之前已经画过了,不过最近小仙又看到一种貌美的画法,决定复刻一下.文献中看到的图如下: Step1. 绘图数据的准备 首先要把你想要绘图的数据调整成R语言可以识别的格式,建议大家在excel中保存成csv格式.作图数据如下: Step2. 绘图数据的读取 data<-read.csv("your file path", header = T

  • R语言绘制line plot线图示例详解

    目录 Step1.绘图数据的准备 Step2.绘图数据的读取 Step3.绘图所需package的安装.调用 Step4.绘图 最近小仙同学在Nature Cell Biology上看到了这样一张图,很常见的折线图画成这个样子——原来很常见的图标类型也可以“焕发新春”! 今天小仙同学就尝试用R复刻一张类似的折线图. Step1. 绘图数据的准备 首先要把你想要绘图的数据调整成R语言可以识别的格式,建议大家在excel中保存成csv格式.数据的格式如下图:一列表示一种变量,最后一列是每一行的行名.

  • R语言绘制数据可视化小提琴图Violin plot with dot画法

    目录 Step1.绘图数据的准备 Step2.绘图数据的读取 Step3.绘图所需package的安装.调用 Step4.绘图 小提琴图之前已经画过了,不过最近小仙又看到一种貌美的画法,决定复刻一下.文献中看到的图如下: Step1. 绘图数据的准备 首先要把你想要绘图的数据调整成R语言可以识别的格式,建议大家在excel中保存成csv格式.作图数据如下: Step2. 绘图数据的读取 data<-read.csv("your file path", header = T) #注

  • R语言利用ggplot2绘制QQ图和箱线图详解

    目录 绘制qq图 函数介绍 例子 绘制boxplot 函数介绍 例子 利用分位点绘制箱线图 将QQ图和箱线图进行融合 函数介绍 参数介绍 注意事项 例子 绘制qq图 在ggplot2中绘制qq图需要两步,geom_qq()将绘制样本分位点,geom_qq_line()将绘制标准正态线 函数介绍 geom_qq() geom_qq( mapping = NULL, data = NULL, geom = "point", position = "identity",

  • R语言ComplexHeatmap绘制复杂热图heatmap

    目录 一 载入R包 数据 1.1 载入ComplexHeatmap包,数据 1.2 绘制最简单的热图 二 常见“表型”注释 读入注释文件 2.1 添加注释,且设置颜色 三 添加“块”注释 3.1 k-means指定K个数 3.2 先验知识知道样本分为几个簇 3.3 根据富集结果添加行注释 四 目标基因分析 4.1 标签展示目标基因 4.2 绘制目标基因热图 ComplexHeatmap|绘制单个热图介绍了单个热图绘制的内容 一 载入R包 数据 1.1 载入ComplexHeatmap包,数据 为

  • R语言 实现将两张图放在同一张画布

    我就废话不多说了,大家还是直接看代码吧~ ts1<-ts(test_data$tot_num,frequency = 365,start=c(2017,11,21)) plot(ts1,col='blue',lty='dotted',ylim=c(50,550)) par(new=TRUE) ts2<-ts(test_data$pre_result,frequency = 365,start=c(2017,11,21)) plot(ts2,col='red',ylim=c(50,550)) 好

随机推荐