用R语言绘制ROC曲线的实例讲解

1 roc曲线的意义

ROC曲线就是用来判断诊断的正确性,最理想的就是曲线下的面积为1,比较理想的状态就是曲线下的面积在0.8-0.9之间,0.5的话对实验结果没有什么影响。

如图:

2代码部分

install.packages(“pROC”)
install.packages(“ggplot2”)
library(pROC)
library(ggplot2)
#建立曲线
data(aSAH)
rocobj1<-roc(aSAHo u t c o m e , a S A H outcome,aSAHoutcome,aSAHs100b)
rocobj2<-roc(aSAHo u t c o m e , a S A H outcome,aSAHoutcome,aSAHwfns)
rocobj3<-roc(aSAHo u t c o m e , a S A H outcome,aSAHoutcome,aSAHndka)
#计算full AUC
auc(rocobj1)
auc(rocobj2)
auc(rocobj3)
#绘制曲线
plot(rocobj1)
#其他参数美化
plot(rocobj1,print.auc=TRUE,auc.polygon=TRUE,grid=c(0.1,0.2),grid.col=c(“green”,“red”),max.auc.polygon=TRUE,auc.polygon.col=“skyblue”,print.thres=TRUE)
#计算partial AUC选择关注一定范围数据
plot(rocobj1,print.auc=TRUE,auc.polygon=TRUE,partial.auc=c(0.8,0.4),partial.auc.focus=“sp”,grid=c(0.1,0.2),grid.col=c(“green”,“red”),max.auc.polygon=TRUE,auc.polygon.col=“skyblue”,print.thres=TRUE,reuse.auc=FALSE)
#比较两个曲线,pROC提供三种方法比较“delong”, “bootstrap”或“venkatraman”
roc.test(rocobj1,rocobj2,method = “bootstrap”)
#ggroc(功能仍在测试中)绘制Multiple curves
g3<-ggroc(list(s100b=rocobj,wfns=rocobj2,ndka=rocobj3))
g3
install.packages(“pROC”)
library(“pROC”)##roc
data(aSAH)
roc1<-roc(myDatal a b e l , m y D a t a label,myDatalabel,myDatascore)
roc2<-roc(myData2l a b e l , m y D a t a 2 label,myData2label,myData2score)
polt(roc1,col=“blue”)
polt.roc(roc2,add=TRUE,col=“red”)

3 实验结果

补充:R语言proc包绘制多重ROC曲线(信用评分应用,已有label和相应score)

数据:好坏标签label、用四种model简单计算出的每一个样本的score,标记为pre1至pre4,约1w样本

目的:使用proc包绘制ROC曲线,并生成AUC值

1.读入数据

data<-read.csv(file="D:/个人消费信用/第三次上机/工作簿2.csv",header=T)

header=T 即在读取中,将原有数据的第一行设置为变量名。

注意文件的分隔为 “ / ”,与默认不同。

2.画出最基本的ROC曲线

library(pROC) #加载pROC包
roc1<-roc(data$label,data$pre1)
plot(roc1,print.auc=TRUE,plot=TRUE,
print.thres=TRUE)

包含AUC的值和最优临界点,下面把它美化一下~

(问题:为啥横坐标Specificity的范围是1.5到-0.5,查了一下没有找到原因,可能是因为原数据本身的问题,以前以违约概率而非score的时候没有出现这个问题,择日探究……TvT)

3.美化ROC曲线

plot(roc2,print.auc=TRUE,print.auc.x=0.4,print.auc.y=0.4,auc.polygon=TRUE,auc.polygon.col="gray",
smooth=TRUE,
grid=c(0.5, 0.2),
grid.col=c("black", "black"),
max.auc.polygon=TRUE,
print.thres=TRUE,print.thres.cex=0.8,
lty=1,main=" ROC曲线",mfrow=c(1,1)) 

解释在括号里面叠加命令的代码:

print.auc.x=0.4,print.auc.y=0.4 #设置AUC值显示出来的坐标
auc.polygon=TRUE,auc.polygon.col="gray" #设置ROC曲线下填充色,此处设定为灰色
smooth=TRUE #使ROC曲线变得光滑
max.auc.polygon=TRUE #整个图像填充
print.thres.cex=0.8 #设置最优临界点字体的大小
lty=1,main=" ROC曲线",mfrow=c(1,1) #设置标题啥的 mfrow貌似是图形参数,待查……

4.合并ROC曲线

由于共有4个model,所以要想比较模型的优劣,可以将四个ROC曲线画到一起。

roc1<- roc(data$label,data$pre1)
roc2<- roc(data$label,data$pre2)
roc3<- roc(data$label,data$pre3)
roc4<- roc(data$label,data$pre4)
plot(roc1, print.auc=TRUE,print.auc.x=0.4,print.auc.y=0.4, auc.polygon=TRUE,auc.polygon.col="gray", grid=c(0.5, 0.2),smooth=T,grid.col=c("black", "black"), max.auc.polygon=TRUE)
plot.roc(roc2,add=T,col="red", print.auc=TRUE,print.auc.x=0.3,print.auc.y=0.3)
plot.roc(roc3,add=T,col="blue",print.auc=TRUE,print.auc.x=0.5,print.auc.y=0.5)
plot.roc(roc4,add=T,col="yellow",print.auc=TRUE,print.auc.x=0.6,print.auc.y=0.6)

由于此处要显示AUC值,且不要重合~所以在后面加上了print.auc=TRUE,print.auc.x=0.6,print.auc.y=0.6的命令。

如果不重合的话,直接在roc1下面加上下列代码即可:

plot.roc(roc2,add=T,col="red")

由于原有数据的问题,这里的四条ROC曲线几乎重合~但此处只是介绍pROC包绘制ROC曲线的用法。就不要太在意辽!

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。如有错误或未考虑完全的地方,望不吝赐教。

(0)

相关推荐

  • python 如何在 Matplotlib 中绘制垂直线

    介绍 Matplotlib是Python中使用最广泛的数据可视化库之一.Matplotlib的受欢迎程度大部分来自其自定义选项.您可以调整其对象层次结构中的几乎任何元素. 在本教程中,我们将研究如何在Matplotlib图上绘制垂直线,这使我们能够标记和突出显示图的某些区域,而无需缩放或更改轴范围. 创建图 让我们首先用一些随机数据创建一个简单的图: import matplotlib.pyplot as plt import numpy as np fig, ax = plt.subplots

  • python3使用diagrams绘制架构图的步骤

    技术背景 对于一个架构师或者任何一个软件工程师而言,绘制架构图都是一个比较值得学习的技能.这就像我们学习的时候整理的一些Xmind那种思维逻辑图一样,不仅可以帮我们看到组件之间的联系和层级,还能够展示出组件的全貌.虽然我们也可以用Visio或者Edraw等专业绘图工具来绘制架构图,但是对于工程师而言,用代码来直接绘制架构图,会显得更加的优雅.这里我们介绍的diagrams,就是一个可以用来绘制架构图的python包. diagrams的安装 与其他python库一样的,diagrams也可以通过

  • 详解CocosCreator优化之DrawCall

    前言 在游戏开发中,DrawCall 作为一个非常重要的性能指标,直接影响游戏的整体性能表现. 无论是 Cocos Creator.Unity.Unreal 还是其他游戏引擎,只要说到游戏性能优化,DrawCall 都是绝对少不了的一项. 本文将会介绍什么是 DrawCall,为什么要减少 DrawCall 以及在 Cocos Creator 项目中如何减少 DrawCall 来提升游戏性能. 什么是 DrawCall DrawCall就是CPU调用图形库(比如DirectX或OpenGL)的图

  • CocosCreator实现技能冷却效果

    CocosCreator实现技能CD效果 在很多游戏里面都有技能,玩家在点击技能按钮后技能会有一个冷却的时间,当冷却时间过了之后技能才可以再次使用 在cocos中实现这个效果很简单,需要用到精灵组件 首先将技能按钮的图片拖到canvas下 然后在技能按钮下新建一个label 像这样 然后新建TS脚本把下面的代码复制粘贴进去 const {ccclass, property} = cc._decorator; @ccclass export default class NewClass exten

  • 详解CocosCreator华容道数字拼盘

    前言 华容道是啥玩意? 这种数字拼图游戏大家都玩过吧,他就是典型的华容道之一. 华容道是古老的中国民间益智游戏,以其变化多端.百玩不厌的特点与魔方.独立钻石棋一起被国外智力专家并称为"智力游戏界的三个不可思议". 今天咱们就来了解一下这个华容道. 正文 今天咱们主要以3*3的布局来进行,菜鸟用cocos creator 写了一个简单的demo,下面咱们逐步说一下 1.面板 首先咱们随机生成一个面板排列 2.华容道求解 思路: 穷举法:大家都知道这种游戏的玩法,滑动其中可以滑动的方格,将

  • 详解CocosCreator游戏之鱼群算法

    前言 最近想学一下CocosCreator,于是,编辑器下载,启动. 众所周知,边写边学才是最快的学习方法,得写个Demo练练手,那么写什么呢?听说现在<墨虾探蝌>挺火的,那就抄(学习的事怎么能叫抄呢?)写一个类似的小游戏吧! (在<墨虾探蝌>中,鱼的位置固定,到达一定数量后玩家会升级,不会出现一大群鱼的情况,本项目其实和它不同,没有升级进化,是会有一大群鱼的,每条鱼也不是固定位置,而是有自己的运动逻辑,其实和另一个游戏更像,不过我不知道叫什么...) 效果展示: 正文 首先整一个

  • Python绘制的爱心树与表白代码(完整代码)

    Python给女朋友带来的快乐 用的的开发工具为pycham,pycham也是广泛用于做Python开发的工具.运用的turtle库,当然了如果是安装了anaconda3这个库那更好,以为这里面有我们会做Python程序设计时用到的大部分的库,turtle它是python中一个绘制图像的函数库,可以用它来绘制很多的东西,比如简单的小黄人.玫瑰花等,这个库也可以生说是一只马良的神笔的吧.比如以下是为女朋友准备的小小的惊喜吧. 1.爱心树 import turtle import random de

  • python opencv常用图形绘制方法(线段、矩形、圆形、椭圆、文本)

    最近学了下 python opencv,分享下使用 opencv 在图片上绘制常用图形的方法. 案例中实现了在图片中添加线段.圆形.矩形.椭圆形以及添加文字的方法,使用 opencv2 实现的. 实现方法 1)画线段 cv.line 在图片中绘制一段直线 # 绘制线段 # 参数1:图片 # 参数2:起点 # 参数3:终点 # 参数4:BGR颜色 # 参数5:宽度 cv2.line(img, (60, 40), (90, 90), (255, 255, 255), 2); 参数说明 参数 值 说明

  • 如何在CocosCreator里画个炫酷的雷达图

    前言 雷达图(Radar Chart) 也称为网络图.星图或蜘蛛网图. 是以从同一点开始的轴上表示的三个或更多个定量变量的二维图表的形式显示多元数据的图形方法. 适用于显示三个或更多的维度的变量. 雷达图常用于

  • 用R语言绘制ROC曲线的实例讲解

    1 roc曲线的意义 ROC曲线就是用来判断诊断的正确性,最理想的就是曲线下的面积为1,比较理想的状态就是曲线下的面积在0.8-0.9之间,0.5的话对实验结果没有什么影响. 如图: 2代码部分 install.packages("pROC") install.packages("ggplot2") library(pROC) library(ggplot2) #建立曲线 data(aSAH) rocobj1<-roc(aSAHo u t c o m e ,

  • R语言箱线图创建实例讲解

    箱线图是数据集中的数据分布良好的度量. 它将数据集分成三个四分位数. 此图表表示数据集中的最小值,最大值,中值,第一四分位数和第三四分位数. 它还可用于通过绘制每个数据集的箱线图来比较数据集之间的数据分布. R语言中使用boxplot()函数来创建箱线图. 语法 在R语言中创建箱线图的基本语法是 - boxplot(x, data, notch, varwidth, names, main) 以下是所使用的参数的描述 - x是向量或公式. 数据是数据帧. notch是逻辑值. 设置为TRUE以绘

  • R语言操作X轴日期实例讲解

    R语言操作X轴日期: 需要用到程序包library(lubridate):程序包是在R的安装包C:\R-3.4.4\bin\x64\RGui.exe里根据命令安装的 将日期改为xxxx/xx/01: firstDay='2020/02/12' : 可用 day(firstDay)<-01; //此时firstDay的数据为:'2020/02/01':day()是获取日,month()获取月份,year()获取年份 都需要'lubridate'包 可以通过write.table(firstDay,

  • R语言基础统计方法图文实例讲解

    tidyr > tdata <- data.frame(names=rownames(tdata),tdata)行名作为第一列 > gather(tdata,key="Key",value="Value",cyl:disp,mpg)创key列和value列,cyl和disp放在一列中 -号减去不需要转换的列 > spread(gdata,key="Key",value="Value") 根据value将

  • R语言对CSV文件操作实例讲解

    在 R 语言中,我们可以从存储在 R 语言环境外的文件中读取数据. 我们还可以将数据写入将被操作系统存储和访问的文件. R 语言可以读取和写入各种文件格式,如​csv​,​excel​,​xml​等. 在本章中,我们将学习从​csv​文件读取数据,然后将数据写入​csv​文件. 该文件应该存在于当前工作目录中,以便 R 语言可以读取它. 当然我们也可以设置我们自己的目录并从那里读取文件. 获取和设置工作目录 您可以使用​getwd()​函数检查R语言工作区指向的目录. 您还可以使用​setwd(

  • R语言绘制空间热力图实例讲解

    先上图 R语言的REmap包拥有非常强大的空间热力图以及空间迁移图功能,里面内置了国内外诸多城市坐标数据,使用起来方便快捷. 开始首先安装相关包 install_packages("devtools") install_packages("REmap") library(devtools) library(REmap) 我们来试试其强大的城市坐标获取功能 city<- c("beijing","上海") get_geo_

  • R语言绘制地图实例讲解

    setwd("C:/Users/75377/Desktop/SHEEP_ROH") png("12.png",width = 7000,height = 5500,pointsize = 170) par(mai = c(12,12,12,12),mgp = c(2.1,0.5,0)) #地图数据下载http://cos.name/wp-content/uploads/2009/07/chinaprovinceborderdata_tar_gz.zip librar

  • R语言绘制散点图实例分析

    散点图显示在笛卡尔平面中绘制的许多点. 每个点表示两个变量的值. 在水平轴上选择一个变量,在垂直轴上选择另一个变量. 使用plot()函数创建简单散点图. 语法 在R语言中创建散点图的基本语法是 - plot(x, y, main, xlab, ylab, xlim, ylim, axes) 以下是所使用的参数的描述 - x是其值为水平坐标的数据集. y是其值是垂直坐标的数据集. main要是图形的图块. xlab是水平轴上的标签. ylab是垂直轴上的标签. xlim是用于绘图的x的值的极限.

  • R语言绘制折线图实例分析

    折线图是通过在它们之间绘制线段来连接一系列点的图. 这些点在它们的坐标(通常是x坐标)值之一中排序. 折线图通常用于识别数据中的趋势. R语言中的plot()函数用于创建折线图. 语法 在R语言中创建折线图的基本语法是 - plot(v,type,col,xlab,ylab) 以下是所使用的参数的描述 - v是包含数值的向量. 类型采用值"p"仅绘制点,"l"仅绘制线和"o"绘制点和线. xlab是x轴的标签. ylab是y轴的标签. main是

  • R语言绘制直方图实例讲解

    直方图表示被存储到范围中的变量的值的频率. 直方图类似于条形图,但不同之处在于将值分组为连续范围. 直方图中的每个柱表示该范围中存在的值的数量的高度. R语言使用hist()函数创建直方图. 此函数使用向量作为输入,并使用一些更多的参数来绘制直方图. 语法 使用R语言创建直方图的基本语法是 hist(v,main,xlab,xlim,ylim,breaks,col,border) 以下是所使用的参数的描述 v是包含直方图中使用的数值的向量. main表示图表的标题. col用于设置条的颜色. b

随机推荐