# 安装包
if (!requireNamespace("data.table", quietly = TRUE)) {
install.packages("data.table")
}
if (!requireNamespace("jsonlite", quietly = TRUE)) {
install.packages("jsonlite")
}
if (!requireNamespace("pROC", quietly = TRUE)) {
install.packages("pROC")
}
if (!requireNamespace("ggplotify", quietly = TRUE)) {
install.packages("ggplotify")
}
# 加载包
library(data.table)
library(jsonlite)
library(pROC)
library(ggplotify)ROC 曲线
注记
Hiplot 网站
本页面为 Hiplot ROC 插件的源码版本教程,您也可以使用 Hiplot 网站实现无代码绘图,更多信息请查看以下链接:
接收者工作特征曲线(ROC 曲线)是用来说明二元分类器系统在其识别阈值变化时诊断能力的图形。
环境配置
系统: Cross-platform (Linux/MacOS/Windows)
编程语言: R
依赖包:
data.table;jsonlite;pROC;ggplotify
sessioninfo::session_info("attached")─ Session info ───────────────────────────────────────────────────────────────
setting value
version R version 4.5.2 (2025-10-31)
os Ubuntu 24.04.3 LTS
system x86_64, linux-gnu
ui X11
language (EN)
collate C.UTF-8
ctype C.UTF-8
tz UTC
date 2026-01-27
pandoc 3.1.3 @ /usr/bin/ (via rmarkdown)
quarto 1.8.27 @ /usr/local/bin/quarto
─ Packages ───────────────────────────────────────────────────────────────────
package * version date (UTC) lib source
data.table * 1.18.0 2025-12-24 [1] RSPM
ggplotify * 0.1.3 2025-09-20 [1] RSPM
jsonlite * 2.0.0 2025-03-27 [1] RSPM
pROC * 1.19.0.1 2025-07-31 [1] RSPM
[1] /home/runner/work/_temp/Library
[2] /opt/R/4.5.2/lib/R/site-library
[3] /opt/R/4.5.2/lib/R/library
* ── Packages attached to the search path.
──────────────────────────────────────────────────────────────────────────────
数据准备
示例数据为一列二分类变量的结局和三列不同变量(诊断指标)及其数值。
# 加载数据
data <- data.table::fread(jsonlite::read_json("https://hiplot.cn/ui/basic/roc/data.json")$exampleData$textarea[[1]])
data <- as.data.frame(data)
# 整理数据格式
name_val <- colnames(data)[2:ncol(data)]
num_value <- ncol(data) - 1
# 查看数据
head(data) outcome value-Am value-GG value-EL
1 Good 3 0.33 17.30
2 Good 2 0.11 12.71
3 Good 4 0.28 9.44
4 Good 2 0.07 11.07
5 Good 1 0.10 19.46
6 Good 4 0.32 10.83
可视化
# ROC 曲线
col <- c("#00468BFF","#ED0000FF","#42B540FF")
p <- as.ggplot(function() {
for (i in 1:num_value) {
if (i == 1) {
roc_data <- roc(data[, 1], data[, i + 1],
percent = T, plot = T, grid = T, lty = i, quiet = T,
print.auc = F, col = col[i], smooth = F,
main = "ROC Plot"
)
text(30, 50, "AUC", font = 2, col = "darkgray")
text(30, 50 - 10 * i,
paste(name_val[i], ":", sprintf("%0.4f", as.numeric(roc_data$auc))),
col = col[i]
)
} else {
roc_data <- roc(data[, 1], data[, i + 1],
percent = T, plot = T, grid = T, add = T, lty = i, quiet = T,
print.auc = F, col = col[i]
)
text(30, 50 - 10 * i,
paste(name_val[i], ":", sprintf("%0.4f", as.numeric(roc_data$auc))),
col = col[i]
)
}
}
})
p
横轴表示特异性,纵轴表示敏感性,二者之间没有函数关系。曲线越靠近左上角,认为该诊断指标预测能力越好。图示中每种颜色表示一个变量(诊断指标),蓝色曲线和红色曲线的预测能力明显较绿色曲线好。AUC 为 ROC 曲线下面积。AUC = 1 表示该曲线存在至少一个阈值能得出完美预测。0.5 < AUC < 1,优于随机猜测,妥善选择阈值,能有预测价值。AUC = 0.5,跟随机猜测一样,模型没有预测价值。若 AUC < 0.5,可能原因是二分类变量如(0,1)与结局设置颠倒,调换结局赋值即可。在本图示中,value-Am (86.9792) > value-GG (84.3750) > value-EL (56.7708),可以认为 Am 变量的预测能力最好。
