本文首发于“生信补给站”:https://mp.weixin.qq.com/s/lpkWwrLNtkLH8QA75X5STw

生存分析作为分析疾病/癌症预后的出镜频率超高的分析手段,而其结果展示的KM曲线也必须拥有姓名和颜值

生存分析相关推文:

生存分析和KM曲线:R|生存分析(1)

分析结果一键输出:R|生存分析-结果整理

时间依赖生存分析:R|timeROC-分析

一 数据和R包

为方便,使用内置lung数据集

  1. #载入所需的R包
    library("survival")
    library("survminer")
    #载入并查看数据集
    data("lung")
    head(lung)
     inst time status age sex ph.ecog ph.karno pat.karno meal.cal wt.loss
    1    3  306      2  74   1       1       90       100     1175      NA
    2    3  455      2  68   1       0       90        90     1225      15
    3    3 1010      1  56   1       0       90        90       NA      15
    4    5  210      2  57   1       1       90        60     1150      11
    5    1  883      2  60   1       0      100        90       NA       0
    6   12 1022      1  74   1       1       50        80      513       0

二 原生KM曲线

  1. #构建模型
    fit <- survfit(Surv(time, status) ~ sex, data=lung)

#绘制原生KM曲线

  1. plot(fit)

可以很容易的发现与文献中的差异,可优化:

1)区分两条线的颜色和legend

2)坐标轴,标题,主题优化

3)Risk table

4)P值,OR值,CI值等注释信息

三 优化KM曲线

1 survminer绘制KM曲线

  1. p1 <- ggsurvplot(fit)
    P1

呐,线的颜色可以和性别对应起来了,Q1解决!

2 坐标轴,标题,主题优化

  1. p2 <- ggsurvplot(fit, data = lung,
              surv.median.line = "hv", #添加中位生存曲线
              palette=c("red", "blue"),  #更改线的颜色
              legend.labs=c("Sex1","Sex2"), #标签
              legend.title="Treatment",
              title="Overall survival", #标题
              ylab="Cumulative survival (percentage)",xlab = " Time (Days)", #更改横纵坐标
              censor.shape = 124,censor.size = 2,conf.int = FALSE, #删失点的形状和大小
              break.x.by = 100#横坐标间隔
              )
    P2

以上基本就完成了KM曲线颜色,线型大小,标签,横纵坐标,标题,删失点等的修改,Q2搞定!

注意中位生存时间表示50 %的个体尚存活的时间,而不是生存时间的中位数

3 Risk Table

  1. p3 <- ggsurvplot(fit, data = lung,
              surv.median.line = "hv", #添加中位生存曲线
              palette=c("red", "blue"),
              legend.labs=c("Sex1","Sex2"), #标签
              legend.title="Treatment",
              title="Overall survival",
              ylab="Cumulative survival (percentage)",xlab = " Time (Days)", #更改横纵坐标
              censor.shape = 124,censor.size = 2,conf.int = FALSE,
              break.x.by = 100,
              risk.table = TRUE,tables.height = 0.2,
              tables.theme = theme_cleantable(),
              ggtheme = theme_bw())
    p3

注 tables.height可调整为看起来“舒服”的高度

根据risk table 可以看出关键点的当前状态,Q3摆平!

4 添加注释信息

1)添加KM的P值

  1. P4 <- ggsurvplot(fit, data = lung,
              pval = TRUE,#添加P
              pval.coord = c(0, 0.03), #调节Pval的位置
              surv.median.line = "hv", #添加中位生存曲线
              palette=c("red", "blue"),
              legend.labs=c("Sex1","Sex2"), #标签
              legend.title="Treatment",
              title="Overall survival",
              ylab="Cumulative survival (percentage)",xlab = " Time (Days)", #更改横纵坐标
              censor.shape = 124,censor.size = 2,conf.int = FALSE,
              break.x.by = 100,
              risk.table = TRUE,tables.height = 0.2,
              tables.theme = theme_cleantable(),
              ggtheme = theme_bw())
    P4

pval.coord可以调节P值得位置

2)添加COX回归hazard ratio值等相关信息**

  1. ###添加COX回归hazard ratio值相关信息
    res_cox<-coxph(Surv(time, status) ~sex, data=lung)
    p3$plot = p3$plot + ggplot2::annotate("text",x = 50, y = 0.15,
                                label = paste("HR :",round(summary(res_cox)$conf.int[1],2))) + ggplot2::annotate("text",x = 50, y = 0.10,
                       label = paste("(","95%CI:",round(summary(res_cox)$conf.int[3],2),"-",round(summary(res_cox)$conf.int[4],2),")",sep = ""))+
     ggplot2::annotate("text",x = 50, y = 0.05,
                       label = paste("P:",round(summary(res_cox)$coef[5],4)))
    p3

3)添加其他信息

可类似上述annotation得方式,使用ggplot2添加文字,箭头,公式等其他信息,下面为你可能需要的ggplot2的几个知识:

ggplot2|详解八大基本绘图要素

ggplot2|theme主题设置,详解绘图优化-“精雕细琢”

ggplot2 |legend参数设置,图形精雕细琢

ggplot2|ggpubr进行“paper”组图合并

参考资料:

更多参数参见官方文档:https://github.com/kassambara/survminer

◆ ◆ ◆ ◆ ◆

精心整理(含图版)|R语言生信分析,可视化,你要的全拿走,建议收藏!

R|生存分析 - KM曲线 ,值得拥有姓名和颜值的更多相关文章

  1. R生存分析AFT

    γ = 1/scale =1/0.902 α = exp(−(Intercept)γ)=exp(-(7.111)*γ) > library(survival) > myfit=survre ...

  2. 生存分析与R

    生存分析与R 2018年05月19日 19:55:06 走在码农路上的医学狗 阅读数:4399更多 个人分类: R语言   版权声明:本文为博主原创文章,未经博主允许不得转载. https://blo ...

  3. Forest plot(森林图) | Cox生存分析可视化

    本文首发于“生信补给站”微信公众号,https://mp.weixin.qq.com/s/2W1W-8JKTM4S4nml3VF51w 更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号 ...

  4. 生存分析与R--转载

    生存分析与R 生存分析是将事件的结果和出现这一结果所经历的时间结合起来分析的一类统计分析方法.不仅考虑事件是否出现,而且还考虑事件出现的时间长短,因此这类方法也被称为事件时间分析(time-to-ev ...

  5. R数据分析:生存分析与有竞争事件的生存分析的做法和解释

    今天被粉丝发的文章给难住了,又偷偷去学习了一下竞争风险模型,想起之前写的关于竞争风险模型的做法,真的都是皮毛哟,大家见笑了.想着就顺便把所有的生存分析的知识和R语言的做法和论文报告方法都给大家梳理一遍 ...

  6. R语言学习 - 非参数法生存分析--转载

    生存分析指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析或存活率分析.常用于肿瘤等疾病的标志物筛选.疗效及预后的考 ...

  7. survival analysis 生存分析与R 语言示例 入门篇

    原创博客,未经允许,不得转载. 生存分析,survival analysis,顾名思义是用来研究个体的存活概率与时间的关系.例如研究病人感染了病毒后,多长时间会死亡:工作的机器多长时间会发生崩溃等. ...

  8. WOE:信用评分卡模型中的变量离散化方法(生存分析)

    WOE:信用评分卡模型中的变量离散化方法 2016-03-21 生存分析 在做回归模型时,因临床需要常常需要对连续性的变量离散化,诸如年龄,分为老.中.青三组,一般的做法是ROC或者X-tile等等. ...

  9. SPSS数据分析—生存分析

    生存分析是对生存时间进行统计分析的一种技术,所谓生存时间,就是指从某一时间点起到所关心的事件发生的这段时间.这里的时间不一定就是钟表日历上的时间,也有可能是其他的度量单位,比如长度单位等. 生存时间有 ...

随机推荐

  1. Java操作redis客户端Jedis使用

    1.1   jedis介绍 Redis不仅是使用命令来操作,现在基本上主流的语言都有客户端支持,比如java.C.C#.C++.php.Node.js.Go等. 在官方网站里列一些Java的客户端,有 ...

  2. django-crontab使用

    用 django-crontab 为 Django 添加定时任务 需求 做后台开发的时候,有时候会遇到这样的需求,在某个固定时间或者一定时间间隔自动触发某一事件.比如说我有一个需求要求是,周一到周五早 ...

  3. [LC] 159. Longest Substring with At Most Two Distinct Characters

    Given a string s , find the length of the longest substring t  that contains at most 2 distinct char ...

  4. The Pomodoro Technique

    目录 简介 What to solve How to use Some applications 自我总结 结束语 简介 番茄工作法是简单易行的时间管理方法,是由弗朗西斯科·西里洛于1992年创立的一 ...

  5. Linux BASH简单总结

    BASH: 变量的设置规则: 1.变量与变量内容以一个符号"="来链接 2.等号两边不能直接接空白字符 3.变量名称只能是英文字母与数字,但是不能以数字开头 4.变量内容若有空白字 ...

  6. Springmvc+Mybatis+shiro整合

    Apache Shiro是一个强大且易用的Java安全框架,执行身份验证.授权.密码学和会话管理.使用Shiro的易于理解的API,您可以快速.轻松地获得任何应用程序,从最小的移动应用程序到最大的网络 ...

  7. python中字典以key排序,以value排序。以及通过value找key的方式

    1.sorted函数首先介绍sorted函数,sorted(iterable,key,reverse),sorted一共有iterable,key,reverse这三个参数. 其中iterable表示 ...

  8. 关于分频器的FPGA实现整理思路

    分频器是用的最广的一种FPGA电路了,我最初使用的是crazybingo的一个任意分频器,可以实现高精度任意分频的一个通用模块,他的思想在于首先指定计数器的位宽比如32位,那么这个计数器的最大值就是2 ...

  9. c socket 开发测试

    c语言异常 参照他人代码写一个tcp的 socket 开发测试 异常A,在mac osx系统下编译失败,缺库转到debian下. 异常B,include引用文件顺序不对,编译大遍异常 异常C,/usr ...

  10. Cortana携手微软学术搜索,变身研究人员最佳个人助理

    编者按:在美国时间7月14日于微软总部雷蒙德召开的2014年微软教育峰会上,负责技术与研究的微软全球执行副总裁沈向洋博士在他的开幕主题演讲中正式宣布,Windows Phone 8.1系统中的虚拟个人 ...