生存分析与R】的更多相关文章

生存分析与R 2018年05月19日 19:55:06 走在码农路上的医学狗 阅读数:4399更多 个人分类: R语言   版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/weixin_40466280/article/details/80377317 生存分析与R 生存分析是将事件的结果和出现这一结果所经历的时间结合起来分析的一类统计分析方法.不仅考虑事件是否出现,而且还考虑事件出现的时间长短,因此这类方法也被称为事件时间分析(time-to-…
原创博客,未经允许,不得转载. 生存分析,survival analysis,顾名思义是用来研究个体的存活概率与时间的关系.例如研究病人感染了病毒后,多长时间会死亡:工作的机器多长时间会发生崩溃等.  这里“个体的存活”可以推广抽象成某些关注的事件. 所以SA就成了研究某一事件与它的发生时间的联系的方法.这个方法广泛的用在医学.生物学等学科上,近年来也越来越多人用在互联网数据挖掘中,例如用survival analysis去预测信息在社交网络的传播程度,或者去预测用户流失的概率. R里面有很成熟…
本文首发于“生信补给站”:https://mp.weixin.qq.com/s/lpkWwrLNtkLH8QA75X5STw 生存分析作为分析疾病/癌症预后的出镜频率超高的分析手段,而其结果展示的KM曲线也必须拥有姓名和颜值! 生存分析相关推文: 生存分析和KM曲线:R|生存分析(1) 分析结果一键输出:R|生存分析-结果整理 时间依赖生存分析:R|timeROC-分析 一 数据和R包 为方便,使用内置lung数据集 #载入所需的R包library("survival")library…
生存分析与R 生存分析是将事件的结果和出现这一结果所经历的时间结合起来分析的一类统计分析方法.不仅考虑事件是否出现,而且还考虑事件出现的时间长短,因此这类方法也被称为事件时间分析(time-to-event analysis).生存分析是医学领域中一个重要的内容,在肿瘤等疾病的研究中运用十分广泛. 1.生存分析中的重要概念 生存分析的数据资料与其它一般的数据资料有一些不同的特征: 1. 其同时考虑生存时间和生存结局 2. 通常存在删失(censored)数据 3. 生存时间通常不服从生态分布.…
生存分析指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析或存活率分析.常用于肿瘤等疾病的标志物筛选.疗效及预后的考核. 简单地说,比较两组或多组人群随着时间的延续,存活个体的比例变化趋势.活着的个体越少的组危险性越大,对应的基因对疾病影响越大,对应的药物治疗效果越差. 生存分析适合于处理时间-事件数据,如下 生存时间数据有两种类型: 完全数据 (complete data)指被观测对象从观察起点到出现终点事件所…
今天被粉丝发的文章给难住了,又偷偷去学习了一下竞争风险模型,想起之前写的关于竞争风险模型的做法,真的都是皮毛哟,大家见笑了.想着就顺便把所有的生存分析的知识和R语言的做法和论文报告方法都给大家梳理一遍. 什么时候用生存分析 当你关心结局和结局发生时间的时候,就要考虑生存分析了,这种既有结局又有时间的数据叫做生存数据,英文叫做Time-to-event data. 只不过因为这个方法医学上用来分析存活情况用的多,所以得名生存分析,反正你就记住一个例子,我要研究汽车发生故障,我也应该用生存分析,因为…
参考:<复杂数据统计方法--基于R的应用> 吴喜之 在生存分析中,研究的主要对象是寿命超过某一时间的概率.还可以描述其他一些事情发生的概率,例如产品的失效.出狱犯人第一次犯罪.失业人员第一次找到工作.青少年第一次吸毒等等. 生存函数S(t): S(t)=P(T>t)=1-P(T<=t),t>0 T:表示寿命的随机变量 t:特定时间 综合生存函数图:用到包survival 案例:口腔癌数据 实验分成两组: TX=1:仅放疗 TX=2:放疗+化疗 #读取数据 u=read.csv…
在spark.ml中,实现了加速失效时间(AFT)模型,这是一个用于检查数据的参数生存回归模型. 它描述了生存时间对数的模型,因此它通常被称为生存分析的对数线性模型. 不同于为相同目的设计的比例风险模型,AFT模型更容易并行化,因为每个实例独立地贡献于目标函数. 当在具有常量非零列的数据集上匹配AFTSurvivalRegressionModel而没有截距时,Spark MLlib为常量非零列输出零系数. 这种行为不同于R survival :: survreg. 导入包 import org.…
本文首发于“生信补给站”微信公众号,https://mp.weixin.qq.com/s/2W1W-8JKTM4S4nml3VF51w 更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号,给您干货. Meta分析的结果使用森林图进行可视化展示很常见,其实COX生存分析也能用森林图展示. 之前分享过绘制KM曲线R|生存分析(1),诺莫图展示COX结果Nomogram(诺莫图) | Logistic.Cox生存分析结果可视化,本文将简单的介绍如何使用R-survminer包绘制Cox生…
WOE:信用评分卡模型中的变量离散化方法 2016-03-21 生存分析 在做回归模型时,因临床需要常常需要对连续性的变量离散化,诸如年龄,分为老.中.青三组,一般的做法是ROC或者X-tile等等.今天介绍一种在信用卡评分系统中常用的连续变量离散化方法.目的是给大家在临床数据分析中提供一种借鉴思路. 最初接触信用卡评分系统是在2013年SAS中国数据分析大赛总决赛上,题目是用历史数据建立一个信用卡评分系统,其中的变量离散化技术主要用到WOE(Weight of Evidence)翻译过来叫证据…