生存分析之Cox比例风险模型

如题所述

第1个回答  2022-06-10

之前文章 介绍了Kaplan-Meier生存曲线分析,Kaplan-Meier模型除了展示预后状况,也可以用log-rank法检测是否分组预后有显著差异。cox比例风险模型则适合衡量具体某一因素对生存的影响程度,用HR(hazard ratio)值体现,HR是某一因素影响生存的比率。cox模型公式如下。

HR值对应含义如下

不过我们不只看HR值,还要看95%CI即95%置信度区间,如果95%CI跨越了1,一般就不认为该因素对生存有显著影响。另外要提示的是HR值受 输入值的规模 (身高用CM为单位还是M为单位)影响,所以如果得到非常巨大/小的HR结果,要思考自己数据缩放问题。

下面用 lung 数据集分别展示单因素、多因素cox分析。

使用 coxph 函数进行cox回归分析。我们看性别对肺癌预后有多大影响。

用 summary 函数查看结果,其中 coef 是系数beta, exp(coef) 就是HR值,在这里是 0.5880,95%CI是 0.4237 ~ 0.816. P值给3个,如果样本少适合"Likelihood ratio test",如果样本量大,3个方法P值不会差异太多。

如果有多个因素的数据,进行多因素cox回归是适合的。也同样使用 coxph 和 summary 函数。

可以看到性别因素sex是显著影响生存预后的,但是年龄因素age(HR:1.013, P:0.171, 95%CI:0.9945~1.0318)不是。然后使用 ggforest 函数直接画出森林图。

图片如下,效果有点复古。也可以自己手动画森林图,95%CI用线段(geom_segment)表示,HR值用点(geom_point)然后颜色表示P值即可。

参考
Cox Proportional-Hazards Model - Easy Guides - Wiki - STHDA
Drawing Survival Curves using 'ggplot2' • survminer

相似回答