Cox比例风险模型

如题所述

第1个回答  2023-09-07

Cox回归模型,又称“比例风险回归模型(proportional hazards model)”,简称Cox回归。它是一种研究相关因素对于生存时间影响的回归模型,其已在医疗,金融和市场研究等专业领域中广泛使用。比如医学研究中,新药物使用是否会有效的增加癌症病人的存活时间;企业创始人能力素质对于企业生存时间的影响关系研究等。

当前某研究人员拟观察一种新型癌症药物的疗效情况,首先将50名癌症患者随机分成两组,对照组使用传统治疗方式,实验组使用新式药物治疗方式。并且随访时间为2年。并且以是否死亡为作为结局。希望通过研究了解到新式药物是否对于生存时间带来影响,同时性别和年龄有可能对于生存时间产生影响,因而性别和年龄也考虑在内。

Cox回归的目的在于研究X对于Y的影响,而此处的Y需要使用2项表示,分别为生存态度和生存时间,简单地讲即需要同时考虑结局(死亡)是否发生,同时还需要考虑结局发生的时间。

比如从当前时间点到2年后的随访,有可能患者仅生成4周,也有可能生成20周,更有可能在2年后依然存活,此处的生存时间即为存活的时间长度。同时还需要单独用一项表示生存状态,分别用数字1和0表示,1表示死亡,0表示生存。

可以使用SPSSAU进行分析:

结果如下:

上表格为模型似然比检验结果,似然比检验原假设为是否放入自变量两类模型质量均一致;从上表可知,模型拒绝原定假设(χ2=8.725,p =0.033 <0.05),即说明本次构建模型时,放入的自变量具有有效性,本次模型构建有意义。

从上表可知,将药物组别作为自变量进行cox回归研究,模型公式为:ln[h(t,X)/h0(t)]=-1.171*药物组别 (ln代表取对数,h0(t)代表基准风险率)。最终具体分析可知:药物组别的回归系数值为-1.171,并且呈现出0.01水平的显著性(z =-2.587,p =0.010 < 0.01),意味着药物组别会对生存时间(周)产生显著的负向影响关系。以及相对危险度(HR值)为0.310(95% CI:0.128~0.753),意味着相对于传统治疗,新式药物的死亡风险为传统治疗的0.310倍。

第2个回答  2022-07-31

Cox比例风险模型(Cox, 1972)本质上是统计学回归模型,医学研究中常用于调查患者生存时间与一个或多个预测变量之间的关系。

生存分析的步骤:

Kaplan-Meier曲线和log-rank检验是单因素分析。在研究中,只研究一个因素的影响,进而忽略了其他因素的影响。

此外,Kaplan-Meier曲线和log-rank检验只有在预测变量是分类的情况下才有用(例如:治疗A vs治疗B;男性和女性)。对于基因表达、体重或年龄等定量预测指标,它们并不能很好的分析。

这儿要提出一种新的方法,那就是Cox比例风险回归分析,既适用于定量预测变量,也适用于分类变量。

Cox回归模型不仅适用于离散或连续性变量,还可以同时评估多个危险因素对生存时间的影响。

Cox比例风险模型可同时评估多个因子对生存的影响。在特定时间点事件发生的概率就是风险概率( hazard rate),预测风险概率的因素被称为协变量。

Cox模型用风险函数h(t)表示。简单地说,风险函数可以解释为t时刻的死亡风险,可以用下面方程计算:

exp(bi)称为危险比(HR)。bi>0的风险比,表明随着第i个协变量的值的增加,事件风险增加,因此生存时间缩短。换句话说,风险比大于1表示协变量与事件概率正相关,因此与生存时间负相关。

如果存在两个病人 k 和k’,各自风险函数和风险函数比例如下:

换句话说,如果一个人在最初的某个时间点的死亡风险是另一个人的两倍,那么在以后的所有时间里,死亡风险仍然是另一个人的两倍。

survival 包中 coxph ()可以用于构建Cox比例风险回归模型。

formula: 为以生存对象为响应变量的线性模型。函数Surv()创建生存对象,如:Surv(时间,事件)。

Data: 包含变的数据框。

method: 默认efron, 还有‘breslow’ 和 ‘exact’.

示例

对协变量: age, sex, ph.ecog and wt.loss, 首先进行单变量Cox分析; 然后我们将使用两个变量进行多变量cox分析来探究这些因素是如何共同影响生存的。

## 单变量Cox回归

## 对每个协变量进行单因素cox分析。

上面的结果显示了回归系数、效应量(以风险比表示)和每个变量在总体生存率方面的统计显著性。通过单独的单变量Cox回归来评估每个因素对生存的影响。

现在,我们想要研究这些因素是如何共同影响生存的。为了回答这个问题,我们将进行多元Cox回归分析。由于ph.karno在单变量Cox分析中不显著,将在多变量分析中剔除它。我们将把3个因素(性别、年龄和博士)纳入多元模型。

## 多元回归分析

三种检验中(likelihood, Wald和score)的p值都是显著的,表明模型是显著的。这些检验基于的无效假设是所有beta (β)是0。在上面的例子中,无效假设均被拒绝。

多变量Cox分析中,性别和 ph.ecog是显著的(p < 0.05)。但协变量年龄不显著(p = 0.23,大于0.05)。

## 可视化生存时间的估计分布

用Cox模型对数据进行拟合后,就可以在任何给定时间点对特定风险组的预测生存概率进行可视化。函数survfit()估计生存概率,默认情况下是协变量的平均值。

想要评估性别对估计生存概率的影响。在本例中,构造了一个有两行的新数据,每一行代表一个性别值;其他协变量设置为它们的平均值(如果是连续变量)或最低水平(如果是离散变量)。对于一个 虚拟变量(dummy covariate),平均值是数据集中编码为1的比例。

系列文章

相似回答