文章信息
- 周江杰, 王胜锋.
- Zhou Jiangjie, Wang Shengfeng
- 界标模型介绍及在动态预测中的应用
- Introduction of landmarking approach and its application in dynamic prediction
- 中华流行病学杂志, 2022, 43(1): 112-117
- Chinese Journal of Epidemiology, 2022, 43(1): 112-117
- http://dx.doi.org/10.3760/cma.j.cn112338-20210122-00051
-
文章历史
收稿日期: 2021-01-22
以电子病历为代表的电子医疗数据,记录着患者症状、体征、检验检查、诊断和处方等信息,对临床实践有很好的代表性。但利用电子医疗数据构建预测模型时,常面临预测结局随时间变化,预测因素也随时间变化的情况。理想的预测工作应考虑这些因素随时间变化的特性,借由动态预测提高预测准确性。传统的生存分析Cox比例风险回归模型只考虑基线时点的协变量信息,属于静态预测[1-2]。扩展的时依性Cox比例风险回归模型,尽管将随时间变化的因素作为时间依赖性协变量纳入,但仍存在未考虑协变量的测量误差等不足[1, 3]。1997年,有学者提出整合时间依赖性变量与生存结局建立联合模型[4],国内也有学者对该方法进行了介绍[3]。但实际应用时,联合模型存在分析复杂,参数估计较困难的问题[3],同时,对于临床较为常见的患者动态进出,如何估计其随机效应项也仍是一项挑战[1]。2004年,Zheng和Heagerty[5]提出将界标模型用于生存分析的动态预测,由于形式相对简洁、模型拟合耗时显著减少,逐渐得到研究者的关注。目前,已在慢性肾功能疾病[6]、囊性纤维化[7]、乳腺癌[8]、宫颈癌[2]等多个临床领域得到运用。
本研究简要介绍了界标模型的基本原理,并通过案例应用,阐述其在实际应用过程中的步骤和注意事项、比较其与传统Cox模型之间的性能差异,进而为界标模型在纵向生存资料的统计建模中的应用提供参考。
一、界标模型的基本原理界标模型是在界标框架内建立的一类模型的统称。界标框架即利用数据集在某一个时间点(不一定是基线时间)仍处于风险状态的对象进行后续分析的一种思想,最早由Anderson等[9]在肿瘤研究中提出。Zheng和Heagerty[5]首先通过将界标模型用于生存分析的动态预测,并称其为部分条件生存模型(partly conditional survival model),其中“部分”是指该模型进行预测时仅考虑预测时间点及其以前的信息。随后,van Houwelingen[10]对其进行了扩充和完善,主要围绕模型的参数估计算法进行改进。为了更方便读者理解,表 1将传统Cox模型、时依性Cox模型、联合模型与界标模型进行了对比。以单一死亡结局为例(注意对于存在竞争风险较复杂的情况,参见“子分布风险模型”[11-12]),目前界标模型的基本思想如下:
(1)固定一个预测窗口(prediction window)w;
(2)选择一系列界标时点(即预测时点)tLM;
(3)选择在tLM时点仍处于风险状态(at risk)的人群建立预测数据集R(tLM),对tLM+w后发生的所有事件做删失处理;
(4)在每个R(tLM)上建立预测模型,在tLM~tLM+w时段对事件发生的概率进行预测。
据此,当预测模型选择Cox模型时,则得到最基本形式的界标模型:
注意上述基本形式,实际相当于构建了多个独立的Cox模型,这显然并不便于模型解释,因此实践中几乎不用。实际常用的做法是将一系列预测数据集进行拼接,构成一个“超预测数据集”,在此基础上构建“超Cox模型”(super cox model):
其中
该超模型通过引入关于tLM的光滑函数θ(tLM)来描述基线风险函数关于tLM的变化情况,其作用等同于将多个独立的Cox模型组成一个整体。如果更进一步,可以对β同样引入一个光滑函数,描述协变量的时间依赖性效应:
其中
实践中上述光滑函数多采用的是多项式基函数的线性组合形式[2, 7, 13],如β(tLM) = β0 + β1tLM + β2tLM2[2],可以通过尝试多种不同的函数形式并比较对应的模型性能以选出最优的光滑函数。
二、界标模型的参数估计由于模型(6)可以简化到模型(5)与模型(4),以下讨论以最复杂的模型(6)为例。模型(6)的参数估计采用伪部分对数似然函数法(pseudo partial log-likelihood),其似然函数如下[14]:
其中xi为第i次测量的纵向协变量,di为生存状态指示变量,β为协变量系数,θ为描述基线风险变化的光滑函数,γ和η为对应的回归系数向量。
现有的R包survival中的优化算法可以直接应用于上述界标模型的参数估计。针对纵向重复测量数据测量时间不均匀分布的情况,有人指出在参数估计时应当用关于测量时间与tLM差值的核函数(kernel function)对以上似然函数进行加权处理[6]。
三、案例应用通过实例演示界标模型在R中的实现过程,并将界标模型的结果与时依性Cox模型进行对比。
1。数据来源: 测试用数据来自Benelux CML Study Group[15]于1998年完成的一项针对慢性粒细胞白血病患者的随机对照试验,该数据集可通过R包dynpred加载获得(命名为wbc)[14-15]。研究对象为195名慢性髓系白血病(chronic myelogenous leukemia,CML)患者,被随机分配接受羟基脲和干扰素-α两种不同的治疗方案(由于未发现治疗方案对患者总体生存有显著影响,该数据集没有纳入治疗方案变量,另有5名患者未进行白细胞计数测量,亦未纳入此数据集[14])。记录研究开始及之后每1~2个月的白细胞计数测量值。拟考虑利用年龄、Sokal评分[16]、白细胞计数预测4年生存率。其中,白细胞计数是随时间变化的指标,白细胞计数升高是CML的主要特征[17]。Sokal评分为CML患者预后的评估指标,综合年龄、脾脏大小、血小板计数和髓母细胞百分比计算得出,其数值越大提示预后越差。
2。模型构建:
(1)界标模型: 构建界标模型,首先需要对数据进行预处理。该数据集中,患者的最大随访时间为8年,选定界标时间tLM为一从0到4的等间隔序列(单位为年),目标是预测4年生存率,因此设置预测窗口w=4,间隔设置为与白细胞计数测量间隔相近的0.1,从而将原始数据集划分为一系列预测数据集R(tLM),然后通过程序将R(tLM)拼接为一个超预测数据集。此处采用R包dynpred完成,超预测数据集构建工作,具体数据预处理的程序:
LMdata < - NULL
LMs < - seq(0,4,by=0.1)
w = 4
for(LM in LMs){
LMdataLM < - cutLM(data=wbc,outcome=list(time="survtime",status="d"),LM=LM,horizon=LM+w,covs=list(fixed=c("sokal","age"),varying="lwbc"),
format="long",id="patnr",rtime="wbctime")
LMdataLM < -LMdataLM[LM-LMdataLM $wbctime < = 0.25,]
LMdataLM < - LMdataLM[! is.na(LMdataLM$patnr),]
LMdata < - rbind(LMdata,LMdataLM)
}
注意tLM时点如果没有白细胞计数测量值,则采用最近一次的测量数值替代。考虑临床实际意义,对患者当前状态有预测价值的是距离当前较近时间段所测量的数据,因此如果最近一次测量距离tLM较远,可以考虑不将其纳入分析。此处最大允许时间间隔设定为0.25(LMdataLM[LM-LMdataLM$wbctime < =0.25,],实际应用时应考虑具体临床背景进行设置)。另外预处理过程还产生了一系列衍生变量如LM1与lwbc1等,在lwbc与时间的交互作用项lwbc1及lwbc2的计算式中,有人建议将界标时点tLM视为新的基线时间t0以提高模型准确性[5],van Houwelingen等[10]则认为重置基线时间会增大参数估计的复杂度。此处通过(survtime-LM)进行重置操作。
以上数据预处理完成后,超预测数据集中变量清单及含义见表 2,然后采用R包survival中的coxph函数即可构建如下界标模型:
其中: β(tLM) = β0 + β1tLM/4 + β2 (tLM/4)2,θ(tLM) = θ1tLM/4 + θ2 (tLM/4)2,tLM除去最大界标时点进行归一化。核心程序:
model < -coxph[Surv(LM,survtime,d)~sokal+age
+lwbc+lwbc1+lwbc2
+ LM1 + LM2
+ cluster(patnr),
data = LMdata,
method = "breslow"]
(2)时依性Cox模型: 建立相应的时依性Cox模型如下:
(3)模型比较方法: 模型的性能从校准度(calibration)与区分度(discrimination)两方面进行评估。校准度评估的是模型预测值与实际样本值之间的一致性,本文选用Brier score评估校准度[18]。Brier score计算的是模型预测的概率和实际观测概率之间的均方误差,范围从0到1,Brier score越小说明模型的预测误差越小。区分度评估的是模型区分两类样本的能力(这里区分的是死亡事件发生与否),本文选用C-index评估区分度[19]。C-index计算的是模型预测的一对事件的发生顺序和样本中事件发生顺序之间的一致性,范围从0到1,C-index越大说明一致性越高,模型区分两类事件的能力越强。
(4)结果分析及性能评估: 界标模型及时依性Cox模型均显示,sokal评分、白细胞计数与死亡风险的关联存在统计学意义(P < 0.05)。见表 3。在时依性Cox模型中,白细胞计数每增加1个单位,风险比(hazard ratio,HR)增加为e0.454 = 1.575倍,95%CI:1.081~2.295。对于界标模型,白细胞计数每增加一个单位,其HR值随时间增加而下降,且其估计出的HR比时依性Cox模型高(图 1)。界标模型与Cox模型在各界标时点预测4年生存率的Brier score和C-index见图 2,3。
界标模型在整个预测时间段内Brier score均小于Cox模型。对于C-index,界标模型在前半段预测时间内C-index指标较Cox模型高,后半段二者表现相似。总体上,界标模型性能优于时依性Cox模型。
四、讨论本研究以CML研究数据为例,分别构建了时依性Cox模型与界标模型,结果表明白细胞计数、sokal评分与患者死亡风险高度相关,界标模型能给出死亡风险随界标时间的动态变化趋势,且界标模型的性能在校准度和区分度两方面都要优于时依性Cox模型。在利用纵向数据实现生存分析动态预测时,相比时依性Cox模型应优先考虑界标模型。
界标模型通过将数据集划分为一系列预测数据集,在各预测集上分别建立模型或者将各预测集堆叠为一个超预测数据集并在其上建立模型来达到动态预测的目的[10]。该方法最大的优势在于只需对原始数据集进行适当预处理,即可直接利用现有软件进行建模[2, 14]。相比计算复杂的联合模型,思路简单,计算效率也更高[3]。同时,界标模型也不需要大量前提假设,从而结果更加稳健,尤其当时依协变量过多且其时间分布复杂时[1, 20]。而医学研究中,常常面临症状、体征、检验检查、诊断和处方等多个变量信息,都随时间变化的情况,界标模型也因此成为目前流行的动态预测方法之一[1]。截至2020年12月7日,PubMed检索landmark相关案例已经达192例。例如Fontein等[21]利用是否局部复发等3个时间依赖性变量以及肿瘤大小等基线变量构建界标模型对乳腺癌患者的五年生存率进行动态预测。
此外,使用界标模型进行动态预测时,也有3个注意事项:
(1)在数据准备阶段,目前对界标时间tLM和预测窗口w的选取仍依赖于经验。目前,对于tLM,常根据平均测量间隔或研究设计时设置的测量间隔,进行等间隔选取(即本文所使用的方法)[6]; 而对于w,大多按照实际需求预先指定,更为主观[7],也有少数研究通过交叉验证选出使得模型性能最优的w值[11]。
(2)对于重复测量时间分布不均的纵向数据,经常面临tLM时点未产生测量数据的情境。传统解决方案是采用最近一次时点的测量值替代,要求当最近一次测量时点与tLM间隔较远时,则舍弃,但其实对于“较远”并没有明确界定[10]。近年来,有学者尝试将测量时点选为tLM,考虑利用tLM-τ时间段的历史信息(τ称为历史窗口),构造新的协变量Z(tLM)(如取tLM-τ时间段测量值的平均值)用以替代原来的单时点观察值X(tLM)。该方法的优势在于保证历史窗口内至少发生一次测量[6]。
(3)对新患者未来生存状态进行预测时,可能无法判断新患者处在哪个界标时间tLM。目前有学者提出可以尝试将患者年龄作为界标时点,但该方法的效果还有待进一步探讨[7]。
对于界标模型和联合模型,如前所述,两者互有优势,现有证据也表明,很多情况下两者性能表现是相近的[20, 22-23]。实践中,当时依协变量的时间分布可以通过纵向子模型准确地预测时,更适合采用联合模型[20, 24],当时依协变量数目较多,且很难预测时,更适合采用界标模型。另外最近亦有将机器学习方法应用于动态预测进而克服二者不足之处的探索[25-26]。
电子医疗大数据的兴起和利用,为医学研究的动态预测提供了难得的机遇,包括界标模型在内的动态预测方法,能够充分利用数据,从临床视角对患者进行个体动态预测。R软件包survival即可用于拟合基本的界标模型。国内目前关于界标模型的介绍还较少,中国知网、万方数据库检索也未发现相关应用案例。未来应当将界标模型与电子医疗大数据结合,充分发挥其在医学研究动态预测中的价值。
利益冲突 所有作者声明无利益冲突
作者贡献声明 周江杰:研究设计、实施研究、采集数据、分析、解释数据、论文撰写、统计分析;王胜锋:研究设计、对文章的知识性内容批评性审阅、获取研究经费,行政、技术和材料支持
[1] |
Bull LM, Lunt M, Martin GP, et al. Harnessing repeated measurements of predictor variables for clinical risk prediction: a review of existing methods[J]. Diagn Progn Res, 2020, 4: 9. DOI:10.1186/s41512-020-00078-z |
[2] |
Yang ZJ, Hou YW, Lyu J, et al. Dynamic prediction and prognostic analysis of patients with cervical cancer: a landmarking analysis approach[J]. Ann Epidemiol, 2020, 44: 45-51. DOI:10.1016/j.annepidem.2020.01.009 |
[3] |
翟映红, 陈琪, 韩贺东, 等. 联合模型介绍及在医学研究中的应用[J]. 中华流行病学杂志, 2019, 40(11): 1456-1460. Zhai YH, Chen Q, Han HD, et al. Introduction of joint model and its applications in medical research[J]. Chin J Epidemiol, 2019, 40(11): 1456-1460. DOI:10.3760/cma.j.issn.0254-6450.2019.11.021 |
[4] |
Wulfsohn MS, Tsiatis AA. A joint model for survival and longitudinal data measured with error[J]. Biometrics, 1997, 53(1): 330-339. DOI:10.2307/2533118 |
[5] |
Zheng YY, Heagerty PJ. Partly conditional survival models for longitudinal data[J]. Biometrics, 2005, 61(2): 379-391. DOI:10.1111/j.1541-0420.2005.00323.x |
[6] |
Li L, Luo S, Hu B, et al. Dynamic prediction of renal failure using longitudinal biomarkers in a cohort study of chronic kidney disease[J]. Stat Biosci, 2017, 9(2): 357-378. DOI:10.1007/s12561-016-9183-7 |
[7] |
Keogh RH, Seaman SR, Barrett JK, et al. Dynamic prediction of survival in cystic fibrosis: a landmarking analysis using UK patient registry data[J]. Epidemiology, 2019, 30(1): 29-37. DOI:10.1097/ede.0000000000000920 |
[8] |
Alafchi B, Tapak L, Hamidi O, et al. Landmark prediction of survival for breast cancer patients: a case study in Tehran, Iran[J]. Iran J Public Health, 2019, 48(12): 2249-2259. |
[9] |
Anderson JR, Cain KC, Gelber RD. Analysis of survival by tumor response[J]. J Clin Oncol, 1983, 1(11): 710-719. DOI:10.1200/jco.1983.1.11.710 |
[10] |
van Houwelingen HC. Dynamic prediction by landmarking in event history analysis[J]. Scand J Stat, 2007, 34(1): 70-85. DOI:10.1111/j.1467-9469.2006.00529.x |
[11] |
Wu C, Li L, Li RS. Dynamic prediction of competing risk events using landmark sub-distribution hazard model with multiple longitudinal biomarkers[J]. Stat Methods Med Res, 2020, 29(11): 3179-3191. DOI:10.1177/0962280220921553 |
[12] |
Liu Q. Dynamic prediction models for data with competing risks[D]. Pittsburgh, Pennsylvania: University of Pittsburgh, 2014.
|
[13] |
Zhao HL, Cao YT, Wang Y, et al. Dynamic prognostic model for kidney renal clear cell carcinoma (KIRC) patients by combining clinical and genetic information[J]. Sci Rep, 2018, 8(1): 17613. DOI:10.1038/s41598-018-35981-5 |
[14] |
van Houwelingen HC, Putter H. Dynamic prediction in clinical survival analysis[M]. Boca Raton: CRC Press, 2012.
|
[15] |
The Benelux CML Study Group. Randomized study on hydroxyurea alone versus hydroxyurea combined with low-dose interferon-α2b for chronic myeloid leukemia[J]. Blood, 1998, 91(8): 2713-2721. DOI:10.1182/blood.V91.8.2713.2713_2713_2721 |
[16] |
Sokal JE, Cox EB, Baccarani M, et al. Prognostic discrimination in "good-risk" chronic granulocytic leukemia[J]. Blood, 1984, 63(4): 789-799. DOI:10.1182/blood.V63.4.789.789 |
[17] |
葛均波, 徐永健. 内科学[M]. 8版. 北京: 人民卫生出版社, 2013. Ge JB, Xu YJ. Internal medicine[M]. 8th ed. Beijing: People's Health Publishing House, 2013. |
[18] |
Graf E, Schmoor C, Sauerbrei W, et al. Assessment and comparison of prognostic classification schemes for survival data[J]. Stat Med, 1999, 18(17/18): 2529-2545. DOI:10.1002/(sici)1097-0258(19990915/30)18:17/18<2529::aid-sim274>3.0.co;2-5 |
[19] |
Harrell FE, Lee KL, Mark DB. Multivariable prognostic models: issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors[J]. Stat Med, 1996, 15(4): 361-387. DOI:10.1002/(sici)1097-0258(19960229)15:4<361::aid-sim168>3.0.co;2-4 |
[20] |
Suresh K, Taylor JMG, Spratt DE, et al. Comparison of joint modeling and landmarking for dynamic prediction under an illness-death model[J]. Biom J, 2017, 59(6): 1277-1300. DOI:10.1002/bimj.201600235 |
[21] |
Fontein DBY, Grand MK, Nortier JWR, et al. Dynamic prediction in breast cancer: proving feasibility in clinical practice using the TEAM trial[J]. Ann Oncol, 2015, 26(6): 1254-1262. DOI:10.1093/annonc/mdv146 |
[22] |
Cortese G, Gerds TA, Andersen PK. Comparing predictions among competing risks models with time-dependent covariates[J]. Stat Med, 2013, 32(18): 3089-3101. DOI:10.1002/sim.5773 |
[23] |
Maziarz M, Heagerty P, Cai TX, et al. On longitudinal prediction with time-to-event outcome: comparison of modeling options[J]. Biometrics, 2017, 73(1): 83-93. DOI:10.1111/biom.12562 |
[24] |
Rizopoulos D, Molenberghs G, Lesaffre EMEH. Dynamic predictions with time-dependent covariates in survival analysis using joint modeling and landmarking[J]. Biom J, 2017, 59(6): 1261-1276. DOI:10.1002/bimj.201600238 |
[25] |
Jarrett D, Yoon J, van der Schaar M. Match-net: Dynamic prediction in survival analysis using convolutional neural networks[J]. arXiv preprint. arXiv: 1811.10746, 2018.
|
[26] |
Lee C, Yoon J, Schaar MV. Dynamic-DeepHit: a deep learning approach for dynamic survival analysis with competing risks based on longitudinal data[J]. IEEE Trans Biomed Eng, 2020, 67(1): 122-133. DOI:10.1109/tbme.2019.2909027 |