界标模型介绍及在动态预测中的应用

http://dx.doi.org/10.3760/cma.j.cn112338-20210122-00051
中华医学会主办。

文章信息

周江杰, 王胜锋.

Zhou Jiangjie, Wang Shengfeng

界标模型介绍及在动态预测中的应用

Introduction of landmarking approach and its application in dynamic prediction

中华流行病学杂志, 2022, 43(1): 112-117

Chinese Journal of Epidemiology, 2022, 43(1): 112-117

http://dx.doi.org/10.3760/cma.j.cn112338-20210122-00051

文章历史

收稿日期: 2021-01-22

引用本文

周江杰, 王胜锋. 界标模型介绍及在动态预测中的应用[J]. 中华流行病学杂志, 2022, 43(1): 112-117

Zhou Jiangjie, Wang Shengfeng. Introduction of landmarking approach and its application in dynamic prediction[J]. Chinese Journal of Epidemiology, 2022, 43(1): 112-117.

界标模型介绍及在动态预测中的应用

周江杰 , 王胜锋

北京大学公共卫生学院流行病与卫生统计学系，北京 100191

收稿日期: 2021-01-22

基金项目: 国家自然科学基金面上项目(82173616)

通信作者: 王胜锋，Email：shengfeng1984@126.com

摘要: 传统的生存预测属于“静态预测”，即其只能利用基线暴露信息预测结局的发生情况。而目前出于临床研究实际需求，越来越多的研究者开始关注“动态预测”，该方法能利用截至预测起点（界标时点）的暴露信息对预测模型进行更新，从而实现对患者结局的动态预测。界标模型即一种动态预测模型，其结构简单、容易实现、计算效率高，且其性能与相较之下更为复杂的联合模型相近，目前已得到广泛应用。但其在国内的应用仍较少，本文从界标模型的基本思想出发，通过案例简要介绍其应用方法，以期促进其在临床生存分析动态预测场景中的应用。

关键词: 界标模型动态预测生存分析

Introduction of landmarking approach and its application in dynamic prediction

Zhou Jiangjie , Wang Shengfeng

Department of Epidemiology and Biostatistics, School of Public Health, Peking University, Beijing 100191, China

Corresponding author: Wang Shengfeng, Email: shengfeng1984@126.com.

Fund program: National Natural Science Foundation of China, General Program (82173616)

Abstract: Conventional prediction model, as a static prediction model, can be only used to predict the probability of the occurrence of an event during the observation period using the information available at baseline survey. However, based on current clinical demands, dynamic prediction, which obtains prediction probabilities for both baseline survey and later time points given the history of the events and covariates up to that time, is gaining a growing attention. As a dynamic prediction model, the landmarking approach is simple, easy to use, computationally efficient and has a comparable performance of joint modeling, which makes it to be widely used in recent researches. Because of its limited application in China, this paper makes a brief introduction of its ideas and basic application to further promote its applications in clinical dynamic prediction.

Key words: Landmarking approach Survival analysis Dynamic prediction

以电子病历为代表的电子医疗数据，记录着患者症状、体征、检验检查、诊断和处方等信息，对临床实践有很好的代表性。但利用电子医疗数据构建预测模型时，常面临预测结局随时间变化，预测因素也随时间变化的情况。理想的预测工作应考虑这些因素随时间变化的特性，借由动态预测提高预测准确性。传统的生存分析Cox比例风险回归模型只考虑基线时点的协变量信息，属于静态预测^[1-2]。扩展的时依性Cox比例风险回归模型，尽管将随时间变化的因素作为时间依赖性协变量纳入，但仍存在未考虑协变量的测量误差等不足^{[1, 3]}。1997年，有学者提出整合时间依赖性变量与生存结局建立联合模型^[4]，国内也有学者对该方法进行了介绍^[3]。但实际应用时，联合模型存在分析复杂，参数估计较困难的问题^[3]，同时，对于临床较为常见的患者动态进出，如何估计其随机效应项也仍是一项挑战^[1]。2004年，Zheng和Heagerty^[5]提出将界标模型用于生存分析的动态预测，由于形式相对简洁、模型拟合耗时显著减少，逐渐得到研究者的关注。目前，已在慢性肾功能疾病^[6]、囊性纤维化^[7]、乳腺癌^[8]、宫颈癌^[2]等多个临床领域得到运用。

本研究简要介绍了界标模型的基本原理，并通过案例应用，阐述其在实际应用过程中的步骤和注意事项、比较其与传统Cox模型之间的性能差异，进而为界标模型在纵向生存资料的统计建模中的应用提供参考。

一、界标模型的基本原理

界标模型是在界标框架内建立的一类模型的统称。界标框架即利用数据集在某一个时间点（不一定是基线时间）仍处于风险状态的对象进行后续分析的一种思想，最早由Anderson等^[9]在肿瘤研究中提出。Zheng和Heagerty^[5]首先通过将界标模型用于生存分析的动态预测，并称其为部分条件生存模型（partly conditional survival model），其中“部分”是指该模型进行预测时仅考虑预测时间点及其以前的信息。随后，van Houwelingen^[10]对其进行了扩充和完善，主要围绕模型的参数估计算法进行改进。为了更方便读者理解，表 1将传统Cox模型、时依性Cox模型、联合模型与界标模型进行了对比。以单一死亡结局为例（注意对于存在竞争风险较复杂的情况，参见“子分布风险模型”^[11-12]），目前界标模型的基本思想如下:

表 1 传统Cox模型、时依性Cox模型、联合模型与界标模型的对比

表选项

（1）固定一个预测窗口（prediction window）w;

（2）选择一系列界标时点（即预测时点）t_LM;

（3）选择在t_LM时点仍处于风险状态（at risk）的人群建立预测数据集R（t_LM），对t_LM+w后发生的所有事件做删失处理;

（4）在每个R（t_LM）上建立预测模型，在t_LM~t_LM+w时段对事件发生的概率进行预测。

据此，当预测模型选择Cox模型时，则得到最基本形式的界标模型:

(1)

注意上述基本形式，实际相当于构建了多个独立的Cox模型，这显然并不便于模型解释，因此实践中几乎不用。实际常用的做法是将一系列预测数据集进行拼接，构成一个“超预测数据集”，在此基础上构建“超Cox模型”（super cox model）:

(2)

其中是一系列光滑函数。

该超模型通过引入关于t_LM的光滑函数θ(t_LM)来描述基线风险函数关于t_LM的变化情况，其作用等同于将多个独立的Cox模型组成一个整体。如果更进一步，可以对β同样引入一个光滑函数，描述协变量的时间依赖性效应:

(3)

其中是一系列光滑函数。

实践中上述光滑函数多采用的是多项式基函数的线性组合形式^{[2, 7, 13]}，如β(t_LM) = β₀ + β₁t_LM + β₂t_LM²^[2]，可以通过尝试多种不同的函数形式并比较对应的模型性能以选出最优的光滑函数。

二、界标模型的参数估计

由于模型（6）可以简化到模型（5）与模型（4），以下讨论以最复杂的模型（6）为例。模型（6）的参数估计采用伪部分对数似然函数法（pseudo partial log-likelihood），其似然函数如下^[14]:

(4)

其中x_i为第i次测量的纵向协变量，d_i为生存状态指示变量，β为协变量系数，θ为描述基线风险变化的光滑函数，γ和η为对应的回归系数向量。

现有的R包survival中的优化算法可以直接应用于上述界标模型的参数估计。针对纵向重复测量数据测量时间不均匀分布的情况，有人指出在参数估计时应当用关于测量时间与t_LM差值的核函数（kernel function）对以上似然函数进行加权处理^[6]。

三、案例应用

通过实例演示界标模型在R中的实现过程，并将界标模型的结果与时依性Cox模型进行对比。

1。数据来源: 测试用数据来自Benelux CML Study Group^[15]于1998年完成的一项针对慢性粒细胞白血病患者的随机对照试验，该数据集可通过R包dynpred加载获得（命名为wbc）^[14-15]。研究对象为195名慢性髓系白血病（chronic myelogenous leukemia，CML）患者，被随机分配接受羟基脲和干扰素-α两种不同的治疗方案（由于未发现治疗方案对患者总体生存有显著影响，该数据集没有纳入治疗方案变量，另有5名患者未进行白细胞计数测量，亦未纳入此数据集^[14]）。记录研究开始及之后每1~2个月的白细胞计数测量值。拟考虑利用年龄、Sokal评分^[16]、白细胞计数预测4年生存率。其中，白细胞计数是随时间变化的指标，白细胞计数升高是CML的主要特征^[17]。Sokal评分为CML患者预后的评估指标，综合年龄、脾脏大小、血小板计数和髓母细胞百分比计算得出，其数值越大提示预后越差。

2。模型构建:

（1）界标模型: 构建界标模型，首先需要对数据进行预处理。该数据集中，患者的最大随访时间为8年，选定界标时间t_LM为一从0到4的等间隔序列（单位为年），目标是预测4年生存率，因此设置预测窗口w=4，间隔设置为与白细胞计数测量间隔相近的0.1，从而将原始数据集划分为一系列预测数据集R（t_LM），然后通过程序将R（t_LM）拼接为一个超预测数据集。此处采用R包dynpred完成，超预测数据集构建工作，具体数据预处理的程序:

LMdata < - NULL

LMs < - seq（0，4，by=0.1）

w = 4

for（LM in LMs）{

LMdataLM < - cutLM（data=wbc，outcome=list（time="survtime"，status="d"），LM=LM，horizon=LM+w，covs=list（fixed=c（"sokal"，"age"），varying="lwbc"），

format="long"，id="patnr"，rtime="wbctime"）

LMdataLM < -LMdataLM[LM-LMdataLM ＄wbctime < = 0.25，]

LMdataLM < - LMdataLM[! is.na（LMdataLM＄patnr），]

LMdata < - rbind（LMdata，LMdataLM）

}

注意t_LM时点如果没有白细胞计数测量值，则采用最近一次的测量数值替代。考虑临床实际意义，对患者当前状态有预测价值的是距离当前较近时间段所测量的数据，因此如果最近一次测量距离t_LM较远，可以考虑不将其纳入分析。此处最大允许时间间隔设定为0.25（LMdataLM[LM-LMdataLM＄wbctime < =0.25，]，实际应用时应考虑具体临床背景进行设置）。另外预处理过程还产生了一系列衍生变量如LM1与lwbc1等，在lwbc与时间的交互作用项lwbc1及lwbc2的计算式中，有人建议将界标时点t_LM视为新的基线时间t₀以提高模型准确性^[5]，van Houwelingen等^[10]则认为重置基线时间会增大参数估计的复杂度。此处通过（survtime-LM）进行重置操作。

以上数据预处理完成后，超预测数据集中变量清单及含义见表 2，然后采用R包survival中的coxph函数即可构建如下界标模型:

(5)

表 2 预处理后生成的超预测数据集变量清单

表选项

其中: β(t_LM) = β₀ + β₁t_LM/4 + β₂ (t_LM/4)²，θ(t_LM) = θ₁t_LM/4 + θ₂ (t_LM/4)²，t_LM除去最大界标时点进行归一化。核心程序:

model < -coxph[Surv（LM，survtime，d）~sokal+age

+lwbc+lwbc1+lwbc2

+ LM1 + LM2

+ cluster（patnr），

data = LMdata，

method = "breslow"]

（2）时依性Cox模型: 建立相应的时依性Cox模型如下:

(6)

（3）模型比较方法: 模型的性能从校准度（calibration）与区分度（discrimination）两方面进行评估。校准度评估的是模型预测值与实际样本值之间的一致性，本文选用Brier score评估校准度^[18]。Brier score计算的是模型预测的概率和实际观测概率之间的均方误差，范围从0到1，Brier score越小说明模型的预测误差越小。区分度评估的是模型区分两类样本的能力（这里区分的是死亡事件发生与否），本文选用C-index评估区分度^[19]。C-index计算的是模型预测的一对事件的发生顺序和样本中事件发生顺序之间的一致性，范围从0到1，C-index越大说明一致性越高，模型区分两类事件的能力越强。

（4）结果分析及性能评估: 界标模型及时依性Cox模型均显示，sokal评分、白细胞计数与死亡风险的关联存在统计学意义（P < 0.05）。见表 3。在时依性Cox模型中，白细胞计数每增加1个单位，风险比（hazard ratio，HR）增加为e^0.454 = 1.575倍，95%CI：1.081~2.295。对于界标模型，白细胞计数每增加一个单位，其HR值随时间增加而下降，且其估计出的HR比时依性Cox模型高（图 1）。界标模型与Cox模型在各界标时点预测4年生存率的Brier score和C-index见图 2，3。

表 3 界标模型和时依性Cox模型输出结果

表选项

图 1 界标模型与Cox模型估计的白细胞计数对死亡风险的影响

图选项

图 2 界标模型与Cox模型的Brier score比较

图选项

图 3 界标模型与Cox模型的C-index比较

图选项

界标模型在整个预测时间段内Brier score均小于Cox模型。对于C-index，界标模型在前半段预测时间内C-index指标较Cox模型高，后半段二者表现相似。总体上，界标模型性能优于时依性Cox模型。

四、讨论

本研究以CML研究数据为例，分别构建了时依性Cox模型与界标模型，结果表明白细胞计数、sokal评分与患者死亡风险高度相关，界标模型能给出死亡风险随界标时间的动态变化趋势，且界标模型的性能在校准度和区分度两方面都要优于时依性Cox模型。在利用纵向数据实现生存分析动态预测时，相比时依性Cox模型应优先考虑界标模型。

界标模型通过将数据集划分为一系列预测数据集，在各预测集上分别建立模型或者将各预测集堆叠为一个超预测数据集并在其上建立模型来达到动态预测的目的^[10]。该方法最大的优势在于只需对原始数据集进行适当预处理，即可直接利用现有软件进行建模^{[2, 14]}。相比计算复杂的联合模型，思路简单，计算效率也更高^[3]。同时，界标模型也不需要大量前提假设，从而结果更加稳健，尤其当时依协变量过多且其时间分布复杂时^{[1, 20]}。而医学研究中，常常面临症状、体征、检验检查、诊断和处方等多个变量信息，都随时间变化的情况，界标模型也因此成为目前流行的动态预测方法之一^[1]。截至2020年12月7日，PubMed检索landmark相关案例已经达192例。例如Fontein等^[21]利用是否局部复发等3个时间依赖性变量以及肿瘤大小等基线变量构建界标模型对乳腺癌患者的五年生存率进行动态预测。

此外，使用界标模型进行动态预测时，也有3个注意事项:

（1）在数据准备阶段，目前对界标时间t_LM和预测窗口w的选取仍依赖于经验。目前，对于t_LM，常根据平均测量间隔或研究设计时设置的测量间隔，进行等间隔选取（即本文所使用的方法）^[6]; 而对于w，大多按照实际需求预先指定，更为主观^[7]，也有少数研究通过交叉验证选出使得模型性能最优的w值^[11]。

（2）对于重复测量时间分布不均的纵向数据，经常面临t_LM时点未产生测量数据的情境。传统解决方案是采用最近一次时点的测量值替代，要求当最近一次测量时点与t_LM间隔较远时，则舍弃，但其实对于“较远”并没有明确界定^[10]。近年来，有学者尝试将测量时点选为t_LM，考虑利用t_LM-τ时间段的历史信息（τ称为历史窗口），构造新的协变量Z(t_LM)（如取t_LM-τ时间段测量值的平均值）用以替代原来的单时点观察值X(t_LM)。该方法的优势在于保证历史窗口内至少发生一次测量^[6]。

（3）对新患者未来生存状态进行预测时，可能无法判断新患者处在哪个界标时间t_LM。目前有学者提出可以尝试将患者年龄作为界标时点，但该方法的效果还有待进一步探讨^[7]。

对于界标模型和联合模型，如前所述，两者互有优势，现有证据也表明，很多情况下两者性能表现是相近的^{[20, 22-23]}。实践中，当时依协变量的时间分布可以通过纵向子模型准确地预测时，更适合采用联合模型^{[20, 24]}，当时依协变量数目较多，且很难预测时，更适合采用界标模型。另外最近亦有将机器学习方法应用于动态预测进而克服二者不足之处的探索^[25-26]。

电子医疗大数据的兴起和利用，为医学研究的动态预测提供了难得的机遇，包括界标模型在内的动态预测方法，能够充分利用数据，从临床视角对患者进行个体动态预测。R软件包survival即可用于拟合基本的界标模型。国内目前关于界标模型的介绍还较少，中国知网、万方数据库检索也未发现相关应用案例。未来应当将界标模型与电子医疗大数据结合，充分发挥其在医学研究动态预测中的价值。

利益冲突 所有作者声明无利益冲突

作者贡献声明 周江杰：研究设计、实施研究、采集数据、分析、解释数据、论文撰写、统计分析；王胜锋：研究设计、对文章的知识性内容批评性审阅、获取研究经费，行政、技术和材料支持

参考文献

[1]	Bull LM, Lunt M, Martin GP, et al. Harnessing repeated measurements of predictor variables for clinical risk prediction: a review of existing methods[J]. Diagn Progn Res, 2020, 4: 9. DOI:10.1186/s41512-020-00078-z

[2]	Yang ZJ, Hou YW, Lyu J, et al. Dynamic prediction and prognostic analysis of patients with cervical cancer: a landmarking analysis approach[J]. Ann Epidemiol, 2020, 44: 45-51. DOI:10.1016/j.annepidem.2020.01.009

[3]	翟映红, 陈琪, 韩贺东, 等. 联合模型介绍及在医学研究中的应用[J]. 中华流行病学杂志, 2019, 40(11): 1456-1460. Zhai YH, Chen Q, Han HD, et al. Introduction of joint model and its applications in medical research[J]. Chin J Epidemiol, 2019, 40(11): 1456-1460. DOI:10.3760/cma.j.issn.0254-6450.2019.11.021

[4]	Wulfsohn MS, Tsiatis AA. A joint model for survival and longitudinal data measured with error[J]. Biometrics, 1997, 53(1): 330-339. DOI:10.2307/2533118

[5]	Zheng YY, Heagerty PJ. Partly conditional survival models for longitudinal data[J]. Biometrics, 2005, 61(2): 379-391. DOI:10.1111/j.1541-0420.2005.00323.x

[6]	Li L, Luo S, Hu B, et al. Dynamic prediction of renal failure using longitudinal biomarkers in a cohort study of chronic kidney disease[J]. Stat Biosci, 2017, 9(2): 357-378. DOI:10.1007/s12561-016-9183-7

[7]	Keogh RH, Seaman SR, Barrett JK, et al. Dynamic prediction of survival in cystic fibrosis: a landmarking analysis using UK patient registry data[J]. Epidemiology, 2019, 30(1): 29-37. DOI:10.1097/ede.0000000000000920

[8]	Alafchi B, Tapak L, Hamidi O, et al. Landmark prediction of survival for breast cancer patients: a case study in Tehran, Iran[J]. Iran J Public Health, 2019, 48(12): 2249-2259.

[9]	Anderson JR, Cain KC, Gelber RD. Analysis of survival by tumor response[J]. J Clin Oncol, 1983, 1(11): 710-719. DOI:10.1200/jco.1983.1.11.710

[10]	van Houwelingen HC. Dynamic prediction by landmarking in event history analysis[J]. Scand J Stat, 2007, 34(1): 70-85. DOI:10.1111/j.1467-9469.2006.00529.x

[11]	Wu C, Li L, Li RS. Dynamic prediction of competing risk events using landmark sub-distribution hazard model with multiple longitudinal biomarkers[J]. Stat Methods Med Res, 2020, 29(11): 3179-3191. DOI:10.1177/0962280220921553

[12]	Liu Q. Dynamic prediction models for data with competing risks[D]. Pittsburgh, Pennsylvania: University of Pittsburgh, 2014.

[13]	Zhao HL, Cao YT, Wang Y, et al. Dynamic prognostic model for kidney renal clear cell carcinoma (KIRC) patients by combining clinical and genetic information[J]. Sci Rep, 2018, 8(1): 17613. DOI:10.1038/s41598-018-35981-5

[14]	van Houwelingen HC, Putter H. Dynamic prediction in clinical survival analysis[M]. Boca Raton: CRC Press, 2012.

[15]	The Benelux CML Study Group. Randomized study on hydroxyurea alone versus hydroxyurea combined with low-dose interferon-α2b for chronic myeloid leukemia[J]. Blood, 1998, 91(8): 2713-2721. DOI:10.1182/blood.V91.8.2713.2713_2713_2721

[16]	Sokal JE, Cox EB, Baccarani M, et al. Prognostic discrimination in "good-risk" chronic granulocytic leukemia[J]. Blood, 1984, 63(4): 789-799. DOI:10.1182/blood.V63.4.789.789

[17]	葛均波, 徐永健. 内科学[M]. 8版. 北京: 人民卫生出版社, 2013. Ge JB, Xu YJ. Internal medicine[M]. 8^th ed. Beijing: People's Health Publishing House, 2013.

[18]	Graf E, Schmoor C, Sauerbrei W, et al. Assessment and comparison of prognostic classification schemes for survival data[J]. Stat Med, 1999, 18(17/18): 2529-2545. DOI:10.1002/(sici)1097-0258(19990915/30)18:17/18<2529::aid-sim274>3.0.co;2-5

[19]	Harrell FE, Lee KL, Mark DB. Multivariable prognostic models: issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors[J]. Stat Med, 1996, 15(4): 361-387. DOI:10.1002/(sici)1097-0258(19960229)15:4<361::aid-sim168>3.0.co;2-4

[20]	Suresh K, Taylor JMG, Spratt DE, et al. Comparison of joint modeling and landmarking for dynamic prediction under an illness-death model[J]. Biom J, 2017, 59(6): 1277-1300. DOI:10.1002/bimj.201600235

[21]	Fontein DBY, Grand MK, Nortier JWR, et al. Dynamic prediction in breast cancer: proving feasibility in clinical practice using the TEAM trial[J]. Ann Oncol, 2015, 26(6): 1254-1262. DOI:10.1093/annonc/mdv146

[22]	Cortese G, Gerds TA, Andersen PK. Comparing predictions among competing risks models with time-dependent covariates[J]. Stat Med, 2013, 32(18): 3089-3101. DOI:10.1002/sim.5773

[23]	Maziarz M, Heagerty P, Cai TX, et al. On longitudinal prediction with time-to-event outcome: comparison of modeling options[J]. Biometrics, 2017, 73(1): 83-93. DOI:10.1111/biom.12562

[24]	Rizopoulos D, Molenberghs G, Lesaffre EMEH. Dynamic predictions with time-dependent covariates in survival analysis using joint modeling and landmarking[J]. Biom J, 2017, 59(6): 1261-1276. DOI:10.1002/bimj.201600238

[25]	Jarrett D, Yoon J, van der Schaar M. Match-net: Dynamic prediction in survival analysis using convolutional neural networks[J]. arXiv preprint. arXiv: 1811.10746, 2018.

[26]	Lee C, Yoon J, Schaar MV. Dynamic-DeepHit: a deep learning approach for dynamic survival analysis with competing risks based on longitudinal data[J]. IEEE Trans Biomed Eng, 2020, 67(1): 122-133. DOI:10.1109/tbme.2019.2909027