中华流行病学杂志  2018, Vol. 39 Issue (2): 222-226   PDF    
http://dx.doi.org/10.3760/cma.j.issn.0254-6450.2018.02.017
中华医学会主办。
0

文章信息

胡贵平, 詹思延.
Hu Guiping, Zhan Siyan.
PRECIS-2:基于研究目标的试验设计
The PRECIS-2 tool: designing trials that are fit for purpose
中华流行病学杂志, 2018, 39(2): 222-226
Chinese Journal of Epidemiology, 2018, 39(2): 222-226
http://dx.doi.org/10.3760/cma.j.issn.0254-6450.2018.02.017

文章历史

收稿日期: 2017-08-01
PRECIS-2:基于研究目标的试验设计
胡贵平1, 詹思延2     
1. 100191 北京大学公共卫生学院劳动卫生与环境卫生系;
2. 100191 北京大学流行病与卫生统计学系
摘要: 采用随机对照试验(RCT)评价的干预措施效果,涉及理论疗效和实际的临床效果两方面。PRECIS(Pragmatic-Explanatory Continuum Indicator Summary)通过评价RCT设计的解释性和实用性两方面的程度,指导研究者如何实行干预和试验设计,使RCT在内部真实性和外部真实性之间达到一个平衡。在临床试验方案设计过程中,PRECIS的作用逐渐被研究者所认同。为了确保试验的设计与结果相关联,便于患者、临床医生和政策决策者应用,国际多团队专家对PRECIS进行了修正和升级,提出了新的PRECIS-2。PRECIS-2的9个维度都是为了帮助试验设计者思考研究设计的预期效果与试验结果的一致性和特定场景的适用性。本文旨在介绍PRECIS-2的研发、基本原理、特点及应用,以期为国内临床试验设计、决策提供帮助。
关键词: 随机对照试验     PRECIS-2     解释性试验     实用性试验    
The PRECIS-2 tool: designing trials that are fit for purpose
Hu Guiping1, Zhan Siyan2     
1. Department of Occupational and Environmental Health, School of Public Health, Peking University, Beijing 100191, China;
2. Department of Epidemiology and Biostatistics, School of Public Health, Peking University, Beijing 100191, China
Corresponding author: Zhan Siyan, Email:siyan-zhan@bjmu.edu.cn
Fund program: National Natural Science Foundation of China (81473067)
Abstract: To evaluate the intervention effects of randomized controlled trials (RCT) involved in theoretical efficacy and actual clinical outcome (effectiveness). Pragmatic-Explanatory Continuum Indicator Summary (PRECIS) is a tool to help researchers make decisions in study design which is consistent with the intended purpose of their trial which can be used in the design of RCT to balance the internal validity and external validity. The role of PRECIS has been gradually recognized in the practice of designing clinical trials. To ensure that the design choices are concordant with the intention and the facilitation of use set by patients, clinicians and policy makers, a new PRECIS-2 tool has been developed by mangy international team experts under modification and upgrading the existing PRECIS. The PRECIS-2 tool mainly focuses on trial design choices which determining the applicability of a trial. PRECIS-2 has nine domains, with each of them intends to help the researchers consider the consequences of that design decision in terms of the applicability of the results under particular setting. The purpose of this paper is to introduce the development, basic principle, characteristics and application of PRECIS-2 for the designers and decision makers when working on clinical trials.
Key words: Randomized controlled trial     Pragmatic-Explanatory Continuum Indicator Summary-2     Explanatory trial     Pragmatic/practical trial    

1.概述:随机对照试验(randomized controlled trials,RCT)是评价干预措施效果的金标准,但研究实施的难度较大[1]。在理想的条件下开展严格受控的试验,获得的效果可以反映干预措施所能达到的最大效果,即理论疗效或效力(efficacy);而在实际或接近实际的医疗环境下显示的临床效果(effectiveness),通常可直接用于指导临床和公共卫生决策,服务于患者和公众健康的改善[2-3]。因此RCT也是利益相关者(患者或者其他可能受益的人群、医疗保健和研究资助者、政策制定者、临床护理医生和研究人员)最为关心的研究。然而,很大部分临床RCT可能并未达到研究者的预期效力或效果,限制了其在特定场景的适用性[4-5]

50年前Schwartz和Lellouch等就强调了在RCT研究中区分解释性(explanatory)和实用性(pragmatic/practical)的重要意义。解释性随机临床试验(explanatory randomized clinical trial,ERCT)是在理想条件下实施,以最大限度地评估干预措施的效力;实用性随机临床试验(pragmatic/practical randomized clinical trial,PRCT)力图阐述“真实的世界”,专注于在接近或近似真实情况下的应用,旨在决定是否采取干预措施,具有一定的推广性。这种区分为RCT的设计者提供了两种选择[6-7]。然而,在RCT实际设计过程中,实用性和解释性并不是截然分离的两个极端,许多RCT通常会同时兼有两种设计的部分属性,很难单纯地将其一分为二为解释性或实用性试验,而更多的是二者相结合,成为在ERCT和PRCT中间的某一状态[8-9]

为了使RCT的设计能更加符合研究者的目的,2005年8月,由25个国际随机对照试验的研究者和方法学专家组成团队,提出了PRECIS(Pragmatic-Explanatory Continuum Indicator Summary)模型,通过在RCT设计过程中综合考虑解释性和实用性两方面的内容,以帮助研究者了解某项RCT的实用或解释程度,明确研究设计的方向,从而避免研究设计与最初目标的不匹配[7, 10]。自2009年以来,PRECIS工具的引用超过了300次,进入了英国国家卫生研究所随机试验方法(UK National Institute for Health Research Randomised Trials Methods)网站(www.nets.nihr.ac.uk/resources/trials-coordination)中,成为“最有用临床试验工具”之一[7, 10]。2016年3月,笔者也给出过相关介绍[8]

PRECIS发布后,不同领域的学者们虽然一致承认该工具在RCT设计中的重要地位,但经过几年的使用,也逐渐认识到它的一些不足。PRECIS的主要问题是工具的效度和评分间信度不清楚,缺乏评分系统,轮状模型中有些维度冗余,因而需要重新考虑如何使用这一工具[11-12]。2015年,在80多个国际临床试验研究者、临床医生和政策制定者的帮助下,PRECIS得到了很大的发展,PRECIS-2逐渐形成。与2009年PRECIS初始版一样,PRECIS-2也主要用于临床试验的设计阶段,旨在帮助临床试验研究者明确试验设计目标,以保证临床试验的实施和最初预期研究目标一致。同时,新的PRECIS-2工具简化了原来轮状模型图中的维度,将初始版本中的10个维度重新整合为9个维度,一方面弥补初始版本中的不足和信度效度检测,另一方面继续发扬了PRECIS工具中的优势。可以预期,PRECIS-2在RCT研究的循证评价、系统综述、基金支持、论文定稿等多方面将具有很好的应用前景[5, 9, 11]

2. PRECIS-2的开发与原理:某项临床随机试验是偏向解释性还是倾向于实用性,对研究者、临床医生、决策者、患者和社会产生的影响会明显不同[13]。在这种情况下,试验设计是否符合研究者预期目的对诸多利益相关者均至关重要。PRECIS模型的提出就是为了帮助研究者了解试验设计是否符合预期试验目的,判断一项临床试验的实用或解释性的程度[13]。如图 1所示,纳入标准(eligibility criteria)、试验干预措施的灵活性(flexibility of the experimental)、实验组干预者的专业水平(experimental practitioner expertise)、对照组干预措施的灵活性(flexibility of the comparison intervention)、对照组干预者的专业水平(comparison practitioner expertise)、随访强度(fellow-up intensity)、结局指标(outcome)、研究对象的依从性(participant compliance)、干预者的一致性(practitioner adherence)和主要分析(primary analysis)共10个维度而组成了PRECIS轮状模型的统一体[6, 8, 14-15]。研究者对该模型各个维度进行评分来绘制PRECIS模型图,以帮助研究者形象直观地了解试验设计,更好地反映试验的实际临床特征,并提示研究者需要从哪些方面改进[8]

图 1 初始PRECIS的轮状模型示意图

PRECIS工具的评分系统在一定程度上克服了群体评价工具内部真实性不明确的弱点,形象的描述了一项研究的解释性和实用性程度,在判断一项临床试验的解释性或实用程度上具有独特的作用,有助于研究者知道自己的试验设计是否与试验目的相适应[8, 16]。然而,初始PRECIS工具并没能使研究者试验设计一蹴而就,试验的内、外部效度、研究的可行性和结果精确性等维度仍然影响了研究设计类型的选择[12, 17]。此外,初始PRECIS工具中的某一些维度可能具有多个条目,例如内部效度可能包括:①治疗或干预的标准化;②干预的定义;③研究中解释和实用的程度。另外,在利用初始PRECIS对研究设计进行评价时,轮状模型及每个维度的得分范围并不是很一致,根据研究者的研究设计不同,PRECIS模型中各维度的得分会有很大的变化,各研究每个维度打分从1~5分到0~20分的评分范围也不一致[15, 18]

为了确保试验的设计与结果相关联,便于患者、临床医生、政策决策者和研究者在特定场景中的应用,PRECIS工具制定者召集了参与了PRECIS工具的研究者、没有参加PRECIS制定和应用评估的人开展了2轮德尔菲法讨论会(delphi communication),一起采用头脑风暴法(brainstorming)围绕PRECIS使用过程中发现的问题,讨论了如何改善和升级PRECIS。然后,由包括参加德尔菲法讨论会的专家、PRECIS使用和测试者和临床试验经验丰富的研究者或医生等来自多行业的33名专家逐一讨论PRECIS-2的应用和测试,并对其使用指南做了相应的修改。最后19家国际专业评级机构对PRECIS-2的信度和效度进行了测试,从而最终获得了一致认可的PRECIS-2最终版本和专门的网站(http://www.precis-2.org/[11]

新的PRECIS-2工具删除了原来与对照措施有关的2个维度“对照组干预者的专业水平”和“对照组干预措施的灵活性”以及实验组的“干预者的专业水平”,但保留了原来的轮状模型图,重新整合为9个维度并对图的各维度增加了简短的说明(图 2)。PRECIS-2的9个维度分别为纳入标准(eligibility criteria)、招募(recruitment)、场景(setting)、组织(organisation)、灵活性(flexibility)、依从性(adherence)、随访(follow-up)、主要结局(primary outcome)、主要分析(primary analysis)。统一在PRECIS-2轮状模型图按1~5分对每个维度进行评分,各维度得分越低则解释性越强(very explanatory),相反得分越高则实用性越强(very pragmatic)[11]。PRECIS-2的每个维度都是为了帮助试验设计者思考研究设计的目的是否与预期效果一致,以促使各方达成共识[19]

图 2 PRECIS-2的轮状模型示意图

RCT在各场景中的干预通常能保持一致,而其偏解释还是实用,则可以通过PRECIS-2的各维度进行综合评价。PRCT设计分析尽量包含全部的患者,忽略依从性,关心测量的干预是否在实际环境中有效。而在ERCT中密切监测每个研究对象的依从性,数据可能采用意向性分析(intention-to-treat analysis,ITT),判断理想情况下的最大效果。干预如果是不能测量的指标,或者存在多个干预且相互之间不好区分,那么各个干预需要进行单独的评分。同时对于不同测量指标,利益相关者在轮状模型组织、灵活性(开展)和灵活性(依从性)等维度的评价可能存在意见不一致。若试验设计者旨在应用性强(即选择一个实用性的研究设计),那么我们可以期望试验和平常干预之间是较一致的。同样,如果试验研究者想呈现出最好的干预效果(即解释性方法),那么这个试验效果和平常的干预并不很一致。

3. PRECIS-2的实施:PRECIS-2不是为了设计出一个实用性或解释性的研究,而是为了让研究团队能充分思考试验设计是否与预期目标一致。其着重关注于临床研究设计的确定,以明确临床试验结果的适用性,即临床试验结果在特定情况或场景下应用或使用的能力。不同的试验设计选择可以使试验更多或更少适用于现实的环境中,PRCT多集中在最常见的环境中,而较少集中在高度专业化的特定理想环境中。实用性很强的试验设计结果可能在社区普通用户中普遍适用,但某些实用性较弱的试验设计只适用于研究者所计划应用的特定场景。即使在一个特定理想环境中,一个试验适用程度也取决于它提供的资源和临床医生设定的标准,而患者就是经常被设定的场景。一个高度解释性的试验则力求最大限度使干预的效果达到预期的机制,很少关注这一结果在真实的条件下是否能实现。

为了使PRECIS-2工具能应用于特定干预和干预实施的现场中,设计者为PRECIS-2制定了4个实施步骤[11]。如果试验预期目标和预期设计之间存在不一致,则各步骤将迭代返回。

步骤一:采用什么样的设计方法?明确RCT设计的意图。例如:是想采用一个解释性方法来回答干预是否在理想条件下有效?还是采用一个实用性方法来回答干预是否在通常一般条件下有效?两种方法均有其各自的适用空间。现实的情况是,许多临床试验研究者常常想当然的将RCT设计成为解释性的,而非深思熟虑做出决策。因此,临床试验设计者首先需要清楚他们想偏重于那方面。

步骤二:根据PRECIS-2每个领域确定试验设计:在了解PRECIS-2每个维度的详细信息后,想象每个维度中最实用或解释性最大的设计两端,同时考虑实际情况,从而明确在某个维度的实际选择是实用性还是解释性。在对每个维度评分前,需明确“参与者(participant)”的定义。参与者既可以是患者或其他自愿接受干预的个体,也可以是干预的提供者,或者两者均包括在内。例如,在一个继续教育干预试验中,参与者可以是从事健康专业学员和受过培训的教师,那么试验可随机分为教师组和学员组。在整群试验中,如果随机分组是在两个不同的层次上(如组织和个人参与),那么每个域得分可能需要单独分开考虑。

步骤三:在PRECIS-2轮状模型上对步骤二中的每个维度进行1~5分评分:如果不清楚试验设计在某个特定维度是解释性还是实用性的,那么可以在PRECIS-2轮状模型上对其先不评分,表明这一维度存在一定的不确定性,需要进行集体讨论。同时,若评分的变异较大也需要进一步探讨,并缩小评分范围,按1~4分进行,以增加评分的一致性。

在步骤二中确定试验设计时,记录PRECIS-2轮状模型各个维度是偏向解释性还是倾向于实用性。每个维度评价可以参考以下5个等级:①解释性非常强;②解释性很强;③解释性一般;④实用性很强;⑤实用性非常强。

步骤四:回顾PRECIS-2轮状模型:回顾PRECIS-2轮状模型中各个维度选择依据和理由(步骤二),以确定试验设计与最初目标是否一致,并回到步骤二进行修正。

www.precis-2.org中研究者提供了PRECIS-2具体实践操作指南。在PRECIS-2工具官网中提供了PRECIS-2各个维度评分的4个试验案例分析:印度提高农村孕产妇和新生儿健康的随机试验[20],英国关于哮喘控制的药物初级干预试验[21],音乐治疗学龄前儿童自闭症的国际试验[22],冠状动脉造影的国际外科试验[23]。通过以上4个试验案例分析,研究者可以详细了解每个维度上实用和解释的不同之处。最近,伦敦大学玛丽皇后学院7个已经或者即将要开展不同RCT的研究团队,围绕PRECIS-2维度对各自的研究设计进行独立评分和讨论后再评分,结果表明讨论后再评分,研究者们之间可获得较好的一致性,清楚的了解研究属于何种类型,而直接进行评分者由于不熟悉真实环境的干预是怎样的以及PRECIS-2各个维度的含义,因而各研究者之间的评分差异较大,所以Forbes等[24]建议在进行PRECIS-2评分前,需要进行一个培训和讨论,才能更好的开展PRECIS-2。

4.总结:PRECIS-2工具是在PRECIS初始版本基础上发展和改进的。试验研究者通过对PRECIS-2轮状模型的每个维度进行1~5分的评分,可以使各利益相关方清楚地了解团队内成员对每个维度的意见和预期目标,并最终达成共识,从而避免单纯的将RCT简单地分为PRCT或ERCT。PRECIS-2帮助临床试验研究者确保研究设计与预期的研究目标一致,以确定研究结果的适用性,因此该工具在一定程度上推动了RCT的发展[4]。PRECIS-2具有兼顾试验设计者们对各维度定量判断的优点,因为每个判断或决定都没有一个明确的“正确”答案,相反可以通过试验团队对这些判断进行充分的讨论来明确。PRECIS-2工具的开发和详细指南,可以帮助研究者兼顾临床实际环境条件,了解RCT的适用场景,改善研究设计使之与研究目的相符,从而为临床干预设计试验提供更加有力的决策证据[5, 11]。因此,Journal of Clinical Epidemiology于2017年围绕PRECIS-2的实用性设计选择,具体操作和挑战,操作可行性和伦理可接受性的影响,以及试验结果的普遍性、有效性和精确性等方面进行了一系列的报道[4-5, 12, 17, 19]。此外,由于PRECIS-2工具专注于适用性问题,在很大程度上可以减少由于试验设计的不匹配造成的浪费。综上,PRECIS-2工具的发展使RCT设计和干预适用性更加明确,在临床试验研究方面具有广泛的应用前景。


利益冲突:
参考文献
[1] 唐金陵, 江宇, 张宏伟. 随机对照试验[M]//李立明. 流行病学. 6版. 北京: 人民卫生出版社, 2007: 128-163.
Tang JL, Jiang Y, Zhang HW. Randomized controlled trial[M]//Li LM. Epidemiology. 6th ed. Beijing: People's Medical Publishing House, 2007: 128-163.
[2] 张彦红, 梁伟雄, 朱磊, 等. 实用性临床试验与解释性临床试验的比较[J]. 中国中西医结合杂志, 2009, 29(2): 161–164.
Zhang YH, Liang WX, Zhu L, et al. Comparison of pragmatic clinical trials and explanatory clinical trials[J]. Chin J Integr Tradit West Med, 2009, 29(2): 161–164. DOI:10.3321/j.issn:1003-5370.2009.02.018
[3] 杨祖耀, 詹思延. 随机对照试验的新进展[G]//詹思延. 流行病学进展(第12卷). 北京: 人民卫生出版社, 2010: 377-400.
Yang ZY, Zhan SY. New Development of Randomized controlled trial[G]//Zhan SY. Progress in epidemiological. Vol 12. Beijing: People's Medical Publishing House, 2010: 377-400.
[4] Dekkers OM, Bossuyt PM, Vandenbroucke JP. How trial results are intended to be used:is PRECIS-2 a step forward?[J]. J Clin Epidemiol, 2017, 84: 25–26. DOI:10.1016/j.jclinepi.2016.01.033
[5] Zwarenstein M, Treweek S, Loudon K. PRECIS-2 helps researchers design more applicable RCTs while CONSORT Extension for Pragmatic Trials helps knowledge users decide whether to apply them[J]. J Clin Epidemiol, 2017, 84: 27–29. DOI:10.1016/j.jclinepi.2016.10.010
[6] Thorpe KE, Zwarenstein M, Oxman AD, et al. A pragmatic-explanatory continuum indicator summary (PRECIS):a tool to help trial designers[J]. J Clin Epidemiol, 2009, 62(5): 464–475. DOI:10.1016/j.jclinepi.2008.12.011
[7] Thorpe KE, Zwarenstein M, Oxman AD, et al. A pragmatic-explanatory continuum indicator summary (PRECIS):a tool to help trial designers[J]. CMAJ, 2009, 180(10): E47–57. DOI:10.1503/cmaj.090523
[8] 胡贵平, 胡亚楠, 詹思延. PRECIS研究进展[J]. 中华流行病学杂志, 2016, 37(3): 439–442.
Hu GP, Hu YN, Zhan SY. Progress in research of pragmatic-explanatory continuum indicator summary[J]. Chin J Epidemiol, 2016, 37(3): 439–442. DOI:10.3760/cma.j.issn.0254-6450.2016.03.031
[9] Ford I, Norrie J. Pragmatic trials[J]. N Engl J Med, 2016, 375(5): 454–463. DOI:10.1056/NEJMra1510059
[10] Karanicolas PJ, Montori VM, Devereaux PJ, et al. A new "mechanistic-practical" framework for designing and interpreting randomized trials[J]. J Clin Epidemiol, 2009, 62(5): 479–484. DOI:10.1016/j.jclinepi.2008.02.009
[11] Loudon K, Treweek S, Sullivan F, et al. The PRECIS-2 tool:designing trials that are fit for purpose[J]. BMJ, 2015, 350: h2147. DOI:10.1136/bmj.h2147
[12] Riddle DL. Consequences of randomized clinical trial design decisions need to be clarified[J]. J Clin Epidemiol, 2016, 77: 13–14. DOI:10.1016/j.jclinepi.2016.02.028
[13] Zwarenstein M, Treweek S, Gagnier JJ, et al. Improving the reporting of pragmatic trials:an extension of the CONSORT statement[J]. BMJ, 2008, 337: a2390. DOI:10.1136/bmj.a2390
[14] Koppenaal T, Linmans J, Knottnerus JA, et al. Pragmatic vs explanatory:an adaptation of the PRECIS tool helps to judge the applicability of systematic reviews for daily practice[J]. J Clin Epidemiol, 2011, 64(10): 1095–1101. DOI:10.1016/j.jclinepi.2010.11.020
[15] Tosh G, Soares-Weiser K, Adams CE. Pragmatic vs explanatory trials:the pragmascope tool to help measure differences in protocols of mental health randomized controlled trials[J]. Dialogues Clin Neurosci, 2011, 13(2): 209–215.
[16] Loudon K, Zwarenstein M, Sullivan F, et al. Making clinical trials more relevant:improving and validating the PRECIS tool for matching trial design decisions to trial purpose[J]. Trials, 2013, 14: 115. DOI:10.1186/1745-6215-14-115
[17] Nieuwenhuis JB, Irving E, Oude RK, et al. Pragmatic trial design elements showed a different impact on trial interpretation and feasibility than explanatory elements[J]. J Clin Epidemiol, 2016, 77: 95–100. DOI:10.1016/j.jclinepi.2016.04.010
[18] Bratton DJ, Nunn AJ, Wojnarowska F, et al. The value of the pragmatic-explanatory continuum indicator summary wheel in an ongoing study:the bullous pemphigoid steroids and tetracyclines study[J]. Trials, 2012, 13: 50. DOI:10.1186/1745-6215-13-50
[19] Zuidgeest MG, Goetz I, Grobbee DE, et al. PRECIS-2 in perspective:what is next for pragmatic trials?[J]. J Clin Epidemiol, 2017, 84: 22–24. DOI:10.1016/j.jclinepi.2016.02.027
[20] Tripathy P, Nair N, Mahapatra R, et al. Community mobilisation with women's groups facilitated by Accredited Social Health Activists (ASHAs) to improve maternal and newborn health in underserved areas of Jharkhand and Orissa:study protocol for a cluster-randomised controlled trial[J]. Trials, 2011, 12: 182. DOI:10.1186/1745-6215-12-182
[21] Price D, Musgrave SD, Shepstone L, et al. Leukotriene antagonists as first-line or add-on asthma-controller therapy[J]. N Engl J Med, 2011, 364(18): 1695–1707. DOI:10.1056/NEJMoa1010846
[22] Geretsegger M, Holck U, Gold C. Randomised controlled trial of improvisational music therapy's effectiveness for children with autism spectrum disorders (TIME-A):study protocol[J]. BMC Pediatr, 2012, 12: 2. DOI:10.1186/1471-2431-12-2
[23] Jolly SS, Niemelä K, Xavier D, et al. Design and rationale of the radial versus femoral access for coronary intervention (RIVAL) trial:a randomized comparison of radial versus femoral access for coronary angiography or intervention in patients with acute coronary syndromes[J]. Am Heart J, 2011, 161(2): 254–260. DOI:10.1016/j.ahj.2010.11.021
[24] Forbes G, Loudon K, Treweek S, et al. Understanding the applicability of results from primary care trials:lessons learned from applying PRECIS-2[J]. J Clin Epidemiol, 2017, 90: 119–126. DOI:10.1016/j.jclinepi.2017.06.007