中华流行病学杂志  2020, Vol. 41 Issue (4): 589-593   PDF    
http://dx.doi.org/10.3760/cma.j.cn112338-20191030-00770
中华医学会主办。
0

文章信息

李意杰, 阚慧, 何一宁, 李亚欣, 牟育彤, 戴江红, 郑英杰.
Li Yijie, Kan Hui, He Yining, Li Yaxin, Mu Yutong, Dai Jianghong, Zheng Yingjie
横断面研究能否进行因果推断
May cross-sectional studies provide causal inferences?
中华流行病学杂志, 2020, 41(4): 589-593
Chinese Journal of Epidemiology, 2020, 41(4): 589-593
http://dx.doi.org/10.3760/cma.j.cn112338-20191030-00770

文章历史

收稿日期: 2019-10-30
横断面研究能否进行因果推断
李意杰1,2,3 , 阚慧1,2,3 , 何一宁1,2,3 , 李亚欣1,2,3 , 牟育彤1,2,3 , 戴江红4 , 郑英杰1,2,3     
1. 复旦大学公共卫生学院流行病学教研室, 上海 200032;
2. 国家卫生健康委员会卫生技术评估重点实验室(复旦大学), 上海 200032;
3. 复旦大学公共卫生学院公共卫生安全教育部重点实验室, 上海 200032;
4. 新疆医科大学公共卫生学院流行病与卫生统计学教研室, 乌鲁木齐 4830011
摘要: 基于变量调查(或测量)的共时性、统计学关联及幸存者偏倚等原因, 横断面研究被认为不能进行因果推断, 这是当前的"共识"。本文基于因果思维, 借助因果图, 首先明确定义真实截面和测量截面, 并识别截面概念仅存在于理论的特性。实际横断面研究中, 测量变量的共时性并不存在, 而是无一例外地表现为非共时性时序, 其实质上相当于测量变量间互为独立性假设, 或不存在有差别错分偏倚。类似于累积病例对照研究和历史性队列研究, 横断面研究均为暴露和结局已存在或发生后进行的测量, 这种测量相当于对变量值的历史重建或"考古"。这类研究进行因果推断的共性前提条件之一是, 测量变量与其历史变量间必须存在着因果律。测量变量均为真实变量的替代者, 测量变量间的时序在因果推断上并不重要。应加强对横断面研究分析性角色的认识。
关键词: 因果思维    截面    测量时序    因果推断    流行病学    观察    
May cross-sectional studies provide causal inferences?
Li Yijie1,2,3 , Kan Hui1,2,3 , He Yining1,2,3 , Li Yaxin1,2,3 , Mu Yutong1,2,3 , Dai Jianghong4 , Zheng Yingjie1,2,3     
1. Department of Epidemiology, School of Public Health, Fudan University, Shanghai 200032, China;
2. Key Laboratory for Health Technology Assessment, National Commission of Health and Family Planning, Fudan University, Shanghai 200032, China;
3. Key Laboratory of Public Health Safety, Ministry of Education, School of Public Health, Fudan University, Shanghai 200032, China;
4. Department of Epidemiology and Biostatistics, School of Public Health, Xinjiang Medical University, Urumqi 830011, China
Abstract: Due to the flaws inherited in synchronicity, statistical association and survivor bias on variables under measurement, a common 'consensus' has been reached on "cross-sectiional studies (CSS) can lead to failure on causal inference". In this paper, under both causal thinking and diagram, the real and measured cross-sections are clearly defined that these two concepts only exist theoretically. In real CSS research, the temporal orders of measured variables are all non-synchronic, equivalent to the assumption that measurement variables are independent to each other, or there is no differentiated classification bias. Similar to cumulative case-control or historical cohort studies, both exposure and outcome that exist or occur before their measurements in cross-sectional studies, are actions of historical reconstruction or doing 'Archaeology'. One of the common preconditions for causal inference in such studies is that:there must be a causal relation between the measured variables and their historical counterparts. The measured variables are all agents of their corresponding real counterparts, and the temporal orders are not that important in causal inference. It is necessary to better understand the analytic role of the CSS.
Key words: Causal thinking    Cross-section    Measured temporal orders    Causal inference    Epidemiology    Observation    

人群疾病和/或健康现象有其固有的规律:以时点横断面和纵向面人群为基础,采取合适的设计予以认识[1]。横断面研究(cross sectional study,CSS)是众多设计方法之一,通常被认为以掌握特定时点的人群疾病和/或健康现状为主要目标,从而快速满足卫生服务规划的需要,其在慢性病中较为常用[2]。此外,CSS也可用于一致性研究、诊断试验评价和质量控制等[3-4]

CSS也可研究各种可疑因素与结局(如疾病)的关系,如计算统计学关联。传统上认为,CSS调查中的暴露、结局和协变量是同时进行的(共时性,或截面),无法判定暴露与结局之间的时序[5-6];同时,随着时间推移,长病程疾病(如慢性病)将可能因死亡者的不均衡丢失,而导致幸存者偏倚[7-8]。基于此,通常认为CSS是以描述为主要特征,因而将其归入描述性流行病学范畴[9],只能用来进行分布特征的描述,提供病因线索,而不能进行因果推断。

这种认识存在着问题或误解:①共时性测量变量间的因果律是明确的,即无时序和零效应。然而,这个零效应常在测量上表现为统计学的非零关联,后者为研究者更为感兴趣。这种看似矛盾的做法,实际上意味着,测量变量(暴露与结局)间的非零关联可能有其固有的结构基础,即测量变量、对应的真实变量之间可能存在着某种开放路径[10-11],从而提示着这非零关联的可能解释之一是这两个真实变量之间在测量时点之前某一不明确的历史上存在着因果律。因此,以测量时点变量间关系,来否定其历史真实因果律的可能存在,进而否定因果推断实现的可能性,这种认识是错误的。②CSS中可能存在的幸存者偏倚,与队列研究和临床试验的失访偏倚[12],在因果结构上是相同的,均为选择性偏倚或碰撞偏倚[13]。人群选择是所有研究设计所必须的,偏倚影响因果推断是所有研究设计的共性问题,而不只是CSS才有。③真实发生或存在的变量值,是其被测量的前提。与累积病例对照研究和历史性队列研究类似,CSS也是在同样的前提下进行的研究或测量[11, 14]。这种测量相当于对变量值变量(暴露、结局或协变量)的历史重建或“考古”[15]。因此,CSS也可能具备因果推断的能力。

基于对CSS的认识上仍然存在的误解或疑问,本文从因果思维出发,结合因果图,来探讨CSS在因果推断研究中的可能性,以期获得正确的认识。

1. CSS截面的定义:为简单起见,本文设定大写字母代表真实值变量,其对应测量值变量以同名字母加上标“*”表示,各变量下标代表该变量发生或存在的时点。假定各变量的测量无偏并且互为独立性机制,混杂已得到有效的控制。以单箭头“→”代表箭头左侧变量对其右侧变量产生效应,即二者存在着因果律。默认时间轴方向自左向右。假定真实的暴露、真实的结局分别以变量A和Y表示,均为二分类(1=有,0=无),Δt为时间差。在观察的情况下,除随机测量外,真实的变量值决定着其测量值[16],即A0→A0*和Y0→Y0*成立(图 1)。

注:虚线表示变量间为截面时序;Δt代表A0*与Y0+Δt*之间的时间差 图 1 真实截面及其3种测量时序示意图

本文将截面(或横断面)定义为同一时点上两个及以上变量之间虚拟线段与时间轴垂直方向相交所形成的虚拟时间面。截面上变量间无因果律,无时间序(或横向时序)和因果序(或零效应)——由图 1可一目了然而无需进行任何研究(零效应)。若这两个变量为真实变量,则此截面为真实截面,如图 1①中A0与Y0之间的虚拟时间面。若A0和Y0得以同一时间测量,获得了A0*和Y0+Δt*图 1②,此时Δt=0),此时我们将A0*与Y0+Δt*之间的虚拟时序面定义为测量截面,与真实截面类似,测量截面上的测量变量间的测量时序亦为横向时序。

A0-Y0间的真实截面系理论概念,从而锚定了二者被测量的可能时间域及其测量时序。实践中,测量截面几乎难以获得。例如,采用同一张问卷,先询问暴露之后询问结局,这中间已经过了几毫秒、几秒或几分钟了。因此,测量截面的真实含义是,相差时间很短的变量间进行测量时不会相互影响(或测量的独立性),即对分类变量而言不存在有差别错分。然而,当研究的变量涉及敏感问题时,如收入、性行为、未婚流产等,这种看似很短的时间差,将可能对变量间测量产生影响,从而导致有差别错分的出现。类似的情形可见于实验室检测方法的一致性评价,如同一块微孔板上的多孔检测实验中,孔间加样存在着时间差,孔间存在着相互“污染”的可能,通常默认这种时间差微小而忽略其影响。由此可见,CSS中提及的暴露和结局测量的共时性,实践中并不存在或不容易得以实现。与真实截面类似,测量截面同样地只存在着理论上的可能性。

除了上述的测量截面时序外,依据测量时机的先后顺序,A0*和Y0+Δt*间的测量时序还可表现为纵向时序:即先测Y0+Δt*后测A0*(图 1③),即A0*与Y0+Δt*之间的时间差Δt<0,或先测A0*后测Y0+Δt*(Δt>0,图 1④)。

显然,研究一般不会对真实和测量截面上A0与Y0之间(或A0*与Y0+Δt*之间,图 1②)的零效应感兴趣,因为这个效应无需进行实际研究即可判断,为零!由于A0与Y0均未知,实际研究中只能通过其已知的测量版-A0*与Y0+Δt*来计算两者之间的关联。这种做法令人惊讶!在因果推断中,通常没有可能获得效应值,从而通过关联来估计效应是否存在及其大小有多少。而在此时,A0-Y0间(或A0*-Y0+Δt*间,图 1②)的零效应已经明确,我们却仍然坚持要计算A0*与Y0+Δt*间的关联。由此看来,CSS研究者存在着两种矛盾的做法:一方面,明确了截面时序上测量变量间存在着共时性的零效应,从而得出CSS难以完成判断真实的或测量的暴露与结局间的时序关系,进而认为CSS不能进行因果推断;另一方面,研究者的心目中却暗藏着探索二者关系的问题,即A0*-Y0+Δt*间是否存在关联。若A0*-Y0+Δt*间关联为零,此时该关联正确反映了A0*-Y0*间的零效应,反映了研究设计及其实施过程的准确性;若存在着非零关联,则意味着A0*-Y0+Δt*间在因果图上可能表现为存在某种开放路径,如共因、共果或因果关系等结构[10]。如何正确构建包含上述开放路径的因果图,是CSS进行因果推断研究的关键。

综上,不论是真实截面还是测量截面,CSS的共时性(或截面)是一个理论上的概念;CSS不存在变量测量的共时性,而是无一例外地表现为非共时性(或纵向测量时序)。然而,所有的测量变量均为其真实变量的替代者,在判断因果关系上,测量时序并不重要;真正重要的仍然是测量变量对应的历史真实值变量间的时序,这显然也无法从测量时序来进行判断。尽管如此,这种非共时性测量变量间的非零关联,提示着其在因果图上可能存在着某些开放路径,奠定了CSS进行因果推断和判断测量偏倚来源的可能性。

2. CSS数据产生机制及因果图:从当前的A0-Y0间的真实截面回溯过去,如果暴露(A)的确影响结局(Y),即过去某个时点一个个体出现了暴露(A-1),经过一段时间后,发生了比该个体未出现该暴露时的结局Y0更高的可能性,即暴露与结局的因果关系成立(A-1 →Y0)。此时,问题归结为A-1和A0之间会是什么关系?

了解暴露随着时间而发生发展是我们判断这种关系的前提。单次急性暴露,如广岛原子弹爆炸、单次接触污染物引起的食物中毒等,情形上较为简单,采用CSS进行研究时,此时真实截面不存在,而更为重要的是能否进行对历史发生的单次暴露进行准确的测量。以下假定进行慢性暴露与结局间的关系研究,因A-1在时序上先于A0,因此,二者存在着两种可能:

(1)A-1对A0存在因果律,即A-1 →A0:由图 2①,若A是不可改变的属性,如性别、出生日期、遗传标志物等[17],这种属性对任意一个个体来说,通常保持终身不变。因此,在任何时间进行这类属性的测量都是可行的。

注:Δt代表A0*与Y0*之间的时间差,可以为正数、负数或零;虚线联结代表着二者间为截面时序,仅Δt=0时存在 图 2 横断面研究因果图

若A随着时间而发生改变,但A-1→A0仍然成立,如慢性乙肝感染。从乙肝的自然史来看,绝大多数的慢性乙肝感染者来自于母婴传播,HBsAg的每年自然转阴率很低,约为2%~3%;因此,有理由相信,过去为慢乙肝感染者(A-1),现在也更可能是乙肝感染者A0[18]

(2)A-1对A0不存在因果律:若A-1→A0不成立(图 2②),A0*替代A-1的角色不成立,如涉及个人隐私的敏感信息,包括吸毒、性行为、未婚流产等。这类暴露不合适于采用CSS进行因果推断研究。

若暴露(A)不影响结局(Y),自A0*至Y0+Δt*经A-1-Y0的路径中断,此时不管A-1 →A0是否成立,因A-Y间为零效应,理论上说来A0*-Y0+Δt*间应当零关联。这种零关联将正确地反映A-Y的零效应。因此,基于下述理由,可认为零关联更可能是正确的:①所有经暴露-结局的开放路径不存在;②混杂子对暴露-结局的效应修饰不存在。当前忽视零关联而只愿意接受显著关联的学术论文的局面值得商榷。

综上,本文阐述了慢性暴露与结局间关系研究可能实现的情形,是否能够直接形成“自A-1至A0*的有向路径”的结构是CSS进行因果推断的关键。CSS并不像传统的认识那样,无法判断因果关系,但是这种推断需要对暴露和/或疾病自然史有深刻的认识,考验着每个研究者的水平。不管变量的特征如何,一旦上述结构成立,则A0*替代A-1的角色成立,即可相应地进行因果推断。

3.讨论:本文研究发现,CSS中截面(或共时性)只是个理论上的概念,现实研究中并不存在,测量变量间无一例外地表现为非共时性时序;CSS存在着因果推断的基础,其前提是测量暴露变量与其历史暴露变量间必须存在着因果律。

CSS中真实截面的确立,锚定了CSS的两种测量时序[3-4, 19]:截面测量和纵向测量。因截面为同时点概念,不管是真实截面还是测量截面,截面上变量间因果关系明确,即零效应,无因果序和时间序。然而,现实的原创研究中,测量截面并不存在[20],至多表现为数据收集时间段波动在某一具体的时间点附近,反倒是均表现为纵向测量时序。类似于累积病例对照研究和历史性队列研究,CSS也是在真实的暴露和真实的结局已存在或发生后进行的测量[11, 14],这种测量相当于对变量值变量(暴露、结局或协变量)的历史重建或“考古”[15]。此时,测量变量间的时序关系重要性,已次于测量变量的准确性。因此,以不存在的测量变量间的共时性,来否定其对应的历史上暴露-结局的先后关系,显然是不成立的。此外,测量变量无一例外地为真实变量的替代者,测量值变量间的关联基础是以真实值为混杂子的混杂结构(若真实效应的确存在)[11, 21],并不能作为真实因果律的时序判断依据。总而言之,测量变量间的时序在采用CSS进行因果推断时并不重要。

CSS中,非共时性的测量暴露与测量结局间若存在着非零关联,则意味着二者间可能存在某一开放路径,寻找真实暴露与真实结局是否是这一路径的组成因素,构成了CSS进行因果推断的基础。从暴露(和/或结局)自然发生发展的历史来看,若历史暴露与当前暴露间存在着因果律,则历史暴露与当前结局的因果律是上述非零关联的可能解释之一。此外,CSS进行正确的因果推断的前提条件还包括[22]:稳态人群、无幸存者偏倚、结局病程稳定、理论上暴露-结局的正确时序等。

不论是观察还是实验,所有因果推断的结构基础是理论上的、未知的因果关系,然而,认识这种关系均需通过(统计学的)关联予以实现[16, 23-25]。因此,观察性设计如队列研究、病例对照研究和CSS,或实验性设计如随机对照临床试验、现场试验等,在因果推断上并无不同。此外,所有的观察性设计和实验性设计均难免存在着信息偏倚、选择性偏倚和混杂[26],这也并非CSS所固有的特征。如CSS中的幸存者偏倚,与队列研究或临床试验中的失访偏倚,在因果结构上是相同的,均为选择性偏倚。因此,以统计学关联或幸存者偏倚的可能存在,否定CSS的因果推断能力,也是不正确的。

理论认识上的变化会极大地促进其在实际研究中的应用。由上可见,CSS不只是扮演着描述性角色,也可扮演分析性角色[20, 22, 26-27]。这种观念的转变,促使研究者更为积极思考并充分利用数据以实现这一分析性目的。如McLinden等[28]在HIV-HCV合并感染者中,以注射毒品使用情况作为暴露因素,以严重食物不安全作为结局,建立二者的因果关联估计;DeMaris[29]对CSS数据采用赫克曼选择模型(Heckman selection model,HSM)和工具变量回归以实现控制未测量的混杂因素。同时,这种新观念也促使CSS因果推断方法学的发展,如适合长潜伏期疾病的横断面队列研究的提出[19]、效应指标(现患率比与现患比值比)及其适用模型的讨论[22, 30]

综上所述,CSS可以进行因果推断,有一定的适应条件;因果推断的准确性,要结合研究目的,在深入理解暴露和/或结局自然发生发展的基础上,基于明确或假定的时序,形成因果研究框架。应加强CSS分析性角色的认识。

利益冲突  所有作者均声明不存在利益冲突

参考文献
[1]
Miettinen O. Design options in epidemiologic research. An update[J]. Scand J Work Environ Health, 1982, 8 Suppl 1: 7-14.
[2]
Yang WY, Lu JM, Weng JP, et al. Prevalence of diabetes among men and women in China[J]. N Engl J Med, 2010, 362(12): 1090-1101. DOI:10.1056/NEJMoa0908292
[3]
Feinstein AR. Clinical biostatistics. XLII. The architecture of cross-sectional research (Part I)[J]. Clin Pharmacol Ther, 1978, 23(1): 81-96. DOI:10.1002/cpt197823181
[4]
Feinstein AR. Clinical biostatistics. XLIII. The architecture of cross-sectional research (conclusion)[J]. Clin Pharmacol Ther, 1978, 23(4): 481-493. DOI:10.1002/cpt1978234481
[5]
Ahrens W, Pigeot I. Handbook of epidemiology[M]. New York: Springer Science+Business Media, 2014: 205-206.
[6]
Levin KA. Study design Ⅲ:Cross-sectional studies[J]. Evid Based Dent, 2006, 7(1): 24-25. DOI:10.1038/sj.ebd.6400375
[7]
Neyman J. Statistics; servant of all sciences[J]. Science, 1955, 122(3166): 401-406. DOI:10.1126/science.122.3166.401
[8]
Hill G, Connelly J, Hebert R, et al. Neyman's bias re-visited[J]. J Clin Epidemiol, 2003, 56(4): 293-296. DOI:10.1016/s0895-4356(02)00571-1
[9]
Sedgwick P. Bias in observational study designs: cross sectional studies[J]. BMJ, 2015, 350: h1286. DOI: 10.1136/bmj.h1286.
[10]
Rothman KJ, Greenland S, Lash TL. Modern Epidemiology[M]. 3rd ed. Philadelphia: Lippincott Williams & Wilkins, 2008: 5-31.
[11]
郑英杰, 蔡倩莹, 范伟, 等. 因果思维在效应估计若干问题中的应用[J]. 中华流行病学杂志, 2019, 40(10): 1314-1323.
Zheng YJ, Cai QY, Fan W, et al. The application of causal thinking in several issues in estimation of effects[J]. Chin J Epidemiol, 2019, 40(10): 1314-1323. DOI:10.3760/cma.j.issn.0254-6450.2019.10.026
[12]
Hernán MA, Hernández-Díaz S, Robins JM. A structural approach to selection bias[J]. Epidemiology, 2004, 15(5): 615-625. DOI:10.1097/01.ede.0000135174.63482.43
[13]
Pearce N, Richiardi L. Commentary:Three worlds collide:Berkson's bias, selection bias and collider bias[J]. Int J Epidemiol, 2014, 43(2): 521-524. DOI:10.1093/ije/dyu025
[14]
郑英杰, 赵耐青, 何一宁. 客观世界的因果关系:基于有向无环图的结构解析[J]. 中华流行病学杂志, 2018, 39(1): 90-93.
Zheng YJ, Zhao NQ, He YN. Causality in objective world:Directed Acycli Graphs-based structural parsing[J]. Chin J Epidemiol, 2018, 39(1): 90-93. DOI:10.3760/cma.j.issn.0254-6450.2018.01.019
[15]
Morabia A. Snippets from the past:is Flint, Michigan, the birthplace of the case-control study?[J]. Am J Epidemiol, 2013, 178(12): 1687-1690. DOI:10.1093/aje/kwt221
[16]
Hernan MA, Cole SR. Invited commentary:causal diagrams and measurement bias[J]. Am J Epidemiol, 2009, 170(8): 959-962. DOI:10.1093/aje/kwp293
[17]
Zuccolo L, Fitz-Simon N, Gray R, et al. A non-synonymous variant in ADH1B is strongly associated with prenatal alcohol use in a European sample of pregnant women[J]. Hum Mol Genet, 2009, 18(22): 4457-4466. DOI:10.1093/hmg/ddp388
[18]
Busch K, Thimme R. Natural history of chronic hepatitis B virus infection[J]. Med Microbiol Immunol, 2015, 204(1): 5-10. DOI:10.1007/s00430-014-0369-7
[19]
Hudson JI, Pope HG, Glynn RJ. The cross-sectional cohort study:an underutilized design[J]. Epidemiology, 2005, 16(3): 355-359. DOI:10.1097/01.ede.0000158224.50593.e3
[20]
Kesmodel US. Cross-sectional studies-what are they good for?[J]. Acta Obstet Gynecol Scand, 2018, 97(4): 388-393. DOI:10.1111/aogs.13331
[21]
Shahar E. Causal diagrams for encoding and evaluation of information bias[J]. J Eval Clin Pract, 2009, 15(3): 436-440. DOI:10.1111/j.1365-2753.2008.01031.x
[22]
Reichenheim ME, Coutinho ESF. Measures and models for causal inference in cross-sectional studies:arguments for the appropriateness of the prevalence odds ratio and related logistic regression[J]. BMC Med Res Methodol, 2010, 10: 66. DOI:10.1186/1471-2288-10-66
[23]
Agarwala A, Pokharel Y, Saeed A, et al. The association of lipoprotein(a) with incident heart failure hospitalization:atherosclerosis risk in communities study[J]. Atherosclerosis, 2017, 262: 131-137. DOI:10.1016/j.atherosclerosis.2017.05.014
[24]
Shahar E, Shahar DJ. Causal diagrams and three pairs of biases[C/OL]//Lunet N. Epidemiology-Current Perspectives on Research and Practice. https://www.intechopen.com/books/epidemiology-current-perspectives-on-research-and-practice/causal-diagrams-and-three-pairs-of-biasesInTech,2012:31-62.
[25]
Shahar E, Shahar DJ. Causal diagrams, information bias, and thought bias[J]. Pragmat Obs Res, 2010, 1: 33-47. DOI:10.2147/POR.S13335
[26]
Shahar E, Shahar DJ. Causal diagrams and the cross-sectional study[J]. Clin Epidemiol, 2013, 5: 57-65. DOI:10.2147/CLEP.S42843
[27]
McLinden T. Which is the cart and which is the horse? Getting more out of cross-sectional epidemiological studies[J]. Public Health Nutr, 2019, 22(11): 1-3. DOI:10.1017/S1368980019000624
[28]
McLinden T, Moodie EEM, Hamelin AM, et al. Injection drug use, unemployment, and severe food insecurity among HIV-HCV co-infected individuals:a mediation analysis[J]. AIDS Behav, 2017, 21(12): 3496-3505. DOI:10.1007/s10461-017-1850-2
[29]
DeMaris A. Combating unmeasured confounding in cross-sectional studies:evaluating instrumental-variable and Heckman selection models[J]. Psychol Methods, 2014, 19(3): 380-397. DOI:10.1037/a0037416
[30]
Axelson O, Fredriksson M, Ekberg K. Use of the prevalence ratio v the prevalence odds ratio in view of confounding in cross sectional studies[J]. Occup Environ Med, 1995, 52(7): 494. DOI:10.1136/oem.52.7.494