文章信息
- 李婷, 何金戈, 杨长虹, 李京, 肖月, 李运葵, 陈闯, 吴建林.
- Li Ting, He Jin'ge, Yang Changhong, Li Jing, Xiao Yue, Li Yunkui, Chen Chuang, Wu Jianlin
- SaTScan与FleXScan软件空间扫描统计量法在肺结核疫情空间聚集性研究中的应用比较
- A comparative study on SaTScan and FleXScan software for spatial clustering analysis regarding the incidence of pulmonary tuberculosis
- 中华流行病学杂志, 2020, 41(2): 207-212
- Chinese Journal of Epidemiology, 2020, 41(2): 207-212
- http://dx.doi.org/10.3760/cma.j.issn.0254-6450.2020.02.013
-
文章历史
收稿日期: 2019-04-04
探测肺结核的空间聚集性不仅能够了解其在空间上分布情况,还能识别肺结核发病的高风险区域,可为进一步采取有针对性的防控措施和卫生决策,以及进行卫生资源的合理区域配置提供一定的科学依据[1]。空间扫描统计方法是目前疾病聚集性分析最常使用的方法之一,其中以1997年Kulldorff[2]提出的圆形空间扫描统计量法(circular spatial scan statistic,SaTScan)应用最为广泛,已在国内用于结核病高发时间段和空间区域的识别[3-4]。与该法采用圆形扫描窗口进行扫描不同的是2005年日本统计学家Tango和Takahashi[5]提出基于不规则扫描窗口的可变形空间扫描统计量法(flexible spatial scan statistic,FleXScan),在近几年也得到了一定的应用[1, 6]。四川省是我国结核病疫情最严重省份之一[7]。本研究采用2018年四川省肺结核发病资料,分别使用SaTScan与FleXScan软件对肺结核发病的空间聚集区域进行探测,识别重点防控区域,并比较2种空间扫描方法在应用效果上的差异,为同行应用者提供参考依据。
资料与方法1.资料来源:从中国疾病预防控制信息系统传染病报告信息管理系统中获取四川省181个县(区)[2018年四川省行政规划中有183个县(区),但为与矢量地图匹配,依据行政规划调整,分别将前锋区、恩阳区并入广安区、巴州区]2018年统计表中肺结核报告发病例数和报告发病率(包括涂阳、涂阴、菌阴、仅培阳和未痰检,按照发病日期进行统计)。人口基数来源于中国疾病预防控制信息系统基本信息系统中的2018年四川省常住人口数。以县(区)代码为主索引,建立包括肺结核疫情、人口、经度和纬度等信息的地理信息数据库。
2.研究方法:
(1)基本原理:①SaTScan法采用大小和位置均可动态变化的圆形扫描窗口,对每个扫描窗口,根据实际发病数和人口数计算出理论发病数,然后利用扫描窗口内和扫描窗口外的实际发病数和理论发病数构造检验统计量对数似然比(log-likelihood ratio,LLR)来评价窗口内的发病数是否异常,并通过蒙特卡罗法模拟进行统计学检验,计算概率值[8]。LLR值越大且差异具有统计学意义,则表示该动态窗口下所含区域为聚集区域的概率越大[9]。其中一级空间聚集区域的LLR值最大,二级空间聚集区域较一级空间聚集区域的LLR值小,以此类推[10];②FleXScan法是一种对聚集区域形状不作限定、以不规则扫描窗口进行不同区域的动态扫描、根据区域间的地理连接关系将聚集区域限定在与其相邻的较小区域内的空间扫描方法[5],其与SaTScan一样,通过对样本空间分布进行Poisson分布拟合计算扫描窗口内理论发病数,由LLR值判定聚集性大小。与SaTScan不同之处在于,FleXScan的扫描窗口大小变化不是基于研究区域总人口数,而是根据预先设定的最大距离或最多相邻区域K。K的取值由1开始增加,直到预先设定的最大值,一般设为15。此方法同样可以探测到多个聚集区,除最可能的聚集区外,与最可能聚集区无重合且同样具有统计学意义的其他聚集区称为次级聚集区[11]。
(2)参数设置:SaTScan 9.4.1软件和FleXScan 3.1.2软件均选择Poisson模型。在SaTScan中将最大扫描窗口设置为研究区域内全部风险人口的50%;在FleXScan中将空间聚集区域最大值设置为K=15。
(3)统计学分析:首先根据各县(区)在地理上的相互邻接关系,采用ArcGIS 10.5软件生成空间邻接矩阵,再分别应用SaTScan 9.4.1与FleXScan 3.1.2软件对2018年四川省肺结核发病资料进行空间扫描,最后使用ArcGIS 10.5将空间扫描结果与矢量地图结合进行空间聚集性地图的绘制。检验水准α=0.05,双侧检验。
结果1.疫情概况:四川省181个县(区)2018年肺结核报告病例数47 601例,报告发病率为57.34/10万(47 601/83 019 996)。报告发病率最高的是甘孜藏族自治州(甘孜州)理塘县(431.10/10万),最低的是雅安市荥经县(20.12/10万)。地区差异明显,川西地区报告发病率较高,川中地区较低,见图 1。
2.空间扫描结果:
(1)SaTScan法结果:扫描得到8个有统计学意义的聚集区域,共涉及54个县(区)。一级聚集区(即最有可能聚集区域)以凉山彝族自治州(凉山州)美姑县为聚集中心,波及11个县(区),报告发病率为68.86/10万~282.90/10万(LLR=2 416.05,RR=3.75,P<0.05)。二级聚集区以甘孜州石渠县为聚集中心,波及20个县(区),报告发病率在47.70/10万~431.10/10万之间(LLR=1 738.91,RR=4.08,P<0.05)。三级聚集区以广元市朝天区为聚集中心,波及10个县(区),报告发病率在63.85/10万~93.05/10万之间(LLR=150.00,RR=1.35,P<0.05)。四至八级聚集区分别包括4、5、1、2、1个县(区)(LLR值分别为89.15、67.42、62.87、30.93、24.62,RR值分别为1.39、1.29、1.87、1.41、1.48,均P<0.05),见图 2,表 1。
(2)FleXScan法结果:扫描探测到了10个形状不规则的肺结核发病空间聚集范围,共涉及70个县(区)。一级聚集区波及11个县(区),报告发病率为118.95/10万~282.90/10万(LLR=2 618.96,RR=3.54,P<0.05)。次级聚集区-1波及11个县(区)报告发病率为166.92/10万~431.10/10万(LLR=1 667.63,RR=4.90,P<0.05)。次级聚集区-2波及9个县(区),报告发病率为82.36/10万~250.95/10万(LLR=216.75,RR=1.84,P<0.05)。四至八级聚集区分别包括9、2、8、4、3、6、7个县(区)(LLR值分别为167.92、152.73、141.81、76.47、21.12、20.31、1.48,RR值分别为1.34、3.70、1.36、1.35、1.26、1.45、1.11,P均<0.05),见图 3,表 2。
(3)2种扫描方法结果比较:探测到的一级聚集区高度相似。FleXScan法扫描出的次级聚集区-1全部包含在SaTScan法的二级聚集区内,但减少了新龙县等9个县(区)。FleXScan扫描出的次级聚集区-2与SaTScan的三级聚集区完全不重合。被2种方法判定的聚集区类型不一致的有27个县(区)[仅包括了2种方法中有任意一种判定为前三级聚集区的县(区)]。其中,差异在3级及以上的有17个,见图 4。SaTScan判定为无聚集性区的普格县、石棉县、康定市、稻城县、木里县、冕宁县分别被FleXScan法判定为一级、三级聚集区(普格县为一级聚集区,其余为三级聚集区);SaTScan判定为一级聚集区的金口河区被FleXScan法判定为无聚集性区;SaTScan判定为二级聚集区的金川县、马尔康市、若尔盖县、红原县、丹巴县、新龙县分别被FleXScan判定为九级、九级、五级、五级、无聚集性区、无聚集性区。结合本地及其周围地区的发病率来看,多数情况下FleXScan结果更符合实际。如金口河区实际发病情况并不高,甚至低于周边县(区),却被SaTScan将其与邻近的峨边县、甘洛县一同被判定为一级集聚区,而FleXScan则将其与临近的聚集性区域区分开来,判断为无聚集性区。但也有少数FleXScan结果不符合实际的情况,如若尔盖县和红原县发病率较高,与邻近的被FleXScan判定为二级聚集区的阿坝县相近,被SaTScan判定为二级聚集区但却被FleXScan判定为五级,而其报告发病率高于FleXScan判定出的四级聚集区和大部分三级聚集区(为使比较更直观,将FleXScan扫描结果中的次级聚集区-1记为二级聚集区,以此类推)。
讨论目前,结核病仍是各国关注的严重公共卫生问题,是全球范围内对人类最具威胁性和挑战性的传染性疾病之一。本研究显示2018年四川省肺结核报告发病率为57.34/10万,低于2011-2015年的结果(72.86/10万)[4],可见四川省的结核病防控工作已取得一定的成效。
空间扫描统计不但可以判断疾病分布是否存在空间聚集性,还可以对疾病聚集位置和范围定位。两种空间扫描软件的结果大致相同,均显示2018年四川省肺结核发病在空间上具有聚集性,说明该地仍存在肺结核发病的高风险区域,这提示研究者继续对肺结核进行监测、开展危险因素调查等专项工作、及时掌握肺结核的流行特征和发病趋势、警惕聚集区内疫情暴发情况的出现存在一定的必要性。2种方法探测到的最有可能聚集区域内都覆盖了大、小凉山地区,包括凉山州东部的县以及乐山市与凉山州接壤的2个彝族自治县(峨边县、马边县)也是四川省彝族聚居的地区[12],少数民族人口比例均>50%[13]。这些地区在2011-2012年处于二级聚集区[4],2018年上升为一级,说明传播风险仍在增加。有研究显示,彝族聚居地区结核病疫情较重,彝族居民的居住环境和生活习惯、经济水平较为落后,导致患者有病不就医、不及时检查和治疗,从而成为传染源[14]。同时,美姑县、越西县、昭觉县、甘洛县、金阳县、布拖县等已处于艾滋病高流行期[15],在这些艾滋病高流行区,艾滋病病毒感染者和艾滋病患者中结核共感染患者可能增加,从而加重结核病疫情[12]。四川省地形地貌复杂,西高东低的特点特别明显。二级聚集区共同覆盖了川西高原的甘孜州和阿坝州部分地区,提示川西高原区域仍是结核病高风险传播聚集区,应采取措施加强结核病的控制工作,特别是做好肺结核的发现和治疗管理工作并开展专项调查,探明肺结核发病的影响因素。
进一步对比2种方法的扫描结果发现,二者在扫描出的聚集区域形状和范围上有所差异。SaTScan的一级聚集区覆盖了实际发病情况并不高的金口河区,同样的情况也出现在了在SaTScan二级聚集区中的丹巴县和新龙县,后者的报告发病率甚至低于全省平均水平。这些地区在FleXScan中被正确判定为无聚集性区,即所谓的“冷点”。李思等[1]的研究中也发现了类似结果,SaTScan的结果显示聚集区范围内还包含实际发病情况低于整体发病率平均水平的个别地区。一方面,根据SaTScan和FleXScan的扫描原理,SaTScan以动态的圆形或近似圆形空间进行扫描,因此探测出的聚集区也是圆形或近似圆形,而在地理形状不规则区域,SaTScan会把周围一些没有发病升高风险的区域加入到计算中,导致其更容易探测出比真实情况范围更大的聚集区域;FleXScan是用动态变化的不规则形空间扫描窗口进行扫描,并且扫描的热点区域都是在地理边界上相互连接的,因此也限制了不规则扫描的半径,所得到的聚集区也是在每个起始区域周边较小的邻域内的不规则的形状[2, 16]。另一方面,也应关注这些县,防止向聚集区域转变,同时要考虑是否存在传染病漏报。而FleXScan的一级聚集区中包括的普格县在SaTScan法中被判断为无聚集性区,该县报告发病率是全省平均水平的3倍以上;同样未由SaTScan识别出来而被FleXScan法判定为三级聚集区的石棉县、康定市、稻城县、木里县、冕宁县等报告发病率均远高于四川省平均水平。可能是由于这些地区特殊的地形导致使用不规则形扫描将有可能探测到圆形扫描探测不到的不规则形状聚集区域[16]。Flexible统计量在非圆形聚集区域中的检验效能优于圆形扫描,且探测出的聚集区域更符合实际情况[17]。FleXScan法比SaTScan法更适合应用于边缘不规则的场景。但是红原县和若尔盖县被FleXScan法单独判定为五级聚集区,而其报告发病率高于该法判定出的四级聚集区和大部分三级聚集区。文献表明,圆形扫描对圆形或近似圆形聚集区域的检验效能稍高[17]。出现上述结果可能和这两个县的边界较规整,近似圆形有关。
本研究采用两种方法探测四川省2018年肺结核报告发病率的空间聚集性,总体结果相似,但FleXScan结果相对更准确,更利于精准区分高聚集性区域中的“冷点”地区。然而Flexible空间扫描统计量因未考虑时间因素,有其局限性。因此长期连续利用不同方法探索多种疾病的时空聚集性对获取适合当地的探测方法及疾病的监测、早期预警具有更大的意义[16]。
本研究存在不足,以县域为尺度,导致数据精确度不够,在更小的尺度上比较不同方法的应用也是今后需要进一步完善和探究的方向。
综上所述,四川省肺结核疫情存在明显的空间聚集性,大、小凉山地区和川西高原少数民族地区是高风险和重点防控区域。FleXScan法更利于精准区分高聚集性区域中的“冷点”地区,更适合在四川省肺结核聚集性探测中应用。下一步研究中可加入时间维度做时空聚集分析,全面了解结核病流行特征和趋势。
利益冲突 所有作者均声明不存在利益冲突
[1] |
李思, 朱渭萍, 陆一涵, 等. 应用SaTScan与FleXScan识别丙型肝炎发病的高风险区域[J]. 中华疾病控制杂志, 2017, 21(8): 805-808, 817. Li S, Zhu WP, Lu YH, et al. Identifying the high-risk areas of the incidence of hepatitis C by using SaTScan and FleXScan[J]. Chin J Dis Control Prev, 2017, 21(8): 805-808, 817. DOI:10.16462/j.cnki.zhjbkz.2017.08.013 |
[2] |
Kulldorff M. A spatial scan statistic[J]. Commun Stat Theory Methods, 1997, 26(6): 1481-1496. DOI:10.1080/03610929708831995 |
[3] |
单志力, 徐刚, 周祖木, 等. 2008-2013年温州市肺结核疫情时空流行病学分析[J]. 中国防痨杂志, 2016, 38(2): 99-103. Shan ZL, Xu G, Zhou ZM, et al. Epidemiological analysis on the spatiotemporal clustering of pulmonary tuberculosis in Wenzhou from 2008 to 2013[J]. Chin J Antituberc, 2016, 38(2): 99-103. DOI:10.3969/j.issn.1000-6621.2016.02.006 |
[4] |
李婷, 何金戈, 杨长虹, 等. 基于空间聚集性与时空扫描的肺结核流行特征分析[J]. 中国防痨杂志, 2016, 38(12): 1032-1040. Li T, He JG, Yang CH, et al. A clustering study on pulmonary tuberculosis based on pure spatial clustering and spatiotemporal scanning[J]. Chin J Antituberc, 2016, 38(12): 1032-1040. DOI:10.3969/j.issn.1000-6621.2016.12.007 |
[5] |
Tango T, Takahashi K. A flexibly shaped spatial scan statistic for detecting clusters[J]. Int J Health Geogr, 2005, 4: 11. DOI:10.1186/1476-072X-4-11 |
[6] |
林定文, 崔哲哲, 潘冬香, 等. 基于Flexible空间扫描统计量的广西学校结核病流行病学分析[J]. 中国防痨杂志, 2017, 39(11): 1212-1217. Lin DW, Cui ZZ, Pan DX, et al. Epidemiological analysis of tuberculosis among students in Guangxi based on flexibly shaped spatial scan statistics[J]. Chin J Antituberc, 2017, 39(11): 1212-1217. DOI:10.3969/j.issn.1000-6621.2017.11.012 |
[7] |
李婷, 何金戈, 张佩如, 等. 2012年四川省结核病流行病学调查结果分析[J]. 预防医学情报杂志, 2013, 29(11): 937-941. Li T, He JG, Zhang PR, et al. Epidemiology of tuberculosis in Sichuan in 2012[J]. J Prev Med Inf, 2013, 29(11): 937-941. |
[8] |
Jung I, Kulldorff M, Klassen AC. A spatial scan statistic for ordinal data[J]. Stat Med, 2007, 26(7): 1594-1607. DOI:10.1002/sim.2607 |
[9] |
Song CH, Kulldorff M. Power evaluation of disease clustering tests[J]. Int J Health Geogr, 2003, 2(1): 9. DOI:10.1186/1476-072X-2-9 |
[10] |
赵飞, 王黎霞, 成诗明, 等. 中国2008-2010年结核病空间分布特征分析[J]. 中华流行病学杂志, 2013, 34(2): 168-172. Zhao F, Wang LX, Cheng SM, et al. Analysis on the spatial clustering of tuberculosis based on provincial level in China from 2008 to 2010[J]. Chin J Epidemiol, 2013, 34(2): 168-172. DOI:10.3760/cma.j.issn.0254-6450.2013.02.015 |
[11] |
赵月.四川省甘孜藏族自治州棘球蚴病空间聚集性分析[D].北京: 中国疾病预防控制中心, 2015. Zhao Y. Spatial clustering analysis of echinococcosis in Ganzi Tibetan autonomous prefecture, Sichuan province[D]. Beijing: Chinese Center for Disease Control and Prevention, 2015. |
[12] |
李婷, 杨长虹, 何金戈, 等. 四川省凉山彝族自治州2011-2016年痰涂片阳性肺结核疫情时空分布特征[J]. 中华流行病学杂志, 2017, 38(11): 1518-1522. Li T, Yang CH, He JG, et al. Spatial-temporal distribution of smear positive pulmonary tuberculosis in Liangshan Yi autonomous prefecture, Sichuan province, 2011-2016[J]. Chin J Epidemiol, 2017, 38(11): 1518-1522. DOI:10.3760/cma.j.issn.0254-6450.2017.11.016 |
[13] |
国家统计局人口和就业统计司, 国家民族事务委员会经济发展司. 中国2010年人口普查分民族人口资料[M]. 北京: 民族出版社, 2013. The Department of Population and Employment Statistics of the State Statistical Bureau, The Department of Economic Development of the State Ethnic Affairs Commission. China 2010 population census:ethnic population data[M]. Beijing: Nationalities Publishing House, 2013. |
[14] |
李京, 李婷, 逯嘉, 等. 2006-2015年四川省彝区与非彝区肺结核流行病学特征分析[J]. 中国防痨杂志, 2017, 39(12): 1318-1323. Li J, Li T, Lu J, et al. A study on epidemiological characteristics of pulmonary tuberculosis in Yi and non Yi districts in Sichuan province from 2006 to 2015[J]. Chin J Antituberc, 2017, 39(12): 1318-1323. DOI:10.3969/j.issn.1000-6621.2017.12.013 |
[15] |
朱成华, 周艺彪, 宋秀霞, 等. 四川省凉山州艾滋病流行原因及防治状况进展[J]. 复旦学报:医学版, 2015, 42(5): 675-679. Zhu CH, Zhou YB, Song XX, et al. Review on the influence factors of AIDS epidemic and control in Liangshan prefecture Sichuan province of China[J]. Fudan Univ J Med Sci, 2015, 42(5): 675-679. DOI:10.3969/j.issn.1672-8467.2015.05.020 |
[16] |
蒋小娟, 孟蕾, 李治平, 等. SaTScan和FleXScan在甘肃省传染病空间聚集性探测中的应用研究[J]. 中华疾病控制杂志, 2015, 19(11): 1185-1186. Jiang XJ, Meng L, Li ZP, et al. Application of SaTScan and FleXScan in spatial aggregation detection of infectious diseases in Gansu province[J]. Chin J Dis Control Prev, 2015, 19(11): 1185-1186. DOI:10.16462/j.cnki.zhjbkz.2015.11.028 |
[17] |
McLauchlan PE, Collet B, Ingerslev E, et al. DNA vaccination against viral haemorrhagic septicaemia (VHS) in rainbow trout:size, dose, route of injection and duration of protection-early protection correlates with Mx expression[J]. Fish Shellfish Immun, 2003, 15(1): 39-50. DOI:10.1016/S1050-4648(02)00137-7 |