食管癌是消化道较常见恶性肿瘤之一,起源于食管或食管胃交界处的恶性肿瘤,发病率位居全世界恶性肿瘤第7位,死亡率位居第6位[1],严重威胁居民健康。手术治疗为大部分食管癌患者的首选方案。食管癌术后最致命的并发症为吻合口瘘(anastomotic leakage,AL),发病率约为5%~30%[2]。不仅影响患者生活质量,还会增加经济压力,甚至影响远期寿命[3]。预测模型是以数学模型为基础,结合预测因子,计算某事件结局的概率[4]。近年来,国内外许多研究者[5-20]针对食管癌术后AL专门建立风险预测模型。但对于模型的构建过程、性能以及数据样本偏倚等缺乏全面的对比研究,该工具是否能够应用于临床尚不明确。因此,本研究针对国内外食管癌术后AL预测模型的研究进行系统评价,为临床医护人员筛选AL相关风险预测模型提供指导。
1 资料与方法
1.1 纳入和排除标准
1.1.1 纳入标准
(1)研究对象为年龄≥18岁且病理检查确诊为食管癌患者;(2)研究内容为构建和/或验证食管癌术后AL预测模型;(3)研究设计为回顾性研究或前瞻性研究;(4)结局指标为术后发生AL,诊断方式采用CT、造影等影像学检查和/或临床特征综合判断[21],采用食管癌国际协作小组[22]提出的AL定义;(5)语言为中文或英文。
1.1.2 排除标准
(1)重复发表的文献;(2)综述、个案、会议摘要等文献;(3)无法获取原文的文献。
1.2 文献检索策略
计算机检索中华医学期刊全文数据库、维普、万方、中国知网、EMbase、Web of Science、Cochrane Library、PubMed公开发表的关于食管癌术后AL风险预测模型的研究,检索时间为建库至2023年10月1日。中文检索词包括:食管癌、食道癌、食管肿瘤、食道占位、吻合口瘘、食管瘘、吻合口漏、预测、预测模型、模型。英文检索词包括:esophageal neoplasm、neoplasm、esophageal、esophagus neoplasm、esophagus neoplasms、neoplasm、esophagus、neoplasms、esophagus、neoplasms、esophageal、cancer of esophagus、esophagus cancer、esophageal cancer、anastomotic fistula、esophageal fistula、anastomotic leak、prediction、prediction model、model。
1.3 文献筛选与资料提取
根据纳排标准,由两名研究员负责进行文献筛查。若存在分歧,则咨询第三方建议。按照Moons等[23]关于预测模型系统评价的数据收集条目(checklist for critical appraisal and data extraction for systematic reviews of prediction modelling studies,CHARMS),制订数据收集表,包括:第一作者、出版日期、国家、研究类型、随访时间、地点、结局指标、研究的样本量、构建模型的方法、建模数量、受试者工作特征曲线下面积(area under the curve,AUC)及校正方法、模型使用的验证方法、预测模型包含的影响因素、模型呈现方式等。
1.4 质量评价
采用PROBAST(prediction model risk of bias assessment tool)[24]评价工具评估文献的偏倚风险和适用性。从4个角度衡量模型的偏倚风险,即研究对象、预测因子、结果以及数据分析。适用性评价从3个角度进行,评价步骤与偏倚风险分析步骤相似。不同角度的评估标准为“低”“高”和“不清楚”3个分级,根据上述特征选择最佳模型。PROBAST不仅能评估单个模型,也能进行多个模型的比较。
1.5 统计学分析
使用Stata 15软件对模型纳入的预测因子进行Meta分析,OR值及95%CI作为效应统计量。采用Q检验及I2统计量评估多个研究的异质性。若P>0.1或I2<50%,认为研究间异质性小,选择固定效应模型;若P≤0.1或I2≥50%,则认为研究间异质性较大,进一步行敏感性分析,若异质性不能消除,则选择随机效应模型。P<0.05为差异有统计学意义。
2 结果
2.1 文献检索结果
通过检索相关数据库,获取相关研究1512篇,经过逐步筛选,确定纳入19篇文献[5-15,18-20,25-29],涉及7373名研究对象,文献筛选流程和结果见图1。

*:包括中国知网(
2.2 纳入文献的基本特征
本研究纳入文献均为近5年内发表文献,发表国家主要为中国,均为回顾性研究,其中中文文献14篇[5-13,18-19,25-27],英文文献5篇[14-15,20,28-29],食管癌术后患者AL的发病率在7.0%~23.9%之间。纳入文献基本特征见表1。

2.3 风险预测模型的基本特征
19篇文献[5-15,18-20,25-29]共构建25个食管癌患者术后AL风险预测模型,在模型构建方面,3篇文献[10-11,20]采用机器学习和logistic回归的方法分别建立预测模型,其余研究仅采用logistic回归分析建立模型。在连续变量的处理方法中,9篇文献[7,9,12,15,25-29]维持了连续变量的连续性,10篇文献[5-6,8,10-11,13-14,18-20]将连续型变量转换为分类变量。在变量选择方面,6篇文献[10-11,14,20,25-26]采用机器学习和单因素分析共同筛选变量,其余文献基于单因素分析;见表2。本研究纳入模型的AUC为0.67~0.960,灵敏度为43%~92%,特异度为78.9%~96.3%,其中23个预测模型[5-13,15,18-20,25,27-29]的预测性能较高(AUC>0.7);13篇文献[5,7-11,13-14,19,25-27,29]均报道了区分度和校准度;在模型验证方面,仅1篇文献[19]进行外部验证,10篇文献[7,9-10,13-14,19-20,26-27,29]进行内部验证,采用的方法主要是Bootstrap法和样本拆分法。模型呈现形式以列线图分析评分为主(n=13),其他方式为β系数绘制风险评分公式(n=5),1篇文献[10]未给出具体模型。预测模型的性能及呈现形式见表3。


2.4 文献质量评价
由两位研究员使用PROBAST量表[24]对文献质量进行全面评估,并仔细审查评价结果,确保其准确性。在研究对象领域,因研究设计为回顾性研究均为高偏倚风险;在预测因子领域,均为低偏倚风险;在数据分析领域,均为高偏倚风险。评价为高偏倚风险的原因包括:(1)文献建模组的样本量不足;每个自变量的发生次数(events per variable,EPV)<20例;(2)研究将连续型变量转换为分类变量;(3)研究基于单因素分析筛选变量;(4)未报告是否进行模型校准度检验;(5)文献未报道是否进行内部验证。在结果领域,均为低偏倚风险。在预测因子领域,所有的预测因子采用相同定义,但结局指标目前没有标准化,诊断方式多采用临床特征结合影像或内镜检查结果,有5篇文献[13,20,25-27]采用食管癌国际协作小组的AL定义。食管癌患者平均年龄通常在63~65岁之间[30],因此适用性评价均为好。整体评估显示,所有研究偏倚风险高,但预测模型适用性好;见表4。

2.5 Meta分析结果
采用文献数量≥3篇的预测因子进行Meta分析,结果显示:低蛋白血症、术后呼吸系统并发症、切口愈合不良、术前胸腹部手术史、术前合并糖尿病、术前合并心血管系统疾病、术前新辅助治疗、术前呼吸系统疾病、吻合方法、手术方式、美国麻醉医师协会(American Society of Anesthesiologists,ASA)评分是食管癌患者术后AL的独立危险因子(P<0.05)。纳入低蛋白血症的5篇文献[8,10-11,18-19]中,无论术前还是术后,低蛋白血症都是食管癌患者术后AL的独立危险因子[OR=9.362,95%CI(3.237,27.080),Z=4.13,P<0.001]。吻合部位不同可能是吻合方法统计学异质性的主要来源,亚组分析结果提示组内统计学差异较小,手工吻合是食管癌术后AL的独立危险因素[OR=2.965,95%CI(1.762,4.991),Z=4.09,P<0.001],相同吻合部位的手工吻合AL平均发生率为机械吻合的1.83倍。年龄和预后营养指数不是食管癌术后AL的独立危险因子(P>0.05)。其余研究敏感性分析中,依次删除相关研究后统计合并效应量,结果无显著差异。Meta分析结果见表5。

3 讨论
食管癌术后AL发病率和病死率高,AL风险预测模型具备早期发现高风险患者的能力,可指导医护人员及早采取预防措施,降低AL发生率。本研究纳入25个AL风险预测模型进行分析,建模方法主要为logistic回归,模型表现形式主要为列线图,大多数模型表现出较好的预测性能(AUC>0.7),但缺乏模型校准度领域评估及模型验证方面的研究。
3.1 食管癌患者术后AL预测模型尚处于探索阶段
本研究中大多数AL模型的区分度高,但是对于模型的构建、验证、结果报告并未深入优化。模型的构建步骤包括:明确研究方向、确定资料来源、变量筛选、数据预处理等。在资料来源方面,本研究纳入的25个预测模型中,所有研究均采用回顾性研究,因队列研究具有良好的代表性,未来在优化模型时建议选择前瞻性数据或注册数据作为建模数据[31],以减少数据偏倚风险[24]。截至目前,AL诊断没有金标准,诊断方式多采用临床特征与影像特征结合的综合判断,其中5篇文献[13,20,25-27]采用了食管癌国际协作小组[22]提出的AL定义;在变量筛选方面,大多数研究基于单因素logistic回归,可能会增加错误预测因子的选择风险[32]。目前有研究[33]提出新的变量筛选方法,如LASSO回归、Ridge回归、ElasticNet回归等,可减少过度拟合风险,建议未来变量的筛选可结合临床实际采用新方法,以提高筛选的准确性;对缺失数据进行报道和处理可避免模型出现过度拟合情况[34] ,建议未来研究对缺失数据进行完善。
在处理连续变量时,将连续性数据转化成分类变量后进行建模,可能会导致模型效能丢失过多。但在模型处于临床推广阶段时,为了提高研究者应用的方便性,可进行数据转换[35]。在性能评估方面,核心指标包含区分度及校准度,区分度常使用AUC值或C指数表示,当其值>0.7时,模型区分度优良;校准度用H-L拟合优度检验或者校准曲线等方法评估。当前研究缺乏性能评估,模型出现过度拟合,某种意义上抑制了模型的适用性。纳入研究平均样本量388例,均属于小样本研究,缺乏内部验证可能会导致模型性能的评估偏高,因此内部验证至关重要。此外,外部验证可提高模型的可推广性[36],但需进行建模与验模数据集的基线比较。目前,预测模型研究取得一定进展,但在模型构建、验证、报告等方面仍需进一步研究。
3.2 食管癌术后吻合口瘘的预测因子
本研究结果显示,食管癌患者术后AL的预测因子包含4个方面:基础疾病因素、手术因素、感染因素、营养因素。低蛋白血症、术后呼吸系统并发症、切口愈合不良、术前胸腹部手术史、术前合并糖尿病、术前合并心血管系统疾病、术前新辅助治疗、术前呼吸系统疾病、吻合方法、手术方式 、ASA评分是食管癌术后AL的常见预测因子,新模型的建立可着重考虑以上11个因子,大部分因子具有客观性且便于收集,模型更具便捷性。Lindenmann等[28]认为,较年轻的患者更容易出现AL,因为年轻患者在术后往往比年长患者更早恢复剧烈运动。也有研究[37]认为,随着年龄的增长,体内血管病变发生率增加,从而影响吻合口周围的供血。因此,年龄和PNI与AL的关系未来需要深入研究。由于吻合的复杂性和精确性[38],吻合方式被认为是AL风险较大的影响因素,机械吻合操作方式可显著缩短手术时间从而减少吻合口感染的风险,且吻合口径一致,可有效避免黏膜破坏和溃烂,正在被广泛采用。
3.3 数据转换
当数据类型是连续型数据时,通常使用均数差(MD)或标准化均数差(SMD)为效应统计量。Friedrich等[39]提出另一种效应测量方法,即均值比(ration of means,ROM),实验结果表明ROM、MD和SMD的统计性能特征相当,ROM可作为连续型数据均值差分法的合理替代方法。连续型数据的变量,在预测模型中未获取OR值时,可采用ROM代替。相对于SMD效应量,使用 ROM可更好的解释预测变量对结局的影响程度。
3.4 对未来模型研究的启示
开发精准预测工具有助于临床决策及指导临床实践。针对食管癌患者术后AL预测模型的研究,未来可从以下几方面进行深入优化:(1)新模型的建立可着重考虑以上Meta分析的13个因子与放射学特征相结合,实现多元化;(2)数据采集时建议使用盲法;(3)可采用EPV值或Riley等[40]提出的机器学习样本量计算方法计算样本量;(4)将连续型变量转换成分类数据前,建议写明分组依据;(5)避免仅基于单因素分析筛选变量,建议与机器学习相关算法、专业知识背景相结合;(6)建议进行大样本、多中心研究,提高模型适用性;(7)建议预测模型根据AL严重程度分级[22]及AL的诊断时机进行预测。
本研究具有一定的局限性:(1)本研究只纳入了关于食管癌患者AL预测模型的中英文文献;(2)部分预测因素涉及的研究较少,未进行Meta分析,可能对预测结局有影响。综上所述,本研究共纳入25个预测模型,大部分模型区分度较好,但预测模型质量还有很大的提升空间。未来,需要进一步完善相关研究,促进研究向临床转化,为患者制定精准化方案,减少AL的发生。
利益冲突:无。
作者贡献:粟宇霜负责研究设计、数据采集、论文撰写与修改;李艳、高虹参与研究设计和数据采集;蒲在春、陈娟负责统计分析,参与论文撰写;刘梦婷、贺雅勰负责整理数据和修改论文;杨琴、何彬对研究设计、研究内容进行指导和修订。
食管癌是消化道较常见恶性肿瘤之一,起源于食管或食管胃交界处的恶性肿瘤,发病率位居全世界恶性肿瘤第7位,死亡率位居第6位[1],严重威胁居民健康。手术治疗为大部分食管癌患者的首选方案。食管癌术后最致命的并发症为吻合口瘘(anastomotic leakage,AL),发病率约为5%~30%[2]。不仅影响患者生活质量,还会增加经济压力,甚至影响远期寿命[3]。预测模型是以数学模型为基础,结合预测因子,计算某事件结局的概率[4]。近年来,国内外许多研究者[5-20]针对食管癌术后AL专门建立风险预测模型。但对于模型的构建过程、性能以及数据样本偏倚等缺乏全面的对比研究,该工具是否能够应用于临床尚不明确。因此,本研究针对国内外食管癌术后AL预测模型的研究进行系统评价,为临床医护人员筛选AL相关风险预测模型提供指导。
1 资料与方法
1.1 纳入和排除标准
1.1.1 纳入标准
(1)研究对象为年龄≥18岁且病理检查确诊为食管癌患者;(2)研究内容为构建和/或验证食管癌术后AL预测模型;(3)研究设计为回顾性研究或前瞻性研究;(4)结局指标为术后发生AL,诊断方式采用CT、造影等影像学检查和/或临床特征综合判断[21],采用食管癌国际协作小组[22]提出的AL定义;(5)语言为中文或英文。
1.1.2 排除标准
(1)重复发表的文献;(2)综述、个案、会议摘要等文献;(3)无法获取原文的文献。
1.2 文献检索策略
计算机检索中华医学期刊全文数据库、维普、万方、中国知网、EMbase、Web of Science、Cochrane Library、PubMed公开发表的关于食管癌术后AL风险预测模型的研究,检索时间为建库至2023年10月1日。中文检索词包括:食管癌、食道癌、食管肿瘤、食道占位、吻合口瘘、食管瘘、吻合口漏、预测、预测模型、模型。英文检索词包括:esophageal neoplasm、neoplasm、esophageal、esophagus neoplasm、esophagus neoplasms、neoplasm、esophagus、neoplasms、esophagus、neoplasms、esophageal、cancer of esophagus、esophagus cancer、esophageal cancer、anastomotic fistula、esophageal fistula、anastomotic leak、prediction、prediction model、model。
1.3 文献筛选与资料提取
根据纳排标准,由两名研究员负责进行文献筛查。若存在分歧,则咨询第三方建议。按照Moons等[23]关于预测模型系统评价的数据收集条目(checklist for critical appraisal and data extraction for systematic reviews of prediction modelling studies,CHARMS),制订数据收集表,包括:第一作者、出版日期、国家、研究类型、随访时间、地点、结局指标、研究的样本量、构建模型的方法、建模数量、受试者工作特征曲线下面积(area under the curve,AUC)及校正方法、模型使用的验证方法、预测模型包含的影响因素、模型呈现方式等。
1.4 质量评价
采用PROBAST(prediction model risk of bias assessment tool)[24]评价工具评估文献的偏倚风险和适用性。从4个角度衡量模型的偏倚风险,即研究对象、预测因子、结果以及数据分析。适用性评价从3个角度进行,评价步骤与偏倚风险分析步骤相似。不同角度的评估标准为“低”“高”和“不清楚”3个分级,根据上述特征选择最佳模型。PROBAST不仅能评估单个模型,也能进行多个模型的比较。
1.5 统计学分析
使用Stata 15软件对模型纳入的预测因子进行Meta分析,OR值及95%CI作为效应统计量。采用Q检验及I2统计量评估多个研究的异质性。若P>0.1或I2<50%,认为研究间异质性小,选择固定效应模型;若P≤0.1或I2≥50%,则认为研究间异质性较大,进一步行敏感性分析,若异质性不能消除,则选择随机效应模型。P<0.05为差异有统计学意义。
2 结果
2.1 文献检索结果
通过检索相关数据库,获取相关研究1512篇,经过逐步筛选,确定纳入19篇文献[5-15,18-20,25-29],涉及7373名研究对象,文献筛选流程和结果见图1。

*:包括中国知网(
2.2 纳入文献的基本特征
本研究纳入文献均为近5年内发表文献,发表国家主要为中国,均为回顾性研究,其中中文文献14篇[5-13,18-19,25-27],英文文献5篇[14-15,20,28-29],食管癌术后患者AL的发病率在7.0%~23.9%之间。纳入文献基本特征见表1。

2.3 风险预测模型的基本特征
19篇文献[5-15,18-20,25-29]共构建25个食管癌患者术后AL风险预测模型,在模型构建方面,3篇文献[10-11,20]采用机器学习和logistic回归的方法分别建立预测模型,其余研究仅采用logistic回归分析建立模型。在连续变量的处理方法中,9篇文献[7,9,12,15,25-29]维持了连续变量的连续性,10篇文献[5-6,8,10-11,13-14,18-20]将连续型变量转换为分类变量。在变量选择方面,6篇文献[10-11,14,20,25-26]采用机器学习和单因素分析共同筛选变量,其余文献基于单因素分析;见表2。本研究纳入模型的AUC为0.67~0.960,灵敏度为43%~92%,特异度为78.9%~96.3%,其中23个预测模型[5-13,15,18-20,25,27-29]的预测性能较高(AUC>0.7);13篇文献[5,7-11,13-14,19,25-27,29]均报道了区分度和校准度;在模型验证方面,仅1篇文献[19]进行外部验证,10篇文献[7,9-10,13-14,19-20,26-27,29]进行内部验证,采用的方法主要是Bootstrap法和样本拆分法。模型呈现形式以列线图分析评分为主(n=13),其他方式为β系数绘制风险评分公式(n=5),1篇文献[10]未给出具体模型。预测模型的性能及呈现形式见表3。


2.4 文献质量评价
由两位研究员使用PROBAST量表[24]对文献质量进行全面评估,并仔细审查评价结果,确保其准确性。在研究对象领域,因研究设计为回顾性研究均为高偏倚风险;在预测因子领域,均为低偏倚风险;在数据分析领域,均为高偏倚风险。评价为高偏倚风险的原因包括:(1)文献建模组的样本量不足;每个自变量的发生次数(events per variable,EPV)<20例;(2)研究将连续型变量转换为分类变量;(3)研究基于单因素分析筛选变量;(4)未报告是否进行模型校准度检验;(5)文献未报道是否进行内部验证。在结果领域,均为低偏倚风险。在预测因子领域,所有的预测因子采用相同定义,但结局指标目前没有标准化,诊断方式多采用临床特征结合影像或内镜检查结果,有5篇文献[13,20,25-27]采用食管癌国际协作小组的AL定义。食管癌患者平均年龄通常在63~65岁之间[30],因此适用性评价均为好。整体评估显示,所有研究偏倚风险高,但预测模型适用性好;见表4。

2.5 Meta分析结果
采用文献数量≥3篇的预测因子进行Meta分析,结果显示:低蛋白血症、术后呼吸系统并发症、切口愈合不良、术前胸腹部手术史、术前合并糖尿病、术前合并心血管系统疾病、术前新辅助治疗、术前呼吸系统疾病、吻合方法、手术方式、美国麻醉医师协会(American Society of Anesthesiologists,ASA)评分是食管癌患者术后AL的独立危险因子(P<0.05)。纳入低蛋白血症的5篇文献[8,10-11,18-19]中,无论术前还是术后,低蛋白血症都是食管癌患者术后AL的独立危险因子[OR=9.362,95%CI(3.237,27.080),Z=4.13,P<0.001]。吻合部位不同可能是吻合方法统计学异质性的主要来源,亚组分析结果提示组内统计学差异较小,手工吻合是食管癌术后AL的独立危险因素[OR=2.965,95%CI(1.762,4.991),Z=4.09,P<0.001],相同吻合部位的手工吻合AL平均发生率为机械吻合的1.83倍。年龄和预后营养指数不是食管癌术后AL的独立危险因子(P>0.05)。其余研究敏感性分析中,依次删除相关研究后统计合并效应量,结果无显著差异。Meta分析结果见表5。

3 讨论
食管癌术后AL发病率和病死率高,AL风险预测模型具备早期发现高风险患者的能力,可指导医护人员及早采取预防措施,降低AL发生率。本研究纳入25个AL风险预测模型进行分析,建模方法主要为logistic回归,模型表现形式主要为列线图,大多数模型表现出较好的预测性能(AUC>0.7),但缺乏模型校准度领域评估及模型验证方面的研究。
3.1 食管癌患者术后AL预测模型尚处于探索阶段
本研究中大多数AL模型的区分度高,但是对于模型的构建、验证、结果报告并未深入优化。模型的构建步骤包括:明确研究方向、确定资料来源、变量筛选、数据预处理等。在资料来源方面,本研究纳入的25个预测模型中,所有研究均采用回顾性研究,因队列研究具有良好的代表性,未来在优化模型时建议选择前瞻性数据或注册数据作为建模数据[31],以减少数据偏倚风险[24]。截至目前,AL诊断没有金标准,诊断方式多采用临床特征与影像特征结合的综合判断,其中5篇文献[13,20,25-27]采用了食管癌国际协作小组[22]提出的AL定义;在变量筛选方面,大多数研究基于单因素logistic回归,可能会增加错误预测因子的选择风险[32]。目前有研究[33]提出新的变量筛选方法,如LASSO回归、Ridge回归、ElasticNet回归等,可减少过度拟合风险,建议未来变量的筛选可结合临床实际采用新方法,以提高筛选的准确性;对缺失数据进行报道和处理可避免模型出现过度拟合情况[34] ,建议未来研究对缺失数据进行完善。
在处理连续变量时,将连续性数据转化成分类变量后进行建模,可能会导致模型效能丢失过多。但在模型处于临床推广阶段时,为了提高研究者应用的方便性,可进行数据转换[35]。在性能评估方面,核心指标包含区分度及校准度,区分度常使用AUC值或C指数表示,当其值>0.7时,模型区分度优良;校准度用H-L拟合优度检验或者校准曲线等方法评估。当前研究缺乏性能评估,模型出现过度拟合,某种意义上抑制了模型的适用性。纳入研究平均样本量388例,均属于小样本研究,缺乏内部验证可能会导致模型性能的评估偏高,因此内部验证至关重要。此外,外部验证可提高模型的可推广性[36],但需进行建模与验模数据集的基线比较。目前,预测模型研究取得一定进展,但在模型构建、验证、报告等方面仍需进一步研究。
3.2 食管癌术后吻合口瘘的预测因子
本研究结果显示,食管癌患者术后AL的预测因子包含4个方面:基础疾病因素、手术因素、感染因素、营养因素。低蛋白血症、术后呼吸系统并发症、切口愈合不良、术前胸腹部手术史、术前合并糖尿病、术前合并心血管系统疾病、术前新辅助治疗、术前呼吸系统疾病、吻合方法、手术方式 、ASA评分是食管癌术后AL的常见预测因子,新模型的建立可着重考虑以上11个因子,大部分因子具有客观性且便于收集,模型更具便捷性。Lindenmann等[28]认为,较年轻的患者更容易出现AL,因为年轻患者在术后往往比年长患者更早恢复剧烈运动。也有研究[37]认为,随着年龄的增长,体内血管病变发生率增加,从而影响吻合口周围的供血。因此,年龄和PNI与AL的关系未来需要深入研究。由于吻合的复杂性和精确性[38],吻合方式被认为是AL风险较大的影响因素,机械吻合操作方式可显著缩短手术时间从而减少吻合口感染的风险,且吻合口径一致,可有效避免黏膜破坏和溃烂,正在被广泛采用。
3.3 数据转换
当数据类型是连续型数据时,通常使用均数差(MD)或标准化均数差(SMD)为效应统计量。Friedrich等[39]提出另一种效应测量方法,即均值比(ration of means,ROM),实验结果表明ROM、MD和SMD的统计性能特征相当,ROM可作为连续型数据均值差分法的合理替代方法。连续型数据的变量,在预测模型中未获取OR值时,可采用ROM代替。相对于SMD效应量,使用 ROM可更好的解释预测变量对结局的影响程度。
3.4 对未来模型研究的启示
开发精准预测工具有助于临床决策及指导临床实践。针对食管癌患者术后AL预测模型的研究,未来可从以下几方面进行深入优化:(1)新模型的建立可着重考虑以上Meta分析的13个因子与放射学特征相结合,实现多元化;(2)数据采集时建议使用盲法;(3)可采用EPV值或Riley等[40]提出的机器学习样本量计算方法计算样本量;(4)将连续型变量转换成分类数据前,建议写明分组依据;(5)避免仅基于单因素分析筛选变量,建议与机器学习相关算法、专业知识背景相结合;(6)建议进行大样本、多中心研究,提高模型适用性;(7)建议预测模型根据AL严重程度分级[22]及AL的诊断时机进行预测。
本研究具有一定的局限性:(1)本研究只纳入了关于食管癌患者AL预测模型的中英文文献;(2)部分预测因素涉及的研究较少,未进行Meta分析,可能对预测结局有影响。综上所述,本研究共纳入25个预测模型,大部分模型区分度较好,但预测模型质量还有很大的提升空间。未来,需要进一步完善相关研究,促进研究向临床转化,为患者制定精准化方案,减少AL的发生。
利益冲突:无。
作者贡献:粟宇霜负责研究设计、数据采集、论文撰写与修改;李艳、高虹参与研究设计和数据采集;蒲在春、陈娟负责统计分析,参与论文撰写;刘梦婷、贺雅勰负责整理数据和修改论文;杨琴、何彬对研究设计、研究内容进行指导和修订。