随机试验报告的透明度对批判性评价和解释研究结果至关重要。析因设计可以在同一个研究中评估2个及以上干预措施,具有全面和高效的方法学优势,在临床试验领域应用广泛。然而目前已发表的析因试验的报告质量堪忧。CONSORT(consolidated standards of reporting trials)工作组在促进健康研究的质量和透明度(enhancing the quality and transparency of health research,EQUATOR)工作组提出的方法学框架基础上,制订了基于共识的析因设计CONSORT 2010扩展声明。该声明修订了CONSORT 2010声明(共37项)中的16个条目,增加了1个新条目,并解释了每个条目重要性,为析因随机试验的报告提供了最低标准参考。本文对该声明进行介绍和解读,为国内学者规范报告析因设计研究提供参考。
析因设计(factorial design)是通过将两个或者多个研究因素的各个水平进行全面组合,以评价各种组合处理的效应[1-4]。在因素A和B的2×2试验中,研究对象可以随机分配到4个治疗组(表1)。析因设计在药物临床试验中应用广泛,可以解决不同的干预组合和药物复方开发等问题,为临床决策提供重要证据[5,6]。

析因设计可以解决特定的研究问题,在不增加样本量的情况下在单个试验中评估2种及以上干预措施,也可以评估干预措施间的交互作用和确定最佳组合形式[7-10]。不同的研究目标需要不同的研究方法,包括样本量计算和分析策略。与其他试验设计相比,析因试验具有更复杂的方法学特性,例如选择主要结局中纳入的治疗组、分析过程中如何处理潜在交互作用以及研究对象的非同步招募等[1,2,11-13]。
析因试验研究的论文发表数量快速增长,但仍缺乏专门针对析因设计的报告规范指导,论文报告质量堪忧。72%研究未提供采用析因设计的理由,37%研究未报告主要结局交互作用的评估结果,只有18%的研究依据交互作用的结果选择分析方法,只有13%研究在进行析因分析时纳入了交互项[11]。为了帮助研究人员、学术期刊编辑及同行评议专家充分理解析因试验内容,确保报告的透明度,2023年,英国学者Kahan等发表了析因设计CONSORT(consolidated standards of reporting trials)扩展声明[14]。该声明的制订过程严格遵循促进健康研究的质量和透明度(enhancing the quality and transparency of health research,EQUATOR)工作组提出的报告规范制订指南,遴选不同专业背景的访谈对象,成立工作小组,审阅清单内容、提出调整建议和审核新增条目。在指定过程中通过概况性综述,制订适用于析因试验报告建议的初始列表。采用德尔菲(Delphi)调查评估每个条目的重要性。召开专家共识会议确定最终报告清单。
本文旨在介绍析因设计CONSORT 2010扩展声明,解读部分条目,结合精神心理疾病领域的析因设计研究实例进行分析,为研究人员规范报告析因设计研究提供参考。
1 析因设计CONSORT 2010扩展声明简介
CONSORT 2010包含25个条目,规范了题目、摘要、引言、方法、结果和讨论等具体报告内容,本文涉及的CONSORT 2010中文版是在已发表的相关文章基础上进行调整修订的版本[15,16]。析因设计扩展声明和摘要的中文版是基于HAWKINS等开发的翻译完整过程形成的[17]。析因随机试验报告清单包括16个修订条目和1个新增条目(表2),涉及题目、摘要、引言、方法和结果5个部分的内容。新增的条目是18b,附加数据摘要,要求按照治疗组报告研究对象的入选、失访、基线和结局数据,目的是方便读者评估主要结局数据、依从性和危害受到交互作用的影响程度。

2 重要条目解读
2.1 标题
条目1a:在标题中明确说明为析因随机试验。
解读:析因设计可以提示读者该设计对结果分析和解释的潜在影响。
2.2 背景
条目2a:科学背景和使用析因设计的理由,包括是否存在交互作用假设。
解读:不同的试验目的和研究假设需要不同的研究方法。通过阐明采用析因设计的理由和是否存在交互作用假设,可以引导读者了解主要目标、研究假设和方法特征[1,12,20]。
2.3 目标
条目2b:明确研究目的或研究假设,说明构成主要比较的处理组。
解读:在析因试验中,干预措施可以构成多种组合。在具有因素A和B的2×2析因试验中,干预措施A与对照组的治疗效应可以通过以下3种方式进行评估:① 随机分配到A药与A药安慰剂的研究对象进行比较;② 单独A药与既不接受A药也不接受B药进行比较;③ A药+B药与单独B药进行比较。这些比较基于不同的研究假设,会产生不同的治疗效应[12,13,21]。
2.4 试验设计
条目3a:描述析因试验类型(例如完全或部分、因素数量以及每个因素的水平)和分配比例。
解读:大多数析因试验采用完全析因设计,研究对象随机分配到所有因素和水平的组合[22]。其他设计包括分数析因设计(省略了部分因素组合)和部分析因设计(部分参与对象仅随机分配到特定因子),不同的研究设计需要不同的方法论[1,23]。
2.5 研究对象
条目4a:描述每个因素的入选标准,必要时说明差异。
解读:不同因素的入选标准差异会对设计和分析产生影响,若处理不当,会增加偏倚风险。例如,不符合随机分配到特定因素的研究对象不应纳入该因素的比较中,纳入这部分研究对象说明基于非随机进行比较分析,会导致混杂偏倚的发生[1,23]。
2.6 样本量
条目7a:如何确定主要比较的样本量,说明计算中是否假设存在交互作用。
解读:析因设计的样本量计算比平行设计更为复杂。在析因试验中,若不同因素的预期效应不同,或者主要结局选择不同,则主要比较的预期样本量则不同[24]。如果假设存在相互作用,则需要增大样本量[1,11,20]。
2.7 期中分析和终止原则
条目7b:必要时,解释期中分析和试验终止原则,说明主要比较之间的差异及其原因。
解读:每个因素的中期分析计划和后续试验终止原都有所不同[23]。如果一个因素先于另一个因素终止,可能会对随机化、对照组的选择或分析产生影响[1,23,25]。
2.8 随机化和分配隐藏
条目8b:随机化类型,包括任何限定细节(如区组和区组长度)。
解读:必要时,说明研究对象是否在不同时点随机分配到各处理因素。研究对象可以在不同时间点随机分配到处理因素(例如,在疾病诊断时接受处理因素A,在完成处理因素A后接受处理因素B)。每个因素的随机化时间点可以提示关键设计特征,例如基线期、随访期以及交互作用的似然估计[11]。
2.9 统计方法
条目12a:说明主要比较中主要结局和次要结局的统计方法。
解读:① 目标治疗效应是否独立于其他研究因素。仅仅依靠统计方法不足以让读者理解确切治疗效应估计,因此需要详述统计分析中涉及的治疗组,方便读者了解目标治疗效应是研究因素的单独效应还是主效应[13,26],了解该试验是否可以回答待解决的临床问题。例如,在B药已证实有效的前提下,研究关注A药联合B药的效应,则应该比较A药+B药与A药安慰剂+B药,获取使用B药时A药的单独效应[13]。
② 采用析因分析方法还是多臂分析,两种方法均可以用于析因实验中,但所需的假设和研究获益有所差别[11,12]。
③ 方法的选择是预先设定还是基于交互作用估计。考虑到可能引入偏倚,不推荐通过交互项检验指导统计分析方法[27]。明确说明基于先验知识或者无交互作用假设预先选择统计方法还是基于交互作用估计选择方法,以便读者评估统计分析方法相关的偏倚风险。
④ 评估交互作用的统计分析方法。考虑到部分分析方法需要依据交互作用假设进行选择或者研究关注交互作用大小,因此需要报告交互作用[2,11-13,20]。交互作用的大小会受到结局指标效应量选择的影响(例如风险差和相对风险比),因此需要同时报告应用的方法和指标,方便读者评估方法是否恰当。
⑤ 析因方法中是否控制了其他研究因素。析因分析可以通过在统计分析模型中纳入其他因素来进行控制,一方面可以增加统计效力,另一方面可以避免该因素引入对治疗效应估计造成的偏倚。
⑥ 必要时,说明如何处理研究因素非同步招募的问题。非同步招募会导致部分研究对象在某些因素水平上未实现随机分组(例如,如果试验使用部分析因设计或中途停止对某因素的招募),在分析过程中没有考虑到该问题可能引入偏倚(见第4a项)[1,23]。
2.10 研究对象流程
条目13a:主要比较中随机分配、接受意向处理以及纳入主要结局分析的研究对象数量。
解读:对于析因试验,尤其比2×2设计更为复杂的试验,在不同的主要比较中,读者难以确认相关的研究对象流程。为每个主要比较提供这些信息可以增加报告的清晰度,方便读者理解[2,7,11,12]。
2.11 研究对象招募
条目14a:报告每个研究因素的招募期和随访时间的具体日期,若适用,说明差异和原因。
解读:如果不同因素的招募周期不同,则在一个因素停止招募后将合格研究对象随机分配到正在进行的因素,统计分析方法与部分析因设计类似(参见CONSORT第4a项)[23]。
2.12 结局和估计
条目17a:对于主要结局和次要结局,列出主要比较的结果、估计效应值及其精度(例如95%CI)。报告主要结局的估计交互效应值及精度。
解读:必要时,报告次要结局的估计交互效应值及其精度。对于无交互作用假设的析因试验或主要关注交互作用的试验,交互作用的评估对于结果解释十分重要[2,11-13,20]。应同时报告估计交互作用效应大小和精度指标,例如95%CI[11]。对于不要求评估交互作用的试验,应阐述理由。
2.13 附加数据摘要
条目18b:析因试验新增条目,按照治疗组报告研究对象入选流程、失访和剔除例数、基线数据以及结局数据(包括主要和次要结局、危害和依从性)。
解读:考虑干预措施有交互作用时,结局和其他随机化后数据会受到其影响,例如依从性、危害和研究对象入选流程[22]。在展示主要比较的结果外,还需要按治疗组(例如,单独A药、单独B药、A药+B药和A药安慰剂+B药安慰剂)提供上述数据,可以让读者评估这些数据受到析因设计交互作用影响的程度[2,5,7,12]。
表3提供了析因随机试验摘要的报告清单[18,19]。修订的7个条目主要是研究设计、研究对象和研究结果3个部分相关的内容。

3 实例分析
本文以2023年发表于成瘾领域顶级学术期刊Addiction的一篇戒烟行为激活联合伐尼克兰治疗现患或曾患抑郁症人群烟草依赖的有效性和安全性评价论文[28]为例,进行实例分析。
报告清单评价结果显示,该论文有11个条目符合析因设计CONSORT 2010报告规范要求,3个条目部分符合,对于析因设计的类型和具体每个治疗组的分配比例、每个研究要素的入选标准是否存在区别、随机区组长度未进行充分描述。有3个条目不符合报告规范要求,未说明是否进行期中分析,在结果部分未说明各项分析的研究对象人数,对于二分类结局未同时提供相对效应值和绝对效应值,未提供各治疗组研究对象入选、失访、剔除、基线数据和结局数据的汇总摘要,无法让读者评估干预措施的交互作用对于依从性、危害以及结局的潜在影响。见表2。
摘要报告清单评价结果显示,有5个条目符合报告规范要求,2个条目不符合,未列出主要比较中研究对象例数和纳入分析例数。见表3。
总体而言,该研究未充分阐明析因设计中各个研究因素和每个治疗组的入选标准和入选流程,对主要结局和敏感性分析的研究对象数量以及各治疗组的失访、剔除、危害、依从性的数据报告不够充分,而这些信息对于精确估计治疗效应至关重要,说明该实例的整体报告质量有待进一步提高。
4 讨论
析因设计随机试验因其研究效率高的优点,越来越广泛地运用到临床试验中,而研究设计和分析方法的复杂性及其对治疗效应的准确估计都建立在研究者严格遵守析因设计随机试验的相关规范基础上。国家药监局药审中心在2023年3月发布的《化药复方药物临床试验技术指导原则》,将持续推动中国研究人员对于析因设计随机试验的应用。本文介绍的析因设计CONSORT 2010扩展声明为提高析因设计随机试验的报告质量提供了指导,也为国内的同行评议、编辑和读者提供了实用的审查评价工具,以促进研究的传播和可读性,最终促进循证决策的有效落实。随着相关指导文件的进一步完善,析因设计随机试验的设计和报告将更加科学、完整和透明。
声明 本研究无任何利益冲突。
析因设计(factorial design)是通过将两个或者多个研究因素的各个水平进行全面组合,以评价各种组合处理的效应[1-4]。在因素A和B的2×2试验中,研究对象可以随机分配到4个治疗组(表1)。析因设计在药物临床试验中应用广泛,可以解决不同的干预组合和药物复方开发等问题,为临床决策提供重要证据[5,6]。

析因设计可以解决特定的研究问题,在不增加样本量的情况下在单个试验中评估2种及以上干预措施,也可以评估干预措施间的交互作用和确定最佳组合形式[7-10]。不同的研究目标需要不同的研究方法,包括样本量计算和分析策略。与其他试验设计相比,析因试验具有更复杂的方法学特性,例如选择主要结局中纳入的治疗组、分析过程中如何处理潜在交互作用以及研究对象的非同步招募等[1,2,11-13]。
析因试验研究的论文发表数量快速增长,但仍缺乏专门针对析因设计的报告规范指导,论文报告质量堪忧。72%研究未提供采用析因设计的理由,37%研究未报告主要结局交互作用的评估结果,只有18%的研究依据交互作用的结果选择分析方法,只有13%研究在进行析因分析时纳入了交互项[11]。为了帮助研究人员、学术期刊编辑及同行评议专家充分理解析因试验内容,确保报告的透明度,2023年,英国学者Kahan等发表了析因设计CONSORT(consolidated standards of reporting trials)扩展声明[14]。该声明的制订过程严格遵循促进健康研究的质量和透明度(enhancing the quality and transparency of health research,EQUATOR)工作组提出的报告规范制订指南,遴选不同专业背景的访谈对象,成立工作小组,审阅清单内容、提出调整建议和审核新增条目。在指定过程中通过概况性综述,制订适用于析因试验报告建议的初始列表。采用德尔菲(Delphi)调查评估每个条目的重要性。召开专家共识会议确定最终报告清单。
本文旨在介绍析因设计CONSORT 2010扩展声明,解读部分条目,结合精神心理疾病领域的析因设计研究实例进行分析,为研究人员规范报告析因设计研究提供参考。
1 析因设计CONSORT 2010扩展声明简介
CONSORT 2010包含25个条目,规范了题目、摘要、引言、方法、结果和讨论等具体报告内容,本文涉及的CONSORT 2010中文版是在已发表的相关文章基础上进行调整修订的版本[15,16]。析因设计扩展声明和摘要的中文版是基于HAWKINS等开发的翻译完整过程形成的[17]。析因随机试验报告清单包括16个修订条目和1个新增条目(表2),涉及题目、摘要、引言、方法和结果5个部分的内容。新增的条目是18b,附加数据摘要,要求按照治疗组报告研究对象的入选、失访、基线和结局数据,目的是方便读者评估主要结局数据、依从性和危害受到交互作用的影响程度。

2 重要条目解读
2.1 标题
条目1a:在标题中明确说明为析因随机试验。
解读:析因设计可以提示读者该设计对结果分析和解释的潜在影响。
2.2 背景
条目2a:科学背景和使用析因设计的理由,包括是否存在交互作用假设。
解读:不同的试验目的和研究假设需要不同的研究方法。通过阐明采用析因设计的理由和是否存在交互作用假设,可以引导读者了解主要目标、研究假设和方法特征[1,12,20]。
2.3 目标
条目2b:明确研究目的或研究假设,说明构成主要比较的处理组。
解读:在析因试验中,干预措施可以构成多种组合。在具有因素A和B的2×2析因试验中,干预措施A与对照组的治疗效应可以通过以下3种方式进行评估:① 随机分配到A药与A药安慰剂的研究对象进行比较;② 单独A药与既不接受A药也不接受B药进行比较;③ A药+B药与单独B药进行比较。这些比较基于不同的研究假设,会产生不同的治疗效应[12,13,21]。
2.4 试验设计
条目3a:描述析因试验类型(例如完全或部分、因素数量以及每个因素的水平)和分配比例。
解读:大多数析因试验采用完全析因设计,研究对象随机分配到所有因素和水平的组合[22]。其他设计包括分数析因设计(省略了部分因素组合)和部分析因设计(部分参与对象仅随机分配到特定因子),不同的研究设计需要不同的方法论[1,23]。
2.5 研究对象
条目4a:描述每个因素的入选标准,必要时说明差异。
解读:不同因素的入选标准差异会对设计和分析产生影响,若处理不当,会增加偏倚风险。例如,不符合随机分配到特定因素的研究对象不应纳入该因素的比较中,纳入这部分研究对象说明基于非随机进行比较分析,会导致混杂偏倚的发生[1,23]。
2.6 样本量
条目7a:如何确定主要比较的样本量,说明计算中是否假设存在交互作用。
解读:析因设计的样本量计算比平行设计更为复杂。在析因试验中,若不同因素的预期效应不同,或者主要结局选择不同,则主要比较的预期样本量则不同[24]。如果假设存在相互作用,则需要增大样本量[1,11,20]。
2.7 期中分析和终止原则
条目7b:必要时,解释期中分析和试验终止原则,说明主要比较之间的差异及其原因。
解读:每个因素的中期分析计划和后续试验终止原都有所不同[23]。如果一个因素先于另一个因素终止,可能会对随机化、对照组的选择或分析产生影响[1,23,25]。
2.8 随机化和分配隐藏
条目8b:随机化类型,包括任何限定细节(如区组和区组长度)。
解读:必要时,说明研究对象是否在不同时点随机分配到各处理因素。研究对象可以在不同时间点随机分配到处理因素(例如,在疾病诊断时接受处理因素A,在完成处理因素A后接受处理因素B)。每个因素的随机化时间点可以提示关键设计特征,例如基线期、随访期以及交互作用的似然估计[11]。
2.9 统计方法
条目12a:说明主要比较中主要结局和次要结局的统计方法。
解读:① 目标治疗效应是否独立于其他研究因素。仅仅依靠统计方法不足以让读者理解确切治疗效应估计,因此需要详述统计分析中涉及的治疗组,方便读者了解目标治疗效应是研究因素的单独效应还是主效应[13,26],了解该试验是否可以回答待解决的临床问题。例如,在B药已证实有效的前提下,研究关注A药联合B药的效应,则应该比较A药+B药与A药安慰剂+B药,获取使用B药时A药的单独效应[13]。
② 采用析因分析方法还是多臂分析,两种方法均可以用于析因实验中,但所需的假设和研究获益有所差别[11,12]。
③ 方法的选择是预先设定还是基于交互作用估计。考虑到可能引入偏倚,不推荐通过交互项检验指导统计分析方法[27]。明确说明基于先验知识或者无交互作用假设预先选择统计方法还是基于交互作用估计选择方法,以便读者评估统计分析方法相关的偏倚风险。
④ 评估交互作用的统计分析方法。考虑到部分分析方法需要依据交互作用假设进行选择或者研究关注交互作用大小,因此需要报告交互作用[2,11-13,20]。交互作用的大小会受到结局指标效应量选择的影响(例如风险差和相对风险比),因此需要同时报告应用的方法和指标,方便读者评估方法是否恰当。
⑤ 析因方法中是否控制了其他研究因素。析因分析可以通过在统计分析模型中纳入其他因素来进行控制,一方面可以增加统计效力,另一方面可以避免该因素引入对治疗效应估计造成的偏倚。
⑥ 必要时,说明如何处理研究因素非同步招募的问题。非同步招募会导致部分研究对象在某些因素水平上未实现随机分组(例如,如果试验使用部分析因设计或中途停止对某因素的招募),在分析过程中没有考虑到该问题可能引入偏倚(见第4a项)[1,23]。
2.10 研究对象流程
条目13a:主要比较中随机分配、接受意向处理以及纳入主要结局分析的研究对象数量。
解读:对于析因试验,尤其比2×2设计更为复杂的试验,在不同的主要比较中,读者难以确认相关的研究对象流程。为每个主要比较提供这些信息可以增加报告的清晰度,方便读者理解[2,7,11,12]。
2.11 研究对象招募
条目14a:报告每个研究因素的招募期和随访时间的具体日期,若适用,说明差异和原因。
解读:如果不同因素的招募周期不同,则在一个因素停止招募后将合格研究对象随机分配到正在进行的因素,统计分析方法与部分析因设计类似(参见CONSORT第4a项)[23]。
2.12 结局和估计
条目17a:对于主要结局和次要结局,列出主要比较的结果、估计效应值及其精度(例如95%CI)。报告主要结局的估计交互效应值及精度。
解读:必要时,报告次要结局的估计交互效应值及其精度。对于无交互作用假设的析因试验或主要关注交互作用的试验,交互作用的评估对于结果解释十分重要[2,11-13,20]。应同时报告估计交互作用效应大小和精度指标,例如95%CI[11]。对于不要求评估交互作用的试验,应阐述理由。
2.13 附加数据摘要
条目18b:析因试验新增条目,按照治疗组报告研究对象入选流程、失访和剔除例数、基线数据以及结局数据(包括主要和次要结局、危害和依从性)。
解读:考虑干预措施有交互作用时,结局和其他随机化后数据会受到其影响,例如依从性、危害和研究对象入选流程[22]。在展示主要比较的结果外,还需要按治疗组(例如,单独A药、单独B药、A药+B药和A药安慰剂+B药安慰剂)提供上述数据,可以让读者评估这些数据受到析因设计交互作用影响的程度[2,5,7,12]。
表3提供了析因随机试验摘要的报告清单[18,19]。修订的7个条目主要是研究设计、研究对象和研究结果3个部分相关的内容。

3 实例分析
本文以2023年发表于成瘾领域顶级学术期刊Addiction的一篇戒烟行为激活联合伐尼克兰治疗现患或曾患抑郁症人群烟草依赖的有效性和安全性评价论文[28]为例,进行实例分析。
报告清单评价结果显示,该论文有11个条目符合析因设计CONSORT 2010报告规范要求,3个条目部分符合,对于析因设计的类型和具体每个治疗组的分配比例、每个研究要素的入选标准是否存在区别、随机区组长度未进行充分描述。有3个条目不符合报告规范要求,未说明是否进行期中分析,在结果部分未说明各项分析的研究对象人数,对于二分类结局未同时提供相对效应值和绝对效应值,未提供各治疗组研究对象入选、失访、剔除、基线数据和结局数据的汇总摘要,无法让读者评估干预措施的交互作用对于依从性、危害以及结局的潜在影响。见表2。
摘要报告清单评价结果显示,有5个条目符合报告规范要求,2个条目不符合,未列出主要比较中研究对象例数和纳入分析例数。见表3。
总体而言,该研究未充分阐明析因设计中各个研究因素和每个治疗组的入选标准和入选流程,对主要结局和敏感性分析的研究对象数量以及各治疗组的失访、剔除、危害、依从性的数据报告不够充分,而这些信息对于精确估计治疗效应至关重要,说明该实例的整体报告质量有待进一步提高。
4 讨论
析因设计随机试验因其研究效率高的优点,越来越广泛地运用到临床试验中,而研究设计和分析方法的复杂性及其对治疗效应的准确估计都建立在研究者严格遵守析因设计随机试验的相关规范基础上。国家药监局药审中心在2023年3月发布的《化药复方药物临床试验技术指导原则》,将持续推动中国研究人员对于析因设计随机试验的应用。本文介绍的析因设计CONSORT 2010扩展声明为提高析因设计随机试验的报告质量提供了指导,也为国内的同行评议、编辑和读者提供了实用的审查评价工具,以促进研究的传播和可读性,最终促进循证决策的有效落实。随着相关指导文件的进一步完善,析因设计随机试验的设计和报告将更加科学、完整和透明。
声明 本研究无任何利益冲突。