统计图形是科研论文中必不可少的组成部分,通过规范、美观的可视化图形直观、准确地呈现研究结果有利于促进学术成果的交流、传播与应用。医疗干预的安全性是其临床应用的基本前提,随机对照试验作为确定医疗干预疗效和安全性的重要研究设计,准确地呈现其结果的安全性信息便显得尤为重要。但是,有研究发现目前发表的随机对照试验报告中并没有充分地利用可视化图形呈现危害结局数据。为了促进临床研究人员更好地使用可视化图形呈现危害结局数据,国际学者近期在BMJ发表了一项共识研究,确定并推荐10种用于呈现随机对照试验危害结局数据的统计图形。为了便于国内学者了解和应用该共识,本文对该共识与推荐意见进行了解读,以期为提高国内随机对照试验报告中危害结局数据可视化的质量提供帮助。
引用本文: 卢存存, 陈子佳, 乔萌, 雷超, 王子怡, 尚文茹, 张强, 谢雁鸣, 王志飞. 随机对照试验报告中危害结局数据可视化的共识与推荐解读. 中国循证医学杂志, 2023, 23(9): 1110-1116. doi: 10.7507/1672-2531.202305017 复制
统计图形是现代科研论文中必不可少的组成部分,通过规范、美观的可视化图形直观、准确地呈现研究结果有利于促进科研成果的交流、传播与应用[1-4]。可视化是人们认识数据,洞察数据背后规律的重要手段,可以使原本枯燥的内容变得生动、直观[4-5]。数据可视化先驱Edward Tufte认为学术图表主要有3个方面的作用,包括真实、准确、全面地展示数据,以较少的空间展示较多的信息和揭示数据的本质、关系和规律[1]。随着计算机技术和统计方法的飞速发展,尤其进入大数据、大健康时代后,各式各样可视化图形常被用于探索数据结构和展示研究结果[5-8]。
一项医疗干预措施的评价主要包括有效性、安全性和经济学方面。随机对照试验被认为是确定干预措施有效性和安全性的重要研究设计,是进行因果推断的金标准[9]。因此,药物与医疗器械的上市审批基本都需严谨设计和实施的随机对照试验提供证据支持。然而,研究发现医学领域中不同学科的随机对照试验研究论文都存在着关键信息报告不清晰、不完整的问题[10-12];为了提高随机对照试验研究论文的报告质量,相关学者已经制订了CONSORT及其扩展版指南指导研究人员规范地报告和撰写研究论文[13-15]。一般来说,一项干预措施的安全性是其有效性和经济性的基本前提,同时临床试验中收集的危害结局数据通常比较复杂,因此,清晰、准确地报告安全性信息对于学术交流和决策者权衡利弊后做出决策至关重要[13,16-17]。临床试验中关于干预措施安全性的表述主要有“危害”、“不良事件”、“不良反应”、“并发症”和“毒副作用”等[13,17]。CONSORT中的“危害”指干预措施任何的可能不良后果的总和[13,18]。尽管CONSORT-Harms规范被制订用于促进随机对照试验中干预危害信息的报告[13],但多项研究表明已发表的随机对照试验在使用可视化图形呈现干预措施的危害信息方面并不理想[19-21]。例如,一项方法学研究调查了来自4本顶级综合医学期刊的184篇随机对照试验研究报告,发现仅有22篇(12%)使用图形展示了不良事件结局的信息[19]。为了帮助研究人员更好地使用可视化统计图形清晰、准确地报告干预措施的危害结局信息,从而促进随机对照试验的危害结局数据的交流,Phillips等[21]近期在BMJ发表了在随机对照试验中使用统计图形可视化干预危害结局信息的共识研究。为了便于国内学者更好地应用该共识,本文对该共识和其中的推荐意见进行了解读,以期提高国内随机对照试验论文中干预措施危害结局数据可视化的质量。
1 制订过程简介
研究团队由20位学术统计师,1位企业统计师,1位学术卫生经济学家,1位数据图形设计师和2位临床医生,共计25位研究人员组成[21]。团队所有成员均参与过临床试验或对数据可视化感兴趣,或二者兼有。共识文件由23位方法学家通过多次共识会议,并在采纳2位临床医生建议的基础上形成。研究人员首先利用概况性评价调查了2018年3月—2019年10月发表的、用于分析药物临床试验不良事件的新方法[22],并考虑了其他可改编后用于分析不良事件的图形;再由23位非临床医生研究者使用由12个条目组成的评估框架在共识会议上对初步拟定的28种用于呈现药物临床试验中干预危害信息的统计图形进行了全面评估,并在必要时对图形进行改进调整。此外,还对2位临床医生独立进行半结构式访谈以获得其反馈意见。研究团队最终确定了10种推荐用于随机对照试验报告中呈现危害结局信息的统计图形,并基于已有的临床试验数据绘制了案例图形[21]。为了与随机对照试验的主要目的(即因果推断)保持一致[21],这些图形主要适用于进行组间比较的危害结局数据。研究人员根据使用目的(即呈现总体危害情况还是单个危害事件;前者指所有或多个危害结局的汇总,而后者既指任何单个的不良事件,也包括由多个不良事件构成单个危害分类)和结局指标类型(即二分类、计数、连续性和时间-事件结局)对10个统计图形的适用情况进行了分类,并提供了图形选择决策树(图1)以帮助研究人员选择适合的图形。

2 推荐图形解读
2.1 点图
该共识推荐点图用于同时呈现多个二分类危害结局数据,能够同时展示多个二分类不良事件(例如,是否发生恶心、头痛)的绝对风险和相对风险。以图2为例,图中左侧部分展示了两个干预组中发生的多个不良事件的比例,右侧部分展示了两组中多个不良事件的具体数量及组间的相对风险。可使用Stata软件的“aedot”或“aedots”命令绘制点图,也可使用R和SAS软件绘制。

2.2 堆积条形图
该共识同样推荐使用堆积条形图同时呈现多个二分类危害结局数据,不仅能够同时呈现发生各不良事件的患者具体数量及其占比,还能展示其严重程度的信息。以图3为例,该图按照干预组别和危害的最大严重程度,同时呈现多个不良事件的患者数量及其占比。需要注意的是,根据最大严重程度分类是指当某个受试者多次发生同一不良事件时,只对其中最严重的不良事件计数。Stata软件的“graph hbar”命令、R软件的“barplot”函数或“ggplot2”包以及SAS软件的“proc gchart”程序均能绘制堆积条形图。

2.3 条形图
该共识推荐使用条形图呈现计数危害结局数据(例如,头痛的发生次数),能够展示发生的不良事件的具体数量。以图4为例,图4a展示了双臂研究中各组不良事件的具体数量及对应的患者占比,图4b展示了三臂研究中各组不良事件的具体数量及对应的患者占比。可使用绘制堆积条形图的软件包实现条形图的绘制。
2.4 KM生存曲线
该共识推荐使用KM生存曲线呈现单个无复发情况的时间-事件危害结局数据(例如,在治疗过程中随时间推移未发生感染的受试者占比数据),能够展示不同干预组中未发生该不良事件的受试者随时间推移一直保持无事件的累积比例,见图5。同时风险计数表展示了不同时间点未发生该事件、发生该事件及删失受试者的数量。可利用Stata软件的“kmunicate_stata”程序和R软件的“KMunicate”包绘制KM生存曲线。

2.5 平均累积函数图
该共识推荐使用平均累积函数图呈现单个具有复发情况的时间-事件危害结局数据,能够展示不同干预组中每个受试者随时间推移发生的不良事件的平均累计数量,见图6。推荐使用SAS软件的可靠性评价过程和“mcfplot”命令来实现平均累积函数图的绘制。

2.6 生存比率图
该共识同样推荐使用生存比率图呈现单个无复发情况的时间-事件危害结局数据,能够展示随时间推移两个干预组中未发生不良事件概率的非参数估计值的比率及其95%置信区间,见图7。可使用R软件“survRatio”包的“drsurv”函数和“ggplot2”包的“ggsurv”函数绘制生存比率图。
2.7 线图
该共识推荐使用线图展示不同干预组中随时间推移发生变化的连续性危害结局数据(例如,嗜酸性细胞计数的改变),但应具有正态分布的特点,如图8;此外,风险计数表还能够展示每个离散时间点具有危害事件风险的受试者的数量。可使用Stata软件的“twoway connected”和“twoway rspike”命令、R软件“ggplot2”包的“geom_line”和“geom_errorbar”函数绘制线图。

2.8 小提琴图
该共识同样推荐使用小提琴图展示不同干预组中随时间推移发生变化的连续性危害结局数据,如图9。此图可作为线图的替代方案,更重要的是,它还能用于呈现非正态分布的连续性危害结局数据和探索数据分布特点。Stata软件的“vioplot”命令、R软件“ggplot2”包的“geom_violin”函数以及SAS的“proc sgpanel”程序均可绘制小提琴图。

2.9 核密度图
该共识推荐使用核密度图展示在某个时间点不同干预组中的连续性危害结局数据,如图10,可用以探索特定时间点某个连续性危害结局数据或改变量的特点。可使用Stata软件的“twoway kdensity”命令、R软件“ggplot2”的“geom_density”函数及SAS软件的“densityplot”程序绘制核密度图。

2.10 散点图矩阵
该共识推荐使用散点图矩阵展示多个连续性危害结局数据在两个不同时间点间的关系,如图11,可用以探索和识别多个连续性危害结局数据的异常值或者分布模式。可使用Stata软件的“twoway scatter”命令分别产生每个结局的散点图,再利用“combine”或“grc1leg”命令组合各图得到散点图矩阵。

3 讨论
正如“一图胜千言”所代表的含义,即与单纯文本内容相比,科学、美观的可视化图形可以直观、准确地展示数据结构,帮助人们洞察数据背后蕴含的真正规律,从而能够帮助我们更快地理解和解释复杂的研究内容[1,23-24]。可视化的图形还能够增加人们对某个现象/事物的关注度,使得人们对其认识和理解更加聚焦[24]。“认知负荷”理论认为理解和解释信息需要消耗精神能量,即认知负荷。认知负荷包括内在负荷(即主题固有的复杂性)、外部负荷(即影响学习的外部因素)和关联负荷(即组织和理解内容所花费的精神能量)组成部分,而美观的视觉效果可以减少内在负荷,优化关联负荷,并消除外部负荷[24]。例如,一种叫做“视觉摘要”(visual abstract)的新型摘要形式,可以使科研论文在推特上的推送信息及论文的阅读量均显著增加[25]。
清晰、直观地报告随机对照试验中干预措施的危害结局信息有助于临床医生综合判断干预措施的获益-风险[17-18],以便做出是否选择该干预措施进行临床治疗的决策。考虑到现有随机对照试验报告中使用可视化图形呈现干预危害结局信息的现状不佳,同时缺少统一的可操作性强的实践规范,Phillips Rachel团队开展了相关系列研究[18-20,22],最终形成了在随机对照试验报告中如何选用恰当的统计图形呈现干预措施危害结局数据的共识推荐[21]。本文对该共识的制订过程、推荐图形的特点、适用性及统计软件作了概述,以期能够为改进国内随机对照试验研究论文中干预措施危害结局信息的报告产生帮助。尽管作者声明该共识主要基于药物临床试验研究制订,但我们认为这些图形也可用于或在改良后用于非药物干预随机对照试验中报告危害结局信息,还可用于非随机临床干预研究。作者在原文中提供了对推荐图形进行改良调整的可能情况,研究者在使用时可在利用决策树初步确定图形后,再根据自己的需求对图形进行改良调整后使用。建议研究者在实际应用时应参照COSORT-Harms指南撰写研究报告,同时选择该共识推荐的图形恰当地呈现医疗干预危害结局数据。此外,学术界在未来还应加强开发能够同时展示多个时间-事件危害结局数据的统计图形的力度。
声明 对该共识的解读已经通过电子邮件征得原文第一作者Phillips Rachel的同意。所在作者均声明不存在任何利益冲突。
统计图形是现代科研论文中必不可少的组成部分,通过规范、美观的可视化图形直观、准确地呈现研究结果有利于促进科研成果的交流、传播与应用[1-4]。可视化是人们认识数据,洞察数据背后规律的重要手段,可以使原本枯燥的内容变得生动、直观[4-5]。数据可视化先驱Edward Tufte认为学术图表主要有3个方面的作用,包括真实、准确、全面地展示数据,以较少的空间展示较多的信息和揭示数据的本质、关系和规律[1]。随着计算机技术和统计方法的飞速发展,尤其进入大数据、大健康时代后,各式各样可视化图形常被用于探索数据结构和展示研究结果[5-8]。
一项医疗干预措施的评价主要包括有效性、安全性和经济学方面。随机对照试验被认为是确定干预措施有效性和安全性的重要研究设计,是进行因果推断的金标准[9]。因此,药物与医疗器械的上市审批基本都需严谨设计和实施的随机对照试验提供证据支持。然而,研究发现医学领域中不同学科的随机对照试验研究论文都存在着关键信息报告不清晰、不完整的问题[10-12];为了提高随机对照试验研究论文的报告质量,相关学者已经制订了CONSORT及其扩展版指南指导研究人员规范地报告和撰写研究论文[13-15]。一般来说,一项干预措施的安全性是其有效性和经济性的基本前提,同时临床试验中收集的危害结局数据通常比较复杂,因此,清晰、准确地报告安全性信息对于学术交流和决策者权衡利弊后做出决策至关重要[13,16-17]。临床试验中关于干预措施安全性的表述主要有“危害”、“不良事件”、“不良反应”、“并发症”和“毒副作用”等[13,17]。CONSORT中的“危害”指干预措施任何的可能不良后果的总和[13,18]。尽管CONSORT-Harms规范被制订用于促进随机对照试验中干预危害信息的报告[13],但多项研究表明已发表的随机对照试验在使用可视化图形呈现干预措施的危害信息方面并不理想[19-21]。例如,一项方法学研究调查了来自4本顶级综合医学期刊的184篇随机对照试验研究报告,发现仅有22篇(12%)使用图形展示了不良事件结局的信息[19]。为了帮助研究人员更好地使用可视化统计图形清晰、准确地报告干预措施的危害结局信息,从而促进随机对照试验的危害结局数据的交流,Phillips等[21]近期在BMJ发表了在随机对照试验中使用统计图形可视化干预危害结局信息的共识研究。为了便于国内学者更好地应用该共识,本文对该共识和其中的推荐意见进行了解读,以期提高国内随机对照试验论文中干预措施危害结局数据可视化的质量。
1 制订过程简介
研究团队由20位学术统计师,1位企业统计师,1位学术卫生经济学家,1位数据图形设计师和2位临床医生,共计25位研究人员组成[21]。团队所有成员均参与过临床试验或对数据可视化感兴趣,或二者兼有。共识文件由23位方法学家通过多次共识会议,并在采纳2位临床医生建议的基础上形成。研究人员首先利用概况性评价调查了2018年3月—2019年10月发表的、用于分析药物临床试验不良事件的新方法[22],并考虑了其他可改编后用于分析不良事件的图形;再由23位非临床医生研究者使用由12个条目组成的评估框架在共识会议上对初步拟定的28种用于呈现药物临床试验中干预危害信息的统计图形进行了全面评估,并在必要时对图形进行改进调整。此外,还对2位临床医生独立进行半结构式访谈以获得其反馈意见。研究团队最终确定了10种推荐用于随机对照试验报告中呈现危害结局信息的统计图形,并基于已有的临床试验数据绘制了案例图形[21]。为了与随机对照试验的主要目的(即因果推断)保持一致[21],这些图形主要适用于进行组间比较的危害结局数据。研究人员根据使用目的(即呈现总体危害情况还是单个危害事件;前者指所有或多个危害结局的汇总,而后者既指任何单个的不良事件,也包括由多个不良事件构成单个危害分类)和结局指标类型(即二分类、计数、连续性和时间-事件结局)对10个统计图形的适用情况进行了分类,并提供了图形选择决策树(图1)以帮助研究人员选择适合的图形。

2 推荐图形解读
2.1 点图
该共识推荐点图用于同时呈现多个二分类危害结局数据,能够同时展示多个二分类不良事件(例如,是否发生恶心、头痛)的绝对风险和相对风险。以图2为例,图中左侧部分展示了两个干预组中发生的多个不良事件的比例,右侧部分展示了两组中多个不良事件的具体数量及组间的相对风险。可使用Stata软件的“aedot”或“aedots”命令绘制点图,也可使用R和SAS软件绘制。

2.2 堆积条形图
该共识同样推荐使用堆积条形图同时呈现多个二分类危害结局数据,不仅能够同时呈现发生各不良事件的患者具体数量及其占比,还能展示其严重程度的信息。以图3为例,该图按照干预组别和危害的最大严重程度,同时呈现多个不良事件的患者数量及其占比。需要注意的是,根据最大严重程度分类是指当某个受试者多次发生同一不良事件时,只对其中最严重的不良事件计数。Stata软件的“graph hbar”命令、R软件的“barplot”函数或“ggplot2”包以及SAS软件的“proc gchart”程序均能绘制堆积条形图。

2.3 条形图
该共识推荐使用条形图呈现计数危害结局数据(例如,头痛的发生次数),能够展示发生的不良事件的具体数量。以图4为例,图4a展示了双臂研究中各组不良事件的具体数量及对应的患者占比,图4b展示了三臂研究中各组不良事件的具体数量及对应的患者占比。可使用绘制堆积条形图的软件包实现条形图的绘制。
2.4 KM生存曲线
该共识推荐使用KM生存曲线呈现单个无复发情况的时间-事件危害结局数据(例如,在治疗过程中随时间推移未发生感染的受试者占比数据),能够展示不同干预组中未发生该不良事件的受试者随时间推移一直保持无事件的累积比例,见图5。同时风险计数表展示了不同时间点未发生该事件、发生该事件及删失受试者的数量。可利用Stata软件的“kmunicate_stata”程序和R软件的“KMunicate”包绘制KM生存曲线。

2.5 平均累积函数图
该共识推荐使用平均累积函数图呈现单个具有复发情况的时间-事件危害结局数据,能够展示不同干预组中每个受试者随时间推移发生的不良事件的平均累计数量,见图6。推荐使用SAS软件的可靠性评价过程和“mcfplot”命令来实现平均累积函数图的绘制。

2.6 生存比率图
该共识同样推荐使用生存比率图呈现单个无复发情况的时间-事件危害结局数据,能够展示随时间推移两个干预组中未发生不良事件概率的非参数估计值的比率及其95%置信区间,见图7。可使用R软件“survRatio”包的“drsurv”函数和“ggplot2”包的“ggsurv”函数绘制生存比率图。
2.7 线图
该共识推荐使用线图展示不同干预组中随时间推移发生变化的连续性危害结局数据(例如,嗜酸性细胞计数的改变),但应具有正态分布的特点,如图8;此外,风险计数表还能够展示每个离散时间点具有危害事件风险的受试者的数量。可使用Stata软件的“twoway connected”和“twoway rspike”命令、R软件“ggplot2”包的“geom_line”和“geom_errorbar”函数绘制线图。

2.8 小提琴图
该共识同样推荐使用小提琴图展示不同干预组中随时间推移发生变化的连续性危害结局数据,如图9。此图可作为线图的替代方案,更重要的是,它还能用于呈现非正态分布的连续性危害结局数据和探索数据分布特点。Stata软件的“vioplot”命令、R软件“ggplot2”包的“geom_violin”函数以及SAS的“proc sgpanel”程序均可绘制小提琴图。

2.9 核密度图
该共识推荐使用核密度图展示在某个时间点不同干预组中的连续性危害结局数据,如图10,可用以探索特定时间点某个连续性危害结局数据或改变量的特点。可使用Stata软件的“twoway kdensity”命令、R软件“ggplot2”的“geom_density”函数及SAS软件的“densityplot”程序绘制核密度图。

2.10 散点图矩阵
该共识推荐使用散点图矩阵展示多个连续性危害结局数据在两个不同时间点间的关系,如图11,可用以探索和识别多个连续性危害结局数据的异常值或者分布模式。可使用Stata软件的“twoway scatter”命令分别产生每个结局的散点图,再利用“combine”或“grc1leg”命令组合各图得到散点图矩阵。

3 讨论
正如“一图胜千言”所代表的含义,即与单纯文本内容相比,科学、美观的可视化图形可以直观、准确地展示数据结构,帮助人们洞察数据背后蕴含的真正规律,从而能够帮助我们更快地理解和解释复杂的研究内容[1,23-24]。可视化的图形还能够增加人们对某个现象/事物的关注度,使得人们对其认识和理解更加聚焦[24]。“认知负荷”理论认为理解和解释信息需要消耗精神能量,即认知负荷。认知负荷包括内在负荷(即主题固有的复杂性)、外部负荷(即影响学习的外部因素)和关联负荷(即组织和理解内容所花费的精神能量)组成部分,而美观的视觉效果可以减少内在负荷,优化关联负荷,并消除外部负荷[24]。例如,一种叫做“视觉摘要”(visual abstract)的新型摘要形式,可以使科研论文在推特上的推送信息及论文的阅读量均显著增加[25]。
清晰、直观地报告随机对照试验中干预措施的危害结局信息有助于临床医生综合判断干预措施的获益-风险[17-18],以便做出是否选择该干预措施进行临床治疗的决策。考虑到现有随机对照试验报告中使用可视化图形呈现干预危害结局信息的现状不佳,同时缺少统一的可操作性强的实践规范,Phillips Rachel团队开展了相关系列研究[18-20,22],最终形成了在随机对照试验报告中如何选用恰当的统计图形呈现干预措施危害结局数据的共识推荐[21]。本文对该共识的制订过程、推荐图形的特点、适用性及统计软件作了概述,以期能够为改进国内随机对照试验研究论文中干预措施危害结局信息的报告产生帮助。尽管作者声明该共识主要基于药物临床试验研究制订,但我们认为这些图形也可用于或在改良后用于非药物干预随机对照试验中报告危害结局信息,还可用于非随机临床干预研究。作者在原文中提供了对推荐图形进行改良调整的可能情况,研究者在使用时可在利用决策树初步确定图形后,再根据自己的需求对图形进行改良调整后使用。建议研究者在实际应用时应参照COSORT-Harms指南撰写研究报告,同时选择该共识推荐的图形恰当地呈现医疗干预危害结局数据。此外,学术界在未来还应加强开发能够同时展示多个时间-事件危害结局数据的统计图形的力度。
声明 对该共识的解读已经通过电子邮件征得原文第一作者Phillips Rachel的同意。所在作者均声明不存在任何利益冲突。