在缺乏数据进行 Meta 分析的系统评价中,通常使用替代合成方法,但这些方法却很少被报道,而模糊的方法阐述可能会导致人们质疑系统评价结果的真实性。无 Meta 分析数据合成(SWiM)报告规范是用于指导采用了替代合成方法评估干预措施效应的系统评价进行清晰报告的规范。本文介绍了 SWiM 规范的研制过程及 9 个 SWiM 报告条目及其相应的解释与示例。
引用本文: 李庚, 欧阳文伟, 周莉, 郭新峰, 温泽淮, 译. 无 Meta 分析数据合成(SWiM)的系统评价报告规范. 中国循证医学杂志, 2020, 20(11): 1359-1364. doi: 10.7507/1672-2531.202008114 复制
决策者认为系统评价是基本的证据来源之一[1]。完整、透明地报告系统评价的方法和结果有助于用户评估评价结果的真实性。为改善系统评价报告质量,已制订了由 27 个条目清单组成的系统评价和 Meta 分析优先报告条目 PRISMA 声明(http://www.prisma-statement.org/)[2]。目前,PRISMA 有多种扩展声明,如进行系统评价的不同方法(如概括性评价[3])、具有特殊关注领域的系统评价(如损害[4])及使用特定方法的系统评价(如网状 Meta 分析[5])。但 PRISMA 对于特定领域的系统评价的报告提供的指导比较有限,比如方法描述与数据合成,同时对于那些无 Meta 分析的系统评价则没有报告规范。我们估计,约 32%与健康相关的干预性系统评价没有进行 Meta 分析[6-8],而是使用了替代方法进行合成,这些替代方法通常用文字描述效应,也被称为叙事性综合[9]。最近有研究发现,叙事性综合研究的报告存在严重缺陷,包括缺乏对采用方法的描述,研究层面的数据与叙事性综合方法及其结论之间缺乏透明的联系及缺乏对合成方法局限性的报告[7]。这表明,当不使用 Meta 分析时,研究者对清楚报告合成方法的要求普遍缺乏了解和存在误解,故需要制订一个专门的报告规范。
1 SWiM 报告规范的范围
本文介绍了无 Meta 分析数据合成(SWiM)的报告规范,它主要适用于评估干预措施量化效应的系统评价,而这些效应的评估不可能或不适合进行 Meta 分析或者至少某个结局指标不适合进行 Meta 分析[10]。当效应评估报告不完整或由于研究特征(例如研究设计、干预类型或结局)过于多样化而无法得出有意义的效应总体评估时[11],一般会出现无法进行 Meta 分析数据合并的情况。此时,可采用替代的报告和合成方法(如计算干预效果估计值的概要性统计,根据效果方向进行的计数统计及 P 值合并),SWiM 可为报告这些方法和结果提供指导[11]。具体而言,SWiM 规范扩展了当前可用的有关“结果合成”条目的规范,例如 PRISMA(条目 14 和 21)和 RAMESES(条目 11、14 和 15)[2, 12, 13]。SWiM 涵盖了所有与数据合成相关的关键信息的报告,包括如何对研究进行分组、数据合成方法、数据与摘要的展示及合成方法的局限性。需要明确的是,SWiM 不适用于定性数据合成的系统评价,因为这类系统评价已有自己的报告规范,比如用于定性证据合成的 ENTREQ 和用于元民族志方法(meta-ethnography)的 eMERGe[14, 15]。
2 SWiM 报告规范的制订
在确认没有类似的报告规范正在制订之后,本项目制订了研究方案并在 EQUATOR 网上注册[10]。所有 SWiM 研究团队成员都是经验丰富的系统评价员,其中一位还是开发叙事性综合(AS)指南的合著者[9]。同时,成立了一个项目顾问小组以提供更多的专业知识,其成员包括来自 Cochrane 协作组、坎贝尔合作组织(Campbell Collaboration)和英国国家优化卫生与保健研究所(NICE)的代表(附件 1)。
本项目得到了制订卫生研究报告规范的推荐[16]。我们评估了目前无 Meta 分析数据合成的报告方法,并与项目顾问小组协商制订了 SWiM 报告条目的初始清单。然后,我们邀请了 91 名专家参与 3 轮德尔菲调查,所有这些专家都是系统评价方法学专家或有无 Meta 分析数据合成系统评价经验的作者。3 轮调查的应答率分别为 48%(n=44/91)、54%(n=37/68)和 82%(n=32/39)。专家小组(项目顾问小组加另一名新的方法学专家)以共识会议形式讨论了调查结果(附件 1)。然后我们试用修订后的指南以评估其易用性和表面效度。接下来,我们还邀请了 8 位未参加德尔菲调查但有丰富经验的系统评价员阅读并试用了该指南。我们简短地采访了试用者,以确定条目中需要澄清的内容或其解释,对条目进行了相应修改,并在最终定稿之前将其分发给专家小组以征求意见。附件 1 提供了 SWiM 制订过程的方法学全部详细信息。
3 SWiM 报告条目
我们确定了 9 个条目,以指导无 Meta 分析数据合成的报告。表 1 是 SWiM 报告指南的具体条目,通过网址:www.equator-network.org/reporting-guidelines 可获得 SWiM 在线版本。下面将具体介绍每个报告条目的解释和阐述。附件 2 提供了报告条目的示例和具体解释。

条目 1:分组描述
1a)描述
提供组别的描述及分组的理由(例如:根据干预措施、人群、结局、研究设计分组)。
1a)解释
由于可能存在方法学、临床或概念上的多样性(如由于包括了不同的研究设计、结局、干预措施、背景、人群),因而有必要清晰报告这些研究特征如何用于数据合成的分组及分组的合理性(参阅《Cochrane 系统评价员手册》第 3 章[17])。尽管在所有系统评价中报告研究特征分组情况都很重要,但在无 Meta 分析的系统评价中尤为重要,因为与 Meta 分析相比,无 Meta 分析的系统评价分组可能没那么明显。
提供干预措施如何起作用并影响结局的合理性或变化的理论依据,将为作者和系统评价使用者提供信息以判定分组的适当性和有用性,可使用图表或逻辑模型可视化地阐明系统评价中所用的变化的潜在理论依据[18, 19]。若干预措施的变化理论依据在其他(例如在方案中)提供了完整说明,则应予引用。在 Cochrane 评价中,分组合理性可在“干预措施将如何起作用”部分中给予说明。
1b)描述
详细说明并提供用于数据合成的组别在方案制订后所做的任何变更的理由。
1b)解释
在研究筛选和数据提取之后,原先计划的数据合成的分组决定可能需要更改。发生这种情况可能是由于数据收集之后才发现人群、干预措施、对照和/或结局指标有重大变化,或者可用于预先设定的分组的数据有限,可能需要对分组进行修改以便利于数据合成(《Cochrane 手册》第 2 章[20])。
对于提高报告透明度,报告计划分组的变更及其原因很重要,因为这可帮助读者评估变更是否可能受到研究结果的影响。此外,在干预措施、人群或结局更广泛层次(任何或多个)上进行分组,将对合成结果的解释产生影响(参见条目 8)。
条目 2:描述所使用的标准化度量和转换方法
描述
描述每个结局指标的标准化度量方法。解释为什么要选择这个/这些度量,并描述研究中所报告的用于将干预措施效应转换为标准化度量的任何方法,同时引用相关的方法学指南。
解释
术语“标准化度量”是指为数据合成或结果解释或两者兼而有之的目的、用于展示研究间的干预措施效应而采用的度量。
标准化度量的示例包括干预效应的测量[例如:危险度比(相对危险度)、比值比、危险度差(归因危险度)、均数差、标准化均数差、均值比]、效应方向或 P 值。Chinn[21]提出了一种将比值比转换为标准化均数差的统计方法的示例。有关其他方法和度量,可参阅《Cochrane 系统评价员手册》第 6 章[22]。
条目 3:描述合成方法
描述
描述并解释无法对估计效应值进行 Meta 分析时用于综合每个结局效应的方法。
解释
由于各种原因可能无法进行效应值的 Meta 分析。此时,需考虑和指定其他数据合成方法,比如合并 P 值,对干预效应估计值进行汇总统计(例如:中位数、四分位数间距)或基于效应方向的计数。有关可能的合成方法的总结,请参见表 2(更多详细信息,可参见 McKenzie 和 Brennan 2019 年发表的论文[11])。同时,作者应该为所选的合成方法提供合理解释。

条目 4:汇总和合成时用于对结果优先排序的标准
描述
如适用,提供用于选择特定的一些研究或某项研究作为主要合成分析或从合成中得出结论的标准及其合理解释(如基于研究设计、偏倚风险评估、与系统评价问题的直接关系)。
解释
标准可用于优先报告某些研究结果而不是其他研究,或者将合成范围限制为某些研究的子集。标准示例包括:研究设计的类型(如仅限随机试验)、偏倚风险评估(如仅限低偏倚风险的研究)、样本量、证据与系统评价问题的相关性(结局、人群/背景或干预)或证据的确定性。预先指定这些标准可提高透明度,以便解释为什么某些研究被优先排序,也限制了选择性报告研究结果的风险。
条目 5:报告效应值异质性的审查
描述
当不可能进行效应值估计的 Meta 分析时,陈述用于检测报告效应的异质性的方法及其扩展情况以审查异质性。
解释
当不能使用常规的统计学方法诸如亚组分析和 Meta 回归方法进行审查时,可考虑采用非正式方法来审查结果的异质性。非正式方法可包含排序表格、结构图,这些图表包括描述诸如方法学特征(如研究设计)、亚组人群(如性别、年龄)、干预措施的成分和/或研究背景/场所(请参阅 Cochrane 手册第 12 章[11])等假定的效应修饰因素,而且应该合理解释所用方法和所选方法。对异质性的审查具有局限性,因为异质性很少是明确的;使用非正式方法时,这种情况更有可能发生。如果未预先指定异质性审查方法,也应当指出。
条目 6:证据的确定性
描述
描述用于评估合成结果确定性的方法。
解释
对证据确定性的评估应旨在考虑整合结果的精确性(置信区间,如果有的话)、研究数量和受试者的例数、研究间的一致性、研究的偏倚风险、纳入研究如何解决计划中的问题(直接性)及发表偏倚。GRADE 是最广泛使用的评估确定性的框架(Cochrane 手册第 14 章[23])。但是,由于使用的合成方法所限,可能难以评估某些领域的确定性(例如:使用计数法的效应的一致性)。
条目 7:数据的展示方法
描述
描述用于展示效应的图形和表格方法(如表格、森林图、收获图)。在文本及任何表格或图中,明确指出用于对研究进行排序的关键研究特征(如研究设计、偏倚风险),并清晰引用所纳入的研究。
解释
表格或图中展示的研究结果与叙事性文本中报告的合成结果应以相同的方式排序,以便于比较每个纳入研究的结果。可能影响数据解释的关键特征诸如研究设计、样本量和偏倚风险也应陈述。可视化呈现的例子包括森林图[24]、收获图[25]、效应方向图[26]、负担图[27]、气泡图[28]和箱线图[29]。McKenzie 和 Brennan 的研究对这些图及何时使用这些图及其优缺点进行了描述[11]。
条目 8:报告结果
描述
对于每项比较与结局,提供一个合成结果及其确定性的描述。使用与合成分析所解决的问题相一致的语言描述结果,并指出哪些研究对结果合成有贡献。
解释
对于每项比较和结局,都应提供对合成结果的描述,明确说明哪些研究对每项合成分结果有贡献(如在文中列出或列表)。在描述这些结果时,作者应清楚所解决问题的性质(见表 2 第 1 列)、使用度量和合成方法、研究和受试者的数量及纳入研究的关键特征(人群/研究场所、干预措施、结局)。可能的话,合成结果应附上置信区间。还应报告对效应确定性的评估。
任何异质性的审查结果都应加以说明,如果未预先计划,注意避免对结果进行过度解释。
如果使用了预先指定的逻辑模型,那么作者可报告在评价过程中或因评价结果导致逻辑模型所做的任何更改[30]。
条目 9:合成的局限性
描述
报告所使用的数据合成方法和/或合成中使用的分组的局限性及与原始评价问题相关的结论如何受这些局限性影响。
解释
当报告数据合成的局限性时,要考虑的因素包括所使用的标准化度量、所用的合成方法及用于整合的分组再配置(比较、干预措施、人群、结局)。
度量和合成方法的选择将影响所解决的问题(请参见表 2)。例如:如果标准化度量是效应方向,并且使用了计数方法,那么所需解决的问题将会是“是否有某一效应的任何证据?”而不是“干预的平均效应是什么?”,后者一般采用随机效应 Meta 分析。
数据合成的局限性可能源于在制订方案后合成的结构和方法的更改。这些更改可能是由于证据有限、不完整报告结局或效应估计、或者在纳入研究中使用了不同的效应评测方法。这些局限性可能会影响数据合成回答预计的评价问题的能力,例如当计划进行效应评估的 Meta 分析却又不可能执行时。
4 讨论
SWiM 报告规范旨在提高无法使用 Meta 分析进行效应估计的合成报告的透明度。该规范特别提出透明地报告数据合成和展示方法及结果,并且可能与包含了不适合做 Meta 分析的多种数据源的评价最相关。SWiM 报告规范应与涵盖系统评价其他方面的规范结合使用,例如 PRISMA[31]。我们希望 SWiM 成为系统评价作者的资源,并支持期刊编辑和读者评价某项系统评价研究的过程并审阅其结果的真实性。
SWiM 报告条目旨在涵盖研究结果的陈述和合成方面,而这些方面在使用 Meta 分析之外的方法时经常不会报告[7]。这包括报告合成框架和比较分组(条目 1、4、5 和 6)、用于合成的标准化度量(条目 2)、合成方法(条目 3 和 9)、数据呈现(条目 7)及与有明确数据支持的合成结果的总结(条目 8)。尽管 SWiM 项目是专为无 Meta 分析的评价制订的,但在报告包括 Meta 分析结果在内的所有综合方法时,它也能体现提高报告透明度的核心原则。因此,无论使用哪种方法,进行定量效应数据的合成结果报告时,SWiM 条目都是相关的。
报告规范有时被理解为实施规范或用于评估研究或系统评价的质量;这并不是报告规范的适用范围,因此 SWiM 不应被用于指导证据整合的实施。至于如何使用 SWiM 中提到的方法进行数据合成,我们建议读者参考 Cochrane 干预性系统评价手册第二版,特别是第 12 章[11]。尽管报告和实施之间不可避免地存在重叠,但 SWiM 报告规范并非旨在规定方法的选择,并且每个条目的详细程度都并不可能完全适用。例如:异质性的审查(条目 5)可能并不总是必要或有用的。涉及到 SWiM,我们预计即将发布的 PRISMA 更新版将包含更广泛的合成方法的新条目[32],但是该版本将不会提供无 meta 分析数据合成方法的详细指导和示例。
SWiM 报告规范起源于 ICONS-Quant 项目,该项目旨在改善叙事性合成的透明度及其实施情况[10]。在 SWiM 中有意避免使用“叙事性合成”一词,以促进不依赖于 Meta 分析数据合成的系统评价中所用方法的清晰度。叙事(方法)在所有研究中普遍使用,并且它可在撰写来自各种数据的连贯故事中发挥重要作用[33, 34]。但是,在证据合成领域,定量效应估计合成中的叙述方法缺乏透明性,因而难以评估其结果的真实性[7]。SWiM 报告规范和最近发布的关于替代合成方法的其他规范[11],旨在提高无 Meta 分析数据合成的系统评价的报告透明度,进而信任这些系统评价,尤其是针对干预效应的评价。
附件
附件 1:SWiM 报告规范制订的方法学详细信息,下载地址:https://www.bmj.com/content/bmj/suppl/2020/01/16/bmj.l6890.DC1/camm051291.ww1.pdf.
附件 2:报告条目的示例和具体解释,下载地址:https://www.bmj.com/content/bmj/suppl/2020/01/16/bmj.l6890.DC1/camm051291.ww2.pdf.
决策者认为系统评价是基本的证据来源之一[1]。完整、透明地报告系统评价的方法和结果有助于用户评估评价结果的真实性。为改善系统评价报告质量,已制订了由 27 个条目清单组成的系统评价和 Meta 分析优先报告条目 PRISMA 声明(http://www.prisma-statement.org/)[2]。目前,PRISMA 有多种扩展声明,如进行系统评价的不同方法(如概括性评价[3])、具有特殊关注领域的系统评价(如损害[4])及使用特定方法的系统评价(如网状 Meta 分析[5])。但 PRISMA 对于特定领域的系统评价的报告提供的指导比较有限,比如方法描述与数据合成,同时对于那些无 Meta 分析的系统评价则没有报告规范。我们估计,约 32%与健康相关的干预性系统评价没有进行 Meta 分析[6-8],而是使用了替代方法进行合成,这些替代方法通常用文字描述效应,也被称为叙事性综合[9]。最近有研究发现,叙事性综合研究的报告存在严重缺陷,包括缺乏对采用方法的描述,研究层面的数据与叙事性综合方法及其结论之间缺乏透明的联系及缺乏对合成方法局限性的报告[7]。这表明,当不使用 Meta 分析时,研究者对清楚报告合成方法的要求普遍缺乏了解和存在误解,故需要制订一个专门的报告规范。
1 SWiM 报告规范的范围
本文介绍了无 Meta 分析数据合成(SWiM)的报告规范,它主要适用于评估干预措施量化效应的系统评价,而这些效应的评估不可能或不适合进行 Meta 分析或者至少某个结局指标不适合进行 Meta 分析[10]。当效应评估报告不完整或由于研究特征(例如研究设计、干预类型或结局)过于多样化而无法得出有意义的效应总体评估时[11],一般会出现无法进行 Meta 分析数据合并的情况。此时,可采用替代的报告和合成方法(如计算干预效果估计值的概要性统计,根据效果方向进行的计数统计及 P 值合并),SWiM 可为报告这些方法和结果提供指导[11]。具体而言,SWiM 规范扩展了当前可用的有关“结果合成”条目的规范,例如 PRISMA(条目 14 和 21)和 RAMESES(条目 11、14 和 15)[2, 12, 13]。SWiM 涵盖了所有与数据合成相关的关键信息的报告,包括如何对研究进行分组、数据合成方法、数据与摘要的展示及合成方法的局限性。需要明确的是,SWiM 不适用于定性数据合成的系统评价,因为这类系统评价已有自己的报告规范,比如用于定性证据合成的 ENTREQ 和用于元民族志方法(meta-ethnography)的 eMERGe[14, 15]。
2 SWiM 报告规范的制订
在确认没有类似的报告规范正在制订之后,本项目制订了研究方案并在 EQUATOR 网上注册[10]。所有 SWiM 研究团队成员都是经验丰富的系统评价员,其中一位还是开发叙事性综合(AS)指南的合著者[9]。同时,成立了一个项目顾问小组以提供更多的专业知识,其成员包括来自 Cochrane 协作组、坎贝尔合作组织(Campbell Collaboration)和英国国家优化卫生与保健研究所(NICE)的代表(附件 1)。
本项目得到了制订卫生研究报告规范的推荐[16]。我们评估了目前无 Meta 分析数据合成的报告方法,并与项目顾问小组协商制订了 SWiM 报告条目的初始清单。然后,我们邀请了 91 名专家参与 3 轮德尔菲调查,所有这些专家都是系统评价方法学专家或有无 Meta 分析数据合成系统评价经验的作者。3 轮调查的应答率分别为 48%(n=44/91)、54%(n=37/68)和 82%(n=32/39)。专家小组(项目顾问小组加另一名新的方法学专家)以共识会议形式讨论了调查结果(附件 1)。然后我们试用修订后的指南以评估其易用性和表面效度。接下来,我们还邀请了 8 位未参加德尔菲调查但有丰富经验的系统评价员阅读并试用了该指南。我们简短地采访了试用者,以确定条目中需要澄清的内容或其解释,对条目进行了相应修改,并在最终定稿之前将其分发给专家小组以征求意见。附件 1 提供了 SWiM 制订过程的方法学全部详细信息。
3 SWiM 报告条目
我们确定了 9 个条目,以指导无 Meta 分析数据合成的报告。表 1 是 SWiM 报告指南的具体条目,通过网址:www.equator-network.org/reporting-guidelines 可获得 SWiM 在线版本。下面将具体介绍每个报告条目的解释和阐述。附件 2 提供了报告条目的示例和具体解释。

条目 1:分组描述
1a)描述
提供组别的描述及分组的理由(例如:根据干预措施、人群、结局、研究设计分组)。
1a)解释
由于可能存在方法学、临床或概念上的多样性(如由于包括了不同的研究设计、结局、干预措施、背景、人群),因而有必要清晰报告这些研究特征如何用于数据合成的分组及分组的合理性(参阅《Cochrane 系统评价员手册》第 3 章[17])。尽管在所有系统评价中报告研究特征分组情况都很重要,但在无 Meta 分析的系统评价中尤为重要,因为与 Meta 分析相比,无 Meta 分析的系统评价分组可能没那么明显。
提供干预措施如何起作用并影响结局的合理性或变化的理论依据,将为作者和系统评价使用者提供信息以判定分组的适当性和有用性,可使用图表或逻辑模型可视化地阐明系统评价中所用的变化的潜在理论依据[18, 19]。若干预措施的变化理论依据在其他(例如在方案中)提供了完整说明,则应予引用。在 Cochrane 评价中,分组合理性可在“干预措施将如何起作用”部分中给予说明。
1b)描述
详细说明并提供用于数据合成的组别在方案制订后所做的任何变更的理由。
1b)解释
在研究筛选和数据提取之后,原先计划的数据合成的分组决定可能需要更改。发生这种情况可能是由于数据收集之后才发现人群、干预措施、对照和/或结局指标有重大变化,或者可用于预先设定的分组的数据有限,可能需要对分组进行修改以便利于数据合成(《Cochrane 手册》第 2 章[20])。
对于提高报告透明度,报告计划分组的变更及其原因很重要,因为这可帮助读者评估变更是否可能受到研究结果的影响。此外,在干预措施、人群或结局更广泛层次(任何或多个)上进行分组,将对合成结果的解释产生影响(参见条目 8)。
条目 2:描述所使用的标准化度量和转换方法
描述
描述每个结局指标的标准化度量方法。解释为什么要选择这个/这些度量,并描述研究中所报告的用于将干预措施效应转换为标准化度量的任何方法,同时引用相关的方法学指南。
解释
术语“标准化度量”是指为数据合成或结果解释或两者兼而有之的目的、用于展示研究间的干预措施效应而采用的度量。
标准化度量的示例包括干预效应的测量[例如:危险度比(相对危险度)、比值比、危险度差(归因危险度)、均数差、标准化均数差、均值比]、效应方向或 P 值。Chinn[21]提出了一种将比值比转换为标准化均数差的统计方法的示例。有关其他方法和度量,可参阅《Cochrane 系统评价员手册》第 6 章[22]。
条目 3:描述合成方法
描述
描述并解释无法对估计效应值进行 Meta 分析时用于综合每个结局效应的方法。
解释
由于各种原因可能无法进行效应值的 Meta 分析。此时,需考虑和指定其他数据合成方法,比如合并 P 值,对干预效应估计值进行汇总统计(例如:中位数、四分位数间距)或基于效应方向的计数。有关可能的合成方法的总结,请参见表 2(更多详细信息,可参见 McKenzie 和 Brennan 2019 年发表的论文[11])。同时,作者应该为所选的合成方法提供合理解释。

条目 4:汇总和合成时用于对结果优先排序的标准
描述
如适用,提供用于选择特定的一些研究或某项研究作为主要合成分析或从合成中得出结论的标准及其合理解释(如基于研究设计、偏倚风险评估、与系统评价问题的直接关系)。
解释
标准可用于优先报告某些研究结果而不是其他研究,或者将合成范围限制为某些研究的子集。标准示例包括:研究设计的类型(如仅限随机试验)、偏倚风险评估(如仅限低偏倚风险的研究)、样本量、证据与系统评价问题的相关性(结局、人群/背景或干预)或证据的确定性。预先指定这些标准可提高透明度,以便解释为什么某些研究被优先排序,也限制了选择性报告研究结果的风险。
条目 5:报告效应值异质性的审查
描述
当不可能进行效应值估计的 Meta 分析时,陈述用于检测报告效应的异质性的方法及其扩展情况以审查异质性。
解释
当不能使用常规的统计学方法诸如亚组分析和 Meta 回归方法进行审查时,可考虑采用非正式方法来审查结果的异质性。非正式方法可包含排序表格、结构图,这些图表包括描述诸如方法学特征(如研究设计)、亚组人群(如性别、年龄)、干预措施的成分和/或研究背景/场所(请参阅 Cochrane 手册第 12 章[11])等假定的效应修饰因素,而且应该合理解释所用方法和所选方法。对异质性的审查具有局限性,因为异质性很少是明确的;使用非正式方法时,这种情况更有可能发生。如果未预先指定异质性审查方法,也应当指出。
条目 6:证据的确定性
描述
描述用于评估合成结果确定性的方法。
解释
对证据确定性的评估应旨在考虑整合结果的精确性(置信区间,如果有的话)、研究数量和受试者的例数、研究间的一致性、研究的偏倚风险、纳入研究如何解决计划中的问题(直接性)及发表偏倚。GRADE 是最广泛使用的评估确定性的框架(Cochrane 手册第 14 章[23])。但是,由于使用的合成方法所限,可能难以评估某些领域的确定性(例如:使用计数法的效应的一致性)。
条目 7:数据的展示方法
描述
描述用于展示效应的图形和表格方法(如表格、森林图、收获图)。在文本及任何表格或图中,明确指出用于对研究进行排序的关键研究特征(如研究设计、偏倚风险),并清晰引用所纳入的研究。
解释
表格或图中展示的研究结果与叙事性文本中报告的合成结果应以相同的方式排序,以便于比较每个纳入研究的结果。可能影响数据解释的关键特征诸如研究设计、样本量和偏倚风险也应陈述。可视化呈现的例子包括森林图[24]、收获图[25]、效应方向图[26]、负担图[27]、气泡图[28]和箱线图[29]。McKenzie 和 Brennan 的研究对这些图及何时使用这些图及其优缺点进行了描述[11]。
条目 8:报告结果
描述
对于每项比较与结局,提供一个合成结果及其确定性的描述。使用与合成分析所解决的问题相一致的语言描述结果,并指出哪些研究对结果合成有贡献。
解释
对于每项比较和结局,都应提供对合成结果的描述,明确说明哪些研究对每项合成分结果有贡献(如在文中列出或列表)。在描述这些结果时,作者应清楚所解决问题的性质(见表 2 第 1 列)、使用度量和合成方法、研究和受试者的数量及纳入研究的关键特征(人群/研究场所、干预措施、结局)。可能的话,合成结果应附上置信区间。还应报告对效应确定性的评估。
任何异质性的审查结果都应加以说明,如果未预先计划,注意避免对结果进行过度解释。
如果使用了预先指定的逻辑模型,那么作者可报告在评价过程中或因评价结果导致逻辑模型所做的任何更改[30]。
条目 9:合成的局限性
描述
报告所使用的数据合成方法和/或合成中使用的分组的局限性及与原始评价问题相关的结论如何受这些局限性影响。
解释
当报告数据合成的局限性时,要考虑的因素包括所使用的标准化度量、所用的合成方法及用于整合的分组再配置(比较、干预措施、人群、结局)。
度量和合成方法的选择将影响所解决的问题(请参见表 2)。例如:如果标准化度量是效应方向,并且使用了计数方法,那么所需解决的问题将会是“是否有某一效应的任何证据?”而不是“干预的平均效应是什么?”,后者一般采用随机效应 Meta 分析。
数据合成的局限性可能源于在制订方案后合成的结构和方法的更改。这些更改可能是由于证据有限、不完整报告结局或效应估计、或者在纳入研究中使用了不同的效应评测方法。这些局限性可能会影响数据合成回答预计的评价问题的能力,例如当计划进行效应评估的 Meta 分析却又不可能执行时。
4 讨论
SWiM 报告规范旨在提高无法使用 Meta 分析进行效应估计的合成报告的透明度。该规范特别提出透明地报告数据合成和展示方法及结果,并且可能与包含了不适合做 Meta 分析的多种数据源的评价最相关。SWiM 报告规范应与涵盖系统评价其他方面的规范结合使用,例如 PRISMA[31]。我们希望 SWiM 成为系统评价作者的资源,并支持期刊编辑和读者评价某项系统评价研究的过程并审阅其结果的真实性。
SWiM 报告条目旨在涵盖研究结果的陈述和合成方面,而这些方面在使用 Meta 分析之外的方法时经常不会报告[7]。这包括报告合成框架和比较分组(条目 1、4、5 和 6)、用于合成的标准化度量(条目 2)、合成方法(条目 3 和 9)、数据呈现(条目 7)及与有明确数据支持的合成结果的总结(条目 8)。尽管 SWiM 项目是专为无 Meta 分析的评价制订的,但在报告包括 Meta 分析结果在内的所有综合方法时,它也能体现提高报告透明度的核心原则。因此,无论使用哪种方法,进行定量效应数据的合成结果报告时,SWiM 条目都是相关的。
报告规范有时被理解为实施规范或用于评估研究或系统评价的质量;这并不是报告规范的适用范围,因此 SWiM 不应被用于指导证据整合的实施。至于如何使用 SWiM 中提到的方法进行数据合成,我们建议读者参考 Cochrane 干预性系统评价手册第二版,特别是第 12 章[11]。尽管报告和实施之间不可避免地存在重叠,但 SWiM 报告规范并非旨在规定方法的选择,并且每个条目的详细程度都并不可能完全适用。例如:异质性的审查(条目 5)可能并不总是必要或有用的。涉及到 SWiM,我们预计即将发布的 PRISMA 更新版将包含更广泛的合成方法的新条目[32],但是该版本将不会提供无 meta 分析数据合成方法的详细指导和示例。
SWiM 报告规范起源于 ICONS-Quant 项目,该项目旨在改善叙事性合成的透明度及其实施情况[10]。在 SWiM 中有意避免使用“叙事性合成”一词,以促进不依赖于 Meta 分析数据合成的系统评价中所用方法的清晰度。叙事(方法)在所有研究中普遍使用,并且它可在撰写来自各种数据的连贯故事中发挥重要作用[33, 34]。但是,在证据合成领域,定量效应估计合成中的叙述方法缺乏透明性,因而难以评估其结果的真实性[7]。SWiM 报告规范和最近发布的关于替代合成方法的其他规范[11],旨在提高无 Meta 分析数据合成的系统评价的报告透明度,进而信任这些系统评价,尤其是针对干预效应的评价。
附件
附件 1:SWiM 报告规范制订的方法学详细信息,下载地址:https://www.bmj.com/content/bmj/suppl/2020/01/16/bmj.l6890.DC1/camm051291.ww1.pdf.
附件 2:报告条目的示例和具体解释,下载地址:https://www.bmj.com/content/bmj/suppl/2020/01/16/bmj.l6890.DC1/camm051291.ww2.pdf.