证据图谱是通过对现有证据的系统收集、评价和综合,明确研究现状和差距,进而促进科学研究和决策的一种新型证据综合研究方法。经过近 20 年的发展,证据图谱的制作与报告方法不断完善,获得了国际社会的广泛关注与认可。我国对于证据图谱的关注较早,但相关理论和实践研究相对较少,证据图谱概念的定义尚不统一。本文系统梳理了证据图谱的起源发展和定义演化,全面介绍了证据图谱的制作与报告,供研究者借鉴参考,以期进一步促进证据图谱在我国的研究与发展。
引用本文: 李艳飞, 李秀霞, 李睿, 曹柳娇, 李美萱, 李慧娟, 后亮瑛, 张维益, 杨克虎. 证据图谱的制作与报告. 中国循证医学杂志, 2020, 20(9): 1098-1103. doi: 10.7507/1672-2531.202001079 复制
1 证据图谱的起源和发展
证据图谱(evidence mapping,EM)是对相关研究领域的现有证据进行系统收集、深入分析、综合评价,整合凝练、以表格或图形为主要呈现形式的一种新型证据综合研究方法。2000 年,美国耶鲁大学预防研究中心对补充与替代医学相关的证据进行了一次系统审查,从而形成了一种可靠且可重复的 9 步骤的审查模型,这标志着证据图谱的诞生[1]。2002 年, Arksey 等[2]关于“Scoping Study”的研究推动了对较大研究范围的证据进行审查的进程。2003 年,Katz等[1]对 9 步骤模型进行了调整并发表了第一篇证据图谱报告;2007 年,澳大利亚成立“The Global Evidence Mapping Initiative”[3];2008 年和 2009 年,Cochrane 协作网两届学术年会均对证据图谱进行了专题研讨[3, 4]。
由于证据图谱是一种新型的证据综合研究方法,其制作方法、呈现形式和报告规范均不统一,推广和应用比较缓慢。截至 2010 年,仅有 10 篇证据图谱论文发表[5]。2013 年,Althuis 等[6]和 Gaarder 等[7]对证据图谱的定义和方法进行了全面介绍,极大地推动了证据图谱的发展,仅 2014 年,就有 11 篇证据图谱研究发表。近年来,证据图谱作为一种新型证据综合研究方法在国外备受关注,Campbell 协作网等多个证据生产、传播与转化的学术机构专门开展了证据图谱的研究[8-15],进一步促进了证据图谱的发展。
目前,我国关于证据图谱的研究数量较少,方法学方面的研究和介绍更加缺乏。2019 年 12 月,以“证据图谱、证据图、差距图”为检索词检索 CNKI 数据库,结果显示证据图谱方法的论文仅有 2 篇[4, 16]。李伦等[4]首次在国内提及证据图的概念和相关报告流程;田金徽等[16]研究报告了证据图撰写注意事项。所以,系统梳理证据图谱的起源发展,厘清证据图谱的定义,介绍证据图谱的制作与报告方法,对进一步促进证据图谱在我国的研究与发展非常重要。
2 证据图谱的定义
证据图谱是系统收集相关研究领域的现有证据、进行综合分析、科学评价,整合凝练、简明直观地呈现其研究现状、存在问题、发展方向和证据差距的一种新型证据综合研究方法[17, 18]。
目前,证据图谱主要包括证据图(evidence map)和差距图(gap map)两种研究类型[7]。证据图主要描述某一特定领域的研究性质、特点和数量,并通过比较所研究问题的相关文献来确定不同证据的样本量和结论等信息(证据差距),一般不对纳入研究进行质量评价,是证据图谱中的一种较为常见的类型。差距图通过可视化特定领域中的现有证据,为政策和实践提供信息,其主要是对疾病干预措施有关的证据进行评价整合分析,不涉及预防和预后等,即干预性证据图谱,目前主要由 Campbell 协作网进行研究和推广。因此,这两种证据图谱的研究方法有一定差异。证据图谱、证据图和差距图之间的关系如图 1 所示。但近年发表的证据图谱相关的论文中,证据图谱、证据图、差距图三者常常相互代替使用,并没有严格的区别。此外,与获得普遍认可的系统评价、系统评价再评价相比较,证据图谱突破了仅针对具体问题证据的局限,着眼于对更为广泛的某一研究领域中的证据进行评价和综合,并以更为直观的方式呈现。证据图谱是在系统评价理论的基础上,更加快速、便捷地对相关研究领域的证据进行科学的整合、分析、凝练和呈现的一种方法。

3 证据图谱的制作方法
自美国耶鲁大学提出证据图谱的 9 步骤以来[1],证据图谱的撰写步骤在不断地变化。目前,已经发表的证据图谱运用的方法和步骤不尽相同[6, 19-21],主要的研究方法和步骤详见表 1。

4 证据图谱的制作要点
虽然证据图谱的制作方法与步骤尚无公认的制作流程,但归纳其制作要点,主要制作步骤如下。
4.1 确定研究主题
制作证据图谱的第一步是确定一个合适的研究主题并通过制定研究框架来确定具体的研究范围[18]。研究选题来源于实践,又服务于实践,因此一个好的研究主题应符合需要性原则、价值性原则和科学性原则。与系统评价/Meta 分析不同的是,证据图谱的研究主题和范围通常较广,不同类型的证据图谱选题也有区别。证据图选题的方向通常没有限制。但差距图,即干预性证据图谱,往往偏向于某个研究领域中的多种干预措施对特定人群的影响,研究内容包括各种重要干预措施和研究结果,从而系统全面地分析、呈现各种干预措施的具体应用情况,如以家庭为基础的干预对老年人功能影响的差距图[22]。此外,确定研究主题时还应与学术专家、决策者、从业者和资助者在内的利益相关方进行协商。
4.2 制定纳入与排除标准
纳入与排除标准的制定一般根据 PICO 原则进行[23]。限于证据图谱的作用和意义,在纳入排除标准制定时一般只考虑干预措施和人群,很少对结局指标和对照进行限制。此外,Miake-Lye 等[5]的研究显示,有多个只针对系统评价的证据图谱已发表。可见对于研究类型来说分为两种,一种是纳入所有的研究,包括系统评价/Meta 分析和原始研究等。例如早期双相情感障碍的社会心理干预的证据图[24],纳入了符合纳入标准的所有研究,未限制研究类型。一种是仅纳入系统评价/Meta 分析,与系统评价再评价类似。但两者仍有不同,系统评价再评价倾向于解决具体的临床问题,而证据图谱倾向于对某个研究领域进行归纳总结,其纳入的研究涉及面更为广泛[7],如按摩对于疼痛的证据图谱[21]。
4.3 全面证据检索
证据检索的目的是为获取该领域全面的资料信息[25]。证据图谱的制作需要全面搜集研究证据。一般来说,制作证据图谱需要对综合性数据库进行全面检索,主要包括 CNKI、WanFang Data、VIP 和 CBM 等中文数据库和 PubMed、Web of Science、The Cochrane Library、EMbase 等英文数据库。对于某些专业领域,比如教育学、心理学、经济学等专业,还需检索本专业领域的专题数据库。
4.4 数据提取
全面和准确地数据提取是证据图谱真实性的保障。证据图谱的数据提取可分为两部分,一部分是研究的基本特征,展示研究的基本信息。另一部分是研究问题的特征,突出研究重点。以干预性证据图谱为例,提取的信息主要包括[7, 23]:① 研究的基本特征:作者、出版年份、研究类型/设计、目的、检索日期、纳入研究数量和样本大小等;② 研究问题的特征:人群、干预类型、对照措施和结局(PICO 原则)。
目前发表的部分研究只提取了研究的基本特征,如瑜伽对后背疼的证据图[19],该研究提取了作者、年份、研究设计、年龄等信息,并对其进行了分析。而另有一些证据图谱对研究的基本特征和研究问题特征都进行了非常详细的提取与整理,如以胃肠道间质瘤患者干预措施系统评价为基础的证据图谱[20],该研究提取了纳入研究的作者、发表年份、研究目的、原始研究数量、研究类型、干预组、对照组、人群和结局指标等信息,并以研究问题特征为基础进行了深入分析。
4.5 质量评价
证据图谱的质量评价主要是指对纳入的系统评价/Meta 分析进行质量评价,评价内容包括方法学设计、实施步骤、各类偏倚状况及偏倚控制、利益冲突报告等。目前系统评价的评价标准分为方法学质量评价工具和报告质量评价工具,较常用的方法学质量评价工具为 AMSTAR 2[26]、报告质量评价工具为 PRISMA[27]。研究者可根据具体情况,选择恰当标准对其质量进行评价。此外,对于干预性证据图谱(差距图)来说,制作方法中明确包括了质量评价这一关键步骤,而证据图则一般不对纳入研究进行质量评价。但通过近年发表的研究来看,证据图谱的研究通常都会对纳入研究进行质量评价,并且主要针对纳入的系统评价/Meta 分析。例如瑜伽质量后背痛的证据图[19]、以家庭为基础的干预对老年人影响的证据差距图[22]、胃肠道间质瘤患者干预措施系统评价为基础的证据图谱[20]等,都采用 AMSTAR 对纳入的系统评价/Meta 分析进行了方法学质量评价。
4.6 证据图谱的结果呈现
证据图谱的结果主要通过表格和图形两种形式展现,一个内容丰富、简明直观的结果呈现对于证据使用者,尤其是临床决策者尤为重要[18]。
在证据图谱的全文中,数据提取表所展示的内容是全文中非常重要的一部分,被称为基本特征。但总体来看,数据提取表所展示的内容深度有限。因此,证据图谱通常通过一个专门的表格去更深层次地对纳入研究进行分析,例如质量评价结果的展示、通过 PICO 原则所绘制的研究问题(研究问题特征)等。以干预性证据图谱为例,各种干预措施、人群重要特征和临床上的研究热点,均可用表格直观展示。例如糖尿病前期干预的证据图通过表格形式呈现了纳入研究的基本特征、研究问题特征和研究质量信息[28]。
除制作表格之外,图形展示是证据图谱一大亮点。其中最常见的图形是气泡图(bubble chart)[29]。气泡图能够清晰地展示 3 个或多个变量之间的关系,在证据图谱结果的呈现中有举足轻重的地位。譬如它可在一张三维图上同时展示出纳入研究的质量、样本量和干预措施的分布这 3 项重要内容。故在证据图谱中除用表格展示结果之外,用气泡图来立体呈现重点证据的分布和状态能够明显增加可读性。例如按摩对疼痛的证据图[21],该研究除通过表格的形式呈现结果外,还通过气泡图的形式直观呈现研究数量、质量和结论等信息。
此外,与系统评价、系统评价再评价相比,证据图谱的结果呈现更加简洁、直观和丰富。系统评价、系统评价再评价对纳入研究的特征、质量评价结果及效应量等信息进行评价,结果主要通过文字、表格或者森林图等来展示,其中系统评价再评价偏重报告证据的质量特征。而证据图谱结果报告的是整体的证据差距(样本量、原始研究的数量、结论、质量等),对证据差距中的各项内容无明显倾向,主要通过可视化方法,如气泡图的方式呈现[7, 18]。
4.7 研究报告的撰写结构
证据图谱研究报告的撰写结构与系统评价/Meta 分析相似,一般包括研究背景、材料和方法(研究设计、纳入排除标准、检索策略、数据提取及文献筛选、质量评价、数据分析)、结果(纳入研究的数量及基本特征、质量评价结果、证据图谱的展示)、讨论、结论及参考文献[18]。
5 范例解读
本文以“Evidence mapping and quality assessment of systematic reviews on therapeutic interventions for oral cancer”研究[17]为例,对证据图谱进行解读,以供研究者参考。
5.1 研究背景
证据图谱研究背景的撰写同其它研究论文一样,主要是对所研究领域发展现状进行概括性的阐述,从而使读者迅速了解论文背景和目的。在本范例中其背景介绍如下:
口腔癌是全世界最常见的癌症之一。口腔鳞状细胞癌是口腔最常见的癌症,全球每年新增病例约 30 万;仅在美国,2017 年预计新增病例约 5 万。目前,大量已发表研究提出了多种治疗口腔癌的方法。但是人们不了解这些方法有效性的优劣,及何时选用何种治疗方法。因此,需要对现有证据进行批判性分析和方法学质量评估。组织和批判性地评估已发表研究的选择之一是系统评价,它是通过总结来自初级保健研究证据的结果,以回答一个具体的研究问题。同样,也有新的证据综合工具,如证据图谱,它被开发出来以帮助临床医生、病人、研究人员和其他利益相关者做出基于证据的决策。证据图谱适合于解决可能对很多人来说过于广泛的问题,其研究目的是识别、描述和组织现有的关于口腔癌治疗干预的系统评价证据。该方法的目的是确定科学文献中评估的临床问题和证据的相应质量,并提供关于有效性的一般信息,这些信息将有助于发现研究差别,并帮助利害相关方进行科学决策。
5.2 纳入与排除标准
证据图谱的纳入与排除标准一般根据 PICO 原则进行设置,该研究纳入已发表的口腔恶性肿瘤患者疗效评估的系统评价,不管是否进行 Meta 分析。研究人员对至少两个不同的数据库进行了全面搜索,并报告了对所包含研究的方法学质量评估。在处理同一团队在不同阶段发表的相同主题的论文时,纳入最近发表的论文。此外,排除了关于精神分裂、安全性或成本效益分析相关的研究。
5.3 文献检索策略
在 2018 年 10 月 25 日系统检索了 MEDLINE、EMbase、Epistemonikos、The Cochrane Library 4 个数据库。通过主题词和自由词进行口腔癌的检索,检索词包括:mouth neoplasms、oral carcinoma、oral cancer、oral tumor、buccal carcinoma 等。根据每个数据库的具体特点对检索策略进行了调整,没有语言限制。此外,追溯纳入文献的参考文献,以补充获取相关文献。
5.4 质量评价
证据图谱所报告的质量评价主要针对纳入研究,纳入研究的设计类型不同,需选用不同的质量评价工具。此范例主要针对系统评价/Meta 分析,对纳入系统评价/Meta 分析的质量评价采用 AMSTAR 2。
5.5 数据提取
证据图谱的数据提取分为研究的基本特征和研究问题的特征两部分。该范例数据提取内容包括:① 研究的基本特征:作者、出版年份、系统评价的类型(是否进行 Meta 分析)、目的、检索日期、纳入研究的设计和数量及纳入参与者的数量。② 研究问题的特征:根据作者所述的目的,纳排标准和系统评价的结论确定每个系统评价的研究问题。研究问题使用 PICO 框架(人群、干预措施、对照措施和结局)。如果某研究提供了 PICO 框架的所有要素,并在系统评价中描述了关于干预效果的结论,则考虑纳入。提取人口特征(如,人群、癌症类型、癌症分期阶段和癌症位置),干预和对照(如,干预和对照措施均可广泛分类为化疗、手术、放射治疗、免疫治疗和靶向治疗)和结局。此外,根据先前报告的标准[20],将系统评价的结论分为五类:有益(研究结论显示干预措施有效并且纳入的研究偏倚风险极低)、可能有益(尽管结果中报道了结局指标有效,但结论中并没有明显指出干预措施是有益的)、有害(研究结论中明显报告与对照相比干预措施是有害的)、无差异效应(研究结论指出干预组和对照组的效果类似)及不确定(多个研究结局得出了相冲突的结论或者纳入的个别研究限制了结论的得出)。
5.6 结果展示
证据图谱的结果主要通过表格和图形两种形式展示。此范例展示了系统评价的基本特征表、PICO 研究问题特征表和质量评价表,并对疾病严重程度进行了描述性分析从而设计了一个气泡图(图 2),其中每个气泡代表一个系统评价。该图表从 3 个维度显示信息:① 作者的结论:在横轴上的评级为有益、可能有益、有害、无差别效应和不确定;② AMSTAR 2 评估结果,分为高、中、低和极低四个等级,在纵轴上展示;③ 系统评价中包含的主要研究的数量,其在每个气泡中显示并由气泡大小表示。每个气泡也代表一个饼图,显示使用黑色粗线包括的随机对照试验的比例。

5.7 讨论
证据图谱的结论主要是对研究领域内相关研究的发表现状、差距、质量等进行综合分析,以期给出未来的研究方向。此范例对结论部分做了以下报告:
关于口腔癌治疗干预的现有证据有限。该证据图谱中纳入的系统评价的方法学质量为极低。作者报告的可切除口腔癌患者的主要有益治疗干预措施是单独手术或与放疗或化疗联合使用。缺乏无法切除的口腔癌的治疗证据。这些研究结果强调了未来研究的必要性,重点是对新的治疗干预措施和该领域的知识探索,及需要加大努力来改善关于口腔癌治疗的系统评价方法学质量和报告过程。
6 结论
综上,证据图谱和系统评价理念相似,都是通过对现有证据进行综合研究,从而解决回答临床问题的一种证据综合研究方法。系统评价旨在解决较为具体的研究和实践问题,而证据图谱最大的优势在于能够更加方便快捷地解决某个领域的整体研究和实践问题。一个高质量的证据图谱,能够清晰、简明、全面、系统地展示当前证据的质量、有效性、数量和人群等各种信息,找出现有证据体系的不足与证据之间的差别,找准未来的研究方向,从而为政府、研究者、使用者及其他利益相关方提供科学的决策依据。证据图谱是极具发展潜力的一种新兴证据综合研究方法。
1 证据图谱的起源和发展
证据图谱(evidence mapping,EM)是对相关研究领域的现有证据进行系统收集、深入分析、综合评价,整合凝练、以表格或图形为主要呈现形式的一种新型证据综合研究方法。2000 年,美国耶鲁大学预防研究中心对补充与替代医学相关的证据进行了一次系统审查,从而形成了一种可靠且可重复的 9 步骤的审查模型,这标志着证据图谱的诞生[1]。2002 年, Arksey 等[2]关于“Scoping Study”的研究推动了对较大研究范围的证据进行审查的进程。2003 年,Katz等[1]对 9 步骤模型进行了调整并发表了第一篇证据图谱报告;2007 年,澳大利亚成立“The Global Evidence Mapping Initiative”[3];2008 年和 2009 年,Cochrane 协作网两届学术年会均对证据图谱进行了专题研讨[3, 4]。
由于证据图谱是一种新型的证据综合研究方法,其制作方法、呈现形式和报告规范均不统一,推广和应用比较缓慢。截至 2010 年,仅有 10 篇证据图谱论文发表[5]。2013 年,Althuis 等[6]和 Gaarder 等[7]对证据图谱的定义和方法进行了全面介绍,极大地推动了证据图谱的发展,仅 2014 年,就有 11 篇证据图谱研究发表。近年来,证据图谱作为一种新型证据综合研究方法在国外备受关注,Campbell 协作网等多个证据生产、传播与转化的学术机构专门开展了证据图谱的研究[8-15],进一步促进了证据图谱的发展。
目前,我国关于证据图谱的研究数量较少,方法学方面的研究和介绍更加缺乏。2019 年 12 月,以“证据图谱、证据图、差距图”为检索词检索 CNKI 数据库,结果显示证据图谱方法的论文仅有 2 篇[4, 16]。李伦等[4]首次在国内提及证据图的概念和相关报告流程;田金徽等[16]研究报告了证据图撰写注意事项。所以,系统梳理证据图谱的起源发展,厘清证据图谱的定义,介绍证据图谱的制作与报告方法,对进一步促进证据图谱在我国的研究与发展非常重要。
2 证据图谱的定义
证据图谱是系统收集相关研究领域的现有证据、进行综合分析、科学评价,整合凝练、简明直观地呈现其研究现状、存在问题、发展方向和证据差距的一种新型证据综合研究方法[17, 18]。
目前,证据图谱主要包括证据图(evidence map)和差距图(gap map)两种研究类型[7]。证据图主要描述某一特定领域的研究性质、特点和数量,并通过比较所研究问题的相关文献来确定不同证据的样本量和结论等信息(证据差距),一般不对纳入研究进行质量评价,是证据图谱中的一种较为常见的类型。差距图通过可视化特定领域中的现有证据,为政策和实践提供信息,其主要是对疾病干预措施有关的证据进行评价整合分析,不涉及预防和预后等,即干预性证据图谱,目前主要由 Campbell 协作网进行研究和推广。因此,这两种证据图谱的研究方法有一定差异。证据图谱、证据图和差距图之间的关系如图 1 所示。但近年发表的证据图谱相关的论文中,证据图谱、证据图、差距图三者常常相互代替使用,并没有严格的区别。此外,与获得普遍认可的系统评价、系统评价再评价相比较,证据图谱突破了仅针对具体问题证据的局限,着眼于对更为广泛的某一研究领域中的证据进行评价和综合,并以更为直观的方式呈现。证据图谱是在系统评价理论的基础上,更加快速、便捷地对相关研究领域的证据进行科学的整合、分析、凝练和呈现的一种方法。

3 证据图谱的制作方法
自美国耶鲁大学提出证据图谱的 9 步骤以来[1],证据图谱的撰写步骤在不断地变化。目前,已经发表的证据图谱运用的方法和步骤不尽相同[6, 19-21],主要的研究方法和步骤详见表 1。

4 证据图谱的制作要点
虽然证据图谱的制作方法与步骤尚无公认的制作流程,但归纳其制作要点,主要制作步骤如下。
4.1 确定研究主题
制作证据图谱的第一步是确定一个合适的研究主题并通过制定研究框架来确定具体的研究范围[18]。研究选题来源于实践,又服务于实践,因此一个好的研究主题应符合需要性原则、价值性原则和科学性原则。与系统评价/Meta 分析不同的是,证据图谱的研究主题和范围通常较广,不同类型的证据图谱选题也有区别。证据图选题的方向通常没有限制。但差距图,即干预性证据图谱,往往偏向于某个研究领域中的多种干预措施对特定人群的影响,研究内容包括各种重要干预措施和研究结果,从而系统全面地分析、呈现各种干预措施的具体应用情况,如以家庭为基础的干预对老年人功能影响的差距图[22]。此外,确定研究主题时还应与学术专家、决策者、从业者和资助者在内的利益相关方进行协商。
4.2 制定纳入与排除标准
纳入与排除标准的制定一般根据 PICO 原则进行[23]。限于证据图谱的作用和意义,在纳入排除标准制定时一般只考虑干预措施和人群,很少对结局指标和对照进行限制。此外,Miake-Lye 等[5]的研究显示,有多个只针对系统评价的证据图谱已发表。可见对于研究类型来说分为两种,一种是纳入所有的研究,包括系统评价/Meta 分析和原始研究等。例如早期双相情感障碍的社会心理干预的证据图[24],纳入了符合纳入标准的所有研究,未限制研究类型。一种是仅纳入系统评价/Meta 分析,与系统评价再评价类似。但两者仍有不同,系统评价再评价倾向于解决具体的临床问题,而证据图谱倾向于对某个研究领域进行归纳总结,其纳入的研究涉及面更为广泛[7],如按摩对于疼痛的证据图谱[21]。
4.3 全面证据检索
证据检索的目的是为获取该领域全面的资料信息[25]。证据图谱的制作需要全面搜集研究证据。一般来说,制作证据图谱需要对综合性数据库进行全面检索,主要包括 CNKI、WanFang Data、VIP 和 CBM 等中文数据库和 PubMed、Web of Science、The Cochrane Library、EMbase 等英文数据库。对于某些专业领域,比如教育学、心理学、经济学等专业,还需检索本专业领域的专题数据库。
4.4 数据提取
全面和准确地数据提取是证据图谱真实性的保障。证据图谱的数据提取可分为两部分,一部分是研究的基本特征,展示研究的基本信息。另一部分是研究问题的特征,突出研究重点。以干预性证据图谱为例,提取的信息主要包括[7, 23]:① 研究的基本特征:作者、出版年份、研究类型/设计、目的、检索日期、纳入研究数量和样本大小等;② 研究问题的特征:人群、干预类型、对照措施和结局(PICO 原则)。
目前发表的部分研究只提取了研究的基本特征,如瑜伽对后背疼的证据图[19],该研究提取了作者、年份、研究设计、年龄等信息,并对其进行了分析。而另有一些证据图谱对研究的基本特征和研究问题特征都进行了非常详细的提取与整理,如以胃肠道间质瘤患者干预措施系统评价为基础的证据图谱[20],该研究提取了纳入研究的作者、发表年份、研究目的、原始研究数量、研究类型、干预组、对照组、人群和结局指标等信息,并以研究问题特征为基础进行了深入分析。
4.5 质量评价
证据图谱的质量评价主要是指对纳入的系统评价/Meta 分析进行质量评价,评价内容包括方法学设计、实施步骤、各类偏倚状况及偏倚控制、利益冲突报告等。目前系统评价的评价标准分为方法学质量评价工具和报告质量评价工具,较常用的方法学质量评价工具为 AMSTAR 2[26]、报告质量评价工具为 PRISMA[27]。研究者可根据具体情况,选择恰当标准对其质量进行评价。此外,对于干预性证据图谱(差距图)来说,制作方法中明确包括了质量评价这一关键步骤,而证据图则一般不对纳入研究进行质量评价。但通过近年发表的研究来看,证据图谱的研究通常都会对纳入研究进行质量评价,并且主要针对纳入的系统评价/Meta 分析。例如瑜伽质量后背痛的证据图[19]、以家庭为基础的干预对老年人影响的证据差距图[22]、胃肠道间质瘤患者干预措施系统评价为基础的证据图谱[20]等,都采用 AMSTAR 对纳入的系统评价/Meta 分析进行了方法学质量评价。
4.6 证据图谱的结果呈现
证据图谱的结果主要通过表格和图形两种形式展现,一个内容丰富、简明直观的结果呈现对于证据使用者,尤其是临床决策者尤为重要[18]。
在证据图谱的全文中,数据提取表所展示的内容是全文中非常重要的一部分,被称为基本特征。但总体来看,数据提取表所展示的内容深度有限。因此,证据图谱通常通过一个专门的表格去更深层次地对纳入研究进行分析,例如质量评价结果的展示、通过 PICO 原则所绘制的研究问题(研究问题特征)等。以干预性证据图谱为例,各种干预措施、人群重要特征和临床上的研究热点,均可用表格直观展示。例如糖尿病前期干预的证据图通过表格形式呈现了纳入研究的基本特征、研究问题特征和研究质量信息[28]。
除制作表格之外,图形展示是证据图谱一大亮点。其中最常见的图形是气泡图(bubble chart)[29]。气泡图能够清晰地展示 3 个或多个变量之间的关系,在证据图谱结果的呈现中有举足轻重的地位。譬如它可在一张三维图上同时展示出纳入研究的质量、样本量和干预措施的分布这 3 项重要内容。故在证据图谱中除用表格展示结果之外,用气泡图来立体呈现重点证据的分布和状态能够明显增加可读性。例如按摩对疼痛的证据图[21],该研究除通过表格的形式呈现结果外,还通过气泡图的形式直观呈现研究数量、质量和结论等信息。
此外,与系统评价、系统评价再评价相比,证据图谱的结果呈现更加简洁、直观和丰富。系统评价、系统评价再评价对纳入研究的特征、质量评价结果及效应量等信息进行评价,结果主要通过文字、表格或者森林图等来展示,其中系统评价再评价偏重报告证据的质量特征。而证据图谱结果报告的是整体的证据差距(样本量、原始研究的数量、结论、质量等),对证据差距中的各项内容无明显倾向,主要通过可视化方法,如气泡图的方式呈现[7, 18]。
4.7 研究报告的撰写结构
证据图谱研究报告的撰写结构与系统评价/Meta 分析相似,一般包括研究背景、材料和方法(研究设计、纳入排除标准、检索策略、数据提取及文献筛选、质量评价、数据分析)、结果(纳入研究的数量及基本特征、质量评价结果、证据图谱的展示)、讨论、结论及参考文献[18]。
5 范例解读
本文以“Evidence mapping and quality assessment of systematic reviews on therapeutic interventions for oral cancer”研究[17]为例,对证据图谱进行解读,以供研究者参考。
5.1 研究背景
证据图谱研究背景的撰写同其它研究论文一样,主要是对所研究领域发展现状进行概括性的阐述,从而使读者迅速了解论文背景和目的。在本范例中其背景介绍如下:
口腔癌是全世界最常见的癌症之一。口腔鳞状细胞癌是口腔最常见的癌症,全球每年新增病例约 30 万;仅在美国,2017 年预计新增病例约 5 万。目前,大量已发表研究提出了多种治疗口腔癌的方法。但是人们不了解这些方法有效性的优劣,及何时选用何种治疗方法。因此,需要对现有证据进行批判性分析和方法学质量评估。组织和批判性地评估已发表研究的选择之一是系统评价,它是通过总结来自初级保健研究证据的结果,以回答一个具体的研究问题。同样,也有新的证据综合工具,如证据图谱,它被开发出来以帮助临床医生、病人、研究人员和其他利益相关者做出基于证据的决策。证据图谱适合于解决可能对很多人来说过于广泛的问题,其研究目的是识别、描述和组织现有的关于口腔癌治疗干预的系统评价证据。该方法的目的是确定科学文献中评估的临床问题和证据的相应质量,并提供关于有效性的一般信息,这些信息将有助于发现研究差别,并帮助利害相关方进行科学决策。
5.2 纳入与排除标准
证据图谱的纳入与排除标准一般根据 PICO 原则进行设置,该研究纳入已发表的口腔恶性肿瘤患者疗效评估的系统评价,不管是否进行 Meta 分析。研究人员对至少两个不同的数据库进行了全面搜索,并报告了对所包含研究的方法学质量评估。在处理同一团队在不同阶段发表的相同主题的论文时,纳入最近发表的论文。此外,排除了关于精神分裂、安全性或成本效益分析相关的研究。
5.3 文献检索策略
在 2018 年 10 月 25 日系统检索了 MEDLINE、EMbase、Epistemonikos、The Cochrane Library 4 个数据库。通过主题词和自由词进行口腔癌的检索,检索词包括:mouth neoplasms、oral carcinoma、oral cancer、oral tumor、buccal carcinoma 等。根据每个数据库的具体特点对检索策略进行了调整,没有语言限制。此外,追溯纳入文献的参考文献,以补充获取相关文献。
5.4 质量评价
证据图谱所报告的质量评价主要针对纳入研究,纳入研究的设计类型不同,需选用不同的质量评价工具。此范例主要针对系统评价/Meta 分析,对纳入系统评价/Meta 分析的质量评价采用 AMSTAR 2。
5.5 数据提取
证据图谱的数据提取分为研究的基本特征和研究问题的特征两部分。该范例数据提取内容包括:① 研究的基本特征:作者、出版年份、系统评价的类型(是否进行 Meta 分析)、目的、检索日期、纳入研究的设计和数量及纳入参与者的数量。② 研究问题的特征:根据作者所述的目的,纳排标准和系统评价的结论确定每个系统评价的研究问题。研究问题使用 PICO 框架(人群、干预措施、对照措施和结局)。如果某研究提供了 PICO 框架的所有要素,并在系统评价中描述了关于干预效果的结论,则考虑纳入。提取人口特征(如,人群、癌症类型、癌症分期阶段和癌症位置),干预和对照(如,干预和对照措施均可广泛分类为化疗、手术、放射治疗、免疫治疗和靶向治疗)和结局。此外,根据先前报告的标准[20],将系统评价的结论分为五类:有益(研究结论显示干预措施有效并且纳入的研究偏倚风险极低)、可能有益(尽管结果中报道了结局指标有效,但结论中并没有明显指出干预措施是有益的)、有害(研究结论中明显报告与对照相比干预措施是有害的)、无差异效应(研究结论指出干预组和对照组的效果类似)及不确定(多个研究结局得出了相冲突的结论或者纳入的个别研究限制了结论的得出)。
5.6 结果展示
证据图谱的结果主要通过表格和图形两种形式展示。此范例展示了系统评价的基本特征表、PICO 研究问题特征表和质量评价表,并对疾病严重程度进行了描述性分析从而设计了一个气泡图(图 2),其中每个气泡代表一个系统评价。该图表从 3 个维度显示信息:① 作者的结论:在横轴上的评级为有益、可能有益、有害、无差别效应和不确定;② AMSTAR 2 评估结果,分为高、中、低和极低四个等级,在纵轴上展示;③ 系统评价中包含的主要研究的数量,其在每个气泡中显示并由气泡大小表示。每个气泡也代表一个饼图,显示使用黑色粗线包括的随机对照试验的比例。

5.7 讨论
证据图谱的结论主要是对研究领域内相关研究的发表现状、差距、质量等进行综合分析,以期给出未来的研究方向。此范例对结论部分做了以下报告:
关于口腔癌治疗干预的现有证据有限。该证据图谱中纳入的系统评价的方法学质量为极低。作者报告的可切除口腔癌患者的主要有益治疗干预措施是单独手术或与放疗或化疗联合使用。缺乏无法切除的口腔癌的治疗证据。这些研究结果强调了未来研究的必要性,重点是对新的治疗干预措施和该领域的知识探索,及需要加大努力来改善关于口腔癌治疗的系统评价方法学质量和报告过程。
6 结论
综上,证据图谱和系统评价理念相似,都是通过对现有证据进行综合研究,从而解决回答临床问题的一种证据综合研究方法。系统评价旨在解决较为具体的研究和实践问题,而证据图谱最大的优势在于能够更加方便快捷地解决某个领域的整体研究和实践问题。一个高质量的证据图谱,能够清晰、简明、全面、系统地展示当前证据的质量、有效性、数量和人群等各种信息,找出现有证据体系的不足与证据之间的差别,找准未来的研究方向,从而为政府、研究者、使用者及其他利益相关方提供科学的决策依据。证据图谱是极具发展潜力的一种新兴证据综合研究方法。