影像诊断系统评价被临床实践指南引用情况调查_《中国循证医学杂志》

作者：

 王梦书 ¹ ^# , 李乐 ² ^# , 张红霞 ³ , 李瑞 ³ , 常晓楠 ² , 杜亮 ⁴ , 杨克虎 ^5,6,7 ,  雷军强 ¹ , 裴彩侠 ¹ , 陈耀龙 ^5,6,7

1. 兰州大学第一医院兰州 730000;
2. 兰州大学第一临床医学院兰州 730000;
3. 兰州大学第二临床医学院兰州 730000;
4. 四川大学华西医院中国循证医学中心成都 610041;
5. 兰州大学循证医学中心, 兰州大学基础医学院兰州 730000;
6. 甘肃省循证医学与临床转化重点实验室兰州 730000;
7. GRADE中国中心兰州 730000;

关键词：

影像诊断系统评价引文分析临床实践指南

DOI：

10.7507/1672-2531.20160053

视频：

导出 下载 收藏 扫码 引用

摘要 全文 图表 视频 参考文献 施引文献 补充材料

目的调查影像诊断领域系统评价被临床实践指南引用的情况，以期为国内循证影像诊断指南的制定提供借鉴。方法检索PubMed数据库，查找影像诊断系统评价，检索时限为2010年1月1日至2012年12月31日。由2位研究者独立进行文献筛选和资料提取。对纳入的系统评价，在Web of Science数据库中获取其引文信息，应用引文分析方法对影像诊断系统评价被临床实践指南的引用情况进行分析。结果共纳入292篇影像诊断系统评价。引用分析结果显示：94%（275/292）的系统评价被Web of Science数据库收录，其总被引频次为5413次，篇被引频次的中位数为20次，范围为0～131次；28%（78/275）的系统评价被指南引用，7%（19/275）的系统评价被作为指南推荐意见的证据来源。结论影像诊断系统评价被指南引用比例不高，被作为推荐意见证据来源的比例更低，引用存在滞后。

引用本文： 王梦书, 李乐, 张红霞, 李瑞, 常晓楠, 杜亮, 杨克虎, 雷军强, 裴彩侠, 陈耀龙. 影像诊断系统评价被临床实践指南引用情况调查. 中国循证医学杂志, 2016, 16(3): 341-347. doi: 10.7507/1672-2531.20160053 复制

1990年，美国医学科学院（Institute of Medicine，IOM）对实践指南进行了定义：实践指南是针对特定的临床情况，系统制订的帮助医务人员和患者做出恰当处理的指导性建议（推荐意见） ^[1]。2011年，随着循证医学和系统评价的发展及其对指南的影响，IOM组织了国际专家，对指南的定义进行了20年来的首次更新，即：指南是基于系统评价的证据和平衡了不同干预措施的利弊，在此基础上形成的能够为患者提供最佳保健服务的推荐意见集合 ^[2]。2014年6月起，美国国立指南文库更是将指南是否基于系统评价作为其收录的基本条件之一 ^[3]。

诊断试验系统评价是系统评价的一种重要类型，近年来其数量快速增长，方法学也不断取得发展 ^[4-6]。调查显示，2009年国外学者发表的诊断试验系统评价就达230篇 ^[7]。中国大陆学者2001年至2011年底共发表诊断试验系统评价312篇，其中中文235篇，英文77篇。影像诊断系统评价比例占45% ^[8]。这为循证影像诊断指南的制定提供了重要的证据来源。但当前发表的影像诊断系统评价有多少被指南引用或用于支持其推荐意见，尚没有相关研究或论文发表。本文作为循证诊断临床实践指南研究课题组系列文章的第三篇，旨在调查影像诊断系统评价被指南引用的情况，以期为国内循证影像诊断指南的制定提供借鉴。

1 资料与方法

1.1 纳入与排除标准

纳入：① 诊断精确性系统评价；② 关注的诊断技术为影像技术或影像相关诊断策略；③ 发表语种为中英文。

1.2 文献检索

以systematic review、meta-analysis、meta analyses、specificity、sensitivity等为检索词在PubMed中进行检索，检索时间限定为2010年1月1日至2012年12月31日，具体检索策略见框1。

框 1 在PubMed中的检索策略

#1 “sensitivity and specificity”[MeSH Terms]

#2 “sensitivity”[All Fields]

#3 “specificity”[All Fields]

#4 #2 AND #3

#5 “sensitivity and specificity”[All Fields]

#6 #1 OR #4 OR #5

#7 “Meta-Analysis” [Publication Type]

#8 “systematic reviews”[Title/Abstract]

#9 “systematic review”[Title/Abstract]

#10 “meta-analyses”[Title/Abstract]

#11 “meta-analysis”[Title/Abstract]

#12 “meta analyses”[Title/Abstract]

#13 “meta analysis”[Title/Abstract]

#14 #7 OR #8 OR #9 OR #10 OR #11 OR #12 OR #13

#15 “2010/01/01”[Date - Publication]: “2012/12/31” [Date - Publication]

#16 #6 AND #14 AND #15

1.3 文献筛选与资料提取

文献筛选分为题目、摘要筛选和全文筛选两个阶段；确定纳入文献后，再对纳入文献进行数据提取。提取内容包含：发表年份、发表期刊、来源国家、作者数量、检索数据库、偏倚风险评估工具、诊断的影像技术；同时，在Web of Science数据库中对纳入的系统评价进行检索，提取纳入系统评价的被引频次、引文类型及引文基本信息。文献筛选与资料提取均由两名研究人员独立进行，遇到分歧双方讨论解决或请第三方介入。

1.4 数据分析

通过Excel软件对提取的数据进行整理，分析影像领域诊断系统评价的发表现状及其被指南引用情况。

2 结果

2.1 文献检索结果

初检出相关文献1 744篇，经过题目、摘要和全文两轮筛选分别排除1 363和89篇文献，最终纳入292篇影像诊断系统评价。文献筛选流程及结果见图 1。

图1 文献筛选流程及结果

图选项

下载全尺寸图像

下载幻灯片

2.2 纳入系统评价的基本情况

① 在发表数量的时间分布上，2010、2011和2012年分别发表55篇（19%）、96篇（33%）和141篇（48%）；② 在第一作者的国家分布方面，纳入的系统评价分别来自24个国家，发表数量前五的国家分别为：中国（74，25%）、美国（54，18%）、英国（42，14%）、荷兰（28，10%）、意大利（18，6%）；③ 在发表期刊方面，纳入的系统评价分别发表在170种期刊上，发表数量前五位期刊见表 1；④ 在作者数量方面，影像诊断系统评价作者数量的中位数为5人，范围为1～29人；⑤ 在检索数据库方面，检索频次排名前三的数据库分别为：PubMed/MEDLINE（99%）、EMbase（71%）和The Cochrane Library（36%），14%（40/292）的系统评价仅检索了一个数据库；⑥ 在偏倚风险评估方面，225篇系统评价报告了对偏倚风险的评估，且偏倚风险评估工具中以QUADAS（Quality Assessment of Diagnostic Accuracy Studies）或QUADAS-2的使用率最高（87%，196/225），其次为Cochrane Methods Working Group on Systematic Review of Screening and Diagnostic Tests（3%，6/225），有4篇系统评价将STARD（Standards for Reporting Diagnostic Accuracy）报告规范 ^{[9, 10]}作为偏倚风险评估工具 ^[11-14]。

表1 发表影像诊断系统评价数量前五位期刊

表选项

下载CSV

排名	期刊名	发表系统评价数（篇）
1	European Journal of Radiology	21
2	European Radiology	10
3	Radiology	8
4	Academic Radiology	7
5	Breast Cancer Research and Treatment	6

2.3 影像诊断系统评价被引情况

94%（275/292）的系统评价被Web of Science数据库收录，其总被引频次为5 413次，被引频次的中位数为20次，范围为0～131次（详见图 2），其中28%（78/275）的系统评价被指南引用，总被引频次为132次，被引频次的中位数为1次，范围为1～6次，共有118部指南引用了此78篇系统评价，引用同一篇系统评价的指南部数最高为4，其中位数为1，范围为1～4（详情见表 2）。系统评价首次被引与其发表时间间隔中位数为2年，范围为0～5年（详情见表 3）。7%（19/275）的系统评价被指南纳入后明确作为推荐意见的证据来源（详情见表 4）。

图2 影像诊断系统评价被引情况

图选项

下载全尺寸图像

下载幻灯片

表2 系统评价被指南引用的情况

表选项

下载CSV

系统评价（篇）	引用指南数（部）	构成比（%）
50	1	64.1
18	2	23.1
8	3	10.3
2	4	2.6
注：在计算指南部数时，一篇系统评价被同一部指南系列文章多次引用，则只算一部。

表3 系统评价首次被引用与其发表时间间隔

表选项

下载CSV

时间间隔（年）	系统评价数（篇）	构成比（%）
0	2	2.6
1	18	23.1
2	28	35.9
3	20	25.6
4	9	11.5
5	1	1.3

表4 明确作为推荐意见证据来源的系统评价及相关推荐意见的情况

表选项

下载CSV

表4 明确作为推荐意见证据来源的系统评价及相关推荐意见的情况

系统评价题目	系统评价年份	引用该系统评价的指南题目	指南年份	指南中基于该系统评价的影像诊断推荐意见	推荐意见级别	证据水平
Meta分析：64层CT血管造影在评估冠状动脉支架内再狭窄的诊断准确性 ^[15]	2010	ACCF/AHA/ACP/AATS/PCNA/SCAI/STS指南：稳定的缺血性心脏病患者的诊断和管理（概要） ^[16]	2012	· 不考虑其运动能力，用冠状动脉计算机断层血管造影（CCTA）评估新发的或恶化的但不同于不稳定性心绞痛症状的已知患有稳定性缺血性心脏病患者的冠脉旁路移植血管或3 mm及以上直径冠状动脉支架时的通畅性可能是合理的	Ⅱb	B
· 不考虑其运动能力，冠状动脉计算机断层血管造影（CCTA）不应用于新发的或恶化的但不同于不稳定性心绞痛症状的中度或重度自体冠状动脉钙化或冠状动脉支架直径小于3 mm的稳定性缺血性心脏病患者	Ⅲ	B
前瞻性试验的Meta分析：心脏磁共振在评估由冠状动脉疾病导致的慢性心室功能障碍患者的可行性 ^[17]	2012	韩国指南：心脏磁共振成像的恰当使用（韩国心脏病学会与放射学会联合报告） ^[18]	2014	· 使用延迟钆剂显像（LGE）或多巴酚丁胺负荷心脏磁共振成像（CMR）确定血管再通之前的生存能力/确定血管再生（经皮冠状动脉介入治疗或冠状动脉旁路移植）或药物治疗功能恢复的可能性	A	A
Meta分析：心血管磁共振负荷灌注成像检测冠状动脉疾病的诊断性能 ^[19]	2010	ACCF/AHA/ACP/AATS/PCNA/SCAI/STS指南：稳定的缺血性心脏病患者的诊断和管理（概要） ^[16]	2012	· 药物负荷心脏磁共振对有中至高度验前概率且其有无法解释的心电图但至少中度运动功能或无禁忌症的阻塞性缺血性心脏病患者可以使用	Ⅱa	B
· 药物负荷心脏磁共振对有中至高度验前概率且其有至少中度运动功能障碍或有禁忌症的慢性缺血性心脏病患者是可行的	Ⅱa	B
Meta分析和系统评价：计算机断层扫描血管造影对急诊室胸痛三联患者的诊断作用 ^[20]	2012	韩国心脏计算机断层扫描（CT）的恰当使用指南 ^[21]	2015	怀疑有急性冠脉综合征的急性胸痛患者：
· 若有明确心肌梗死，冠状动脉CT血管造影对其不适用	I	C
· 若心电图和心肌酶水平正常，冠状动脉CT血管造影是推荐的	A	A
Meta分析和文献的系统评价：多排计算机断层血管造影评估急性胸痛 ^[22]	2010	国际心肺复苏和心血管急救推荐意见共识：第九部分-急性冠脉综合症 ^[23]	2010	· 在选定的初始接受非诊断性常规检查的急诊室胸痛病人，可考虑无创性检查（CT血管造影、心脏磁共振成像，心肌灌注成像和超声心动图）	-	-
Meta分析：脑磁共振生物标志物在新生儿脑病中的作用 ^[24]	2010	低温治疗新生儿脑病：日本低温治疗新生儿脑病工作组（JSPNM & MHLW）实践指南 ^[25]	2012	· 磁共振波谱是婴儿脑病敏感的结局预测因子，如果条件允许，除MRI外也应该考虑	-	-
系统评价和Meta分析：双源CT血管造影对冠状动脉疾病的诊断和评估 ^[26]	2012	韩国心脏计算机断层扫描（CT）的恰当使用指南 ^[21]	2015	· 如果怀疑是缺血性胸痛的非急性胸痛患者，其心电图无法解释或不能运动，对有低至中度验前概率的患者推荐冠状动脉CT血管造影	A	A
系统评价：在急性胆源性胰腺炎中，超声内镜和内镜逆行胆胰管造影的比较 ^[27]	2011	ECCO和ESGAR联合循证共识指南：评估炎症性肠病的成像技术 ^[28]	2013	· 在评估远端胆道梗阻时，超声内镜是磁共振胆胰管造影的可替代检查	A	2
Meta分析：超声弹性成像对良、恶性淋巴结的鉴别 ^[29]	2011	EFSUMB指南和推荐：超声弹性成像的临床应用（第二部分：临床应用） ^[30]	2013	· 超声弹性成像可用于区分良恶性淋巴结	-	-
系统评价：使用多排计算机断层扫描对冠状动脉移植血管病变的评估 ^[31]	2012	韩国心脏计算机断层扫描（CT）的恰当使用指南 ^[21]	2015	· 冠状动脉CT血管造影推荐用于心脏移植后确认冠状动脉移植血管病变	A	A
对新诊断乳腺癌无症状远处转移影像分期证据的评估 ^[32]	2012	日本乳腺癌学会临床实践指南：乳腺癌的筛查和影像诊断 ^[33]	2015	· 虽然没有足够确凿的科学依据，对有症状或提示有远处转移的新诊断的I期或Ⅱ期原发性乳腺癌患者以及Ⅲ期原发性乳腺癌患者可以考虑将肝脏超声、骨显像、FDG正电子发射计算机断层扫描作为术前（分期）检查	C	1
系统评价和Meta分析：超声在触诊不清的隐睾症中的诊断性能 ^[34]	2011	AUA指南：隐睾症的评估和治疗 ^[35]	2014	· 在转诊之前，操作者不应该使用超声或其他成像模式去评估隐睾症男孩，因为其在决策中几乎没有帮助	推荐	B
Meta分析：CT在结肠癌局部分期中的诊断精确性 ^[36]	2010	欧洲结、直肠会议共识：结、直肠多学科管理 ^[37]	2014	· 对结肠癌患者实行腹部CT，是因为腹部CT对结肠癌分期的精确性，T分期的准确性为67%，N 分期为69%，而CT的真正价值在于其对检测远处转移准确性很高	-	-
系统评价和Meta分析：正电子发射断层扫描（PET）对早期乳腺癌腋窝淋巴结状态的评估 ^[38]	2011	日本乳腺癌学会临床实践指南：乳腺癌的筛查和成像诊断 ^[33]	2015	· 尽管没有足够的科学证据，详细的超声仍可考虑用于评价腋窝淋巴结	C	1
系统评价和Meta分析：多排CT在急性肠系膜缺血中的诊断精确性 ^[39]	2010	ACG临床指南：结肠缺血的流行病学、风险因素、呈现模式、诊断和管理 ^[40]	2015	· CT（静脉注射和口服对比剂）是怀疑为结肠缺血患者评价结肠炎分布和时期首选的成像方法	强推荐	中等质量
· 结肠缺血的诊断可基于CT的发现	强推荐	中等质量
				· 多期相CT血管造影应该推荐用于任何怀疑为孤立的右半结肠缺血患者或不能排除急性肠系膜缺血的患者	强推荐	中等质量
Meta分析：心肌灌注成像和负荷超声心动图在左主干和三根冠状动脉血管疾病的诊断精确性 ^[41]	2010	ESC指南：稳定性冠状动脉疾病的管理 ^[42]	2013	· 对运动心电图不肯定的患者推荐将负荷成像用于危险分层	I	B
系统评价和Meta分析：非侵入性经阴道超声诊断肠道子宫内膜异位症的精确性 ^[43]	2011	ESHRE指南：子宫异位症女性的管理 ^[44]	2014	· 对有直肠内膜子宫异位症症状和征象的女性，可考虑用阴道超声来确定和排除直肠子宫内膜异位症	A	-
Meta分析：对黑色素瘤患者分期和监测的现代影像诊断方法 ^[45]	2011	S3指南：黑色素瘤的诊断、治疗和随访 ^[46]	2013	· 对主要诊断为黑色素瘤的无症状患者不应该将全身CT检查做为标准	A	1a
· PET和 PET/CT 不可以常规作为ⅡA/ⅡB期以上患者的初始分期检查方法	A	1a
· 应该对怀疑或证实有局部区域转移的黑素瘤患者进行局部区域淋巴结超声检查	A	1a
Meta分析：64层CT冠脉血管造影在评估支架内再狭窄的诊断精确性 ^[47]	2010	ACCF/AHA/ACP/AATS/PCNA/SCAI/STS指南：稳定的缺血性心脏病患者的诊断和管理（概要） ^[16]	2012	· 推荐意见同前。

3 讨论

3.1 影像诊断系统评价发展迅速，但制作方法尚不规范

2010年至2012年影像诊断系统评价发表数量持续上升，且2012年的数量是2010年的近3倍，其中以中国的发表量最多。然而影像诊断系统评价的制作方法尚需提高，原因如下：① 在纳入研究的偏倚风险评估方面，近1/3的系统评价未对纳入研究进行偏倚风险评估；② 在偏倚风险评估工具方面，有4篇系统评价错误运用诊断试验报告规范STARD工具作为评估纳入研究质量的标准；③ 在检索数据库数量方面，14%的系统评价只检索了1个数据库，而系统评价质量评价工具（AMSTAR工具）要求系统评价作者至少检索2种电子数据库 ^[48]；④ 在系统评价作者方面，有2篇系统评价只有1名作者 ^{[49, 50]}，而Cochrane系统评价指导手册中要求在提取纳入研究数据时需要两名研究人员独立完成再合并最后的结果，同时研究显示单名研究人员提取数据相比于两名研究人员独立提取数据会出现更多错误 ^[51]，因此单个作者完成的系统评价可能难以实现数据提取的准确性，其结果的真实性有待商榷。

3.2 影像诊断系统评价被指南引用的比例小、频次低、时间间隔长

在纳入的影像诊断系统评价中，被指南引用的仅占1/3，其中仅有1篇系统评价被4部指南引用，且超过半数的系统评价仅被1部指南引用。影像诊断系统评价被引频数低的原因可能有：① 系统评价的质量低；指南要利用现有的系统评价，前提是系统评价的质量要高。本研究纳入的部分系统评价在方法学上存在一定的缺陷，可能是造成低引用的原因之一。② 部分指南未报告参考文献；研究显示中国期刊发表指南引文报告率低于五成 ^[52]，因此可能部分影像诊断系统评价已被指南引用，但因指南未报告参考文献而无法统计。③ 指南制定者在纳入研究时，未进行系统检索，故有遗漏系统评价和Meta分析的可能性。

此外，近四成的影像诊断系统评价发表 3年或以上才被指南引用。然而随着原始研究不断地完成和发表，系统评价也需要不断地更新，Cochrane协作网要求其系统评价应该在两年内更新 ^[7]，因此这部分系统评价被指南引用时，可能存在过期风险，应予以警惕。

3.3 作为推荐意见证据来源的影像诊断系统评价比例低

系统评价的重要作用之一是为临床指南的推荐意见提供证据支持。IOM对指南新的定义中明确要求指南的推荐意见应该基于系统评价产生。但本研究结果显示，尽管影像诊断系统评价数量逐年快速增长，但被用作推荐意见证据来源的比例不到十分之一。系统评价和指南制作过程需要投入大量人力和经费等资源，建议系统评价的制作者在选题之初就应与指南制定者合作，在发表之后也需积极联系指南制定者，从而提高被引用的效率。指南制定者也应加强对现有系统评价的检索和利用，避免对研究资源的浪费。

3.4 小结

影像诊断系统评价发展迅速，但部分系统评价制作过程尚存在一定的缺陷；而被指南引用或者作为推荐意见证据来源的比例低。影像诊断系统评价作者应严格按照相关系统评价手册的要求制作系统评价，保证制作过程严谨、规范；同时，指南制定者也应注重基于系统评价证据制定推荐意见。