引用本文: 王梦书, 李乐, 张红霞, 李瑞, 常晓楠, 杜亮, 杨克虎, 雷军强, 裴彩侠, 陈耀龙. 影像诊断系统评价被临床实践指南引用情况调查. 中国循证医学杂志, 2016, 16(3): 341-347. doi: 10.7507/1672-2531.20160053 复制
1990年,美国医学科学院(Institute of Medicine,IOM)对实践指南进行了定义:实践指南是针对特定的临床情况,系统制订的帮助医务人员和患者做出恰当处理的指导性建议(推荐意见) [1]。2011年,随着循证医学和系统评价的发展及其对指南的影响,IOM组织了国际专家,对指南的定义进行了20年来的首次更新,即:指南是基于系统评价的证据和平衡了不同干预措施的利弊,在此基础上形成的能够为患者提供最佳保健服务的推荐意见集合 [2]。2014年6月起,美国国立指南文库更是将指南是否基于系统评价作为其收录的基本条件之一 [3]。
诊断试验系统评价是系统评价的一种重要类型,近年来其数量快速增长,方法学也不断取得发展 [4-6]。调查显示,2009年国外学者发表的诊断试验系统评价就达230篇 [7]。中国大陆学者2001年至2011年底共发表诊断试验系统评价312篇,其中中文235篇,英文77篇。影像诊断系统评价比例占45% [8]。这为循证影像诊断指南的制定提供了重要的证据来源。但当前发表的影像诊断系统评价有多少被指南引用或用于支持其推荐意见,尚没有相关研究或论文发表。本文作为循证诊断临床实践指南研究课题组系列文章的第三篇,旨在调查影像诊断系统评价被指南引用的情况,以期为国内循证影像诊断指南的制定提供借鉴。
1 资料与方法
1.1 纳入与排除标准
纳入:① 诊断精确性系统评价;② 关注的诊断技术为影像技术或影像相关诊断策略;③ 发表语种为中英文。
1.2 文献检索
以systematic review、meta-analysis、meta analyses、specificity、sensitivity等为检索词在PubMed中进行检索,检索时间限定为2010年1月1日至2012年12月31日,具体检索策略见框1。
框 1 在PubMed中的检索策略
#1 “sensitivity and specificity”[MeSH Terms] #2 “sensitivity”[All Fields] #3 “specificity”[All Fields] #4 #2 AND #3 #5 “sensitivity and specificity”[All Fields] #6 #1 OR #4 OR #5 #7 “Meta-Analysis” [Publication Type] #8 “systematic reviews”[Title/Abstract] #9 “systematic review”[Title/Abstract] #10 “meta-analyses”[Title/Abstract] #11 “meta-analysis”[Title/Abstract] #12 “meta analyses”[Title/Abstract] #13 “meta analysis”[Title/Abstract] #14 #7 OR #8 OR #9 OR #10 OR #11 OR #12 OR #13 #15 “2010/01/01”[Date - Publication]: “2012/12/31” [Date - Publication] #16 #6 AND #14 AND #15
1.3 文献筛选与资料提取
文献筛选分为题目、摘要筛选和全文筛选两个阶段;确定纳入文献后,再对纳入文献进行数据提取。提取内容包含:发表年份、发表期刊、来源国家、作者数量、检索数据库、偏倚风险评估工具、诊断的影像技术;同时,在Web of Science数据库中对纳入的系统评价进行检索,提取纳入系统评价的被引频次、引文类型及引文基本信息。文献筛选与资料提取均由两名研究人员独立进行,遇到分歧双方讨论解决或请第三方介入。
1.4 数据分析
通过Excel软件对提取的数据进行整理,分析影像领域诊断系统评价的发表现状及其被指南引用情况。
2 结果
2.1 文献检索结果
初检出相关文献1 744篇,经过题目、摘要和全文两轮筛选分别排除1 363和89篇文献,最终纳入292篇影像诊断系统评价。文献筛选流程及结果见图 1。

2.2 纳入系统评价的基本情况
① 在发表数量的时间分布上,2010、2011和2012年分别发表55篇(19%)、96篇(33%)和141篇(48%);② 在第一作者的国家分布方面,纳入的系统评价分别来自24个国家,发表数量前五的国家分别为:中国(74,25%)、美国(54,18%)、英国(42,14%)、荷兰(28,10%)、意大利(18,6%);③ 在发表期刊方面,纳入的系统评价分别发表在170种期刊上,发表数量前五位期刊见表 1;④ 在作者数量方面,影像诊断系统评价作者数量的中位数为5人,范围为1~29人;⑤ 在检索数据库方面,检索频次排名前三的数据库分别为:PubMed/MEDLINE(99%)、EMbase(71%)和The Cochrane Library(36%),14%(40/292)的系统评价仅检索了一个数据库;⑥ 在偏倚风险评估方面,225篇系统评价报告了对偏倚风险的评估,且偏倚风险评估工具中以QUADAS(Quality Assessment of Diagnostic Accuracy Studies)或QUADAS-2的使用率最高(87%,196/225),其次为Cochrane Methods Working Group on Systematic Review of Screening and Diagnostic Tests(3%,6/225),有4篇系统评价将STARD(Standards for Reporting Diagnostic Accuracy)报告规范 [9, 10]作为偏倚风险评估工具 [11-14]。

2.3 影像诊断系统评价被引情况
94%(275/292)的系统评价被Web of Science数据库收录,其总被引频次为5 413次,被引频次的中位数为20次,范围为0~131次(详见图 2),其中28%(78/275)的系统评价被指南引用,总被引频次为132次,被引频次的中位数为1次,范围为1~6次,共有118部指南引用了此78篇系统评价,引用同一篇系统评价的指南部数最高为4,其中位数为1,范围为1~4(详情见表 2)。系统评价首次被引与其发表时间间隔中位数为2年,范围为0~5年(详情见表 3)。7%(19/275)的系统评价被指南纳入后明确作为推荐意见的证据来源(详情见表 4)。




3 讨论
3.1 影像诊断系统评价发展迅速,但制作方法尚不规范
2010年至2012年影像诊断系统评价发表数量持续上升,且2012年的数量是2010年的近3倍,其中以中国的发表量最多。然而影像诊断系统评价的制作方法尚需提高,原因如下:① 在纳入研究的偏倚风险评估方面,近1/3的系统评价未对纳入研究进行偏倚风险评估;② 在偏倚风险评估工具方面,有4篇系统评价错误运用诊断试验报告规范STARD工具作为评估纳入研究质量的标准;③ 在检索数据库数量方面,14%的系统评价只检索了1个数据库,而系统评价质量评价工具(AMSTAR工具)要求系统评价作者至少检索2种电子数据库 [48];④ 在系统评价作者方面,有2篇系统评价只有1名作者 [49, 50],而Cochrane系统评价指导手册中要求在提取纳入研究数据时需要两名研究人员独立完成再合并最后的结果,同时研究显示单名研究人员提取数据相比于两名研究人员独立提取数据会出现更多错误 [51],因此单个作者完成的系统评价可能难以实现数据提取的准确性,其结果的真实性有待商榷。
3.2 影像诊断系统评价被指南引用的比例小、频次低、时间间隔长
在纳入的影像诊断系统评价中,被指南引用的仅占1/3,其中仅有1篇系统评价被4部指南引用,且超过半数的系统评价仅被1部指南引用。影像诊断系统评价被引频数低的原因可能有:① 系统评价的质量低;指南要利用现有的系统评价,前提是系统评价的质量要高。本研究纳入的部分系统评价在方法学上存在一定的缺陷,可能是造成低引用的原因之一。② 部分指南未报告参考文献;研究显示中国期刊发表指南引文报告率低于五成 [52],因此可能部分影像诊断系统评价已被指南引用,但因指南未报告参考文献而无法统计。③ 指南制定者在纳入研究时,未进行系统检索,故有遗漏系统评价和Meta分析的可能性。
此外,近四成的影像诊断系统评价发表 3年或以上才被指南引用。然而随着原始研究不断地完成和发表,系统评价也需要不断地更新,Cochrane协作网要求其系统评价应该在两年内更新 [7],因此这部分系统评价被指南引用时,可能存在过期风险,应予以警惕。
3.3 作为推荐意见证据来源的影像诊断系统评价比例低
系统评价的重要作用之一是为临床指南的推荐意见提供证据支持。IOM对指南新的定义中明确要求指南的推荐意见应该基于系统评价产生。但本研究结果显示,尽管影像诊断系统评价数量逐年快速增长,但被用作推荐意见证据来源的比例不到十分之一。系统评价和指南制作过程需要投入大量人力和经费等资源,建议系统评价的制作者在选题之初就应与指南制定者合作,在发表之后也需积极联系指南制定者,从而提高被引用的效率。指南制定者也应加强对现有系统评价的检索和利用,避免对研究资源的浪费。
3.4 小结
影像诊断系统评价发展迅速,但部分系统评价制作过程尚存在一定的缺陷;而被指南引用或者作为推荐意见证据来源的比例低。影像诊断系统评价作者应严格按照相关系统评价手册的要求制作系统评价,保证制作过程严谨、规范;同时,指南制定者也应注重基于系统评价证据制定推荐意见。
1990年,美国医学科学院(Institute of Medicine,IOM)对实践指南进行了定义:实践指南是针对特定的临床情况,系统制订的帮助医务人员和患者做出恰当处理的指导性建议(推荐意见) [1]。2011年,随着循证医学和系统评价的发展及其对指南的影响,IOM组织了国际专家,对指南的定义进行了20年来的首次更新,即:指南是基于系统评价的证据和平衡了不同干预措施的利弊,在此基础上形成的能够为患者提供最佳保健服务的推荐意见集合 [2]。2014年6月起,美国国立指南文库更是将指南是否基于系统评价作为其收录的基本条件之一 [3]。
诊断试验系统评价是系统评价的一种重要类型,近年来其数量快速增长,方法学也不断取得发展 [4-6]。调查显示,2009年国外学者发表的诊断试验系统评价就达230篇 [7]。中国大陆学者2001年至2011年底共发表诊断试验系统评价312篇,其中中文235篇,英文77篇。影像诊断系统评价比例占45% [8]。这为循证影像诊断指南的制定提供了重要的证据来源。但当前发表的影像诊断系统评价有多少被指南引用或用于支持其推荐意见,尚没有相关研究或论文发表。本文作为循证诊断临床实践指南研究课题组系列文章的第三篇,旨在调查影像诊断系统评价被指南引用的情况,以期为国内循证影像诊断指南的制定提供借鉴。
1 资料与方法
1.1 纳入与排除标准
纳入:① 诊断精确性系统评价;② 关注的诊断技术为影像技术或影像相关诊断策略;③ 发表语种为中英文。
1.2 文献检索
以systematic review、meta-analysis、meta analyses、specificity、sensitivity等为检索词在PubMed中进行检索,检索时间限定为2010年1月1日至2012年12月31日,具体检索策略见框1。
框 1 在PubMed中的检索策略
#1 “sensitivity and specificity”[MeSH Terms] #2 “sensitivity”[All Fields] #3 “specificity”[All Fields] #4 #2 AND #3 #5 “sensitivity and specificity”[All Fields] #6 #1 OR #4 OR #5 #7 “Meta-Analysis” [Publication Type] #8 “systematic reviews”[Title/Abstract] #9 “systematic review”[Title/Abstract] #10 “meta-analyses”[Title/Abstract] #11 “meta-analysis”[Title/Abstract] #12 “meta analyses”[Title/Abstract] #13 “meta analysis”[Title/Abstract] #14 #7 OR #8 OR #9 OR #10 OR #11 OR #12 OR #13 #15 “2010/01/01”[Date - Publication]: “2012/12/31” [Date - Publication] #16 #6 AND #14 AND #15
1.3 文献筛选与资料提取
文献筛选分为题目、摘要筛选和全文筛选两个阶段;确定纳入文献后,再对纳入文献进行数据提取。提取内容包含:发表年份、发表期刊、来源国家、作者数量、检索数据库、偏倚风险评估工具、诊断的影像技术;同时,在Web of Science数据库中对纳入的系统评价进行检索,提取纳入系统评价的被引频次、引文类型及引文基本信息。文献筛选与资料提取均由两名研究人员独立进行,遇到分歧双方讨论解决或请第三方介入。
1.4 数据分析
通过Excel软件对提取的数据进行整理,分析影像领域诊断系统评价的发表现状及其被指南引用情况。
2 结果
2.1 文献检索结果
初检出相关文献1 744篇,经过题目、摘要和全文两轮筛选分别排除1 363和89篇文献,最终纳入292篇影像诊断系统评价。文献筛选流程及结果见图 1。

2.2 纳入系统评价的基本情况
① 在发表数量的时间分布上,2010、2011和2012年分别发表55篇(19%)、96篇(33%)和141篇(48%);② 在第一作者的国家分布方面,纳入的系统评价分别来自24个国家,发表数量前五的国家分别为:中国(74,25%)、美国(54,18%)、英国(42,14%)、荷兰(28,10%)、意大利(18,6%);③ 在发表期刊方面,纳入的系统评价分别发表在170种期刊上,发表数量前五位期刊见表 1;④ 在作者数量方面,影像诊断系统评价作者数量的中位数为5人,范围为1~29人;⑤ 在检索数据库方面,检索频次排名前三的数据库分别为:PubMed/MEDLINE(99%)、EMbase(71%)和The Cochrane Library(36%),14%(40/292)的系统评价仅检索了一个数据库;⑥ 在偏倚风险评估方面,225篇系统评价报告了对偏倚风险的评估,且偏倚风险评估工具中以QUADAS(Quality Assessment of Diagnostic Accuracy Studies)或QUADAS-2的使用率最高(87%,196/225),其次为Cochrane Methods Working Group on Systematic Review of Screening and Diagnostic Tests(3%,6/225),有4篇系统评价将STARD(Standards for Reporting Diagnostic Accuracy)报告规范 [9, 10]作为偏倚风险评估工具 [11-14]。

2.3 影像诊断系统评价被引情况
94%(275/292)的系统评价被Web of Science数据库收录,其总被引频次为5 413次,被引频次的中位数为20次,范围为0~131次(详见图 2),其中28%(78/275)的系统评价被指南引用,总被引频次为132次,被引频次的中位数为1次,范围为1~6次,共有118部指南引用了此78篇系统评价,引用同一篇系统评价的指南部数最高为4,其中位数为1,范围为1~4(详情见表 2)。系统评价首次被引与其发表时间间隔中位数为2年,范围为0~5年(详情见表 3)。7%(19/275)的系统评价被指南纳入后明确作为推荐意见的证据来源(详情见表 4)。




3 讨论
3.1 影像诊断系统评价发展迅速,但制作方法尚不规范
2010年至2012年影像诊断系统评价发表数量持续上升,且2012年的数量是2010年的近3倍,其中以中国的发表量最多。然而影像诊断系统评价的制作方法尚需提高,原因如下:① 在纳入研究的偏倚风险评估方面,近1/3的系统评价未对纳入研究进行偏倚风险评估;② 在偏倚风险评估工具方面,有4篇系统评价错误运用诊断试验报告规范STARD工具作为评估纳入研究质量的标准;③ 在检索数据库数量方面,14%的系统评价只检索了1个数据库,而系统评价质量评价工具(AMSTAR工具)要求系统评价作者至少检索2种电子数据库 [48];④ 在系统评价作者方面,有2篇系统评价只有1名作者 [49, 50],而Cochrane系统评价指导手册中要求在提取纳入研究数据时需要两名研究人员独立完成再合并最后的结果,同时研究显示单名研究人员提取数据相比于两名研究人员独立提取数据会出现更多错误 [51],因此单个作者完成的系统评价可能难以实现数据提取的准确性,其结果的真实性有待商榷。
3.2 影像诊断系统评价被指南引用的比例小、频次低、时间间隔长
在纳入的影像诊断系统评价中,被指南引用的仅占1/3,其中仅有1篇系统评价被4部指南引用,且超过半数的系统评价仅被1部指南引用。影像诊断系统评价被引频数低的原因可能有:① 系统评价的质量低;指南要利用现有的系统评价,前提是系统评价的质量要高。本研究纳入的部分系统评价在方法学上存在一定的缺陷,可能是造成低引用的原因之一。② 部分指南未报告参考文献;研究显示中国期刊发表指南引文报告率低于五成 [52],因此可能部分影像诊断系统评价已被指南引用,但因指南未报告参考文献而无法统计。③ 指南制定者在纳入研究时,未进行系统检索,故有遗漏系统评价和Meta分析的可能性。
此外,近四成的影像诊断系统评价发表 3年或以上才被指南引用。然而随着原始研究不断地完成和发表,系统评价也需要不断地更新,Cochrane协作网要求其系统评价应该在两年内更新 [7],因此这部分系统评价被指南引用时,可能存在过期风险,应予以警惕。
3.3 作为推荐意见证据来源的影像诊断系统评价比例低
系统评价的重要作用之一是为临床指南的推荐意见提供证据支持。IOM对指南新的定义中明确要求指南的推荐意见应该基于系统评价产生。但本研究结果显示,尽管影像诊断系统评价数量逐年快速增长,但被用作推荐意见证据来源的比例不到十分之一。系统评价和指南制作过程需要投入大量人力和经费等资源,建议系统评价的制作者在选题之初就应与指南制定者合作,在发表之后也需积极联系指南制定者,从而提高被引用的效率。指南制定者也应加强对现有系统评价的检索和利用,避免对研究资源的浪费。
3.4 小结
影像诊断系统评价发展迅速,但部分系统评价制作过程尚存在一定的缺陷;而被指南引用或者作为推荐意见证据来源的比例低。影像诊断系统评价作者应严格按照相关系统评价手册的要求制作系统评价,保证制作过程严谨、规范;同时,指南制定者也应注重基于系统评价证据制定推荐意见。