引用本文: 管慧, 戴国华, 高武霖, 任丽丽, 展志宏, 王群. 中医药临床研究中应用德尔菲法的系统评价. 中国循证医学杂志, 2021, 21(2): 186-190. doi: 10.7507/1672-2531.202009034 复制
中医学理论体系是在长期的临床实践中逐步建立和发展的,中医药临床工作多凭个案和各家经验,存在很强的差异性和不确定性,这可能成为阻碍中医药向标准化、现代化发展的瓶颈。在保证中医学特点、适应时代发展需要的前提下,疾病和证候诊疗标准制订、评价指标体系构建等一系列复杂和繁重问题的解决,可极大改善中医学向标准化、现代化发展面临的困境。德尔菲法(Delphi 法)通过对未来事物发展的预测、评价和决策分析,形成相对优化和可靠的结论或方案,以期为决策者提供科学决策依据[1]。作为一种客观综合多数专家经验和主观判断相结合的方法,Delphi 法符合中医证候形成的本质特点,在中医药临床研究中显示出良好的应用前景。目前,关于中医药临床应用 Delphi 法的具体情况尚不清楚。因此,本文系统评价 Delphi 法在中医药临床研究中的应用现状、实施情况,论述中医药临床应用 Delphi 法存在的问题并提出针对性建议,为 Delphi 法在中医药临床研究的应用提供参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 纳入标准
使用 Delphi 法的中医药临床研究或方法学研究。
1.1.2 排除标准
① 非中英文文献;② 重复发表的文献;③ 原文无法获取。
1.2 文献检索策略
计算机检索 PubMed、EMbase、CNKI、WanFang Data 和 VIP 数据库,搜集有关使用 Delphi 法的中医药临床研究和方法学研究,检索时限均为建库至 2020 年 8 月 30 日。此外,追溯纳入文献的参考文献,以补充获取相关文献。检索采取主题词和自由词相结合的方式进行。中文检索词包括:中医、中医学、中医药、德尔菲法、专家调查、专家咨询等;英文检索词包括:traditional Chinese medicine、Delphi、Delphi technique 等。以 PubMed 为例,其具体检索策略见框 1。

1.3 文献筛选与资料提取
由 2 名研究者独立筛选文献、提取资料并交叉核对。如有分歧,则通过讨论或与第三方协商解决。文献筛选时首先阅读文题,在排除明显不相关的文献后,进一步阅读摘要和全文以确定是否纳入。如有需要,通过邮件、电话联系原始研究作者获取未确定但对本研究非常重要的信息[2]。资料提取内容包括:文题、数据库来源、发表年份、作者、文献类型、研究疾病、研究目的、Delphi 法轮次、专家小组成立情况、预调查、专家数量、调查形式、统计分析情况(包括专家积极系数、权威系数、集中程度、协调程度等)。
1.4 统计分析
采用定性描述的方法进行分析。
2 结果
2.1 文献筛选流程及结果
初检共获得相关文献 1 505 篇,经逐层筛选,最终纳入文献 612 篇。文献筛选流程及结果见图 1。

*所检索的数据库及检出文献数具体如下:PubMed(
2.2 中医药临床研究应用 Delphi 法的现状
2.2.1 文献发表数量和趋势
应用 Delphi 法的中医药临床研究年度发文量见图 2。2000~2006 年发表的研究较少,2007 年起开始增长,2016 年出现快速增长,考虑与该年制订了大量儿科和妇科的中医诊疗共识和指南有关,其后发文量处于相对稳定状态。整体来看,Delphi 法在中医药临床研究应用比较广泛,随着中医药研究现代化进程的加快,Delphi 法的应用可能会进一步增多[3, 4]。

2.2.2 文献类型和研究领域
纳入文献包括原始研究 573 篇(94.75%)、方法学研究 39 篇(5.25%)。期刊论文 361 篇(58.99%)、硕博士论文 200 篇(32.68%)、会议论文 38 篇(6.21%)、其他 13 篇(2.12%)。原始研究中明确研究疾病的 540 篇(88.24%),涉及前 5 位的科室分别为儿科 78 篇(14.44%)、心血管内科 73 篇(13.52%)、呼吸内科 50 篇(9.26%)、妇科 31 篇(5.74%)、肿瘤科 28 篇(5.19%),其他依次为神经科、内分泌科、治未病科等。涉及具体疾病 167 种,前 5 位分别为冠心病 30 篇(5.56%)、高血压 19 篇(3.52%)、慢性阻塞性肺疾病 17 篇(3.15%)、卒中 16 篇(2.96%)、呼吸道感染 13 篇(2.41%)。涉及中医特色诊疗技术 45 篇(7.85%)(包括针法、灸法、穴位贴敷、熏蒸法等)。
2.2.3 根据主要研究目的对文献归类
Delphi 法在中医药临床研究应用广泛,每项研究目的各有不同且有交叉。以主要研究目的为依据,将文献划分为 8 大类[5-12],其中疾病诊疗(诊疗方案、规范、指南、专家共识)150 篇(24.51%),证候研究(证候诊断标准、规范)195 篇(31.86%),量表研制(包括证候诊断量表、生活质量量表、医生报告结局量表、患者报告结局量表等)60 篇(9.80%),评价研究(包括疗效评价、安全性评价、评价标准、评价指南、评价体系的构建)52 篇(8.50%),指标研究(包括各类评价核心指标、结局指标、风险预警指标、疾病危险因素、证候构成指标、试验报告条目)37 篇(6.05%),临床调查(包括临床证候特征、诊疗规律、体质分类)32 篇(5.23%),方法学研究 39 篇(6.37%),其它研究(药物、穴位、适宜技术、适宜病种优选)47 篇(7.68%),结果见图 3。

2.3 Delphi 法的实施情况
纳入的 487 篇文献对 Delphi 法的实施过程和结果进行了不同程度的报告。
2.3.1 Delphi 法实施轮次
487 篇文献对 Delphi 法的实施轮次进行了报告,其中实施一轮的 66 篇(13.55%)、二轮 300 篇(61.60%)、三轮 116 篇(23.82%)和四轮 5 篇(1.03%)。
2.3.2 工作小组成立情况
在 487 篇文献中,180 篇(36.96%)报告了成立工作小组指导 Delphi 法的全程实施,其余文献未对工作小组成立情况进行报告,也未在文中其它部分描述研究是否在工作小组的指导下进行。
2.3.3 问卷预调查情况
487 篇文献几乎均报告了函询问卷制作,但仅 85 篇(17.45%)对问卷进行了预调查。
2.3.4 专家数量
487 篇文献均对专家数量进行了报告,专家数量从 4~1 218 名不等,平均 41 名,其中专家数量为 20~50 名的有 364 篇(74.74%)。冠心病证候特征研究对 6 大区 41 家医院的 1 218 名专家进行了较大规模的问卷调查,是专家数量最多的研究[13]。
2.3.5 问卷发放形式
409 篇(83.98%)文献对问卷发放形式进行了报告,包括电子邮件、邮寄纸质信函、面呈、微信、网页及两种或三种形式的结合。其中以一种形式发放包括电子邮件 284 篇(58.32%)、邮寄纸质信函 24 篇(4.93%)、面呈 18 篇(3.70%)、微信或网页 8 篇(1.64%),以其中两种形式结合的 68 篇(13.96%),以三种形式结合的 7 篇(1.44%)。采用单一发放形式的问卷平均回收率为 91.61%,采用多种方式结合的问卷平均回收率为 95.77%。
2.3.6 统计分析结果
共 285 篇(58.52%)文献展示了参与调查的专家基本信息。426 篇(87.47%)报告了专家积极系数,积极系数在 40%~100% 之间,其中第一轮平均积极系数为 92.56%、第二轮为 95.94%、第三轮为 94.81%、第四轮为 67.23%。193 篇(39.63%)对专家权威系数进行了报告,389 篇(79.88%)报告了集中程度,390 篇(80.08%)报告了协调程度。153 篇(31.42%)对专家积极系数、权威系数、集中程度和协调程度同时进行了报告。
3 讨论
本研究结果发现,Delphi 法在中医药临床研究中得到了较广泛应用且取得了重要成果,但仍有待于改进。只有 36.96% 的研究成立了工作小组。工作小组是以科学研究和开发为目的,为共同的科研目标组成的研究群体,是交流研究进展、优化研究方案的形式,对研究工作的运行起着重要作用[14],其水平一定程度上决定了研究水平。强化顶层设计、全面统筹、良好沟通、及时反馈,提高信息交流效率,才能更好、更快地解决科研工作的难题。因此,建立负责整个研究规划、统筹工作指导小组和具体方案实施的联络调查小组是非常必要的,是提高研究质量的第一步。
期刊论文限于篇幅一般不展示函询问卷具体内容,从已发表的硕博论文看,函询问卷的设计没有统一规范,大部分针对某一研究问题结合文献调查和头脑风暴等方法搜集研究内容。存在内容简单不能全面涵盖研究内容,或者调查表异常复杂的问题,为专家填写带来困难,并且 80% 以上的研究未通过预调查对问卷行进一步修改和完善[15]。由于中医药临床研究的不确定性、内容的广泛性及证候的错综复杂和变动性,问卷的设计具有一定困难。其设计应遵循整体性、简要性、导向性、可比性、均匀性、可操作性和实际性原则,并能体现中医药特色。应确定一名执笔人独立撰写和修改,成文后由小组成员集体讨论定稿,避免集体撰写的方式。然后,需根据问卷涉及的具体内容,梳理文献,参照研究内容行业规范、标准、指南,形成原始问题清单,由指导小组专家对原始问题清单进行初筛、修改和补充,形成初始条目池,并对关键条目进行优先化排序和重要性分级。最后,按照条目的优先级排序形成初始咨询表[16],实施预调查,修改完善,形成正式函询问卷[17]。
专家遴选是 Delphi 法的重要环节,然而部分研究未对专家遴选的纳入与排除标准进行详细描述,缺乏严格性和科学性。专家遴选要考虑专家的权威性、代表性、广泛性,代表性又需考虑区域代表性与学科代表性[18],还要结合专家的职业操守、学术造诣、行业影响及承担工作的能力,选取覆盖多个领域不同层次,能够最广泛的代表全国相关机构及从业人员意见的专家。专家的数量也是需要重点考虑的问题,人数过少,会限制学科领域的代表性;人数过多,会增加调查工作和数据收集、处理、分析的难度,本次系统评价结果显示 75% 的研究专家数量在 20~50 名之间,比较合理。构建完备的中医药临床研究专家库是专家遴选的有效方法,建立健全的专家库可有效提高 Delphi 法的研究效率和质量,然而目前国内尚未建立针对 Delphi 法的专家库[19]。
有研究发现 85% 的研究采用了 2~3 轮调查,此时具有最佳的回收率,继续增加调查轮次会使回收率大大下降[15],采用多种方式结合的调查形式可增加 4% 的回收率[20]。尽管分析结果显示 1~3 轮调查平均回收率都在 90% 以上,实际在实施过程中问卷回收难度大、质量低一直是 Delphi 法面临的难题。早期电子邮件因其成本低、容易建立与操作、填答时间具有弹性等优点而得到广泛应用,如今电子邮件泛滥,大量寄发的电子问卷降低了专家填答意愿,回收率也随之下降[21]。虽然随着互联网发展,问卷回收率有所提高,但很多问卷填写质量并不高。有研究表明使用私人化亲密用语表达邀请,至少可增加 5% 的回收率。受访专家会受与实施者的熟识关系而影响作答意愿。应事先征询专家意愿,尽可能选择熟悉程度较高的专家。催复可有效提高回收率,如催复后仍不回复,可改变方式后再行访问。
本次研究结果发现仅有 30% 的研究同时报告了专家积极系数、权威系数、集中程度和协调程度,部分研究选择性地报告统计指标,极少有研究能够全面详细地报告专家基本信息、积极系数(即回收率)、专家权威程度(权威系数)、集中程度(包括均数、等级和、满分比及不重要性百分比)、协调程度(包括变异系数、肯德尔和谐系数)[22-24]。中医药研究涉及条目较多,很多研究存在量化指标模糊不清、统计指标不全面、分析方法缺乏准确性等问题。作为一种定性与定量相结合的方法,定量处理是 Delphi 法的一个重要特点,首先要使用指标赋分量化方法对定性指标进行量化,再进一步采用统计学指标进行分析。统计分析过程是实现 Delphi 法定量化最为关键的一步,其准确性直接关系到条目的取舍。一般采用 Matlab 程序对判断矩阵进行一致性检验,通过一致性检验的问卷方可进行统计分析[25]。
本次纳入的 612 篇文献,方法学文献仅占 5.25%,数量较少。仅有不足 30% 的研究详细描述了规范的实施过程,提供了较为详尽的结果报告,多数研究选择性报告了部分实施细节和统计分析结果。博硕士论文 Delphi 法实施和报告内容较为详细,期刊论文限于篇幅报告内容不全面,有些会议论文只是简单报告了使用 Delphi 法,但未对实施细节和结果进行任何报告。超过 60% 的研究未成立工作小组,研究多为一名或数名研究生完成,缺乏严格的质量控制标准。缺乏方法学指导是导致目前 Delphi 法在中医药临床研究应用不规范,研究质量不高的重要原因。将临床统计方法学与中医药临床研究进行慎重、有机的结合,将有利于提高中医药临床研究质量,促进产出高水平的研究结果和证据。
由于中医学本身的主观性和不确定性,很难找到足够的符合现代循证医学的高级别证据来进行中医药临床研究,通过证据评价并将证据转化成推荐建议的思路较难实现。中医药临床行业标准的制订,很难凭借个人经验达成共识,加之实际中存在的流派差异、地域差异、自身学术水平限制等,亟需集思广益,综合具备一定学术水平专家的意见[26]。Delphi 法因其独特的优势更加符合中医药研究特色,是当前中医药临床研究的较佳选择,其结果是经过专家反复论证的,充分综合了专家在多年理论研究与临床实践的经验,且通过量化的方法,突破了传统定性方法的限制,具有很强的科学性与实践性。因此中医药临床诊疗指南、证候诊断标准、评价指标等制订多借助 Delphi 法,依赖高年资专家意见。
本研究存在一定的局限性:① 仅纳入了已发表的研究,尚有正在进行的研究未被纳入;② 考虑研究者语言限制,仅纳入了中、英文研究,可能遗漏其他语种发表的研究;③ 本研究纳入研究数量较多,未能展示全部文献详细内容。
综上所述,目前我国采用 Delphi 法构建的中医药临床诊疗方案、规范、指南、专家共识仍存在方法学不规范、过程不透明、程序不合规和利益冲突不声明等硬伤,这都会对临床诊疗工作的指导产生负面影响。因此有必要综合中医药临床、方法学、统计学等多方专家意见,制订中医药领域 Delphi 法的具体实施步骤、报告规范、质量评价标准,以提高研究质量和报告的规范性。
中医学理论体系是在长期的临床实践中逐步建立和发展的,中医药临床工作多凭个案和各家经验,存在很强的差异性和不确定性,这可能成为阻碍中医药向标准化、现代化发展的瓶颈。在保证中医学特点、适应时代发展需要的前提下,疾病和证候诊疗标准制订、评价指标体系构建等一系列复杂和繁重问题的解决,可极大改善中医学向标准化、现代化发展面临的困境。德尔菲法(Delphi 法)通过对未来事物发展的预测、评价和决策分析,形成相对优化和可靠的结论或方案,以期为决策者提供科学决策依据[1]。作为一种客观综合多数专家经验和主观判断相结合的方法,Delphi 法符合中医证候形成的本质特点,在中医药临床研究中显示出良好的应用前景。目前,关于中医药临床应用 Delphi 法的具体情况尚不清楚。因此,本文系统评价 Delphi 法在中医药临床研究中的应用现状、实施情况,论述中医药临床应用 Delphi 法存在的问题并提出针对性建议,为 Delphi 法在中医药临床研究的应用提供参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 纳入标准
使用 Delphi 法的中医药临床研究或方法学研究。
1.1.2 排除标准
① 非中英文文献;② 重复发表的文献;③ 原文无法获取。
1.2 文献检索策略
计算机检索 PubMed、EMbase、CNKI、WanFang Data 和 VIP 数据库,搜集有关使用 Delphi 法的中医药临床研究和方法学研究,检索时限均为建库至 2020 年 8 月 30 日。此外,追溯纳入文献的参考文献,以补充获取相关文献。检索采取主题词和自由词相结合的方式进行。中文检索词包括:中医、中医学、中医药、德尔菲法、专家调查、专家咨询等;英文检索词包括:traditional Chinese medicine、Delphi、Delphi technique 等。以 PubMed 为例,其具体检索策略见框 1。

1.3 文献筛选与资料提取
由 2 名研究者独立筛选文献、提取资料并交叉核对。如有分歧,则通过讨论或与第三方协商解决。文献筛选时首先阅读文题,在排除明显不相关的文献后,进一步阅读摘要和全文以确定是否纳入。如有需要,通过邮件、电话联系原始研究作者获取未确定但对本研究非常重要的信息[2]。资料提取内容包括:文题、数据库来源、发表年份、作者、文献类型、研究疾病、研究目的、Delphi 法轮次、专家小组成立情况、预调查、专家数量、调查形式、统计分析情况(包括专家积极系数、权威系数、集中程度、协调程度等)。
1.4 统计分析
采用定性描述的方法进行分析。
2 结果
2.1 文献筛选流程及结果
初检共获得相关文献 1 505 篇,经逐层筛选,最终纳入文献 612 篇。文献筛选流程及结果见图 1。

*所检索的数据库及检出文献数具体如下:PubMed(
2.2 中医药临床研究应用 Delphi 法的现状
2.2.1 文献发表数量和趋势
应用 Delphi 法的中医药临床研究年度发文量见图 2。2000~2006 年发表的研究较少,2007 年起开始增长,2016 年出现快速增长,考虑与该年制订了大量儿科和妇科的中医诊疗共识和指南有关,其后发文量处于相对稳定状态。整体来看,Delphi 法在中医药临床研究应用比较广泛,随着中医药研究现代化进程的加快,Delphi 法的应用可能会进一步增多[3, 4]。

2.2.2 文献类型和研究领域
纳入文献包括原始研究 573 篇(94.75%)、方法学研究 39 篇(5.25%)。期刊论文 361 篇(58.99%)、硕博士论文 200 篇(32.68%)、会议论文 38 篇(6.21%)、其他 13 篇(2.12%)。原始研究中明确研究疾病的 540 篇(88.24%),涉及前 5 位的科室分别为儿科 78 篇(14.44%)、心血管内科 73 篇(13.52%)、呼吸内科 50 篇(9.26%)、妇科 31 篇(5.74%)、肿瘤科 28 篇(5.19%),其他依次为神经科、内分泌科、治未病科等。涉及具体疾病 167 种,前 5 位分别为冠心病 30 篇(5.56%)、高血压 19 篇(3.52%)、慢性阻塞性肺疾病 17 篇(3.15%)、卒中 16 篇(2.96%)、呼吸道感染 13 篇(2.41%)。涉及中医特色诊疗技术 45 篇(7.85%)(包括针法、灸法、穴位贴敷、熏蒸法等)。
2.2.3 根据主要研究目的对文献归类
Delphi 法在中医药临床研究应用广泛,每项研究目的各有不同且有交叉。以主要研究目的为依据,将文献划分为 8 大类[5-12],其中疾病诊疗(诊疗方案、规范、指南、专家共识)150 篇(24.51%),证候研究(证候诊断标准、规范)195 篇(31.86%),量表研制(包括证候诊断量表、生活质量量表、医生报告结局量表、患者报告结局量表等)60 篇(9.80%),评价研究(包括疗效评价、安全性评价、评价标准、评价指南、评价体系的构建)52 篇(8.50%),指标研究(包括各类评价核心指标、结局指标、风险预警指标、疾病危险因素、证候构成指标、试验报告条目)37 篇(6.05%),临床调查(包括临床证候特征、诊疗规律、体质分类)32 篇(5.23%),方法学研究 39 篇(6.37%),其它研究(药物、穴位、适宜技术、适宜病种优选)47 篇(7.68%),结果见图 3。

2.3 Delphi 法的实施情况
纳入的 487 篇文献对 Delphi 法的实施过程和结果进行了不同程度的报告。
2.3.1 Delphi 法实施轮次
487 篇文献对 Delphi 法的实施轮次进行了报告,其中实施一轮的 66 篇(13.55%)、二轮 300 篇(61.60%)、三轮 116 篇(23.82%)和四轮 5 篇(1.03%)。
2.3.2 工作小组成立情况
在 487 篇文献中,180 篇(36.96%)报告了成立工作小组指导 Delphi 法的全程实施,其余文献未对工作小组成立情况进行报告,也未在文中其它部分描述研究是否在工作小组的指导下进行。
2.3.3 问卷预调查情况
487 篇文献几乎均报告了函询问卷制作,但仅 85 篇(17.45%)对问卷进行了预调查。
2.3.4 专家数量
487 篇文献均对专家数量进行了报告,专家数量从 4~1 218 名不等,平均 41 名,其中专家数量为 20~50 名的有 364 篇(74.74%)。冠心病证候特征研究对 6 大区 41 家医院的 1 218 名专家进行了较大规模的问卷调查,是专家数量最多的研究[13]。
2.3.5 问卷发放形式
409 篇(83.98%)文献对问卷发放形式进行了报告,包括电子邮件、邮寄纸质信函、面呈、微信、网页及两种或三种形式的结合。其中以一种形式发放包括电子邮件 284 篇(58.32%)、邮寄纸质信函 24 篇(4.93%)、面呈 18 篇(3.70%)、微信或网页 8 篇(1.64%),以其中两种形式结合的 68 篇(13.96%),以三种形式结合的 7 篇(1.44%)。采用单一发放形式的问卷平均回收率为 91.61%,采用多种方式结合的问卷平均回收率为 95.77%。
2.3.6 统计分析结果
共 285 篇(58.52%)文献展示了参与调查的专家基本信息。426 篇(87.47%)报告了专家积极系数,积极系数在 40%~100% 之间,其中第一轮平均积极系数为 92.56%、第二轮为 95.94%、第三轮为 94.81%、第四轮为 67.23%。193 篇(39.63%)对专家权威系数进行了报告,389 篇(79.88%)报告了集中程度,390 篇(80.08%)报告了协调程度。153 篇(31.42%)对专家积极系数、权威系数、集中程度和协调程度同时进行了报告。
3 讨论
本研究结果发现,Delphi 法在中医药临床研究中得到了较广泛应用且取得了重要成果,但仍有待于改进。只有 36.96% 的研究成立了工作小组。工作小组是以科学研究和开发为目的,为共同的科研目标组成的研究群体,是交流研究进展、优化研究方案的形式,对研究工作的运行起着重要作用[14],其水平一定程度上决定了研究水平。强化顶层设计、全面统筹、良好沟通、及时反馈,提高信息交流效率,才能更好、更快地解决科研工作的难题。因此,建立负责整个研究规划、统筹工作指导小组和具体方案实施的联络调查小组是非常必要的,是提高研究质量的第一步。
期刊论文限于篇幅一般不展示函询问卷具体内容,从已发表的硕博论文看,函询问卷的设计没有统一规范,大部分针对某一研究问题结合文献调查和头脑风暴等方法搜集研究内容。存在内容简单不能全面涵盖研究内容,或者调查表异常复杂的问题,为专家填写带来困难,并且 80% 以上的研究未通过预调查对问卷行进一步修改和完善[15]。由于中医药临床研究的不确定性、内容的广泛性及证候的错综复杂和变动性,问卷的设计具有一定困难。其设计应遵循整体性、简要性、导向性、可比性、均匀性、可操作性和实际性原则,并能体现中医药特色。应确定一名执笔人独立撰写和修改,成文后由小组成员集体讨论定稿,避免集体撰写的方式。然后,需根据问卷涉及的具体内容,梳理文献,参照研究内容行业规范、标准、指南,形成原始问题清单,由指导小组专家对原始问题清单进行初筛、修改和补充,形成初始条目池,并对关键条目进行优先化排序和重要性分级。最后,按照条目的优先级排序形成初始咨询表[16],实施预调查,修改完善,形成正式函询问卷[17]。
专家遴选是 Delphi 法的重要环节,然而部分研究未对专家遴选的纳入与排除标准进行详细描述,缺乏严格性和科学性。专家遴选要考虑专家的权威性、代表性、广泛性,代表性又需考虑区域代表性与学科代表性[18],还要结合专家的职业操守、学术造诣、行业影响及承担工作的能力,选取覆盖多个领域不同层次,能够最广泛的代表全国相关机构及从业人员意见的专家。专家的数量也是需要重点考虑的问题,人数过少,会限制学科领域的代表性;人数过多,会增加调查工作和数据收集、处理、分析的难度,本次系统评价结果显示 75% 的研究专家数量在 20~50 名之间,比较合理。构建完备的中医药临床研究专家库是专家遴选的有效方法,建立健全的专家库可有效提高 Delphi 法的研究效率和质量,然而目前国内尚未建立针对 Delphi 法的专家库[19]。
有研究发现 85% 的研究采用了 2~3 轮调查,此时具有最佳的回收率,继续增加调查轮次会使回收率大大下降[15],采用多种方式结合的调查形式可增加 4% 的回收率[20]。尽管分析结果显示 1~3 轮调查平均回收率都在 90% 以上,实际在实施过程中问卷回收难度大、质量低一直是 Delphi 法面临的难题。早期电子邮件因其成本低、容易建立与操作、填答时间具有弹性等优点而得到广泛应用,如今电子邮件泛滥,大量寄发的电子问卷降低了专家填答意愿,回收率也随之下降[21]。虽然随着互联网发展,问卷回收率有所提高,但很多问卷填写质量并不高。有研究表明使用私人化亲密用语表达邀请,至少可增加 5% 的回收率。受访专家会受与实施者的熟识关系而影响作答意愿。应事先征询专家意愿,尽可能选择熟悉程度较高的专家。催复可有效提高回收率,如催复后仍不回复,可改变方式后再行访问。
本次研究结果发现仅有 30% 的研究同时报告了专家积极系数、权威系数、集中程度和协调程度,部分研究选择性地报告统计指标,极少有研究能够全面详细地报告专家基本信息、积极系数(即回收率)、专家权威程度(权威系数)、集中程度(包括均数、等级和、满分比及不重要性百分比)、协调程度(包括变异系数、肯德尔和谐系数)[22-24]。中医药研究涉及条目较多,很多研究存在量化指标模糊不清、统计指标不全面、分析方法缺乏准确性等问题。作为一种定性与定量相结合的方法,定量处理是 Delphi 法的一个重要特点,首先要使用指标赋分量化方法对定性指标进行量化,再进一步采用统计学指标进行分析。统计分析过程是实现 Delphi 法定量化最为关键的一步,其准确性直接关系到条目的取舍。一般采用 Matlab 程序对判断矩阵进行一致性检验,通过一致性检验的问卷方可进行统计分析[25]。
本次纳入的 612 篇文献,方法学文献仅占 5.25%,数量较少。仅有不足 30% 的研究详细描述了规范的实施过程,提供了较为详尽的结果报告,多数研究选择性报告了部分实施细节和统计分析结果。博硕士论文 Delphi 法实施和报告内容较为详细,期刊论文限于篇幅报告内容不全面,有些会议论文只是简单报告了使用 Delphi 法,但未对实施细节和结果进行任何报告。超过 60% 的研究未成立工作小组,研究多为一名或数名研究生完成,缺乏严格的质量控制标准。缺乏方法学指导是导致目前 Delphi 法在中医药临床研究应用不规范,研究质量不高的重要原因。将临床统计方法学与中医药临床研究进行慎重、有机的结合,将有利于提高中医药临床研究质量,促进产出高水平的研究结果和证据。
由于中医学本身的主观性和不确定性,很难找到足够的符合现代循证医学的高级别证据来进行中医药临床研究,通过证据评价并将证据转化成推荐建议的思路较难实现。中医药临床行业标准的制订,很难凭借个人经验达成共识,加之实际中存在的流派差异、地域差异、自身学术水平限制等,亟需集思广益,综合具备一定学术水平专家的意见[26]。Delphi 法因其独特的优势更加符合中医药研究特色,是当前中医药临床研究的较佳选择,其结果是经过专家反复论证的,充分综合了专家在多年理论研究与临床实践的经验,且通过量化的方法,突破了传统定性方法的限制,具有很强的科学性与实践性。因此中医药临床诊疗指南、证候诊断标准、评价指标等制订多借助 Delphi 法,依赖高年资专家意见。
本研究存在一定的局限性:① 仅纳入了已发表的研究,尚有正在进行的研究未被纳入;② 考虑研究者语言限制,仅纳入了中、英文研究,可能遗漏其他语种发表的研究;③ 本研究纳入研究数量较多,未能展示全部文献详细内容。
综上所述,目前我国采用 Delphi 法构建的中医药临床诊疗方案、规范、指南、专家共识仍存在方法学不规范、过程不透明、程序不合规和利益冲突不声明等硬伤,这都会对临床诊疗工作的指导产生负面影响。因此有必要综合中医药临床、方法学、统计学等多方专家意见,制订中医药领域 Delphi 法的具体实施步骤、报告规范、质量评价标准,以提高研究质量和报告的规范性。