贝叶斯单病例随机对照试验是近年来流行的研究设计。本文对贝叶斯单病例随机对照试验的分析原理、统计要求、应用现状及优缺点等进行介绍。虽然贝叶斯单病例随机对照试验尚处于小规模应用的阶段且有许多问题尚待完善,但是其可提供较为丰富的后验信息,有望成为今后单病例随机对照试验的主要类型。
引用本文: 翟静波, 李江, 商洪才, 王辉, 代敏, 陈静. 贝叶斯单病例随机对照试验简介. 中国循证医学杂志, 2017, 17(7): 848-851. doi: 10.7507/1672-2531.201701079 复制
贝叶斯单病例随机对照试验是近年来在单病例随机对照试验研究领域流行的研究设计。这种设计遵从单病例随机对照试验设计的基本要求,但采用分层贝叶斯模型进行统计分析。由于贝叶斯模型可提供较为丰富的后验信息,其有望成为今后单病例随机对照试验的主要类型。本文对贝叶斯单病例随机对照试验的分析原理、统计要求等进行介绍。
1 单病例随机对照试验的一般流程
单病例随机对照试验(N-of-1 trials)是指对单个受试者开展的临床试验[1]。通常,单病例随机对照试验采用交叉、随机、双盲的设计方式。具体来讲,受试者需要接受多个轮次的治疗。轮次的数量可固定也可不固定。在每轮研究中,患者将经历两个治疗期,一个治疗期内,给予试验药物或新疗法,另一个治疗期内,给予安慰剂或者常规疗法。受试者接受试验还是对照药物或疗法的顺序是通过随机序列产生的,以防止人为因素对分组的不利影响。一般情况下,每个轮次之间会设置一个洗脱期,目的是去除前一个周期治疗产生的延迟效应(carryover effect)。
一般情况下,研究者会同时开展多个单病例随机对照试验,这些试验采用相同的试验方案,称为系列单病例随机对照试验(series of N-of-1 trials)[2]。贝叶斯单病例随机对照试验指的就是采用贝叶斯模型进行统计分析的系列单病例随机对照试验。
2 系列单病例随机对照试验的数据特点
由于设计的特殊性,系列单病例随机对照试验的数据具有如下特点:① 自相关性。由于不同的处理措施施加于相同的患者,所以试验组和对照组的数据之间不可避免地存在自相关性。自相关性的方向和程度可能影响统计分析方法的选择。② 数据量相对较小。系列单病例随机对照试验的样本量通常较小。当获得多个相似单病例随机对照试验的数据时,研究者可通过合并多个患者的多个轮次数据,提高疗效估计的准确性和可靠性。③ 多轮次的重复测量。单病例随机对照试验设计使得研究者可获得多轮次的数据。轮次越多,样本数据对总体的代表性越高,模型拟合效果可能越好。④ 缺失值问题。在系列单病例随机对照试验中,由于患者的治疗效果不佳、依从性等原因,不同患者的治疗轮次数可能是不同的,从而导致缺失值的发生。贝叶斯统计分析模型对缺失值具有一定的容忍度,在一定程度上避免了剔除缺失病例的问题。
3 分层贝叶斯模型用于单病例随机对照试验的分析原理
分层贝叶斯模型可以用于具有分层结构数据的统计分析[3]。先验信息、样本信息和后验信息是贝叶斯模型的三个重要信息。先验信息来源于既往研究。样本信息来源于现有数据,贝叶斯模型利用样本信息更新先验信息,从而获得更加可靠的后验信息。
在分层贝叶斯模型中,分层的数量可是两层或者多层。图 1 为某项多中心临床试验的数据采集流程。第一层级为患者水平层(case level),第二层级为中心水平层(center level)。具体的分层贝叶斯模型构建过程在既往文献中已有报道[3],本文不再赘述。

系列单病例随机对照试验的数据具有分层结构的特点[4]。这是分层贝叶斯模型可用于单病例随机对照试验数据分析的主要原因。贝叶斯单病例随机对照试验中的贝叶斯分析指的是采用分层贝叶斯模型对系列单病例随机对照试验的数据进行合并分析。
假设有 n 个单病例随机对照试验采用完全相同的研究方案,并且在相同医院、由同一位医生实施。这样的做法可尽量控制混杂因素对合并结果产生的影响。图 2 为系列单病例随机对照试验的数据采集流程。数据分为两层,第一层为单个单病例随机对照试验内部多个治疗轮次数据;第二层为多个单病例随机对照试验之间数据。

图 1 中,分层贝叶斯模型通过“多个医院”的“多个患者的单轮次干预”累积数据。图 2 中,“系列单病例随机对照试验”通过“每个单病例随机对照试验的多轮独立重复干预”累积数据。所以,我们可将系列单病例随机对照试验的贝叶斯分析看作分层贝叶斯模型的特殊案例。如系列单病例随机对照试验的数据满足构建分层贝叶斯模型的基本条件(例如:数据可交换性等)时,通过分层贝叶斯模型合并系列单病例随机对照试验可以同步获得个体和群体的疗效估计[5]。
4 分层贝叶斯模型用于系列单病例随机对照试验统计要求
4.1 信息采集方面
不同单病例随机对照试验的实际完成的治疗轮次可能不同。采集的信息可能存在缺失值。尽管分层贝叶斯模型允许存在缺失值,但过多的缺失值会影响数据的拟合效果及结果解释。所以,研究者需事先设定用于统计分析的数据集,例如:至少完成一个轮次干预的患者用于最终的贝叶斯统计分析[6]。
4.2 评价指标方面
由于单病例随机对照试验设计的特殊性及数据的自相关性,研究者无法以某个指标的原始值作为评价指标。研究者可将每轮治疗期试验组和对照组测量结果的差值作为评价指标,也可自行规定一个试验成功的标准。一项阿米替林治疗青少年先天性关节炎的单病例随机对照试验采用疼痛评分的下降值作为主要疗效指标[7]。一项缬草治疗慢性失眠的单病例随机对照试验规定,如果治疗组得分高于对照组,则在这个配对治疗期内治疗是成功的[8]。
4.3 相关参数的设定
Winbugs 软件是构建合并单病例随机对照试验的贝叶斯模型常用软件[9]。建模时,需要设定必要的相关参数,例如:先验分布、Winbugs 软件的运行参数等。Winbugs 软件中参数的设置需要保证数据拟合充分收敛,并且在报告中说明具体参数和评价模型收敛的方法。例如:一项中枢神经兴奋剂治疗儿童脑损伤的单病例随机对照试验中采用迭代史和 Gelman-rubin 指标核查模型的收敛程度[10]。
5 分层贝叶斯模型用于合并单病例随机对照试验的优点
5.1 先验信息的使用
通常情况下,既往数据主要用于计算样本量、确定疗效指标等,并不会用于新试验的统计分析。在分层贝叶斯模型中,既往数据和新的试验数据属于一条连续的数据链。当有新的试验数据产生时,数据链得到更新,产生更精确的后验信息。这种数据整合的过程与 Meta 分析的研究思路类似。
5.2 丰富的后验信息
分层贝叶斯模型可同步估计个体和群体疗效、可信区间以及疗效均值大于或小于某一数值的概率。丰富的后验估计信息为临床决策提供重要依据。此外,还可以用于评估治疗的异质性[11, 12]。
5.3 节省样本量
由于患者是自身对照,单病例随机对照试验存在节省样本量的可能性。很多研究也论证了这一观点[2]。理论上讲,如果单病例随机对照试验借鉴序贯设计或适应性设计中终止试验的方法,极可能节省样本量,从而预防患者处于不利的风险。
5.4 协变量调整
在分层贝叶斯模型中,混杂因素可作为协变量或分层因素纳入模型,从而使结果估计更加精确[13]。因此,合理确定重要的混杂因素是结果估计精确的前提。
6 贝叶斯模型用于合并单病例随机对照试验的现状
早在 20 年前,贝叶斯模型就已被用于单病例随机对照试验的合并分析。但这种方法并未被广泛应用。本课题组前期研究发现[14],至 2016 年仅有 11 篇文献采用贝叶斯模型合并单病例随机对照试验,而这些研究应用于肿瘤、外伤等多个领域。
7 贝叶斯模型用于单病例随机对照试验数据分析的难点
7.1 有效的先验信息不易获取
获取有效的先验信息是构建贝叶斯模型的一个难点。先验信息与后验信息密切相关。先验信息估计的不准确可能造成后验信息的偏差或错误。信息过于广泛或者缺乏均不利于有效先验信息的获取。召开讨论会可能是确定先验信息的重要途径。
7.2 频率学派与贝叶斯学派结论的不一致性
由于基本理论的不同,分析同一组数据,贝叶斯统计与频率统计所得的结论可能不一致。当这种不一致发生时,研究者需要仔细分析原因。当先验信息较为准确时,由于利用先验信息,贝叶斯统计获得的结果可能更接近真值。
7.3 计算的复杂性
贝叶斯模型的构建难度来自于多个方面。研究者对贝叶斯统计的了解程度、使用 Winbugs 软件的熟练程度、参数选择等均可能影响模型的构建。
8 小结
贝叶斯单病例随机对照试验属于一种新颖的设计类型,尚处于小规模应用的阶段,仍有许多问题尚待完善。尽管如此,由于贝叶斯模型可以提供较为丰富的后验信息,贝叶斯单病例随机对照试验有望成为今后单病例随机对照试验的主要类型。
贝叶斯单病例随机对照试验是近年来在单病例随机对照试验研究领域流行的研究设计。这种设计遵从单病例随机对照试验设计的基本要求,但采用分层贝叶斯模型进行统计分析。由于贝叶斯模型可提供较为丰富的后验信息,其有望成为今后单病例随机对照试验的主要类型。本文对贝叶斯单病例随机对照试验的分析原理、统计要求等进行介绍。
1 单病例随机对照试验的一般流程
单病例随机对照试验(N-of-1 trials)是指对单个受试者开展的临床试验[1]。通常,单病例随机对照试验采用交叉、随机、双盲的设计方式。具体来讲,受试者需要接受多个轮次的治疗。轮次的数量可固定也可不固定。在每轮研究中,患者将经历两个治疗期,一个治疗期内,给予试验药物或新疗法,另一个治疗期内,给予安慰剂或者常规疗法。受试者接受试验还是对照药物或疗法的顺序是通过随机序列产生的,以防止人为因素对分组的不利影响。一般情况下,每个轮次之间会设置一个洗脱期,目的是去除前一个周期治疗产生的延迟效应(carryover effect)。
一般情况下,研究者会同时开展多个单病例随机对照试验,这些试验采用相同的试验方案,称为系列单病例随机对照试验(series of N-of-1 trials)[2]。贝叶斯单病例随机对照试验指的就是采用贝叶斯模型进行统计分析的系列单病例随机对照试验。
2 系列单病例随机对照试验的数据特点
由于设计的特殊性,系列单病例随机对照试验的数据具有如下特点:① 自相关性。由于不同的处理措施施加于相同的患者,所以试验组和对照组的数据之间不可避免地存在自相关性。自相关性的方向和程度可能影响统计分析方法的选择。② 数据量相对较小。系列单病例随机对照试验的样本量通常较小。当获得多个相似单病例随机对照试验的数据时,研究者可通过合并多个患者的多个轮次数据,提高疗效估计的准确性和可靠性。③ 多轮次的重复测量。单病例随机对照试验设计使得研究者可获得多轮次的数据。轮次越多,样本数据对总体的代表性越高,模型拟合效果可能越好。④ 缺失值问题。在系列单病例随机对照试验中,由于患者的治疗效果不佳、依从性等原因,不同患者的治疗轮次数可能是不同的,从而导致缺失值的发生。贝叶斯统计分析模型对缺失值具有一定的容忍度,在一定程度上避免了剔除缺失病例的问题。
3 分层贝叶斯模型用于单病例随机对照试验的分析原理
分层贝叶斯模型可以用于具有分层结构数据的统计分析[3]。先验信息、样本信息和后验信息是贝叶斯模型的三个重要信息。先验信息来源于既往研究。样本信息来源于现有数据,贝叶斯模型利用样本信息更新先验信息,从而获得更加可靠的后验信息。
在分层贝叶斯模型中,分层的数量可是两层或者多层。图 1 为某项多中心临床试验的数据采集流程。第一层级为患者水平层(case level),第二层级为中心水平层(center level)。具体的分层贝叶斯模型构建过程在既往文献中已有报道[3],本文不再赘述。

系列单病例随机对照试验的数据具有分层结构的特点[4]。这是分层贝叶斯模型可用于单病例随机对照试验数据分析的主要原因。贝叶斯单病例随机对照试验中的贝叶斯分析指的是采用分层贝叶斯模型对系列单病例随机对照试验的数据进行合并分析。
假设有 n 个单病例随机对照试验采用完全相同的研究方案,并且在相同医院、由同一位医生实施。这样的做法可尽量控制混杂因素对合并结果产生的影响。图 2 为系列单病例随机对照试验的数据采集流程。数据分为两层,第一层为单个单病例随机对照试验内部多个治疗轮次数据;第二层为多个单病例随机对照试验之间数据。

图 1 中,分层贝叶斯模型通过“多个医院”的“多个患者的单轮次干预”累积数据。图 2 中,“系列单病例随机对照试验”通过“每个单病例随机对照试验的多轮独立重复干预”累积数据。所以,我们可将系列单病例随机对照试验的贝叶斯分析看作分层贝叶斯模型的特殊案例。如系列单病例随机对照试验的数据满足构建分层贝叶斯模型的基本条件(例如:数据可交换性等)时,通过分层贝叶斯模型合并系列单病例随机对照试验可以同步获得个体和群体的疗效估计[5]。
4 分层贝叶斯模型用于系列单病例随机对照试验统计要求
4.1 信息采集方面
不同单病例随机对照试验的实际完成的治疗轮次可能不同。采集的信息可能存在缺失值。尽管分层贝叶斯模型允许存在缺失值,但过多的缺失值会影响数据的拟合效果及结果解释。所以,研究者需事先设定用于统计分析的数据集,例如:至少完成一个轮次干预的患者用于最终的贝叶斯统计分析[6]。
4.2 评价指标方面
由于单病例随机对照试验设计的特殊性及数据的自相关性,研究者无法以某个指标的原始值作为评价指标。研究者可将每轮治疗期试验组和对照组测量结果的差值作为评价指标,也可自行规定一个试验成功的标准。一项阿米替林治疗青少年先天性关节炎的单病例随机对照试验采用疼痛评分的下降值作为主要疗效指标[7]。一项缬草治疗慢性失眠的单病例随机对照试验规定,如果治疗组得分高于对照组,则在这个配对治疗期内治疗是成功的[8]。
4.3 相关参数的设定
Winbugs 软件是构建合并单病例随机对照试验的贝叶斯模型常用软件[9]。建模时,需要设定必要的相关参数,例如:先验分布、Winbugs 软件的运行参数等。Winbugs 软件中参数的设置需要保证数据拟合充分收敛,并且在报告中说明具体参数和评价模型收敛的方法。例如:一项中枢神经兴奋剂治疗儿童脑损伤的单病例随机对照试验中采用迭代史和 Gelman-rubin 指标核查模型的收敛程度[10]。
5 分层贝叶斯模型用于合并单病例随机对照试验的优点
5.1 先验信息的使用
通常情况下,既往数据主要用于计算样本量、确定疗效指标等,并不会用于新试验的统计分析。在分层贝叶斯模型中,既往数据和新的试验数据属于一条连续的数据链。当有新的试验数据产生时,数据链得到更新,产生更精确的后验信息。这种数据整合的过程与 Meta 分析的研究思路类似。
5.2 丰富的后验信息
分层贝叶斯模型可同步估计个体和群体疗效、可信区间以及疗效均值大于或小于某一数值的概率。丰富的后验估计信息为临床决策提供重要依据。此外,还可以用于评估治疗的异质性[11, 12]。
5.3 节省样本量
由于患者是自身对照,单病例随机对照试验存在节省样本量的可能性。很多研究也论证了这一观点[2]。理论上讲,如果单病例随机对照试验借鉴序贯设计或适应性设计中终止试验的方法,极可能节省样本量,从而预防患者处于不利的风险。
5.4 协变量调整
在分层贝叶斯模型中,混杂因素可作为协变量或分层因素纳入模型,从而使结果估计更加精确[13]。因此,合理确定重要的混杂因素是结果估计精确的前提。
6 贝叶斯模型用于合并单病例随机对照试验的现状
早在 20 年前,贝叶斯模型就已被用于单病例随机对照试验的合并分析。但这种方法并未被广泛应用。本课题组前期研究发现[14],至 2016 年仅有 11 篇文献采用贝叶斯模型合并单病例随机对照试验,而这些研究应用于肿瘤、外伤等多个领域。
7 贝叶斯模型用于单病例随机对照试验数据分析的难点
7.1 有效的先验信息不易获取
获取有效的先验信息是构建贝叶斯模型的一个难点。先验信息与后验信息密切相关。先验信息估计的不准确可能造成后验信息的偏差或错误。信息过于广泛或者缺乏均不利于有效先验信息的获取。召开讨论会可能是确定先验信息的重要途径。
7.2 频率学派与贝叶斯学派结论的不一致性
由于基本理论的不同,分析同一组数据,贝叶斯统计与频率统计所得的结论可能不一致。当这种不一致发生时,研究者需要仔细分析原因。当先验信息较为准确时,由于利用先验信息,贝叶斯统计获得的结果可能更接近真值。
7.3 计算的复杂性
贝叶斯模型的构建难度来自于多个方面。研究者对贝叶斯统计的了解程度、使用 Winbugs 软件的熟练程度、参数选择等均可能影响模型的构建。
8 小结
贝叶斯单病例随机对照试验属于一种新颖的设计类型,尚处于小规模应用的阶段,仍有许多问题尚待完善。尽管如此,由于贝叶斯模型可以提供较为丰富的后验信息,贝叶斯单病例随机对照试验有望成为今后单病例随机对照试验的主要类型。