多水平模型是既适用于计量资料、又适用于二分类或多分类资料的统计方法。本文通过对各类型的实例数据,分别应用多水平模型、协方差分析和CMH卡方检验方法进行分析,探讨多水平模型在多中心临床试验中心效应分析中的应用。结果表明,在计量资料的中心效应分析中,协方差分析较多水平模型更容易发现中心效应;对分类资料的中心效应,多水平模型更为敏感。可见不同分析方法对中心效应的分析结果不相同,在实际运用中应结合数据自身的结构特点和研究目的,并根据各种方法的适用条件选择分析方法。
引用本文: 傅瑾, 何佳, 杜亮, 刘关键. 多水平模型在临床试验中心效应分析中的研究. 生物医学工程学杂志, 2014, 31(3): 632-636. doi: 10.7507/1001-5515.20140118 复制
引言
多中心临床试验(multicenter clinical trial)是指由一个单位的主要研究者总负责,多个单位的研究者合作,按同一个试验方案同时进行的临床试验。多中心临床试验可以在较短的时间内入选所需的病例数,且入选的病例范围广,试验的结果更具代表性,但其影响因素亦随之更趋复杂[1]。
多中心临床试验必须在统一的组织领导下,遵循一个共同制定的试验方案完成整个试验,并规定统一的纳入、排除标准和试验效应指标,各中心试验组和对照组病例数的比例应与总样本的比例相同,以保证各中心齐同可比。
试验过程中,尽管所有中心都针对同一问题或相同的研究假设进行研究,但各中心通常在研究设计或实施的诸多方面不完全与另一中心相同,难以避免的差异导致了个体结局指标取值在某中心内的相似性[2-3],换言之,同一中心的数据具有聚集性,而不同中心之间的“效应尺度”存在异质性(heterogeneity)。在多中心临床试验中这样的差异性就称之为“中心效应(center effect)” [4]。
多中心临床试验的前提是各中心间结果一致,主效应指标一旦出现中心效应,则试验结果可能受到影响,结论也可能存在偏倚。因此,多中心临床试验的中心效应分析是评价干预措施结果的真实性和可靠性的重要环节。在新药临床试验中若出现中心效应,多数情况下要求重新做该试验[5]。
多水平模型(multilevel models)的研究和应用始于20世纪80年代初期英国初级中学学校效益分析及美国的补偿教育研究,是将Ⅱ型方差分析理论与多元统计分析相结合的新技术,是分析和处理具有层次结构特征的有力工具。其理论、方法及计算技术发展迅速,目前在心理学、社会学、经济学[6]、地理学、实验研究、儿童生长发育、流行病学及其他医学领域应用广泛,并展现出日益广阔的应用前景。
多水平数据(multilevel data)或具有多水平层次结构(hierarchical structure)的数据是多水平统计模型(multilevel statistical models)发展和应用的基础。此类数据的主要特征是反应变量的分布在个体间不具备独立性,但存在地理距离内、某行政划区内或特定空间范围内的聚集性(clustering)。多中心临床试验中的数据具有上述典型特征[7]。
在多中心临床试验的统计分析中,除了常规统计分析外,还需要对多个中心的各效应指标是否具有一致性进行评价[8]。当前分析中心效应常用的方法有:① 用于计量资料的协方差分析[9];② 适用于定性资料的CMH卡方检验;③ logistic回归(二分类或多分类)。
运用这些常用的统计方法检验中心效应时有两个问题:其一,传统统计模型的估计方法是建立在个体测量值相互独立的假设上。当这个假设不成立时,模型中的各参数估计值的有效性和统计特性均会受到影响,从而可能使最终的统计推断结论存在偏倚。其二,中心变量对同一中心的每一个体的取值是一样的,即该变量的自由度在同一中心内已经人为扩大了,其结果无疑会影响该变量参数估计值的统计推断,因为该估计值的标准误会有偏差[10-11]。
多水平模型按中心进行分层拟合多水平的模型,通过判断数据在水平2内是否存在相似性或聚集性来判断中心效应,同时可以将变异从中心(水平2)中分离出来,从而得到个体水平(水平1)的净效应。
1 研究目的
本研究采用多水平模型对多中心临床试验的中心效应(异质性)进行分析,并分别与协方差、CMH卡方检验的分析结果进行比较,探讨这些统计分析方法在中心效应分析时的适用条件、作用及优缺点,为多水平模型在多中心临床试验中心效应分析中的应用提供参考。
2 实例分析
2.1 资料来源
本研究来源于“某新药预防化疗后中性粒细胞减少的疗效和安全性的Ⅲ期临床试验方案研究”,采用多中心临床随机对照研究方法,由19个单位(中心)共同完成。各中心均按临床试验前的随机化方案进行临床病例的随机分组,试验过程中的质量控制由各中心自行质控,主持单位定期或不定期地到各中心进行CRF表的质控。该研究将所有研究对象随机分为两组:试验组和对照组,共纳入研究对象326人,其中试验组160人,对照组166人。该研究以两组中性粒细胞绝对计数值(ANC)和中性粒细胞减少发生率为分析指标来评价药物疗效。
2.2 数据管理及统计分析方法
数据录入人员经统一培训,采用Epitada软件建立数据库,数据录入校对等完成后生成SPSS/SAS/MLwiN等数据库文件。在SAS9.01、SPSS17.0及MLwiN2.02统计软件上完成全部数据的统计分析。统计分析采用协方差分析、CMH卡方检验、多水平统计模型等方法。若无特殊说明,本研究中检验水准均为α=0.05。
3 结果
3.1 分类资料
3.1.1 CMH卡方检验
首先分别采用Breslow-Day检验与Tarone’s statistics检验对各中心中性粒细胞减少发生率同质性进行检验,结果如表 1所示。

同质性检验结果显示无统计学意义(P=0.162),提示中心结果具有一致性,可将各中心数据进行合并分析。
采用卡方检验,比较两组中性粒细胞减少发生率,结果如表 2所示。
由卡方检验结果可见,两组中性粒细胞减少发生率的差异无统计学意义(χ2=0.611,P=0.434),尚不能认为两组中性粒细胞减少发生率不同。

以中心为分层因素,采用CMH卡方检验对两组中性粒细胞减少发生率进行比较,结果如表 3所示。

由CMH卡方检验结果可见,两组中性粒细胞减少发生率的差异无统计学意义(CMH χ2=0.616,P=0.433),尚不能认为两组中性粒细胞减少发生率不同。
综上所述,卡方检验的结果与将中心作为分层因素而采用CMH卡方检验的结果一致,提示无中心效应。
3.1.2 多水平模型
当反应变量为率,一般采用二项分布(binomial distribution)。假定服从标准二项分布的率:
yij~Bin(nij,πij),
其中 i指水平1单位,j指水平2单位,以中性粒细胞减少发生率为反应变量,中心为水平2单位,个体为水平1单位,拟合两水平logistic回归模型:
logit(Pij)=(β0+u0j)+β1xij
u0j=β0j-β0 ,u0j~N(0,σu02)
β1为处理因素的效应参数,又称固定效应(fixed effects)参数。u0j为水平2单位的logit均值β0j与总均值β0之差,又称为随机效应(random effects)或高水平的残差,其方差σu02越大说明数据在高水平单位内的聚集性越强。
运行MLwiN2.02,分析结果如表 4所示。
由多水平模型的分析结果可见,水平2(中心)有统计学意义(P<0.05),可以认为各中心的试验效应不具有一致性,提示存在中心效应;组别间的差异无统计学意义(P>0.05),尚不能认为两组治疗后中性粒细胞减少的发生情况不同。

3.2 计量资料
3.2.1 协方差分析
对治疗前后中性粒细胞绝对计数值ANC进行统计描述,同时,考虑治疗前ANC值可能会对疗效产生影响,故以疗前值为协变量,考虑中心效应以及中心与组别的交互作用,建立ANC比较的协方差分析模型,其结果如表 5所示。

由两组治疗后ANC比较的协方差分析结果可见,疗前值对结果的影响有统计学意义(F=28.499,P=0.000);各中心间的差异有统计学意义(F=2.372,P=0.002),尚不能认为各中心的试验效应具有一致性,提示存在中心效应;中心与组别的交互作用无统计学意义(F=0.741,P=0.768);两组ANC的差别无统计学意义(F=3.668,P=0.056),尚不能认为两组治疗后ANC不同。
上述统计分析结果表明该研究中心与组别的交互作用无统计学意义,故重新拟合不考虑交互作用的协方差模型,其结果如表 6所示。

由两组治疗后ANC比较的协方差分析结果可见,疗前值对结果的影响有统计学意义(F=33.057,P=0.000);各中心间的差异有统计学意义(F=2.499,P=0.001),尚不能认为各中心的试验效应具有一致性,提示存在中心效应;两组ANC的差别有统计学意义(F=9.981,P=0.002),尚不能认为两组治疗后ANC相同。
3.2.2 多水平模型
比较组间治疗前后ANC实测值,以中心为水平2单位,个体为水平1单位,拟合两水平方差成分模型:
yij=β0j+β1Xij +e0ij ,β0j=β0+ u0j
u0j~N(0,σu02),e0ij ~N(0,σe02),
其中 i表示水平1单位(个体),j表示水平2单位(中心),X表示组别,β0j为截距,e0ij为个体水平的随机误差项,σu02和σe02描述模型的随机效应。σu02为中心水平的方差成分,σe02为个体水平的方差成分。
运行MLwiN2.02,分析结果如表 7所示。

由多水平模型的分析结果可见,水平2(中心)无统计学意义(P>0.05),可以认为各中心的试验效应具有一致性,不存在中心效应;组别间的差异有统计学意义(P<0.05),尚不能认为两组治疗后ANC相同。
3.3 各分析方法的结果汇总(见表 8

对于分类资料,分别采用CMH卡方检验和多水平模型对中心效应进行分析。CMH检验结果为:同质性检验结果无统计学意义,χ2检验与采用CMH卡方检验的结果一致,即提示各中心具有一致性,不存在中心效应;多水平模型结果为:水平2(中心)有统计学意义,不能认为各中心的试验效应具有一致性,提示存在中心效应。两种方法对中心效应的检验结果不一致,提示各种方法对分类资料异质性的敏感性程度不同,多水平模型较为敏感。
对于计量资料,分别采用协方差分析与多水平模型对中心效应进行分析。协方差分析结果为:各中心间的差异有统计学意义,不能认为各中心的试验效应具有一致性,提示存在中心效应,但中心与组别的交互作用无统计学意义;多水平模型结果为:水平2(中心)无统计学意义,可以认为各中心的试验效应具有一致性,不存在中心效应。两种方法对中心效应的检验结果不一致,这提示各种方法对计量数据异质性的敏感性程度不同,协方差分析较为敏感。
4 讨论
本研究结果显示,在多中心临床试验中可使用多水平模型实现中心效应的分析,该方法不仅适用于二分类、有序分类和无序分类资料[12],也可用于计量资料,较传统的统计分析方法有更加广阔的应用空间。
对分类资料,多水平模型通过将随机误差项随机分解到与数据层次结构相应的水平上,除了使得个体水平的随机误差更纯,还可了解高水平的情况,即可以直接得到中心效应的情况和考虑了中心效应的组间比较结果,并且提供了进一步拟合研究水平上复杂误差结构的可能。采用传统的CMH卡方检验时,只能通过比较分层前后的分析结果间接了解是否有中心效应,研究结果也显示,对分类资料的中心效应分析,多水平模型较CMH卡方检验更为敏感。进一步进行多因素的分析时,虽然CMH卡方检验也可对多因素进行分层处理,但是当分层因素较多时,单元格被划分得越来越细,列联表的格子中频数可能很小甚至为0,一方面对样本含量的要求较大,另一方面也将导致检验结果的不可靠。
对计量资料,临床试验中常涉及重复测量数据[13],多水平统计模型通过将数据的不同层次设置为不同水平,将低水平的随机误差分解到数据系统结构的相应水平上,从而获得处理具有层次结构的数据的明显优势,以充分考虑数据的层次性和各层内数据之间的相关性,对数据资料提供的信息的利用也较其他统计分析方法更为充分,从而可以对重复测量资料的多次观测数据进行更加全面和系统的分析。目前对于多中心临床试验重复测量的计量资料,其中心效应分析往往使用协方差分析,而同一个体的重复测量数据间往往存在相关性,这就违反了方差分析模型要求的数据独立性,这时若仍采用协方差分析,就只能在各时间点分别进行分析,孤立地看待各时间点的观测值,没有充分考虑各观测点之间的相关性,不能充分利用该类资料所提供的信息,所得结论会有一定的偏倚。此时虽然可考虑采用单变量重复测量的方差分析来分析重复测量资料各测量点间的相关性,但此法对协方差结构有更严格的要求,须通过球性检验,否则就需用校正因子对F分布的自由度加以校正,这种校正分析对于各种各样的方差和协方差结构显然是不够的,且多次单变量分析也会增大犯Ⅰ型错误的概率。
多水平模型还可在其固定或随机部分轻松引入任何水平上测量到的解释变量,使得研究者能够探讨各水平单位的特征对反应变量的影响,以及对反应变量在高水平单位甚至是低水平位之间变异的影响,分析结果的影响因素及可能的变化趋势。对分类资料采用logistic回归模型,以及对计量资料采用协方差分析或多元线性回归,也可以同时分析多个解释变量的影响,以及各变量间的交互作用,但是,这些分析方法都是建立在单水平上的,当遇到多中心临床试验这样具有层次结构的数据,如前所述,忽略了数据在高水平的聚集性,其统计分析结论可能会有一定的偏倚。
当然,多水平模型也有其局限性,如:对非正态分布数据拟合模型较困难;当水平增多、解释变量增多时,会增加对分析结果解释的困难;当中心数较多时,不宜将中心设为哑变量对中心效应进行处理,这样不但增加了拟合模型的复杂程度,同时减少了拟合优度的自由度,此时常用随机效应来表示中心效应,即将中心作为一个更高的层次来拟合模型,但是多中心临床试验常需要检验中心与组别间的交互作用,多水平模型无法拟合高层次单位与低层次单位变量间的交互作用,因此将中心作为高层次单位以后,将不能分析中心(高层次)和组别(低层次)的交互作用。
多水平模型对多中心临床试验数据的处理有独特的优势,但是研究也显示各种分析方法对中心效应的估计不尽一致,因此在实际运用中应结合待分析数据自身的结构特点和研究目的,并根据各种方法的适用条件来选择适当的分析方法,可以采用多种分析方法同时进行综合分析,以减少偏倚,提高研究结论的可靠性和准确性。
引言
多中心临床试验(multicenter clinical trial)是指由一个单位的主要研究者总负责,多个单位的研究者合作,按同一个试验方案同时进行的临床试验。多中心临床试验可以在较短的时间内入选所需的病例数,且入选的病例范围广,试验的结果更具代表性,但其影响因素亦随之更趋复杂[1]。
多中心临床试验必须在统一的组织领导下,遵循一个共同制定的试验方案完成整个试验,并规定统一的纳入、排除标准和试验效应指标,各中心试验组和对照组病例数的比例应与总样本的比例相同,以保证各中心齐同可比。
试验过程中,尽管所有中心都针对同一问题或相同的研究假设进行研究,但各中心通常在研究设计或实施的诸多方面不完全与另一中心相同,难以避免的差异导致了个体结局指标取值在某中心内的相似性[2-3],换言之,同一中心的数据具有聚集性,而不同中心之间的“效应尺度”存在异质性(heterogeneity)。在多中心临床试验中这样的差异性就称之为“中心效应(center effect)” [4]。
多中心临床试验的前提是各中心间结果一致,主效应指标一旦出现中心效应,则试验结果可能受到影响,结论也可能存在偏倚。因此,多中心临床试验的中心效应分析是评价干预措施结果的真实性和可靠性的重要环节。在新药临床试验中若出现中心效应,多数情况下要求重新做该试验[5]。
多水平模型(multilevel models)的研究和应用始于20世纪80年代初期英国初级中学学校效益分析及美国的补偿教育研究,是将Ⅱ型方差分析理论与多元统计分析相结合的新技术,是分析和处理具有层次结构特征的有力工具。其理论、方法及计算技术发展迅速,目前在心理学、社会学、经济学[6]、地理学、实验研究、儿童生长发育、流行病学及其他医学领域应用广泛,并展现出日益广阔的应用前景。
多水平数据(multilevel data)或具有多水平层次结构(hierarchical structure)的数据是多水平统计模型(multilevel statistical models)发展和应用的基础。此类数据的主要特征是反应变量的分布在个体间不具备独立性,但存在地理距离内、某行政划区内或特定空间范围内的聚集性(clustering)。多中心临床试验中的数据具有上述典型特征[7]。
在多中心临床试验的统计分析中,除了常规统计分析外,还需要对多个中心的各效应指标是否具有一致性进行评价[8]。当前分析中心效应常用的方法有:① 用于计量资料的协方差分析[9];② 适用于定性资料的CMH卡方检验;③ logistic回归(二分类或多分类)。
运用这些常用的统计方法检验中心效应时有两个问题:其一,传统统计模型的估计方法是建立在个体测量值相互独立的假设上。当这个假设不成立时,模型中的各参数估计值的有效性和统计特性均会受到影响,从而可能使最终的统计推断结论存在偏倚。其二,中心变量对同一中心的每一个体的取值是一样的,即该变量的自由度在同一中心内已经人为扩大了,其结果无疑会影响该变量参数估计值的统计推断,因为该估计值的标准误会有偏差[10-11]。
多水平模型按中心进行分层拟合多水平的模型,通过判断数据在水平2内是否存在相似性或聚集性来判断中心效应,同时可以将变异从中心(水平2)中分离出来,从而得到个体水平(水平1)的净效应。
1 研究目的
本研究采用多水平模型对多中心临床试验的中心效应(异质性)进行分析,并分别与协方差、CMH卡方检验的分析结果进行比较,探讨这些统计分析方法在中心效应分析时的适用条件、作用及优缺点,为多水平模型在多中心临床试验中心效应分析中的应用提供参考。
2 实例分析
2.1 资料来源
本研究来源于“某新药预防化疗后中性粒细胞减少的疗效和安全性的Ⅲ期临床试验方案研究”,采用多中心临床随机对照研究方法,由19个单位(中心)共同完成。各中心均按临床试验前的随机化方案进行临床病例的随机分组,试验过程中的质量控制由各中心自行质控,主持单位定期或不定期地到各中心进行CRF表的质控。该研究将所有研究对象随机分为两组:试验组和对照组,共纳入研究对象326人,其中试验组160人,对照组166人。该研究以两组中性粒细胞绝对计数值(ANC)和中性粒细胞减少发生率为分析指标来评价药物疗效。
2.2 数据管理及统计分析方法
数据录入人员经统一培训,采用Epitada软件建立数据库,数据录入校对等完成后生成SPSS/SAS/MLwiN等数据库文件。在SAS9.01、SPSS17.0及MLwiN2.02统计软件上完成全部数据的统计分析。统计分析采用协方差分析、CMH卡方检验、多水平统计模型等方法。若无特殊说明,本研究中检验水准均为α=0.05。
3 结果
3.1 分类资料
3.1.1 CMH卡方检验
首先分别采用Breslow-Day检验与Tarone’s statistics检验对各中心中性粒细胞减少发生率同质性进行检验,结果如表 1所示。

同质性检验结果显示无统计学意义(P=0.162),提示中心结果具有一致性,可将各中心数据进行合并分析。
采用卡方检验,比较两组中性粒细胞减少发生率,结果如表 2所示。
由卡方检验结果可见,两组中性粒细胞减少发生率的差异无统计学意义(χ2=0.611,P=0.434),尚不能认为两组中性粒细胞减少发生率不同。

以中心为分层因素,采用CMH卡方检验对两组中性粒细胞减少发生率进行比较,结果如表 3所示。

由CMH卡方检验结果可见,两组中性粒细胞减少发生率的差异无统计学意义(CMH χ2=0.616,P=0.433),尚不能认为两组中性粒细胞减少发生率不同。
综上所述,卡方检验的结果与将中心作为分层因素而采用CMH卡方检验的结果一致,提示无中心效应。
3.1.2 多水平模型
当反应变量为率,一般采用二项分布(binomial distribution)。假定服从标准二项分布的率:
yij~Bin(nij,πij),
其中 i指水平1单位,j指水平2单位,以中性粒细胞减少发生率为反应变量,中心为水平2单位,个体为水平1单位,拟合两水平logistic回归模型:
logit(Pij)=(β0+u0j)+β1xij
u0j=β0j-β0 ,u0j~N(0,σu02)
β1为处理因素的效应参数,又称固定效应(fixed effects)参数。u0j为水平2单位的logit均值β0j与总均值β0之差,又称为随机效应(random effects)或高水平的残差,其方差σu02越大说明数据在高水平单位内的聚集性越强。
运行MLwiN2.02,分析结果如表 4所示。
由多水平模型的分析结果可见,水平2(中心)有统计学意义(P<0.05),可以认为各中心的试验效应不具有一致性,提示存在中心效应;组别间的差异无统计学意义(P>0.05),尚不能认为两组治疗后中性粒细胞减少的发生情况不同。

3.2 计量资料
3.2.1 协方差分析
对治疗前后中性粒细胞绝对计数值ANC进行统计描述,同时,考虑治疗前ANC值可能会对疗效产生影响,故以疗前值为协变量,考虑中心效应以及中心与组别的交互作用,建立ANC比较的协方差分析模型,其结果如表 5所示。

由两组治疗后ANC比较的协方差分析结果可见,疗前值对结果的影响有统计学意义(F=28.499,P=0.000);各中心间的差异有统计学意义(F=2.372,P=0.002),尚不能认为各中心的试验效应具有一致性,提示存在中心效应;中心与组别的交互作用无统计学意义(F=0.741,P=0.768);两组ANC的差别无统计学意义(F=3.668,P=0.056),尚不能认为两组治疗后ANC不同。
上述统计分析结果表明该研究中心与组别的交互作用无统计学意义,故重新拟合不考虑交互作用的协方差模型,其结果如表 6所示。

由两组治疗后ANC比较的协方差分析结果可见,疗前值对结果的影响有统计学意义(F=33.057,P=0.000);各中心间的差异有统计学意义(F=2.499,P=0.001),尚不能认为各中心的试验效应具有一致性,提示存在中心效应;两组ANC的差别有统计学意义(F=9.981,P=0.002),尚不能认为两组治疗后ANC相同。
3.2.2 多水平模型
比较组间治疗前后ANC实测值,以中心为水平2单位,个体为水平1单位,拟合两水平方差成分模型:
yij=β0j+β1Xij +e0ij ,β0j=β0+ u0j
u0j~N(0,σu02),e0ij ~N(0,σe02),
其中 i表示水平1单位(个体),j表示水平2单位(中心),X表示组别,β0j为截距,e0ij为个体水平的随机误差项,σu02和σe02描述模型的随机效应。σu02为中心水平的方差成分,σe02为个体水平的方差成分。
运行MLwiN2.02,分析结果如表 7所示。

由多水平模型的分析结果可见,水平2(中心)无统计学意义(P>0.05),可以认为各中心的试验效应具有一致性,不存在中心效应;组别间的差异有统计学意义(P<0.05),尚不能认为两组治疗后ANC相同。
3.3 各分析方法的结果汇总(见表 8

对于分类资料,分别采用CMH卡方检验和多水平模型对中心效应进行分析。CMH检验结果为:同质性检验结果无统计学意义,χ2检验与采用CMH卡方检验的结果一致,即提示各中心具有一致性,不存在中心效应;多水平模型结果为:水平2(中心)有统计学意义,不能认为各中心的试验效应具有一致性,提示存在中心效应。两种方法对中心效应的检验结果不一致,提示各种方法对分类资料异质性的敏感性程度不同,多水平模型较为敏感。
对于计量资料,分别采用协方差分析与多水平模型对中心效应进行分析。协方差分析结果为:各中心间的差异有统计学意义,不能认为各中心的试验效应具有一致性,提示存在中心效应,但中心与组别的交互作用无统计学意义;多水平模型结果为:水平2(中心)无统计学意义,可以认为各中心的试验效应具有一致性,不存在中心效应。两种方法对中心效应的检验结果不一致,这提示各种方法对计量数据异质性的敏感性程度不同,协方差分析较为敏感。
4 讨论
本研究结果显示,在多中心临床试验中可使用多水平模型实现中心效应的分析,该方法不仅适用于二分类、有序分类和无序分类资料[12],也可用于计量资料,较传统的统计分析方法有更加广阔的应用空间。
对分类资料,多水平模型通过将随机误差项随机分解到与数据层次结构相应的水平上,除了使得个体水平的随机误差更纯,还可了解高水平的情况,即可以直接得到中心效应的情况和考虑了中心效应的组间比较结果,并且提供了进一步拟合研究水平上复杂误差结构的可能。采用传统的CMH卡方检验时,只能通过比较分层前后的分析结果间接了解是否有中心效应,研究结果也显示,对分类资料的中心效应分析,多水平模型较CMH卡方检验更为敏感。进一步进行多因素的分析时,虽然CMH卡方检验也可对多因素进行分层处理,但是当分层因素较多时,单元格被划分得越来越细,列联表的格子中频数可能很小甚至为0,一方面对样本含量的要求较大,另一方面也将导致检验结果的不可靠。
对计量资料,临床试验中常涉及重复测量数据[13],多水平统计模型通过将数据的不同层次设置为不同水平,将低水平的随机误差分解到数据系统结构的相应水平上,从而获得处理具有层次结构的数据的明显优势,以充分考虑数据的层次性和各层内数据之间的相关性,对数据资料提供的信息的利用也较其他统计分析方法更为充分,从而可以对重复测量资料的多次观测数据进行更加全面和系统的分析。目前对于多中心临床试验重复测量的计量资料,其中心效应分析往往使用协方差分析,而同一个体的重复测量数据间往往存在相关性,这就违反了方差分析模型要求的数据独立性,这时若仍采用协方差分析,就只能在各时间点分别进行分析,孤立地看待各时间点的观测值,没有充分考虑各观测点之间的相关性,不能充分利用该类资料所提供的信息,所得结论会有一定的偏倚。此时虽然可考虑采用单变量重复测量的方差分析来分析重复测量资料各测量点间的相关性,但此法对协方差结构有更严格的要求,须通过球性检验,否则就需用校正因子对F分布的自由度加以校正,这种校正分析对于各种各样的方差和协方差结构显然是不够的,且多次单变量分析也会增大犯Ⅰ型错误的概率。
多水平模型还可在其固定或随机部分轻松引入任何水平上测量到的解释变量,使得研究者能够探讨各水平单位的特征对反应变量的影响,以及对反应变量在高水平单位甚至是低水平位之间变异的影响,分析结果的影响因素及可能的变化趋势。对分类资料采用logistic回归模型,以及对计量资料采用协方差分析或多元线性回归,也可以同时分析多个解释变量的影响,以及各变量间的交互作用,但是,这些分析方法都是建立在单水平上的,当遇到多中心临床试验这样具有层次结构的数据,如前所述,忽略了数据在高水平的聚集性,其统计分析结论可能会有一定的偏倚。
当然,多水平模型也有其局限性,如:对非正态分布数据拟合模型较困难;当水平增多、解释变量增多时,会增加对分析结果解释的困难;当中心数较多时,不宜将中心设为哑变量对中心效应进行处理,这样不但增加了拟合模型的复杂程度,同时减少了拟合优度的自由度,此时常用随机效应来表示中心效应,即将中心作为一个更高的层次来拟合模型,但是多中心临床试验常需要检验中心与组别间的交互作用,多水平模型无法拟合高层次单位与低层次单位变量间的交互作用,因此将中心作为高层次单位以后,将不能分析中心(高层次)和组别(低层次)的交互作用。
多水平模型对多中心临床试验数据的处理有独特的优势,但是研究也显示各种分析方法对中心效应的估计不尽一致,因此在实际运用中应结合待分析数据自身的结构特点和研究目的,并根据各种方法的适用条件来选择适当的分析方法,可以采用多种分析方法同时进行综合分析,以减少偏倚,提高研究结论的可靠性和准确性。