危险比(risk ratio,RR)和风险比(hazard ratio,HR)是前瞻性研究中常用的效应指标。但在原始研究和 Meta 分析中描述效应量大小时不能交替使用,如何选择合适的指标并正确解读是临床研究的关键。本文总结了效应指标中危险和风险的异同点,对比 RR 和 HR 在估计方法和临床解读之间的差异,并在同一研究中比较 RR 和 HR 的区别,并提供可行的转换公式便于在 Meta 分析的合并中使用。
引用本文: 黄桥, 赵明娟, 罗丽莎, 邓通, 曾宪涛, 王行环. 前瞻性研究中效应指标危险比(RR)和风险比(HR)的辨析与转换. 中国循证医学杂志, 2020, 20(10): 1221-1225. doi: 10.7507/1672-2531.202005092 复制
前瞻性研究是一种纵向研究设计,随着时间推移,随访观察仅在某一研究因素有所不同的相似个体,探究这一研究因素对研究结局(如死亡、肿瘤进展)发生的影响[1]。前瞻性研究可以确定暴露(干预)和结局之间的时序关系(暴露在前,结局在后),其在病因研究和肿瘤学研究中得到广泛应用。前瞻性研究设计需要纳入一组人群并进行较长时间随访,记录的结局是事件结局(是否发生)或者时间-事件结局(持续时间、是否发生)。因涉及到 2 组或多组比较,常采用相对比作为效应指标。危险比(risk ratio,RR),又称相对危险度(relative risk,RR),是前瞻性研究中以是否发生研究结局(如死亡)的效应指标,RR 表示的是两个危险(risk)之间的比值[2]。风险比(hazard ratio,HR)是前瞻性研究中以时间-事件数据为结局的效应指标,表示的是两个风险率(hazard rate)之间的比值。从临床角度来讲,危险和风险率均对应一种临床结局,如死亡、肿瘤进展等。
RR 和 HR 作为效应指标在临床研究中的应用越来越广泛。因为二者都是相对比的指标,在解读时,HR 常被错误地按照 RR 来进行临床意义解读,但两者显然不同,最明显的区别是 HR 考虑事件发生时间的长短。Meta 分析制作的重要步骤之一是选择合适的效应指标并尝试进行 Meta 合并,如在偏态数据中不建议采用均数而是中位数进行合并[3, 4]。但当纳入的同类研究分别汇报 HR 和 RR,如何选择以及是否两者可以转换是 Meta 分析制作者常面临的问题。临床医生或其他非统计领域的专家常因无法直观理解两者区别,导致采用的统计方法和效应指标使用不合理。因此,有必要对二者的联系和区别进行系统性剖析,降低学习和使用的门槛。
笔者从危险和风险率入手,采用实例数据并可视化展示 HR 和 RR 之间的区别,方便研究者在进行原始研究和 Meta 分析时参考,同时引导 HR 和 RR 的正确和规范使用。
1 危险和风险率的对比
1.1 危险的计算
![]() |
危险表示随访到 t 时刻时,事件发生的概率,其中分子为到 t 时刻时新发事件累积人数,分母为随访开始时的总人数(公式 1)。因按照观察时间累积,又可称为累积危险或累积发生率,大小一般介于 0 到 1 之间。若随访时间足够长,且入组人群均有发生事件的可能(如死亡),危险终将等于 1。因其分母为入组时总人数,所以危险的计算不允许删失的出现。
1.2 风险率的计算
![]() |
![]() |
风险率,又称风险,表示已生存到时间 t 的人群在 t 时刻时的单位时间事件发生率。分子为条件概率[P(A|B)表示在 B 条件下 A 事件发生的概率],其表示为[时间段的发生事件人数除以 t 时刻时仍生存的人数,分母为事件间隔
(公式 2 和 3)。风险率是概率与时间相除所得的单位时间概率,其大小与时间单位有关。此外,风险率是求极限所得的值,当
无限接近 0 时,时间范围[
将无限接近 t 这一瞬间,所以风险率表示 t 时刻瞬间的单位时间概率。
以伍斯特心脏病研究(Worcester Heart Attack Study)的公开数据为例[5],采用不同的时间单位(月、年和五年)分别计算风险率,可以发现风险率随着时间变化,变化趋势完全一致,但是其大小却不同,时间单位越大,风险率越大,范围为[0,+∞),见图 1。因风险率的条件概率计算中,分母仅考虑 t 时刻仍生存的人数,而不是入组时的总人数,所以计算允许删失的存在。

1.3 危险和风险率的比较
危险和风险率的总结对比见表 1。

2 RR 和 HR 的估计和临床解读
2.1 RR 的计算
![]() |
RR 是两组危险的比值(公式 4)。将数据汇总成四格表的形式,分别计算暴露组(干预组)和对照组的危险,然后简单计算比值可得到粗 RR。然而,在临床研究中,混杂因素的存在可能会扭曲暴露与结局之间的关系,所以常需要采用高阶统计方法控制混杂因素的影响。根据不同类型可以分为以下 4 种。
2.1.1 基于四格表拓展
第一种为分层 Mantel-Haenszel 法,该方法只允许纳入为分类变量的混杂协变量,且个数不能太多,否则可能会出现四格表的单元格为 0 的情况,而无法计算。第二种使用 logistic 回归计算各组的倾向得分,然后为平衡组间混杂因素进行匹配,根据匹配后的数据重新整理四格表计算 RR,该方法对样本量要求较高[6]。
2.1.2 基于 logistic 回归
第一种方法是通过多因素 logistic 回归计算调整后的比值比(odds ratio,OR),然后根据公式转换成 RR。一般来说当对照组的事件发生率小于 10% 时,RR 和 OR 的值接近[2];第二种方法基于边际概率,建立多因素 logistic 回归模型,先假设所有个体为暴露组,估计每个观测的预测概率后计算平均值(),然后假设所有个体为非暴露组,估计预测概率后计算平均值(
),两者的比值即为 RR,其置信区间估计需要采用 Bootstrap 法[1]。
2.1.3 基于离散变量分布的回归
第一种为 Log-binomial 回归,模型左边为 ln(p),其中 p 为事件发生率,属于是广义线性模型的一种特殊类型,常应用于队列研究和干预性研究中[7, 8]。因为因变量 ln(p)始终≤0,所以在使用该方法时可将截距设置为−4,提高模型拟合的成功率[9]。另外一种方法是采用稳健误差方差估计的泊松回归(Poisson regression with robust error variance),在泊松回归中不采用稳健的误差的方差估计时,置信区间估计保守。Zou 等[10]引入稳健的“三明治”方差估计方法改进泊松回归,从而得到 RR 的稳健估计。
2.1.4 基于 Cox 等比例风险回归
第一种用于估计指定时间的 RR,与基于 logistic 回归的第二种方法类似。建立多因素 Cox 回归模型,先假设所有个体为暴露组估计每个观测在预测概率,计算指定时间概率的平均值(),同样操作计算对照组的平均值(
),两者的比值即为 RR,置信区间估计采用 Bootstrap 法[11]。第二种是修正的 Cox 等比例风险回归,将所有的观测时间设置为相等的常数(特定时间),采用 Breslow 或 Efron 等的“结”处理方法修正 Cox 比例风险模型,估计 RR 及其置信区间[12]。
郜艳晖等[13]对 RR 和患病率比(prevalence ratio,PR)的估计方法进行了系统全面的介绍。Fang[14]使用 SAS 软件实现了以上介绍的 8 种方法,并用实例展示各自的优缺点。对于非统计专家来说,从实用和便捷的角度出发,推荐先采用截距设置为负的 Log-binomial 回归模型,若模型无法拟合时,则采用稳健误差方差估计的泊松回归。
2.2 HR 的计算
![]() |
HR 是两组风险率的比值(公式 5)。各组的风险率需要在不同的随访时间点求极限,无法通过简单的四格表计算。相较于参数生存回归,Cox 等比例风险模型因不依赖特定的分布(如参数生存分析中的指数分布等)且无需估计基线风险率,广泛应用于生存分析中的 HR 估计。在临床研究中,常采用单因素的 Cox 等比例风险模型估计粗 HR,多因素模型估计调整后 HR。在进行 Cox 等比例风险模型前,需要进行等比例风险的假设检验。等比例风险是指尽管风险率随着时间任意变化,但两组的风险率之比在随访期间是恒定不变的。
2.3 临床解读
以一个干预性的随机对照试验为例,设置干预组和对照组,记录结局事件为疾病进展,随访 5 年,同时估计 RR 和 HR。RR=1.5,表示干预组的 5 年疾病进展发生率是对照组的 1.5 倍(或者干预组的 5 年疾病进展发生率比对照组高 50%)。HR=2,表示干预导致患者的疾病进展更快,在某个时间点尚未进展的患者中,干预组的患者在下一个时间点疾病进展的机会是对照组的 2 倍。
3 HR 和 RR 之间的关系
3.1 HR 固定时 RR 与 HR 之间的关系
以最简单的指数分布的参数生存分析为例,模拟原始时间-事件数据,HR 设置为 2,数据中不考虑删失,绘制 Kaplan-Meier 曲线(图 2),计算不同随访时间点的 RR,将 HR 和 RR 绘制在同一图中(图 2)。从图中可见,仅在随访初期时,HR 与 RR 接近,在后期 RR 逐渐接近 1。

3.2 RR 固定时 HR 与 RR 之间的关系
假设试验组和对照组均纳入 100 人进行随访,在每个单位时间,试验组有 2 人死亡,对照组有 1 人死亡,直到所有对象都发生事件。此时 RR 恒等于 2,采用 Cox 等比例风险模型估计的 HR 为 4.05(图 3)。

3.3 HR 与 RR 的转换
HR 在随访期间恒定为 k 时,RR 并不为 k,且 RR 可能随着时间变化。为理解 HR 和 RR 不等,如以死亡为结局,若 HR 恒定不变,因每个人最终均会死亡,RR 最终将逐渐接近 1。在 Meta 分析中,HR 和 RR 作为效应指标得到广泛使用。若 Meta 分析纳入的研究同时使用 HR 和 RR 时,建议按不同的指标分亚组进行 Meta 合并。但纳入文献较少不适合分亚组时,则可以尝试将 HR 转化为 RR 后进行合并。
若能获得随访结束时对照组的事件发生率 P0,可采用公式 6 将 HR 转换成 RR[15]。若关注的结局事件在随访期间能必然发生时,该公式满足 RR 在随访期间逐渐趋近 1 的特性,当 P0=1 时,RR=1。
![]() |
国外学者 VanderWeele[16]提出在满足等比例风险的情况下,采用公式 7 进行 HR 和 RR 之间的近似转换。若两组的事件发生率介于 0.2 到 0.8,转换的误差小于 16%;但如果不满足此条件,转换导致的偏差可能高达 80%。
![]() |
2019 年 12 月,VanderWeele 发表了将转换 HR 为 RR 的进一步研究结果[17]。首先,定义暴露组和对照组事件发生率分别为 P1 和 P0,且两者大小介于[w,u],采用基于最优偏差比的最大最小值转换(optimal bias-ratio minimax conversion),进一步减少转换带来偏差。根据 HR 和 1 的关系,分为以下两者情况。
若 HR>1,则定义 w≤P0≤P1≤u,
![]() |
若 HR<1,则 w≤P1≤P0≤u,
![]() |
同样的,若两组的事件发生率介于 0.2 到 0.8,转换的误差相较于公式 7 进一步降低,小于 13%[17]。概率区间[w,u]的设置会影响转换的结果,若 P0 和 P1 的合理范围的信息不足,公式 8 和 9 的转换可能存在问题,此时可采用公式 7 转换。
由样本推断总体时,因存在抽样误差,效应指标常需结合点估计值(HR 或 RR)及其 95% 置信区间表示。在进行置信区间的转换时,可依次将区间的上限和下限带入公式,计算转换后的置信区间。例如,某研究的效应量为 HR=1.14[95%CI(1.08,1.21)],采用公式 6 可以转换得到近似的 RR 值,RR=1.13[95%(1.08,1.20)]。
4 总结
RR 和 HR 作为前瞻性研究中常用的效应指标,RR 主要关注结局事件是否发生,HR 主要关注幸免于结局事件的时间长短,二者不同,描述效应大小时不能交替使用。本文从基本概念上对比了 RR 和 HR,对 RR 和 HR 的常用统计分析方法进行分析,以实例区分二者在临床结果上的表达,最后采用模拟数据对比 RR 和 HR 的大小,并提供可能的转换工具。正确理解 RR 和 HR 的联系和区别,将有助于临床研究者进行恰当的统计分析、结果表达和文献解读。
前瞻性研究是一种纵向研究设计,随着时间推移,随访观察仅在某一研究因素有所不同的相似个体,探究这一研究因素对研究结局(如死亡、肿瘤进展)发生的影响[1]。前瞻性研究可以确定暴露(干预)和结局之间的时序关系(暴露在前,结局在后),其在病因研究和肿瘤学研究中得到广泛应用。前瞻性研究设计需要纳入一组人群并进行较长时间随访,记录的结局是事件结局(是否发生)或者时间-事件结局(持续时间、是否发生)。因涉及到 2 组或多组比较,常采用相对比作为效应指标。危险比(risk ratio,RR),又称相对危险度(relative risk,RR),是前瞻性研究中以是否发生研究结局(如死亡)的效应指标,RR 表示的是两个危险(risk)之间的比值[2]。风险比(hazard ratio,HR)是前瞻性研究中以时间-事件数据为结局的效应指标,表示的是两个风险率(hazard rate)之间的比值。从临床角度来讲,危险和风险率均对应一种临床结局,如死亡、肿瘤进展等。
RR 和 HR 作为效应指标在临床研究中的应用越来越广泛。因为二者都是相对比的指标,在解读时,HR 常被错误地按照 RR 来进行临床意义解读,但两者显然不同,最明显的区别是 HR 考虑事件发生时间的长短。Meta 分析制作的重要步骤之一是选择合适的效应指标并尝试进行 Meta 合并,如在偏态数据中不建议采用均数而是中位数进行合并[3, 4]。但当纳入的同类研究分别汇报 HR 和 RR,如何选择以及是否两者可以转换是 Meta 分析制作者常面临的问题。临床医生或其他非统计领域的专家常因无法直观理解两者区别,导致采用的统计方法和效应指标使用不合理。因此,有必要对二者的联系和区别进行系统性剖析,降低学习和使用的门槛。
笔者从危险和风险率入手,采用实例数据并可视化展示 HR 和 RR 之间的区别,方便研究者在进行原始研究和 Meta 分析时参考,同时引导 HR 和 RR 的正确和规范使用。
1 危险和风险率的对比
1.1 危险的计算
![]() |
危险表示随访到 t 时刻时,事件发生的概率,其中分子为到 t 时刻时新发事件累积人数,分母为随访开始时的总人数(公式 1)。因按照观察时间累积,又可称为累积危险或累积发生率,大小一般介于 0 到 1 之间。若随访时间足够长,且入组人群均有发生事件的可能(如死亡),危险终将等于 1。因其分母为入组时总人数,所以危险的计算不允许删失的出现。
1.2 风险率的计算
![]() |
![]() |
风险率,又称风险,表示已生存到时间 t 的人群在 t 时刻时的单位时间事件发生率。分子为条件概率[P(A|B)表示在 B 条件下 A 事件发生的概率],其表示为[时间段的发生事件人数除以 t 时刻时仍生存的人数,分母为事件间隔
(公式 2 和 3)。风险率是概率与时间相除所得的单位时间概率,其大小与时间单位有关。此外,风险率是求极限所得的值,当
无限接近 0 时,时间范围[
将无限接近 t 这一瞬间,所以风险率表示 t 时刻瞬间的单位时间概率。
以伍斯特心脏病研究(Worcester Heart Attack Study)的公开数据为例[5],采用不同的时间单位(月、年和五年)分别计算风险率,可以发现风险率随着时间变化,变化趋势完全一致,但是其大小却不同,时间单位越大,风险率越大,范围为[0,+∞),见图 1。因风险率的条件概率计算中,分母仅考虑 t 时刻仍生存的人数,而不是入组时的总人数,所以计算允许删失的存在。

1.3 危险和风险率的比较
危险和风险率的总结对比见表 1。

2 RR 和 HR 的估计和临床解读
2.1 RR 的计算
![]() |
RR 是两组危险的比值(公式 4)。将数据汇总成四格表的形式,分别计算暴露组(干预组)和对照组的危险,然后简单计算比值可得到粗 RR。然而,在临床研究中,混杂因素的存在可能会扭曲暴露与结局之间的关系,所以常需要采用高阶统计方法控制混杂因素的影响。根据不同类型可以分为以下 4 种。
2.1.1 基于四格表拓展
第一种为分层 Mantel-Haenszel 法,该方法只允许纳入为分类变量的混杂协变量,且个数不能太多,否则可能会出现四格表的单元格为 0 的情况,而无法计算。第二种使用 logistic 回归计算各组的倾向得分,然后为平衡组间混杂因素进行匹配,根据匹配后的数据重新整理四格表计算 RR,该方法对样本量要求较高[6]。
2.1.2 基于 logistic 回归
第一种方法是通过多因素 logistic 回归计算调整后的比值比(odds ratio,OR),然后根据公式转换成 RR。一般来说当对照组的事件发生率小于 10% 时,RR 和 OR 的值接近[2];第二种方法基于边际概率,建立多因素 logistic 回归模型,先假设所有个体为暴露组,估计每个观测的预测概率后计算平均值(),然后假设所有个体为非暴露组,估计预测概率后计算平均值(
),两者的比值即为 RR,其置信区间估计需要采用 Bootstrap 法[1]。
2.1.3 基于离散变量分布的回归
第一种为 Log-binomial 回归,模型左边为 ln(p),其中 p 为事件发生率,属于是广义线性模型的一种特殊类型,常应用于队列研究和干预性研究中[7, 8]。因为因变量 ln(p)始终≤0,所以在使用该方法时可将截距设置为−4,提高模型拟合的成功率[9]。另外一种方法是采用稳健误差方差估计的泊松回归(Poisson regression with robust error variance),在泊松回归中不采用稳健的误差的方差估计时,置信区间估计保守。Zou 等[10]引入稳健的“三明治”方差估计方法改进泊松回归,从而得到 RR 的稳健估计。
2.1.4 基于 Cox 等比例风险回归
第一种用于估计指定时间的 RR,与基于 logistic 回归的第二种方法类似。建立多因素 Cox 回归模型,先假设所有个体为暴露组估计每个观测在预测概率,计算指定时间概率的平均值(),同样操作计算对照组的平均值(
),两者的比值即为 RR,置信区间估计采用 Bootstrap 法[11]。第二种是修正的 Cox 等比例风险回归,将所有的观测时间设置为相等的常数(特定时间),采用 Breslow 或 Efron 等的“结”处理方法修正 Cox 比例风险模型,估计 RR 及其置信区间[12]。
郜艳晖等[13]对 RR 和患病率比(prevalence ratio,PR)的估计方法进行了系统全面的介绍。Fang[14]使用 SAS 软件实现了以上介绍的 8 种方法,并用实例展示各自的优缺点。对于非统计专家来说,从实用和便捷的角度出发,推荐先采用截距设置为负的 Log-binomial 回归模型,若模型无法拟合时,则采用稳健误差方差估计的泊松回归。
2.2 HR 的计算
![]() |
HR 是两组风险率的比值(公式 5)。各组的风险率需要在不同的随访时间点求极限,无法通过简单的四格表计算。相较于参数生存回归,Cox 等比例风险模型因不依赖特定的分布(如参数生存分析中的指数分布等)且无需估计基线风险率,广泛应用于生存分析中的 HR 估计。在临床研究中,常采用单因素的 Cox 等比例风险模型估计粗 HR,多因素模型估计调整后 HR。在进行 Cox 等比例风险模型前,需要进行等比例风险的假设检验。等比例风险是指尽管风险率随着时间任意变化,但两组的风险率之比在随访期间是恒定不变的。
2.3 临床解读
以一个干预性的随机对照试验为例,设置干预组和对照组,记录结局事件为疾病进展,随访 5 年,同时估计 RR 和 HR。RR=1.5,表示干预组的 5 年疾病进展发生率是对照组的 1.5 倍(或者干预组的 5 年疾病进展发生率比对照组高 50%)。HR=2,表示干预导致患者的疾病进展更快,在某个时间点尚未进展的患者中,干预组的患者在下一个时间点疾病进展的机会是对照组的 2 倍。
3 HR 和 RR 之间的关系
3.1 HR 固定时 RR 与 HR 之间的关系
以最简单的指数分布的参数生存分析为例,模拟原始时间-事件数据,HR 设置为 2,数据中不考虑删失,绘制 Kaplan-Meier 曲线(图 2),计算不同随访时间点的 RR,将 HR 和 RR 绘制在同一图中(图 2)。从图中可见,仅在随访初期时,HR 与 RR 接近,在后期 RR 逐渐接近 1。

3.2 RR 固定时 HR 与 RR 之间的关系
假设试验组和对照组均纳入 100 人进行随访,在每个单位时间,试验组有 2 人死亡,对照组有 1 人死亡,直到所有对象都发生事件。此时 RR 恒等于 2,采用 Cox 等比例风险模型估计的 HR 为 4.05(图 3)。

3.3 HR 与 RR 的转换
HR 在随访期间恒定为 k 时,RR 并不为 k,且 RR 可能随着时间变化。为理解 HR 和 RR 不等,如以死亡为结局,若 HR 恒定不变,因每个人最终均会死亡,RR 最终将逐渐接近 1。在 Meta 分析中,HR 和 RR 作为效应指标得到广泛使用。若 Meta 分析纳入的研究同时使用 HR 和 RR 时,建议按不同的指标分亚组进行 Meta 合并。但纳入文献较少不适合分亚组时,则可以尝试将 HR 转化为 RR 后进行合并。
若能获得随访结束时对照组的事件发生率 P0,可采用公式 6 将 HR 转换成 RR[15]。若关注的结局事件在随访期间能必然发生时,该公式满足 RR 在随访期间逐渐趋近 1 的特性,当 P0=1 时,RR=1。
![]() |
国外学者 VanderWeele[16]提出在满足等比例风险的情况下,采用公式 7 进行 HR 和 RR 之间的近似转换。若两组的事件发生率介于 0.2 到 0.8,转换的误差小于 16%;但如果不满足此条件,转换导致的偏差可能高达 80%。
![]() |
2019 年 12 月,VanderWeele 发表了将转换 HR 为 RR 的进一步研究结果[17]。首先,定义暴露组和对照组事件发生率分别为 P1 和 P0,且两者大小介于[w,u],采用基于最优偏差比的最大最小值转换(optimal bias-ratio minimax conversion),进一步减少转换带来偏差。根据 HR 和 1 的关系,分为以下两者情况。
若 HR>1,则定义 w≤P0≤P1≤u,
![]() |
若 HR<1,则 w≤P1≤P0≤u,
![]() |
同样的,若两组的事件发生率介于 0.2 到 0.8,转换的误差相较于公式 7 进一步降低,小于 13%[17]。概率区间[w,u]的设置会影响转换的结果,若 P0 和 P1 的合理范围的信息不足,公式 8 和 9 的转换可能存在问题,此时可采用公式 7 转换。
由样本推断总体时,因存在抽样误差,效应指标常需结合点估计值(HR 或 RR)及其 95% 置信区间表示。在进行置信区间的转换时,可依次将区间的上限和下限带入公式,计算转换后的置信区间。例如,某研究的效应量为 HR=1.14[95%CI(1.08,1.21)],采用公式 6 可以转换得到近似的 RR 值,RR=1.13[95%(1.08,1.20)]。
4 总结
RR 和 HR 作为前瞻性研究中常用的效应指标,RR 主要关注结局事件是否发生,HR 主要关注幸免于结局事件的时间长短,二者不同,描述效应大小时不能交替使用。本文从基本概念上对比了 RR 和 HR,对 RR 和 HR 的常用统计分析方法进行分析,以实例区分二者在临床结果上的表达,最后采用模拟数据对比 RR 和 HR 的大小,并提供可能的转换工具。正确理解 RR 和 HR 的联系和区别,将有助于临床研究者进行恰当的统计分析、结果表达和文献解读。