患者个体化容积旋转调强放疗(VMAT)质量保证(QA)过程是临床调强放疗实施流程中重要的一部分。计算剂量与实施剂量之间差异的容差限值和干预限值是 AAPM TG-218 报告认为的 VMAT QA 过程的关键部分,然而这两个值在各放疗中心之间尚无统一标准。本研究基于 AAPM TG-218 报告,应用统计过程控制(SPC)技术建立了采用 ArcCHECK 进行剂量验证下不同部位 VMAT 计划 γ 通过率的容差限值和干预限值。根据每个部位前 25 例处于受控状态的 VMAT QA 结果计算相应部位的容差限值和干预限值,绘制单值控制图持续监测了 287 例 VMAT 计划的调强剂量验证过程,并分析 QA 失控原因。脑部、头颈部、腹部和盆腔部 VMAT QA 过程的容差限值分别为 94.56%、94.68%、94.34% 和 92.97%,干预限值分别为 93.82%、92.54%、93.23% 和 90.29%。除盆腔部外,脑部、头颈部和腹部容差限值均接近 TG-218 通用容差限值(95%),所有部位干预限值均高于 TG-218 通用干预限值(90%)。通过单值图监测发现头颈部失控的 VMAT QA 为 1 例,腹部和盆腔部各 2 例,其中 4 例受摆位误差影响,1 例受测量设备校准错误影响。结果显示 SPC 技术能有效监测 IMRT/VMAT QA 过程,根据不同部位设置相应的容差限值有助于探查 QA 失控原因。
引用本文: 肖青, 李光俊, 李治斌, 张祥斌, 戴谷宇, 柏森. 基于AAPM TG-218报告应用统计过程控制技术监测患者个体化容积旋转调强放疗质量保证过程的初步研究. 生物医学工程学杂志, 2020, 37(5): 842-847. doi: 10.7507/1001-5515.202001016 复制
引言
当前,调强适形放疗(intensity-modulated radiation therapy,IMRT)和容积旋转调强放疗(volumetric modulated arc therapy,VMAT)采用非均匀射束强度,在提高靶区剂量的同时进一步减少周围危及器官的受照剂量,已经成为很多疾病外照射放疗采用的标准治疗方式[1-3]。相比三维适形放疗(three-dimensional conformal radiotherapy,3D-CRT),IMRT/VMAT 技术更复杂,需要更全面的质量保证(quality assurance,QA)措施,以实现精确放疗实施和保障患者安全[4-5]。其中,患者个体化 IMRT/VMAT QA 过程是临床调强放疗实施流程中重要的一部分[6-7]。治疗前剂量验证分析主要是通过评估计算剂量和测量剂量之间的偏差是否在临床可接受范围,对于超出范围的结果则进行调查以找出造成该结果的原因,并采取纠正措施[8]。然而,计算剂量与实施剂量之间差异的容差限值和干预限值在各中心之间尚缺乏统一的标准[3],且仅基于临床干预限值评估患者个体化 QA 结果无法有效改进质控过程。统计过程控制(statistical process control,SPC)作为一种功能强大的分析性决策工具,基于过程本身通过统计分析来监视过程行为,在过程变差前发出警报,实现过程稳定性并减少过程可变性[9],近十年来已逐渐用于放疗质控过程的监测[8,10-20]。美国医学物理家协会(American Association of Physicists in Medicine,AAPM)在先前研究的基础上对患者个体化 IMRT/VMAT QA 过程进行了详细概括,制定了推动其一致性发展的 TG-218 报告[3]。该报告推荐应用 SPC 技术设定基于流程的容差限值和干预限值,以监测整个 IMRT/VMAT QA 过程的受控状态,并推荐使用通用的容差限值和干预限值。然而,临床上不同部位放疗计划的复杂性是不同的[21-22],基于不同部位设定相应的容差限值和干预限值才更为合理。本研究基于 TG-218 报告,评估了 SPC 技术在监测患者个体化 VMAT QA 过程中的有效性,为不同部位 VMAT QA 过程设定适合的容差限值和干预限值,并根据控制图探查了 VMAT QA 过程失控的原因。
1 材料与方法
1.1 研究对象
选取四川大学华西医院放疗科 2019 年 1 月至 2019 年 11 月的 287 例 VMAT 计划进行调强验证。VMAT 计划纳入标准:① 治疗加速器采用同一台瑞典医科达 Synergy 直线加速器;② 计划设计采用瑞典 RaySearch 公司 Raystation 放疗计划系统(treatment planning system,TPS);③ 计划采用 6 MV 光子束均整(flattening filter,FF)模式,最大剂量率为 600 MU/min。该研究已通过华西医院伦理委员会审查,在中国临床试验注册中心获得注册号:ChiCTR1900028032,并免除了知情同意书。
1.2 仪器与软件
治疗加速器采用瑞典医科达 Synergy 直线加速器,配备 Agility 治疗机头,共有 80 对多叶准直器(multi-leaf collimator,MLC)叶片。剂量测量采用美国 Sun Nuclear 公司螺旋形半导体探测器阵列 ArcCHECK,剂量分析采用其配套软件 SNC Patient(软件版本 6.7.4)。ArcCHECK 是由 1 386 个 SunPoint 半导体探头组成的圆柱形模体,半导体探头尺寸为 0.8 mm × 0.8 mm,灵敏体积为 0.019 mm3,呈柱形放射状螺旋分布,有效测量直径和长度均为 21 cm。每年对 ArcCHECK 半导体阵列进行一次矩阵校准,每次测量前进行剂量校准和本底校准。
1.3 评价指标
通过 SNC Patient 软件对每个 VMAT 计划的计算剂量分布和测量剂量分布进行 γ 分析。根据 TG-218 报告推荐,取最大剂量点对绝对剂量进行全局归一,剂量阈值设为 10%,采用 3%(剂量误差)/2 mm(距离误差)的标准计算每个 VMAT 计划的 γ 通过率。TG-218 报告建议:3%/2 mm 的 γ 通过率通用容差限值:≥ 95%;通用干预限值:≥ 90%。
1.4 SPC 技术分析方法
SPC 技术主要通过控制图(control charts)对过程进行实时监控,及时发现引起过程失控的异常波动,进而识别并消除引起异常波动的特殊原因(系统误差),将过程中的随机误差维持在可接受的范围内,使过程处于稳定的受控状态。基于 TG-218 报告中设置 IMRT/VMAT QA 过程容差限值和干预限值的流程,根据前 25 个受控的 VMAT QA 结果计算过程单值控制图的控制限值和干预限值。单值控制图的中心线(central line,CL)、控制上限(upper control limit,UCL)和控制下限(lower control limit,LCL)由以下公式计算得出:
![]() |
![]() |
![]() |
![]() |
![]() |
其中,X为单个 VMAT QA γ 通过率的值,MR 为移动极差(moving range),N为测量个数。控制限值即为容差限值。
干预限值由以下公式计算:
![]() |
![]() |
![]() |
其中,是干预限值作用范围,即干预上限(upper action limit,UAL)和干预下限(lower action limit,LAL)的差,
是过程方差,T为过程目标值;常数β是两个因子的组合,TG-218 报告中推荐取值为 6[3,10]。在使用 γ 通过率的情况下,T为 100%。由于 γ 通过率最大值为 100%,故容差限值和干预限值上限均为 100%。
另外,考虑到不同部位 VMAT 计划复杂性不同,通过以上相同方法得到相应部位的容差限值和干预限值,并持续监测不同部位患者个体化 VMAT QA 过程。对 VMAT QA 处于失败或处于临界值的结果根据 TG-218 报告给出的操作流程调查相关的失控原因,以改进质控过程。
1.5 统计分析
采用 MINITAB 19 软件进行统计学分析,计算不同部位患者个体化 VMAT QA 过程的容差限值和干预限值,并绘制不同部位的单值控制图。
2 结果
本研究持续监测 VMAT 计划共 287 例,并对病例数大于 25 的部位进行了分组统计,结果如表 1 所示。其中,病例数大于 25 的部位有脑部、头颈部、腹部和盆腔部,四个部位 VMAT 计划平均 γ 通过率均大于 97%,四组间平均 γ 通过率最大差异小于 1.2%。γ 通过率低于 95% 的比例,除盆腔部为 6.72% 外,其余三个部位均低于 5%。γ 通过率低于 90% 的比例,仅在盆腔部有 0.75%,其余三个部位均为 0。

根据每个部位前 25 例受控的调强验证结果计算该部位 VMAT QA 过程的容差限值和干预限值,结果如表 2 所示。在计算腹部容差下限时发现第 2、6 例受到系统误差影响(见图 1),剔除这 2 例后,重新根据前 25 例受控结果计算腹部相关限值。对于容差下限,脑部、头颈部和腹部相当,均大于 94%;盆腔部略低,为 92.97%。对于干预下限,脑部、头颈部和腹部均大于 92%,盆腔部较低为 90.29%。对于整个 VMAT QA 过程,容差下限和干预下限均低于各个部位,分别为 91.46% 和 89.52%。由于 γ 通过率最大值为 100%,所有部位的容差上限和干预上限均为 100%。

红色方块表示 γ 通过率低于容差下限,红色菱形表示 γ 通过率低于干预下限,绿色三角形表示纠正误差后的 γ 通过率
Figure1. Treatment site-specific individuals (X) charts of VMAT QA processesthe red squares indicate the gamma pass rate below the LCL, and red diamonds indicate the gamma pass rate below the LAL, and green triangles indicate the gamma pass rate after error correction

根据每个部位前 25 个受控的调强验证结果计算得到的容差限值和干预限值绘制单值控制图,持续监测该部位的 VMAT QA 过程(见图 1)。脑部所有 VMAT QA 验证结果均大于 94.56%,处于统计受控中;头颈部有 1 个 VMAT QA 验证结果低于容差下限,腹部和盆腔部均有 2 个 VMAT QA 验证结果低于容差下限。而且,盆腔部有 1 个 VMAT QA 验证结果低于干预下限。对于整个 VMAT QA 过程,控制图显示仅有 1 个点处于统计失控状态。根据 TG-218 报告给出的检查和评估 IMRT/VMAT QA 失败的操作流程探查 QA 失控原因,发现 4 例 VMAT QA 结果(头颈部第 44 例、腹部第 2、6 例和盆腔部第 46 例)是受摆位误差的影响(头脚方向均偏差 1 mm),1 例 VMAT QA 结果(盆腔部第 129 例)受 ArcCHECK 校准错误的影响(执行校准程序时输入了错误的校准剂量)。
3 讨论
本文基于 TG-218 报告,利用控制图持续监测了 287 例 VMAT 调强验证结果,为不同部位患者个体化 VMAT QA 过程设置了相应的容差限值和干预限值。研究发现,SPC 控制图在患者个体化 VMAT QA 监测过程中表现出良好的性能。本研究中,脑部、头颈部、腹部和盆腔部四个部位 VMAT 计划平均 γ 通过率均大于 97%,不同部位间平均 γ 通过率最大差异小于 1.2%。然而,通过 SPC 技术发现不同部位的容差限值和干预限值处于不同水平。其中,脑部、头颈部和腹部 VMAT QA 过程容差下限分别为 94.56%、94.68% 和 94.34%,与 TG-218 推荐的通用容差下限(95%)较为接近;盆腔部容差下限为 92.97%,低于通用容差下限。另外,脑部、头颈部和腹部 VMAT QA 过程干预下限均大于 92%,高于 TG-218 推荐的通用干预下限(90%);盆腔部干预下限(90.29%)则与通用干预下限相当。对于整个 VMAT QA 过程而言,容差下限为 91.46%,远低于通用容差下限;干预下限为 89.52%,与通用干预下限基本一致。结果提示,相比脑部、头颈部和腹部,盆腔部 VMAT 计划还需进一步改进。另外,不同部位容差限值和干预限值处于不同水平,可能与不同部位计划的复杂性存在差异有关[21-22],其他研究者也建议根据不同部位设置特定的限值更为合理[17,23]。
控制图作为一种非常经济高效的报警系统[9],有助于发现 VMAT 计划实施过程中的重大误差,减少临床事故的发生。对于调强验证结果低于干预限值的 VMAT 计划,物理师应当马上采取措施,调查原因并仔细评估该计划是否能在临床上使用。对于调强验证结果低于容差限值的 VMAT 计划,物理师应当调查过程变差原因,改进流程。本文根据 TG-218 报告中给出的检查和评估 IMRT/VMAT QA 失败或处于临界值的操作流程,调查了各部位 VMAT QA 失控的原因。基于各部位的容差限值,总共发现 5 例 VMAT QA 结果处于失控状态,其中 4 例(头颈部第 44 例、腹部第 2、6 例和盆腔部第 46 例)受到摆位误差影响(头脚方向均偏差 1 mm),1 例(盆腔部第 129 例)受到 ArcCHECK 校准错误的影响(执行校准程序时输入了错误的校准剂量)。因此,腹部相关限值的计算剔除了失控的第 2、6 例,这与 Sanghangthum 等[2]研究一致,剔除受特殊原因影响的失控例后,重新计算控制限值更为合理。5 例 VMAT QA 结果变差均受人为因素的影响,纠正人为误差后,所有失控的 VMAT QA 结果均在容差下限和干预下限内。另外,在测量过程中不可能完全消除摆位误差,而调强验证的结果受计划系统误差、MLC 误差、摆位和射野误差以及 QA 软件误差等的综合影响,通过 SPC 技术可将综合误差控制在可接受的范围内[3,24]。因此,对于同批次测量中存在摆位误差但仍在容差限值范围内的结果,不会影响相关临床流程及结果,因此无需修正。结果表明,本中心临床 VMAT QA 过程处于统计控制状态。然而,若采用 TG-218 报告推荐的通用容差限值调查 VMAT QA 失控原因,显示共有 18 例(占比 6.27%)处于失控状态。对各部位低于 TG-218 通用容差限值但高于该部位容差限值的 13 例 VMAT QA 结果进行进一步调查,并未发现可显著提高 γ 通过率的相关特殊原因。因此,采用 TG-218 报告通用容差限值监测整个 VMAT QA 过程,可能会增加 VMAT QA 过程失控的误报率,加大物理师调查过程失控原因的难度。
先前的研究将 SPC 技术应用到 IMRT/VMAT QA 过程中已经得到一些临床经验,这些研究中提到的控制下限(LCL)即为容差下限。Sanghangthum 等[2]利用 ArcCHECK,采用 3%/3 mm 的标准、10% 的剂量阈值,基于前 50 个受控点得到头颈部(鼻咽癌)VMAT QA 过程容差下限为 90.3%,IMRT QA 为 85.0%,而本研究中根据前 25 个受控点得到的头颈部 3%/2 mm 标准的 γ 通过率容差限值为 94.7%。Gagneur 等[11]利用 MapCHECK,采用 3%/3 mm 的标准、10% 的剂量阈值,基于前 25 个受控点得到 IMRT QA 过程容差下限为 93.7%。Lee 等[25]利用 MapCHECK 和 ArcCHECK,采用 3%/3 mm 的标准得到头颈部 IMRT QA 容差下限为 98.8%,前列腺 IMRT QA 容差下限为 98.1%,乳腺 IMRT QA 容差下限为 83.4%,乳腺 VMAT QA 容差下限为 85.4%。Fuangrod 等[13]利用 EPID,采用 4%/4 mm 的标准进行了 IMRT 和 VMAT 在体剂量验证,根据 90 个 IMRT 计划共 13 155 个射野计算得到 IMRT QA 容差下限为 62.5%,根据 10 个 VMAT 计划共 372 个射野计算得到 VMAT QA 容差下限为 70.0%。Bellec 等[14]利用 EBT3 胶片,采用 3%/1 mm 的标准分析了 CyberKnife 计划的 γ 通过率,根据 350 个 QA 结果计算得到容差下限为 88%。这些研究基于不同的工具、不同的标准采用 γ 通过率评估了 IMRT/VMAT QA 结果,然而得到的过程容差限值却无法进行比较。TG-218 报告针对该问题对使用 γ 通过率的情况给出了建议,对绝对剂量进行全局归一,采用 3%/2 mm 的标准,剂量阈值设为 10%[3]。本研究基于 TG-218 报告中推荐的 SPC 方法,得到了本中心不同部位 VMAT QA 过程的容差限值和干预限值。本中心 VMAT QA 过程干预限值与 TG-218 报告通用干预限值相当,而盆腔部容差下限低于通用容差限值,还需进一步改进流程。
4 结论
SPC 技术是一种监测 VMAT QA 过程的非常经济、有效的方法,有助于发现影响过程失控的因素,改进质控过程。TG-218 报告给出的基于流程的容差限值和干预限值的操作建议,有助于实现 IMRT/VMAT QA 实施过程的标准化,提高多中心之间的对比性。此外,采用通用容差限值会增加误报率,根据不同部位设置相应的容差限值更为合理。
利益冲突声明:本文全体作者均声明不存在利益冲突。
引言
当前,调强适形放疗(intensity-modulated radiation therapy,IMRT)和容积旋转调强放疗(volumetric modulated arc therapy,VMAT)采用非均匀射束强度,在提高靶区剂量的同时进一步减少周围危及器官的受照剂量,已经成为很多疾病外照射放疗采用的标准治疗方式[1-3]。相比三维适形放疗(three-dimensional conformal radiotherapy,3D-CRT),IMRT/VMAT 技术更复杂,需要更全面的质量保证(quality assurance,QA)措施,以实现精确放疗实施和保障患者安全[4-5]。其中,患者个体化 IMRT/VMAT QA 过程是临床调强放疗实施流程中重要的一部分[6-7]。治疗前剂量验证分析主要是通过评估计算剂量和测量剂量之间的偏差是否在临床可接受范围,对于超出范围的结果则进行调查以找出造成该结果的原因,并采取纠正措施[8]。然而,计算剂量与实施剂量之间差异的容差限值和干预限值在各中心之间尚缺乏统一的标准[3],且仅基于临床干预限值评估患者个体化 QA 结果无法有效改进质控过程。统计过程控制(statistical process control,SPC)作为一种功能强大的分析性决策工具,基于过程本身通过统计分析来监视过程行为,在过程变差前发出警报,实现过程稳定性并减少过程可变性[9],近十年来已逐渐用于放疗质控过程的监测[8,10-20]。美国医学物理家协会(American Association of Physicists in Medicine,AAPM)在先前研究的基础上对患者个体化 IMRT/VMAT QA 过程进行了详细概括,制定了推动其一致性发展的 TG-218 报告[3]。该报告推荐应用 SPC 技术设定基于流程的容差限值和干预限值,以监测整个 IMRT/VMAT QA 过程的受控状态,并推荐使用通用的容差限值和干预限值。然而,临床上不同部位放疗计划的复杂性是不同的[21-22],基于不同部位设定相应的容差限值和干预限值才更为合理。本研究基于 TG-218 报告,评估了 SPC 技术在监测患者个体化 VMAT QA 过程中的有效性,为不同部位 VMAT QA 过程设定适合的容差限值和干预限值,并根据控制图探查了 VMAT QA 过程失控的原因。
1 材料与方法
1.1 研究对象
选取四川大学华西医院放疗科 2019 年 1 月至 2019 年 11 月的 287 例 VMAT 计划进行调强验证。VMAT 计划纳入标准:① 治疗加速器采用同一台瑞典医科达 Synergy 直线加速器;② 计划设计采用瑞典 RaySearch 公司 Raystation 放疗计划系统(treatment planning system,TPS);③ 计划采用 6 MV 光子束均整(flattening filter,FF)模式,最大剂量率为 600 MU/min。该研究已通过华西医院伦理委员会审查,在中国临床试验注册中心获得注册号:ChiCTR1900028032,并免除了知情同意书。
1.2 仪器与软件
治疗加速器采用瑞典医科达 Synergy 直线加速器,配备 Agility 治疗机头,共有 80 对多叶准直器(multi-leaf collimator,MLC)叶片。剂量测量采用美国 Sun Nuclear 公司螺旋形半导体探测器阵列 ArcCHECK,剂量分析采用其配套软件 SNC Patient(软件版本 6.7.4)。ArcCHECK 是由 1 386 个 SunPoint 半导体探头组成的圆柱形模体,半导体探头尺寸为 0.8 mm × 0.8 mm,灵敏体积为 0.019 mm3,呈柱形放射状螺旋分布,有效测量直径和长度均为 21 cm。每年对 ArcCHECK 半导体阵列进行一次矩阵校准,每次测量前进行剂量校准和本底校准。
1.3 评价指标
通过 SNC Patient 软件对每个 VMAT 计划的计算剂量分布和测量剂量分布进行 γ 分析。根据 TG-218 报告推荐,取最大剂量点对绝对剂量进行全局归一,剂量阈值设为 10%,采用 3%(剂量误差)/2 mm(距离误差)的标准计算每个 VMAT 计划的 γ 通过率。TG-218 报告建议:3%/2 mm 的 γ 通过率通用容差限值:≥ 95%;通用干预限值:≥ 90%。
1.4 SPC 技术分析方法
SPC 技术主要通过控制图(control charts)对过程进行实时监控,及时发现引起过程失控的异常波动,进而识别并消除引起异常波动的特殊原因(系统误差),将过程中的随机误差维持在可接受的范围内,使过程处于稳定的受控状态。基于 TG-218 报告中设置 IMRT/VMAT QA 过程容差限值和干预限值的流程,根据前 25 个受控的 VMAT QA 结果计算过程单值控制图的控制限值和干预限值。单值控制图的中心线(central line,CL)、控制上限(upper control limit,UCL)和控制下限(lower control limit,LCL)由以下公式计算得出:
![]() |
![]() |
![]() |
![]() |
![]() |
其中,X为单个 VMAT QA γ 通过率的值,MR 为移动极差(moving range),N为测量个数。控制限值即为容差限值。
干预限值由以下公式计算:
![]() |
![]() |
![]() |
其中,是干预限值作用范围,即干预上限(upper action limit,UAL)和干预下限(lower action limit,LAL)的差,
是过程方差,T为过程目标值;常数β是两个因子的组合,TG-218 报告中推荐取值为 6[3,10]。在使用 γ 通过率的情况下,T为 100%。由于 γ 通过率最大值为 100%,故容差限值和干预限值上限均为 100%。
另外,考虑到不同部位 VMAT 计划复杂性不同,通过以上相同方法得到相应部位的容差限值和干预限值,并持续监测不同部位患者个体化 VMAT QA 过程。对 VMAT QA 处于失败或处于临界值的结果根据 TG-218 报告给出的操作流程调查相关的失控原因,以改进质控过程。
1.5 统计分析
采用 MINITAB 19 软件进行统计学分析,计算不同部位患者个体化 VMAT QA 过程的容差限值和干预限值,并绘制不同部位的单值控制图。
2 结果
本研究持续监测 VMAT 计划共 287 例,并对病例数大于 25 的部位进行了分组统计,结果如表 1 所示。其中,病例数大于 25 的部位有脑部、头颈部、腹部和盆腔部,四个部位 VMAT 计划平均 γ 通过率均大于 97%,四组间平均 γ 通过率最大差异小于 1.2%。γ 通过率低于 95% 的比例,除盆腔部为 6.72% 外,其余三个部位均低于 5%。γ 通过率低于 90% 的比例,仅在盆腔部有 0.75%,其余三个部位均为 0。

根据每个部位前 25 例受控的调强验证结果计算该部位 VMAT QA 过程的容差限值和干预限值,结果如表 2 所示。在计算腹部容差下限时发现第 2、6 例受到系统误差影响(见图 1),剔除这 2 例后,重新根据前 25 例受控结果计算腹部相关限值。对于容差下限,脑部、头颈部和腹部相当,均大于 94%;盆腔部略低,为 92.97%。对于干预下限,脑部、头颈部和腹部均大于 92%,盆腔部较低为 90.29%。对于整个 VMAT QA 过程,容差下限和干预下限均低于各个部位,分别为 91.46% 和 89.52%。由于 γ 通过率最大值为 100%,所有部位的容差上限和干预上限均为 100%。

红色方块表示 γ 通过率低于容差下限,红色菱形表示 γ 通过率低于干预下限,绿色三角形表示纠正误差后的 γ 通过率
Figure1. Treatment site-specific individuals (X) charts of VMAT QA processesthe red squares indicate the gamma pass rate below the LCL, and red diamonds indicate the gamma pass rate below the LAL, and green triangles indicate the gamma pass rate after error correction

根据每个部位前 25 个受控的调强验证结果计算得到的容差限值和干预限值绘制单值控制图,持续监测该部位的 VMAT QA 过程(见图 1)。脑部所有 VMAT QA 验证结果均大于 94.56%,处于统计受控中;头颈部有 1 个 VMAT QA 验证结果低于容差下限,腹部和盆腔部均有 2 个 VMAT QA 验证结果低于容差下限。而且,盆腔部有 1 个 VMAT QA 验证结果低于干预下限。对于整个 VMAT QA 过程,控制图显示仅有 1 个点处于统计失控状态。根据 TG-218 报告给出的检查和评估 IMRT/VMAT QA 失败的操作流程探查 QA 失控原因,发现 4 例 VMAT QA 结果(头颈部第 44 例、腹部第 2、6 例和盆腔部第 46 例)是受摆位误差的影响(头脚方向均偏差 1 mm),1 例 VMAT QA 结果(盆腔部第 129 例)受 ArcCHECK 校准错误的影响(执行校准程序时输入了错误的校准剂量)。
3 讨论
本文基于 TG-218 报告,利用控制图持续监测了 287 例 VMAT 调强验证结果,为不同部位患者个体化 VMAT QA 过程设置了相应的容差限值和干预限值。研究发现,SPC 控制图在患者个体化 VMAT QA 监测过程中表现出良好的性能。本研究中,脑部、头颈部、腹部和盆腔部四个部位 VMAT 计划平均 γ 通过率均大于 97%,不同部位间平均 γ 通过率最大差异小于 1.2%。然而,通过 SPC 技术发现不同部位的容差限值和干预限值处于不同水平。其中,脑部、头颈部和腹部 VMAT QA 过程容差下限分别为 94.56%、94.68% 和 94.34%,与 TG-218 推荐的通用容差下限(95%)较为接近;盆腔部容差下限为 92.97%,低于通用容差下限。另外,脑部、头颈部和腹部 VMAT QA 过程干预下限均大于 92%,高于 TG-218 推荐的通用干预下限(90%);盆腔部干预下限(90.29%)则与通用干预下限相当。对于整个 VMAT QA 过程而言,容差下限为 91.46%,远低于通用容差下限;干预下限为 89.52%,与通用干预下限基本一致。结果提示,相比脑部、头颈部和腹部,盆腔部 VMAT 计划还需进一步改进。另外,不同部位容差限值和干预限值处于不同水平,可能与不同部位计划的复杂性存在差异有关[21-22],其他研究者也建议根据不同部位设置特定的限值更为合理[17,23]。
控制图作为一种非常经济高效的报警系统[9],有助于发现 VMAT 计划实施过程中的重大误差,减少临床事故的发生。对于调强验证结果低于干预限值的 VMAT 计划,物理师应当马上采取措施,调查原因并仔细评估该计划是否能在临床上使用。对于调强验证结果低于容差限值的 VMAT 计划,物理师应当调查过程变差原因,改进流程。本文根据 TG-218 报告中给出的检查和评估 IMRT/VMAT QA 失败或处于临界值的操作流程,调查了各部位 VMAT QA 失控的原因。基于各部位的容差限值,总共发现 5 例 VMAT QA 结果处于失控状态,其中 4 例(头颈部第 44 例、腹部第 2、6 例和盆腔部第 46 例)受到摆位误差影响(头脚方向均偏差 1 mm),1 例(盆腔部第 129 例)受到 ArcCHECK 校准错误的影响(执行校准程序时输入了错误的校准剂量)。因此,腹部相关限值的计算剔除了失控的第 2、6 例,这与 Sanghangthum 等[2]研究一致,剔除受特殊原因影响的失控例后,重新计算控制限值更为合理。5 例 VMAT QA 结果变差均受人为因素的影响,纠正人为误差后,所有失控的 VMAT QA 结果均在容差下限和干预下限内。另外,在测量过程中不可能完全消除摆位误差,而调强验证的结果受计划系统误差、MLC 误差、摆位和射野误差以及 QA 软件误差等的综合影响,通过 SPC 技术可将综合误差控制在可接受的范围内[3,24]。因此,对于同批次测量中存在摆位误差但仍在容差限值范围内的结果,不会影响相关临床流程及结果,因此无需修正。结果表明,本中心临床 VMAT QA 过程处于统计控制状态。然而,若采用 TG-218 报告推荐的通用容差限值调查 VMAT QA 失控原因,显示共有 18 例(占比 6.27%)处于失控状态。对各部位低于 TG-218 通用容差限值但高于该部位容差限值的 13 例 VMAT QA 结果进行进一步调查,并未发现可显著提高 γ 通过率的相关特殊原因。因此,采用 TG-218 报告通用容差限值监测整个 VMAT QA 过程,可能会增加 VMAT QA 过程失控的误报率,加大物理师调查过程失控原因的难度。
先前的研究将 SPC 技术应用到 IMRT/VMAT QA 过程中已经得到一些临床经验,这些研究中提到的控制下限(LCL)即为容差下限。Sanghangthum 等[2]利用 ArcCHECK,采用 3%/3 mm 的标准、10% 的剂量阈值,基于前 50 个受控点得到头颈部(鼻咽癌)VMAT QA 过程容差下限为 90.3%,IMRT QA 为 85.0%,而本研究中根据前 25 个受控点得到的头颈部 3%/2 mm 标准的 γ 通过率容差限值为 94.7%。Gagneur 等[11]利用 MapCHECK,采用 3%/3 mm 的标准、10% 的剂量阈值,基于前 25 个受控点得到 IMRT QA 过程容差下限为 93.7%。Lee 等[25]利用 MapCHECK 和 ArcCHECK,采用 3%/3 mm 的标准得到头颈部 IMRT QA 容差下限为 98.8%,前列腺 IMRT QA 容差下限为 98.1%,乳腺 IMRT QA 容差下限为 83.4%,乳腺 VMAT QA 容差下限为 85.4%。Fuangrod 等[13]利用 EPID,采用 4%/4 mm 的标准进行了 IMRT 和 VMAT 在体剂量验证,根据 90 个 IMRT 计划共 13 155 个射野计算得到 IMRT QA 容差下限为 62.5%,根据 10 个 VMAT 计划共 372 个射野计算得到 VMAT QA 容差下限为 70.0%。Bellec 等[14]利用 EBT3 胶片,采用 3%/1 mm 的标准分析了 CyberKnife 计划的 γ 通过率,根据 350 个 QA 结果计算得到容差下限为 88%。这些研究基于不同的工具、不同的标准采用 γ 通过率评估了 IMRT/VMAT QA 结果,然而得到的过程容差限值却无法进行比较。TG-218 报告针对该问题对使用 γ 通过率的情况给出了建议,对绝对剂量进行全局归一,采用 3%/2 mm 的标准,剂量阈值设为 10%[3]。本研究基于 TG-218 报告中推荐的 SPC 方法,得到了本中心不同部位 VMAT QA 过程的容差限值和干预限值。本中心 VMAT QA 过程干预限值与 TG-218 报告通用干预限值相当,而盆腔部容差下限低于通用容差限值,还需进一步改进流程。
4 结论
SPC 技术是一种监测 VMAT QA 过程的非常经济、有效的方法,有助于发现影响过程失控的因素,改进质控过程。TG-218 报告给出的基于流程的容差限值和干预限值的操作建议,有助于实现 IMRT/VMAT QA 实施过程的标准化,提高多中心之间的对比性。此外,采用通用容差限值会增加误报率,根据不同部位设置相应的容差限值更为合理。
利益冲突声明:本文全体作者均声明不存在利益冲突。