心脏骤停(SCA)是一种致命性心律失常,会对人体生命健康造成严重威胁。基于目前临床记录的心脏猝死(SCD)心电图(ECG)数据极其有限,本文提出了一种基于深度迁移学习的心脏骤停早期预估及分类算法。本文算法在有限的ECG数据训练下,通过提取心脏骤停发作前的心率变异性特征,并送入轻量级卷积神经网络模型进行预训练和微调训练两个阶段的深度迁移学习,实现神经网络模型对心脏骤停高危ECG信号的早期分类识别和预估。基于国际公开ECG数据库中20个心脏猝死患者和18个窦性心律患者的16 788条30 s心率特征片段,本文采用十折交叉量化验证的算法性能评估实验结果显示,对心脏骤停发作前30 min预测的平均准确度(Acc)、灵敏度(Sen)和特异度(Spe)分别为91.79%、87.00%和96.63%;而对不同患者的平均预估准确度达到96.58%。相较于已报道的传统机器学习算法,本文方法不仅有助于解决深度学习模型对大量训练数据的要求,而且能够更加早期、准确地检测和识别心脏骤停发作前的高危ECG征兆。
引用本文: 茶兴增, 张月, 张翼飞, 苏叶, 赖大坤. 基于两阶卷积神经网络训练有限心电数据的心脏骤停早期分类识别算法. 生物医学工程学杂志, 2024, 41(4): 692-699. doi: 10.7507/1001-5515.202306066 复制
0 引言
众所周知,室性心动过速(ventricular tachycardia,VT)、心室颤动(ventricular fibrillation,VF)[1-2]以及严重的缓慢性心律失常[3]等异常情况均有可能导致心脏骤停(sudden cardiac arrest,SCA)[4-5],一旦发作将严重威胁患者的生命安全。据报道,美国每年心脏骤停的患者大约有35万[6],且大多数心脏骤停患者出院时的存活率低于10%[7]。据相关研究表明,超过80%的患者在心脏骤停的前几分钟至数小时内均会发生生命体征恶化。因此,能够尽早判断患者是否遭受心脏骤停的威胁,是一项具有挑战性的研究课题[8]。此外,心脏骤停发作时,抢救患者的黄金时间仅为3 min[9],但目前往往缺乏及时有效的数据记录条件,致使此类生命体征的数据很难被记录下来,导致数据极其有限,不利于开展早期风险预警研究。因此,针对患有严重室性心律失常的患者,在其发作时及时记录重要数据并进行干预对于提高患者的生存率至关重要。
近几十年,快速反应系统(rapid response systems,RRSs)发展迅速,大致分为长时程、短时程两大类,已用于临床上心脏骤停的早期预测。通常,通过定期测量患者生命体征,如心率、血压、体温等,再基于多参数长时程快速反应系统对其进行计算[10],可以发现潜在心脏骤停的高危患者。有研究报道了一种新的基于深度学习的早期预警评分算法[11],与修正型早期预警评分算法相比,该算法预测性能较佳,预测区间为0.5~24 h,但终因其预测时长超过0.5 h,无法实现短时程预测,故不适于临床应用。
近期,基于单一心率特征参数的短时程快速反应系统受到了临床医生和研究人员的广泛关注。许多现有的研究将基于心电图(electrocardiogram,ECG)的心率特征(heart rate features,HRFs)与最新开发的机器学习技术结合起来,以评估恶性室性心律失常的风险,并识别可能发生的心脏骤停。相关研究一方面集中于通过提取不同的心率特征来提高心脏骤停识别和早期预测算法的性能,包括时域特征、频域特征、时域和频域特征以及非线性特征[12-15];另一方面,还探索了不同机器学习方法,包括k最近邻(k-nearest neighbor,KNN)、决策树(decision tree,DT)、朴素贝叶斯(naive Bayes,NB)和支持向量机(support vector machine,SVM)等[16-17]。然而,传统机器学习方法需要研究人员根据自身经验人工提取心率特征,这不可避免地导致特征提取的主观性,从而影响预测方法的灵敏度和特异度,以至于出现较多的假阳性或假阴性。近年来,Taye等[18]提出了一种使用一维卷积神经网络(one-dimensional convolutional neural network,1D-CNN)的深度学习预测方法,实现了特征提取的自动化,克服了传统机器学习方法中ECG特征提取的主观性和经验化。然而,尽管该方法无需人工数据清洗,也无需关于特征提取和预测的明确人工定义,但由于深度学习是基于数据驱动的卷积神经模型,当前心脏骤停ECG数据十分有限,依旧无法充分地对模型进行海量训练和深度迭代优化,这较大程度制约了心脏骤停的早期预测时间和预测准确度[18]。此外,即使在性能达到相对较高标准的情况下,采用非常短的预测时间窗口也难以在临床环境中应用,例如已报道的心脏猝死(sudden cardiac death,SCD)发作前1、4、6、12、13、30 min的时间窗口[19-23]。
综上所述,最优的单参数短时程快速反应系统需同时满足两个标准:高预测性能和长预测时间窗。由此,本文提出了一种深度迁移学习预测模型,旨在实现心脏骤停的早期风险识别。该模型不仅同时满足上述两个条件,而且使用了有限的数据集进行训练。本文模型基于短时程快速反应系统数据对有限高危ECG数据进行深层特征提取和分析,进而探索实现两阶神经网络模型对心脏猝死高危ECG数据的早期分类识别和预估。通过本文研究,或将有助于临床心脏患者的诊疗实践,特别是将其嵌入至可穿戴设备中,用于医院或家庭里具有高危潜在心脏病患者的日常监护和高危征兆的早期预警,将具有非常重要的实践价值。
1 材料和方法
1.1 数据来源
本研究基于单导联ECG信号记录,分别来自两个公开数据库[24]:由麻省理工学院与贝斯以色列医院(Massachusetts Institute of Technology and Beth Israel Hospital,MIT-BIH)联合构建的心源性猝死动态ECG数据库(sudden cardiac death holter database,SCDDB),其包括18名潜在的窦性心律患者(4名间歇起搏)、1名持续起搏患者和4名房颤患者;其中由于编号为40、42和49的3个数据记录没发生心脏骤停,因此本研究只采用了20个数据记录。此外本研究还采用正常窦性心律数据库(normal sinus rhythm database,NSRDB)里包括18份长期ECG信号记录的数据。
在此基础上,本文对上述数据分组形成了两个数据集:① 高风险组(high-risk group),包括来自SCDDB的20个ECG数据记录;② 正常组(normal group),包括来自NSRDB的18个ECG数据记录。正常组中有13名女性和5名男性,高风险组中有7名女性和10名男性,具体数据如表1所示。

高风险组中,数据编号如表2所示,每条数据记录都采集了心脏猝死发作前4.5 h的信号,但编号为37、41、46、48、52号数据记录心脏猝死发作前持续时间不足4.5 h,因此只采集了发作前30 min的信号进行分析。由于SCDDB中编号为40、42、49号数据记录无心脏猝死发作,因此这3条记录不包括在研究范围内。正常组中,将每条数据总时长为233 min的记录作为分析对象。此外,每个组别都生成了两个数据集,分别是由大量标记的ECG数据组成的源域数据(source data)集和由少量ECG数据组成的目标域数据(target data)集,具体数据如表2所示。为了平衡患者和健康受试者的数据样本,从源域数据集和目标域数据集的正常组中收集的“正常”数据量,分别使其与从源域数据集和目标域数据集的高风险组中收集的“高风险”数据量相同。具体而言,高风险组的源域心率特征段是在每条数据记录心脏猝死发作前4.5 h的ECG信号的前4 h中获得的(即表2中源域数据的时间)。高风险组的目标域心率特征段来源于每条数据记录心脏猝死发作前4.5 h信号中的最后30 min。而正常组的源域心率特征片段来自每条记录的233 min信号中的前200 min(表2中源域数据的时间),正常组的目标域心率特征片段来源于每条记录的233 min信号中的最后33 min。

1.2 心脏骤停早期分类识别算法
如图1所示,本文提出的基于深度迁移学习的心脏猝死预测方法包括3个步骤:① 心率特征提取:对输入信号进行预处理,即去除噪声并将连续的单导联ECG信号划分为非重叠的片段,并对每个ECG信号片段提取3个不同的心率特征片段,包括RR间期序列、两个相邻RR间期之间的时间差(dRR间期)序列和心率振荡起点(turbulence onset,TO)序列。② 两阶深度迁移学习模型:设计一个轻量级卷积神经网络作为深度迁移学习方法的基本模型,并利用上述两个区域的心率特征片段连续执行该模型的预训练和微调训练两个阶段。③ 心脏骤停预测:使用具有优化超参数训练的深度迁移学习网络,将心率特征片段分类为“正常”或“高风险”。

1.2.1 心率特征提取
心率变异(heart rate variability,HRV)和心率紊乱(heart rate turbulence,HRT)是许多生理因素对正常心率调节的可靠反映,它们可以作为具有恶性室性心律失常、慢性心力衰竭和心源性猝死风险患者的重要评估指标[18, 25]。如图1所示,本研究首先通过潘—汤普金斯(Pan-Tompkins)算法对ECG信号进行R波检测,进而提取了3个特征[26]。RR间期是两个相邻R波之间的时间差,可通过检测到的R波来确定RR间期的一系列位置,如式(1)所示:
![]() |
其中,RR(∙)代表第n个RR间期,R(∙)代表第n个R波,n代表R波的编号(n = 1, 2, ···)。此外,dRR间期的计算,如式(2)所示:
![]() |
其中,dRR(∙)代表第n个dRR间期。通常,TO被定义为心脏搏动后出现的一种短暂性的心率加速和减慢的现象,通常发生在R波峰之后的短暂时间内。在本研究中,TO的参数计算如式(3)所示:
![]() |
其中,TO(∙)代表第n个TO序列。每个TO的计算应用于所有心博而不仅限于早搏。
1.2.2 两阶深度迁移学习模型
基于1.2.1小节所提取的心率特征,采用卷积神经网络构成两阶深度迁移学习神经网络模型,如图1所示。其中,训练阶段包括预训练和微调训练两个阶段,如图2所示。

首先,在预训练阶段,为了从导入的源域数据心率特征片段中提取ECG信号的深度特征,需要构建卷积神经网络对网络输入层进行卷积操作。然而,卷积操作可能会导致过拟合的问题,因此需要采取一些措施来减少神经元数量。于是,在卷积层后添加了最大池化层,并将步长设置为2,以有效减少神经元的数量,从而避免过拟合的问题。卷积层和最大池化层的组合可将神经元的数量从80 × 32变为10 × 128。在多次特征提取之后,添加两个全连接层用于实现分类任务,生成经预训练的卷积神经网络模型,网络结构细节如表3所示。本文属于二分类问题,因此采用归一化指数函数(softmax)输出分类结果。

其次,在微调训练阶段,主要包括以下过程:① 冻结卷积层和池化层的所有参数:在微调训练中,卷积层和最大池化层中的参数已由预训练的模型训练所得,因此应将这些参数冻结,不随目标数据的训练而改变,以保留预训练模型的特征提取能力,避免过拟合;② 替换全连接层:由于源域数据和目标域数据之间存在一定的差异,需要用新的全连接层替换预训练模型中的全连接层,由此可根据目标任务更好地训练模型,并可减少源域数据和目标域数据之间的差异对模型性能的影响;③ 导入微调训练目标域数据训练新的全连接层:使用目标域数据作为输入,训练新的全连接层,形成基于目标任务的模型参数,从而提高模型的泛化能力和性能。
上述预训练阶段中,本研究在输入层使用了14 400个30 s的心率特征片段,其中7 200个来自高风险组,7 200个来自正常组;而在微调训练阶段中,共使用2 388个30 s的心率特征片段作为模型的输入数据,其中包括1 200个来自高风险组和1 188个来自正常组。
1.2.3 模型的性能评估
如表3所示,通过两个全连接层输出心脏猝死高危ECG数据早期分类识别和预估结果。本文使用了十折交叉验证方法,对源域数据和目标域数据分别进行了预训练和微调训练两个阶段的训练。在每个训练阶段中,本研究将提取到的心率特征片段随机分成10个子集,并将其用于训练、验证和测试。具体而言,在预训练阶段,源域数据的90%用于训练,剩余的10%用于验证;在微调训练阶段,目标域数据的90%用于训练(其中90%用于训练,10%用于验证),而剩余的10%用于测试,如图3所示。本文采用灵敏度(sensitivity,Sen)、特异度(specificity,Spe)和准确度(accuracy,Acc)3个指标来评估所提出的深度迁移学习方法预测心脏骤停的性能,相关计算公式如式(4)~式(6)所示:

![]() |
![]() |
![]() |
其中,真阳性(true positive,TP)是指被认定为“高风险”片段的“高风险”片段数量,假阴性(false negative,FN)指识别为“正常”片段的“高风险”片段的数量,真阴性(true negative,TN)表示识别为“正常”片段的“正常”片段的数量,假阳性(false positive,FP)表示识别为“高风险”片段的“正常”片段的数量。最终,通过十折交叉验证方法评估模型性能,以此获得最佳的深度迁移学习模型。
2 结果
本文提出的深度迁移学习模型均在一台配置了内存为16 GB的中央处理器(central processing unit,CPU)(i5-6300HQ,Intel(R) Core(TM),美国)和2 GB内存的图形处理器(graphics processing unit,GPU)(GTX-960,NVIDIA,美国)的计算机上实现,并且都基于一个用于构建和训练神经网络模型的开源深度学习库Keras 2.2.4(François Chollet,法国)。最终,在微调训练阶段,本文所提出的方法在平均准确度、灵敏度和特异度方面的评估性能分别为91.79%、87.00%和96.63%。
如图4所示,不同时间窗口下心脏猝死发作前的识别模型平均准确度为91.04%。此外,在心脏骤停发生前30 min内,随着每个时间窗口长度依次递增1 min,模型准确度会略微下降。

如图5所示,不同记录(每个患者为一个记录)的识别模型结果都基于相应患者的30 min时间窗口的目标域数据测试所得。横坐标表示高风险组中不同患者的记录编号,纵坐标表示每个患者30 min时间窗口对应的准确度。除了记录38和52外,所有记录的准确度均超过80%。具体而言,17名患者的准确度高于90%,平均准确度为96.58%。

3 讨论
3.1 本研究的主要贡献
过去几年,深度学习凭借其优异的性能成为大多数人工智能方法应用中的首选框架。与传统的机器学习方法(如DT、SVM和KNN)相比,本文提出的深度迁移学习方法具有以下两个优点:① 本文提出的深度迁移学习模型只需要输入RR间期序列、dRR间期序列和TO序列这3个简单的心率特征,无需手动提取复杂的HRV特征,因此在预训练阶段和微调训练阶段,每折数据分别只需花费166.798 0 s和13.335 9 s,而在测试过程中,每折(包括239个片段)仅需1.571 2 s。具体而言,可在0.006 6 s内基于一个30 s心率特征片段给出预测结果。② 本文提出的基于深度迁移学习的心脏骤停预测方法,成功解决了来自高危患者的ECG数据有限的问题。
3.2 与同领域其他研究之间的比较
如表4所示,在相同的数据集SCDDB和NSRDB上,本研究分别从材料、方法和最佳性能3个方面,详细对比了本文所提早期分类识别和预测模型与其他已报道的基于机器学习的模型之间的预测性能。结果表明,本研究的方法可在心脏猝死发生前30 min发出早期预警,满足临床上及时预测心脏猝死的要求。与之前在同一数据集上的相关工作相比,本研究的深度迁移学习方法有4个优点:① 使用简单的心率特征片段作为模型的输入,无需进行复杂的特征提取;② 据本研究所知,这是首次尝试使用深度迁移学习模型进行数据量稀少的心脏骤停风险预测;③ 与之前基于机器学习模型的研究相比,本研究的模型可以使用数据量有限的简单心率特征片段提前30 min预测心脏骤停;④ 本研究提出的深度迁移学习模型在实际测试结果中对高风险患者具有较高的识别率,同时确保了较少的误判。

3.3 本研究存在的局限
当前,心脏骤停的高危ECG信号数据集极为有限,而数据驱动的人工智能模型又需要大量数据进行训练,导致两者之间形成矛盾。尽管本文提出的两阶深度迁移学习模型提供了一种解决该矛盾的有效途径,且相比于已有研究在心脏骤停高危ECG信号征兆的早期预估性能方面有了较大的提升,但仍存留一些问题以待进一步解决。首先,该模型仅在开源数据库中进行了测试,缺少临床数据验证,本课题组下一步将基于临床数据集实现对该模型的训练和验证,以提高其准确度。其次,预训练和微调训练通常需要较长时间,为了进一步缩短训练时间,下一步将采用更高性能的计算机实现网络模型的训练,以此提升模型实时性。综上所述,本课题组将继续深入研究,以便进一步提高该模型的心脏骤停预测准确度并推进其临床应用。
4 结论
本研究提出了一种基于有限ECG数据实现两阶深度迁移学习神经网络模型训练的心脏骤停早期分类识别方法,用于对致命性心脏猝死高危ECG信号的早期分类识别和预估。该方法为当前基于数据驱动的神经网络模型受限于在实际应用中训练数据极为有限的情况,提供了一套可行的解决思路。特别是在临床偶发的恶性心脏骤停可记录的完整ECG数据极其有限的现实情况下,本文方法能确保深度学习模型的完整训练,并充分发挥该模型强大的深层特征提取能力,提高了数据分类及心脏骤停早期预估的准确度。与已报道方法相比,本文提出的方法在推动更好地解决上述难题的同时,在心脏猝死高危ECG信号的早期分类识别和预估方面也实现了较高的准确度。下一步课题组将推动该方法在临床实践中的应用,特别是将其嵌入至可穿戴设备中,为医院或院外环境下的心脏骤停潜在患者,提供一套可靠的高质量日常监护及高危征兆的早期预警方法。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:茶兴增主要负责平台搭建、算法程序设计、数据分析以及论文撰写;张翼飞主要负责实验流程、数据记录与分析;张月和苏叶主要负责协调沟通和提供实验技术指导;赖大坤主要负责提供数据分析指导和论文审阅修订。
0 引言
众所周知,室性心动过速(ventricular tachycardia,VT)、心室颤动(ventricular fibrillation,VF)[1-2]以及严重的缓慢性心律失常[3]等异常情况均有可能导致心脏骤停(sudden cardiac arrest,SCA)[4-5],一旦发作将严重威胁患者的生命安全。据报道,美国每年心脏骤停的患者大约有35万[6],且大多数心脏骤停患者出院时的存活率低于10%[7]。据相关研究表明,超过80%的患者在心脏骤停的前几分钟至数小时内均会发生生命体征恶化。因此,能够尽早判断患者是否遭受心脏骤停的威胁,是一项具有挑战性的研究课题[8]。此外,心脏骤停发作时,抢救患者的黄金时间仅为3 min[9],但目前往往缺乏及时有效的数据记录条件,致使此类生命体征的数据很难被记录下来,导致数据极其有限,不利于开展早期风险预警研究。因此,针对患有严重室性心律失常的患者,在其发作时及时记录重要数据并进行干预对于提高患者的生存率至关重要。
近几十年,快速反应系统(rapid response systems,RRSs)发展迅速,大致分为长时程、短时程两大类,已用于临床上心脏骤停的早期预测。通常,通过定期测量患者生命体征,如心率、血压、体温等,再基于多参数长时程快速反应系统对其进行计算[10],可以发现潜在心脏骤停的高危患者。有研究报道了一种新的基于深度学习的早期预警评分算法[11],与修正型早期预警评分算法相比,该算法预测性能较佳,预测区间为0.5~24 h,但终因其预测时长超过0.5 h,无法实现短时程预测,故不适于临床应用。
近期,基于单一心率特征参数的短时程快速反应系统受到了临床医生和研究人员的广泛关注。许多现有的研究将基于心电图(electrocardiogram,ECG)的心率特征(heart rate features,HRFs)与最新开发的机器学习技术结合起来,以评估恶性室性心律失常的风险,并识别可能发生的心脏骤停。相关研究一方面集中于通过提取不同的心率特征来提高心脏骤停识别和早期预测算法的性能,包括时域特征、频域特征、时域和频域特征以及非线性特征[12-15];另一方面,还探索了不同机器学习方法,包括k最近邻(k-nearest neighbor,KNN)、决策树(decision tree,DT)、朴素贝叶斯(naive Bayes,NB)和支持向量机(support vector machine,SVM)等[16-17]。然而,传统机器学习方法需要研究人员根据自身经验人工提取心率特征,这不可避免地导致特征提取的主观性,从而影响预测方法的灵敏度和特异度,以至于出现较多的假阳性或假阴性。近年来,Taye等[18]提出了一种使用一维卷积神经网络(one-dimensional convolutional neural network,1D-CNN)的深度学习预测方法,实现了特征提取的自动化,克服了传统机器学习方法中ECG特征提取的主观性和经验化。然而,尽管该方法无需人工数据清洗,也无需关于特征提取和预测的明确人工定义,但由于深度学习是基于数据驱动的卷积神经模型,当前心脏骤停ECG数据十分有限,依旧无法充分地对模型进行海量训练和深度迭代优化,这较大程度制约了心脏骤停的早期预测时间和预测准确度[18]。此外,即使在性能达到相对较高标准的情况下,采用非常短的预测时间窗口也难以在临床环境中应用,例如已报道的心脏猝死(sudden cardiac death,SCD)发作前1、4、6、12、13、30 min的时间窗口[19-23]。
综上所述,最优的单参数短时程快速反应系统需同时满足两个标准:高预测性能和长预测时间窗。由此,本文提出了一种深度迁移学习预测模型,旨在实现心脏骤停的早期风险识别。该模型不仅同时满足上述两个条件,而且使用了有限的数据集进行训练。本文模型基于短时程快速反应系统数据对有限高危ECG数据进行深层特征提取和分析,进而探索实现两阶神经网络模型对心脏猝死高危ECG数据的早期分类识别和预估。通过本文研究,或将有助于临床心脏患者的诊疗实践,特别是将其嵌入至可穿戴设备中,用于医院或家庭里具有高危潜在心脏病患者的日常监护和高危征兆的早期预警,将具有非常重要的实践价值。
1 材料和方法
1.1 数据来源
本研究基于单导联ECG信号记录,分别来自两个公开数据库[24]:由麻省理工学院与贝斯以色列医院(Massachusetts Institute of Technology and Beth Israel Hospital,MIT-BIH)联合构建的心源性猝死动态ECG数据库(sudden cardiac death holter database,SCDDB),其包括18名潜在的窦性心律患者(4名间歇起搏)、1名持续起搏患者和4名房颤患者;其中由于编号为40、42和49的3个数据记录没发生心脏骤停,因此本研究只采用了20个数据记录。此外本研究还采用正常窦性心律数据库(normal sinus rhythm database,NSRDB)里包括18份长期ECG信号记录的数据。
在此基础上,本文对上述数据分组形成了两个数据集:① 高风险组(high-risk group),包括来自SCDDB的20个ECG数据记录;② 正常组(normal group),包括来自NSRDB的18个ECG数据记录。正常组中有13名女性和5名男性,高风险组中有7名女性和10名男性,具体数据如表1所示。

高风险组中,数据编号如表2所示,每条数据记录都采集了心脏猝死发作前4.5 h的信号,但编号为37、41、46、48、52号数据记录心脏猝死发作前持续时间不足4.5 h,因此只采集了发作前30 min的信号进行分析。由于SCDDB中编号为40、42、49号数据记录无心脏猝死发作,因此这3条记录不包括在研究范围内。正常组中,将每条数据总时长为233 min的记录作为分析对象。此外,每个组别都生成了两个数据集,分别是由大量标记的ECG数据组成的源域数据(source data)集和由少量ECG数据组成的目标域数据(target data)集,具体数据如表2所示。为了平衡患者和健康受试者的数据样本,从源域数据集和目标域数据集的正常组中收集的“正常”数据量,分别使其与从源域数据集和目标域数据集的高风险组中收集的“高风险”数据量相同。具体而言,高风险组的源域心率特征段是在每条数据记录心脏猝死发作前4.5 h的ECG信号的前4 h中获得的(即表2中源域数据的时间)。高风险组的目标域心率特征段来源于每条数据记录心脏猝死发作前4.5 h信号中的最后30 min。而正常组的源域心率特征片段来自每条记录的233 min信号中的前200 min(表2中源域数据的时间),正常组的目标域心率特征片段来源于每条记录的233 min信号中的最后33 min。

1.2 心脏骤停早期分类识别算法
如图1所示,本文提出的基于深度迁移学习的心脏猝死预测方法包括3个步骤:① 心率特征提取:对输入信号进行预处理,即去除噪声并将连续的单导联ECG信号划分为非重叠的片段,并对每个ECG信号片段提取3个不同的心率特征片段,包括RR间期序列、两个相邻RR间期之间的时间差(dRR间期)序列和心率振荡起点(turbulence onset,TO)序列。② 两阶深度迁移学习模型:设计一个轻量级卷积神经网络作为深度迁移学习方法的基本模型,并利用上述两个区域的心率特征片段连续执行该模型的预训练和微调训练两个阶段。③ 心脏骤停预测:使用具有优化超参数训练的深度迁移学习网络,将心率特征片段分类为“正常”或“高风险”。

1.2.1 心率特征提取
心率变异(heart rate variability,HRV)和心率紊乱(heart rate turbulence,HRT)是许多生理因素对正常心率调节的可靠反映,它们可以作为具有恶性室性心律失常、慢性心力衰竭和心源性猝死风险患者的重要评估指标[18, 25]。如图1所示,本研究首先通过潘—汤普金斯(Pan-Tompkins)算法对ECG信号进行R波检测,进而提取了3个特征[26]。RR间期是两个相邻R波之间的时间差,可通过检测到的R波来确定RR间期的一系列位置,如式(1)所示:
![]() |
其中,RR(∙)代表第n个RR间期,R(∙)代表第n个R波,n代表R波的编号(n = 1, 2, ···)。此外,dRR间期的计算,如式(2)所示:
![]() |
其中,dRR(∙)代表第n个dRR间期。通常,TO被定义为心脏搏动后出现的一种短暂性的心率加速和减慢的现象,通常发生在R波峰之后的短暂时间内。在本研究中,TO的参数计算如式(3)所示:
![]() |
其中,TO(∙)代表第n个TO序列。每个TO的计算应用于所有心博而不仅限于早搏。
1.2.2 两阶深度迁移学习模型
基于1.2.1小节所提取的心率特征,采用卷积神经网络构成两阶深度迁移学习神经网络模型,如图1所示。其中,训练阶段包括预训练和微调训练两个阶段,如图2所示。

首先,在预训练阶段,为了从导入的源域数据心率特征片段中提取ECG信号的深度特征,需要构建卷积神经网络对网络输入层进行卷积操作。然而,卷积操作可能会导致过拟合的问题,因此需要采取一些措施来减少神经元数量。于是,在卷积层后添加了最大池化层,并将步长设置为2,以有效减少神经元的数量,从而避免过拟合的问题。卷积层和最大池化层的组合可将神经元的数量从80 × 32变为10 × 128。在多次特征提取之后,添加两个全连接层用于实现分类任务,生成经预训练的卷积神经网络模型,网络结构细节如表3所示。本文属于二分类问题,因此采用归一化指数函数(softmax)输出分类结果。

其次,在微调训练阶段,主要包括以下过程:① 冻结卷积层和池化层的所有参数:在微调训练中,卷积层和最大池化层中的参数已由预训练的模型训练所得,因此应将这些参数冻结,不随目标数据的训练而改变,以保留预训练模型的特征提取能力,避免过拟合;② 替换全连接层:由于源域数据和目标域数据之间存在一定的差异,需要用新的全连接层替换预训练模型中的全连接层,由此可根据目标任务更好地训练模型,并可减少源域数据和目标域数据之间的差异对模型性能的影响;③ 导入微调训练目标域数据训练新的全连接层:使用目标域数据作为输入,训练新的全连接层,形成基于目标任务的模型参数,从而提高模型的泛化能力和性能。
上述预训练阶段中,本研究在输入层使用了14 400个30 s的心率特征片段,其中7 200个来自高风险组,7 200个来自正常组;而在微调训练阶段中,共使用2 388个30 s的心率特征片段作为模型的输入数据,其中包括1 200个来自高风险组和1 188个来自正常组。
1.2.3 模型的性能评估
如表3所示,通过两个全连接层输出心脏猝死高危ECG数据早期分类识别和预估结果。本文使用了十折交叉验证方法,对源域数据和目标域数据分别进行了预训练和微调训练两个阶段的训练。在每个训练阶段中,本研究将提取到的心率特征片段随机分成10个子集,并将其用于训练、验证和测试。具体而言,在预训练阶段,源域数据的90%用于训练,剩余的10%用于验证;在微调训练阶段,目标域数据的90%用于训练(其中90%用于训练,10%用于验证),而剩余的10%用于测试,如图3所示。本文采用灵敏度(sensitivity,Sen)、特异度(specificity,Spe)和准确度(accuracy,Acc)3个指标来评估所提出的深度迁移学习方法预测心脏骤停的性能,相关计算公式如式(4)~式(6)所示:

![]() |
![]() |
![]() |
其中,真阳性(true positive,TP)是指被认定为“高风险”片段的“高风险”片段数量,假阴性(false negative,FN)指识别为“正常”片段的“高风险”片段的数量,真阴性(true negative,TN)表示识别为“正常”片段的“正常”片段的数量,假阳性(false positive,FP)表示识别为“高风险”片段的“正常”片段的数量。最终,通过十折交叉验证方法评估模型性能,以此获得最佳的深度迁移学习模型。
2 结果
本文提出的深度迁移学习模型均在一台配置了内存为16 GB的中央处理器(central processing unit,CPU)(i5-6300HQ,Intel(R) Core(TM),美国)和2 GB内存的图形处理器(graphics processing unit,GPU)(GTX-960,NVIDIA,美国)的计算机上实现,并且都基于一个用于构建和训练神经网络模型的开源深度学习库Keras 2.2.4(François Chollet,法国)。最终,在微调训练阶段,本文所提出的方法在平均准确度、灵敏度和特异度方面的评估性能分别为91.79%、87.00%和96.63%。
如图4所示,不同时间窗口下心脏猝死发作前的识别模型平均准确度为91.04%。此外,在心脏骤停发生前30 min内,随着每个时间窗口长度依次递增1 min,模型准确度会略微下降。

如图5所示,不同记录(每个患者为一个记录)的识别模型结果都基于相应患者的30 min时间窗口的目标域数据测试所得。横坐标表示高风险组中不同患者的记录编号,纵坐标表示每个患者30 min时间窗口对应的准确度。除了记录38和52外,所有记录的准确度均超过80%。具体而言,17名患者的准确度高于90%,平均准确度为96.58%。

3 讨论
3.1 本研究的主要贡献
过去几年,深度学习凭借其优异的性能成为大多数人工智能方法应用中的首选框架。与传统的机器学习方法(如DT、SVM和KNN)相比,本文提出的深度迁移学习方法具有以下两个优点:① 本文提出的深度迁移学习模型只需要输入RR间期序列、dRR间期序列和TO序列这3个简单的心率特征,无需手动提取复杂的HRV特征,因此在预训练阶段和微调训练阶段,每折数据分别只需花费166.798 0 s和13.335 9 s,而在测试过程中,每折(包括239个片段)仅需1.571 2 s。具体而言,可在0.006 6 s内基于一个30 s心率特征片段给出预测结果。② 本文提出的基于深度迁移学习的心脏骤停预测方法,成功解决了来自高危患者的ECG数据有限的问题。
3.2 与同领域其他研究之间的比较
如表4所示,在相同的数据集SCDDB和NSRDB上,本研究分别从材料、方法和最佳性能3个方面,详细对比了本文所提早期分类识别和预测模型与其他已报道的基于机器学习的模型之间的预测性能。结果表明,本研究的方法可在心脏猝死发生前30 min发出早期预警,满足临床上及时预测心脏猝死的要求。与之前在同一数据集上的相关工作相比,本研究的深度迁移学习方法有4个优点:① 使用简单的心率特征片段作为模型的输入,无需进行复杂的特征提取;② 据本研究所知,这是首次尝试使用深度迁移学习模型进行数据量稀少的心脏骤停风险预测;③ 与之前基于机器学习模型的研究相比,本研究的模型可以使用数据量有限的简单心率特征片段提前30 min预测心脏骤停;④ 本研究提出的深度迁移学习模型在实际测试结果中对高风险患者具有较高的识别率,同时确保了较少的误判。

3.3 本研究存在的局限
当前,心脏骤停的高危ECG信号数据集极为有限,而数据驱动的人工智能模型又需要大量数据进行训练,导致两者之间形成矛盾。尽管本文提出的两阶深度迁移学习模型提供了一种解决该矛盾的有效途径,且相比于已有研究在心脏骤停高危ECG信号征兆的早期预估性能方面有了较大的提升,但仍存留一些问题以待进一步解决。首先,该模型仅在开源数据库中进行了测试,缺少临床数据验证,本课题组下一步将基于临床数据集实现对该模型的训练和验证,以提高其准确度。其次,预训练和微调训练通常需要较长时间,为了进一步缩短训练时间,下一步将采用更高性能的计算机实现网络模型的训练,以此提升模型实时性。综上所述,本课题组将继续深入研究,以便进一步提高该模型的心脏骤停预测准确度并推进其临床应用。
4 结论
本研究提出了一种基于有限ECG数据实现两阶深度迁移学习神经网络模型训练的心脏骤停早期分类识别方法,用于对致命性心脏猝死高危ECG信号的早期分类识别和预估。该方法为当前基于数据驱动的神经网络模型受限于在实际应用中训练数据极为有限的情况,提供了一套可行的解决思路。特别是在临床偶发的恶性心脏骤停可记录的完整ECG数据极其有限的现实情况下,本文方法能确保深度学习模型的完整训练,并充分发挥该模型强大的深层特征提取能力,提高了数据分类及心脏骤停早期预估的准确度。与已报道方法相比,本文提出的方法在推动更好地解决上述难题的同时,在心脏猝死高危ECG信号的早期分类识别和预估方面也实现了较高的准确度。下一步课题组将推动该方法在临床实践中的应用,特别是将其嵌入至可穿戴设备中,为医院或院外环境下的心脏骤停潜在患者,提供一套可靠的高质量日常监护及高危征兆的早期预警方法。
重要声明
利益冲突声明:本文全体作者均声明不存在利益冲突。
作者贡献声明:茶兴增主要负责平台搭建、算法程序设计、数据分析以及论文撰写;张翼飞主要负责实验流程、数据记录与分析;张月和苏叶主要负责协调沟通和提供实验技术指导;赖大坤主要负责提供数据分析指导和论文审阅修订。