引用本文: 刘一鸥, 史洁, 李雪松, 严超, 张冰清, 贺晶, 王思瑜, 周文静. 基于中国抗癫痫协会新版脑电报告系统的癫痫患者脑电大数据初分析. 癫痫杂志, 2022, 8(6): 524-528. doi: 10.7507/2096-0247.202209001 复制
在一个前所未有的高度合作和数据共享的时代,大数据研究已经成为时代所需,它满足了快速处理大量不同数据的需求[1-2]。癫痫是一种在临床和研究领域都具有广泛异质性的疾病,因此适合大数据概念和技术[3]。癫痫数据是多模态的,需要大数据原则来妥善处理,特别是脑电图数据,涵盖背景活动、睡眠波形、异常放电模式、发作类型等各个方面,因此需要更加专业、便捷并能实现数据分析、共享的平台来承载脑电图数据[4]。然而目前中国存在脑电报告术语及报告界面不规范、大量脑电数据无法共享的问题。CAAE主持研发的新版脑电图报告系统(Clinical EEG report software,CERS)便是在这一契机下应用而生。CERS参考国际抗癫痫联盟欧洲委员会的“基于计算机的标准化脑电图报告系统”(Standardized computer-based organized reporting of EEG,SCORE)的标准,SCORE实现了报告流程的规范化、癫痫专业术语的统一,并可以实现数据共享、教学指导作用,成为癫痫诊疗的重要临床工具[5-6]。因此,2019年CAAE神经电生理分会参照SCORE模式,主持并研发了CERS系统,该系统同时参照了权威的诊断及分类指南,如国际抗癫痫联盟(International League Against Epilepsy,ILAE)于2017年推出的“可操作性癫痫发作分类方案”等,目的是实现癫痫术语标准化。同时,CERS在脑电软件录入界面附有癫痫相关概念注释,相当于对癫痫本体论的进一步解读,更加专业和实用[7]。CERS能够实现统一的数据上传、存储、进一步实现资源及数据共享,为临床研究提供了便利的条件和巨大的空间。经过两年多的临床使用、CERS因其内容的规范、便捷的使用界面已经被广大脑电图医生接受,但其在科研方面的应用的价值还不为医生熟知。本文应用CERS系统导出的脑电图数据资料、结合已有数据库资料进行大数据初分析,旨在探讨CERS的科研应用机制,从而探索三级癫痫诊疗中心脑电大数据库的建立模式,并希望以此建立多中心合作的脑电图大数据共享模式。
1 资料与方法
CERS是 CAAE脑电图和神经电生理分会与华科精准公司合作研发的标准化脑电图报告系统。CERS采用国际通用标准化脑电图术语,涵盖符合国际规范要求的各项脑电图报告内容(图1)。我癫痫中心作为率先试用的脑电图培训基地、参与该系统的论证和设计过程。

点击红框内问号可以显示对该录入选项的详细分类解读
Figure1. CERS "Attack Event" entry interfaceClick the question mark in the red box to display a detailed classification of this option
该研究回顾性纳入2021年5月—2022年5月在清华大学玉泉医院癫痫中心行脑电图检查、并应用CAAE新版脑电报告系统出具脑电报告的患者6 380例,脑电图医生根据系统界面提示进行患者脑电相关信息录入,包括基本信息、背景活动、睡眠周期、发作间期癫痫样放电、发作事件、脑电图诊断等。信息录入过程自动生成报告并将这些特性提供给数据库,最后将脑电图数据导出。同时将这6 380例患者导出的脑电图数据和既往本癫痫中心的患者信息数据库进行数据整合,该信息数据库涵盖了所有门诊就诊患者所有相关信息,包括基本信息(性别、年龄等)、所属地域信息、脑电图报告PDF资料、影像学资料、基因报告等,手术病人还包括手术信息、影像后处理结果、术后回访信息等。从而初步搭建患者的脑电报告数据库, 并进一步进行相关数据分析。该研究获得清华大学玉泉医院医学伦理委员会审核批准。
2 结 果
2.1 结合6380例患者在已有数据库资料的相关资料分析
在6 380例患者中,男3 790例(59.4%)、女2 590例(40.6%)。新版脑电报告系统自动定义并归类不同年龄组:所有行脑电图检查患者中,各年龄段比例分别为儿童3 290例(51.0%)、成人1 372例(22.0%)、青少年 753 例(12.0%)、幼儿730例(11.0 %),婴儿235例(4.0%)。脑电总记录时间:总记录时间≤4 h的3 226例,4 h<总记录时间<24 h的1 182例,总记录时间≥24 h的1972例。其中正常脑电报告2 253例(35.3%),异常脑电报告 4 031例(63.2%),界限性脑电图96例。总共有1 466例(23.0%)患者记录到发作事件(详见以下GERS具体发作分型)。通过和既往数据库资料整合分析发现这些脑电图检查患者地域分布以北京周边省份为主(图2),其中患者所在地最多的省份分别是河北、山东、河南、山西、内蒙古。

2.2 基于CERS的临床大数据分析
2.2.1 6380例患者年龄构成比
在所有脑电图报告中,正常脑电图共2 253例,各年龄段所占比例分别为儿童2156例(34.0%)、成人768例(12.0%)、幼儿543例(9.0%),青少年399例(6.0%)、婴儿165例(3.0%);异常脑电报告 4 031例,各年龄段所占比例分别为儿童1089例(17.0%)、成人566例(9.0%)、青少年344例(5.0%),幼儿184例(3.0%),婴儿70例(1.0%)(图3)。

内环显示所有脑电图报告中,正常脑电图和异常脑电图所占比例。外环显示在正常和异常脑电报告中不同年龄阶段患者所占比例
Figure3. The distribution of 6380 EEG patients in different age groupsThe inner circle shows the proportion of normal EEG and abnormal EEG in all EEG reports. The outer circle shows the proportion of patients at different ages in the normal and abnormal EEG groups
2.2.2 6380例患者癫痫发作类型
对6380例患者的发作类型进行统计学分析,共计1 466例(23.0%)患者记录到发作事件。在这1 466例患者中,癫痫发作874例,占总发作事件的60.0%;非癫痫事件517例,占总发作事件的35.0%,其余为电发作或发作性质不能确定;电发作59例,占4.0%,不确定事件16例,占1.0%。在874例癫痫临床发作中,局灶性发作473例,占癫痫发作的54.0%;全面性发作299例,占癫痫发作的34.0%。在全面性发作中,最常见的发作类型分别为痉挛发作 166例、肌阵挛发作58例,强直阵挛发作42例、典型失神发作23例;在局灶性发作中,最常见的是发作类型不明 264例,痉挛发作78例,强直发作78例,继发强直阵挛发作53例(图4)。

右图显示发作性事件占总数的比例。左图内层圆环显示这些发作性事件中癫痫发作和非癫痫发作所占比例,外层圆环显示这些癫痫发作中全面性发作和局灶性发作所占比例,中间圆环显示不同发作类型所占比例
Figure4. Classification of episodic events in 6380 EEG patientsThe right panel shows the proportion of episodic events in the total. The inner circle on the left shows the proportion of seizures and non-seizures among these episodic events, the outer circle shows the proportion of generalized and focal seizures , The middle circle shows the proportion of different seizure types
3 讨 论
大数据时代的到来为科学及健康领域带来新的契机和挑战。癫痫因其广泛异质性,涵盖多个学科领域,非常适合大数据领域[8-9]。特别是作为癫痫重要的检查工具—脑电图,涵盖背景活动、睡眠波形、异常放电模式、发作类型等各个方面,适合大数据概念和技术。同时,脑电图的规范化解读也非常重要,脑电图的误读可能影响对患者病情的解读和治疗,因此,有必要寻找计算机工具以提高临床脑电图报告的质量并能实现数据分析[10]。CAAE主持研发的,提供了一个专业的、可以共享的脑电报告平台,不仅体现了癫痫本体论的概念体系,兼具检索和教学作用,还可以实现资源共享和大数据分析。
通过CERS系统导出的脑电图数据,可以很容易与患者的基本资料数据库进行匹配(通过姓名、出生日期匹配),得到脑电图检查患者完整的数据资料。这样在得到一份完整的脑电报告的时候、还可以了解到这些患者的相关信息,为临床诊疗提供指导。比如本研究发现了至本癫痫中心行脑电图检查患者是有地域分布的规律,体现了这些地区来北京就医的需求情况。此外,还对6 380例患者的年龄分布、发作类型进行初分析,发现这些患者的年龄段分布情况,最多的是儿童,其次为成人、青少年。一方面提示该年龄段可能是癫痫发作的高危年龄段,也为我们今后工作定位提供了方向,针对儿童患者的更加人性化的服务。从6 380例患者的发作类型看,总共有1 466例患者记录到发作事件。在这1 466例患者当中,癫痫发作有874例,占总发作事件的60%;非癫痫事件有517例,占总发作事件的35%。不确定性事件仅有16例。提示脑电图抓发作还是鉴别癫痫发作的重要工具。但如此多的非癫痫性事件,也提示我们当前患者或患者家属对癫痫认知度的提高,警觉性增强,需要抓发做来明确诊断,另一方面也提示我们有必要对患者进行更多的科学知识普及,是否可以对一些常见的明确不是癫痫发作的情况进行初筛或辨别,减少不必要的医疗资源消耗。
在874例癫痫临床发作中,局灶性发作473例,占癫痫发作的54%,提示这些局灶性发作所占的巨大比例,除一些特定的病因以外(如儿童自限性癫痫等),可能很多病例都有潜在的治病灶,是否有进一步手术的空间?在局灶性发作中,大部分发作类型不明确,共264例患者,这些发作类型无法归类到已有的癫痫发作分型或者是阅图医生不能很准确的识别发作类型,一方面表明癫痫发作症状学的复杂,同时也为今后的工作提出了挑战,脑电图医生应该更加细化临床工作、通过多次记录临床发作或科内讨论等形式、明确发作类型及发作起始模式,查找癫痫病因,为今后诊疗提供依据。
当然,本研究数据研究只是冰山一角,CERS导出的很多相关数据还等待我们挖掘,比如脑电图背景活动、患者用药情况、发作起始放电模式等,都给我们提供可研究的大数据资料。CERS 为癫痫大数据研究提供了有力工具,当然我们的目标远不止如此,我们同时正在完善患者基本信息数据库(包括患者影像资料、基因报告、脑电图及影像后处理结果等)、患者病史资料数据库(癫痫调查问卷系统)。丰富数据库构架,这些数据库的整合,可以多维度整合大数据。通过大数据统计方法,我们还可以总结癫痫疾病病因、癫痫发作类型、用药情况等多方面信息、同时还可以通过机器学习、深度学习,最终实现疾病诊断人工智能化及精准治疗[11],减少人力成本,节省医疗资源。
综上,CERS为我们提供了一个规范的脑电报告系统,其价值在于为脑电大数据提供支持。当然一个癫痫中心的数据还是有限的, 但是一旦搭建起来规范的、可共享的脑电数据库平台,多中心就可以实现数据整合,从而实现大数据分析。我们需要搭建的不仅仅是脑电数据平台、在这个基础上、进一步完善患者相关信息如病史资料数据库、检查资料数据库等[12],从而实现大数据的深度学习和研究,揭开病因、症状学及电生理等之间的关联,这是我们今后努力的方向。
利益冲突声明 所有作者无利益冲突。
在一个前所未有的高度合作和数据共享的时代,大数据研究已经成为时代所需,它满足了快速处理大量不同数据的需求[1-2]。癫痫是一种在临床和研究领域都具有广泛异质性的疾病,因此适合大数据概念和技术[3]。癫痫数据是多模态的,需要大数据原则来妥善处理,特别是脑电图数据,涵盖背景活动、睡眠波形、异常放电模式、发作类型等各个方面,因此需要更加专业、便捷并能实现数据分析、共享的平台来承载脑电图数据[4]。然而目前中国存在脑电报告术语及报告界面不规范、大量脑电数据无法共享的问题。CAAE主持研发的新版脑电图报告系统(Clinical EEG report software,CERS)便是在这一契机下应用而生。CERS参考国际抗癫痫联盟欧洲委员会的“基于计算机的标准化脑电图报告系统”(Standardized computer-based organized reporting of EEG,SCORE)的标准,SCORE实现了报告流程的规范化、癫痫专业术语的统一,并可以实现数据共享、教学指导作用,成为癫痫诊疗的重要临床工具[5-6]。因此,2019年CAAE神经电生理分会参照SCORE模式,主持并研发了CERS系统,该系统同时参照了权威的诊断及分类指南,如国际抗癫痫联盟(International League Against Epilepsy,ILAE)于2017年推出的“可操作性癫痫发作分类方案”等,目的是实现癫痫术语标准化。同时,CERS在脑电软件录入界面附有癫痫相关概念注释,相当于对癫痫本体论的进一步解读,更加专业和实用[7]。CERS能够实现统一的数据上传、存储、进一步实现资源及数据共享,为临床研究提供了便利的条件和巨大的空间。经过两年多的临床使用、CERS因其内容的规范、便捷的使用界面已经被广大脑电图医生接受,但其在科研方面的应用的价值还不为医生熟知。本文应用CERS系统导出的脑电图数据资料、结合已有数据库资料进行大数据初分析,旨在探讨CERS的科研应用机制,从而探索三级癫痫诊疗中心脑电大数据库的建立模式,并希望以此建立多中心合作的脑电图大数据共享模式。
1 资料与方法
CERS是 CAAE脑电图和神经电生理分会与华科精准公司合作研发的标准化脑电图报告系统。CERS采用国际通用标准化脑电图术语,涵盖符合国际规范要求的各项脑电图报告内容(图1)。我癫痫中心作为率先试用的脑电图培训基地、参与该系统的论证和设计过程。

点击红框内问号可以显示对该录入选项的详细分类解读
Figure1. CERS "Attack Event" entry interfaceClick the question mark in the red box to display a detailed classification of this option
该研究回顾性纳入2021年5月—2022年5月在清华大学玉泉医院癫痫中心行脑电图检查、并应用CAAE新版脑电报告系统出具脑电报告的患者6 380例,脑电图医生根据系统界面提示进行患者脑电相关信息录入,包括基本信息、背景活动、睡眠周期、发作间期癫痫样放电、发作事件、脑电图诊断等。信息录入过程自动生成报告并将这些特性提供给数据库,最后将脑电图数据导出。同时将这6 380例患者导出的脑电图数据和既往本癫痫中心的患者信息数据库进行数据整合,该信息数据库涵盖了所有门诊就诊患者所有相关信息,包括基本信息(性别、年龄等)、所属地域信息、脑电图报告PDF资料、影像学资料、基因报告等,手术病人还包括手术信息、影像后处理结果、术后回访信息等。从而初步搭建患者的脑电报告数据库, 并进一步进行相关数据分析。该研究获得清华大学玉泉医院医学伦理委员会审核批准。
2 结 果
2.1 结合6380例患者在已有数据库资料的相关资料分析
在6 380例患者中,男3 790例(59.4%)、女2 590例(40.6%)。新版脑电报告系统自动定义并归类不同年龄组:所有行脑电图检查患者中,各年龄段比例分别为儿童3 290例(51.0%)、成人1 372例(22.0%)、青少年 753 例(12.0%)、幼儿730例(11.0 %),婴儿235例(4.0%)。脑电总记录时间:总记录时间≤4 h的3 226例,4 h<总记录时间<24 h的1 182例,总记录时间≥24 h的1972例。其中正常脑电报告2 253例(35.3%),异常脑电报告 4 031例(63.2%),界限性脑电图96例。总共有1 466例(23.0%)患者记录到发作事件(详见以下GERS具体发作分型)。通过和既往数据库资料整合分析发现这些脑电图检查患者地域分布以北京周边省份为主(图2),其中患者所在地最多的省份分别是河北、山东、河南、山西、内蒙古。

2.2 基于CERS的临床大数据分析
2.2.1 6380例患者年龄构成比
在所有脑电图报告中,正常脑电图共2 253例,各年龄段所占比例分别为儿童2156例(34.0%)、成人768例(12.0%)、幼儿543例(9.0%),青少年399例(6.0%)、婴儿165例(3.0%);异常脑电报告 4 031例,各年龄段所占比例分别为儿童1089例(17.0%)、成人566例(9.0%)、青少年344例(5.0%),幼儿184例(3.0%),婴儿70例(1.0%)(图3)。

内环显示所有脑电图报告中,正常脑电图和异常脑电图所占比例。外环显示在正常和异常脑电报告中不同年龄阶段患者所占比例
Figure3. The distribution of 6380 EEG patients in different age groupsThe inner circle shows the proportion of normal EEG and abnormal EEG in all EEG reports. The outer circle shows the proportion of patients at different ages in the normal and abnormal EEG groups
2.2.2 6380例患者癫痫发作类型
对6380例患者的发作类型进行统计学分析,共计1 466例(23.0%)患者记录到发作事件。在这1 466例患者中,癫痫发作874例,占总发作事件的60.0%;非癫痫事件517例,占总发作事件的35.0%,其余为电发作或发作性质不能确定;电发作59例,占4.0%,不确定事件16例,占1.0%。在874例癫痫临床发作中,局灶性发作473例,占癫痫发作的54.0%;全面性发作299例,占癫痫发作的34.0%。在全面性发作中,最常见的发作类型分别为痉挛发作 166例、肌阵挛发作58例,强直阵挛发作42例、典型失神发作23例;在局灶性发作中,最常见的是发作类型不明 264例,痉挛发作78例,强直发作78例,继发强直阵挛发作53例(图4)。

右图显示发作性事件占总数的比例。左图内层圆环显示这些发作性事件中癫痫发作和非癫痫发作所占比例,外层圆环显示这些癫痫发作中全面性发作和局灶性发作所占比例,中间圆环显示不同发作类型所占比例
Figure4. Classification of episodic events in 6380 EEG patientsThe right panel shows the proportion of episodic events in the total. The inner circle on the left shows the proportion of seizures and non-seizures among these episodic events, the outer circle shows the proportion of generalized and focal seizures , The middle circle shows the proportion of different seizure types
3 讨 论
大数据时代的到来为科学及健康领域带来新的契机和挑战。癫痫因其广泛异质性,涵盖多个学科领域,非常适合大数据领域[8-9]。特别是作为癫痫重要的检查工具—脑电图,涵盖背景活动、睡眠波形、异常放电模式、发作类型等各个方面,适合大数据概念和技术。同时,脑电图的规范化解读也非常重要,脑电图的误读可能影响对患者病情的解读和治疗,因此,有必要寻找计算机工具以提高临床脑电图报告的质量并能实现数据分析[10]。CAAE主持研发的,提供了一个专业的、可以共享的脑电报告平台,不仅体现了癫痫本体论的概念体系,兼具检索和教学作用,还可以实现资源共享和大数据分析。
通过CERS系统导出的脑电图数据,可以很容易与患者的基本资料数据库进行匹配(通过姓名、出生日期匹配),得到脑电图检查患者完整的数据资料。这样在得到一份完整的脑电报告的时候、还可以了解到这些患者的相关信息,为临床诊疗提供指导。比如本研究发现了至本癫痫中心行脑电图检查患者是有地域分布的规律,体现了这些地区来北京就医的需求情况。此外,还对6 380例患者的年龄分布、发作类型进行初分析,发现这些患者的年龄段分布情况,最多的是儿童,其次为成人、青少年。一方面提示该年龄段可能是癫痫发作的高危年龄段,也为我们今后工作定位提供了方向,针对儿童患者的更加人性化的服务。从6 380例患者的发作类型看,总共有1 466例患者记录到发作事件。在这1 466例患者当中,癫痫发作有874例,占总发作事件的60%;非癫痫事件有517例,占总发作事件的35%。不确定性事件仅有16例。提示脑电图抓发作还是鉴别癫痫发作的重要工具。但如此多的非癫痫性事件,也提示我们当前患者或患者家属对癫痫认知度的提高,警觉性增强,需要抓发做来明确诊断,另一方面也提示我们有必要对患者进行更多的科学知识普及,是否可以对一些常见的明确不是癫痫发作的情况进行初筛或辨别,减少不必要的医疗资源消耗。
在874例癫痫临床发作中,局灶性发作473例,占癫痫发作的54%,提示这些局灶性发作所占的巨大比例,除一些特定的病因以外(如儿童自限性癫痫等),可能很多病例都有潜在的治病灶,是否有进一步手术的空间?在局灶性发作中,大部分发作类型不明确,共264例患者,这些发作类型无法归类到已有的癫痫发作分型或者是阅图医生不能很准确的识别发作类型,一方面表明癫痫发作症状学的复杂,同时也为今后的工作提出了挑战,脑电图医生应该更加细化临床工作、通过多次记录临床发作或科内讨论等形式、明确发作类型及发作起始模式,查找癫痫病因,为今后诊疗提供依据。
当然,本研究数据研究只是冰山一角,CERS导出的很多相关数据还等待我们挖掘,比如脑电图背景活动、患者用药情况、发作起始放电模式等,都给我们提供可研究的大数据资料。CERS 为癫痫大数据研究提供了有力工具,当然我们的目标远不止如此,我们同时正在完善患者基本信息数据库(包括患者影像资料、基因报告、脑电图及影像后处理结果等)、患者病史资料数据库(癫痫调查问卷系统)。丰富数据库构架,这些数据库的整合,可以多维度整合大数据。通过大数据统计方法,我们还可以总结癫痫疾病病因、癫痫发作类型、用药情况等多方面信息、同时还可以通过机器学习、深度学习,最终实现疾病诊断人工智能化及精准治疗[11],减少人力成本,节省医疗资源。
综上,CERS为我们提供了一个规范的脑电报告系统,其价值在于为脑电大数据提供支持。当然一个癫痫中心的数据还是有限的, 但是一旦搭建起来规范的、可共享的脑电数据库平台,多中心就可以实现数据整合,从而实现大数据分析。我们需要搭建的不仅仅是脑电数据平台、在这个基础上、进一步完善患者相关信息如病史资料数据库、检查资料数据库等[12],从而实现大数据的深度学习和研究,揭开病因、症状学及电生理等之间的关联,这是我们今后努力的方向。
利益冲突声明 所有作者无利益冲突。