引用本文: 曾琴, 谢榕城, 马杰飞, 陈斌. 基于生物信息学分析铁死亡调控基因与脓毒症诱导肺损伤的关系. 中国呼吸与危重监护杂志, 2024, 23(9): 617-624. doi: 10.7507/1671-6205.202403042 复制
脓毒症作为一种严重的临床综合征,由炎症反应失调和随后的多器官功能障碍引起[1],其发病机制异常复杂,不仅涉及全身性炎症反应和免疫紊乱[2],还紊乱了多个器官的功能[3]。在重度脓毒症或脓毒性休克患者中,各种器官功能受损[4],其中肺部是最容易受损的器官之一[5]。据报道,约40%的急性肺损伤与脓毒症有关[6]。急性呼吸窘迫综合征是一种常见的脓毒症诱导的急性肺损伤,由肺内外多种因素引起的急性弥漫性炎症性损伤[7]。在脓毒症诱发的急性呼吸窘迫综合征患者中[8],疾病进展迅速,死亡率极高[9]。然而,目前尚无针对脓毒症诱导的急性呼吸窘迫综合征的特异性治疗方法。因此,深入探究其机制有助于寻找早期识别可能发展为急性呼损伤的脓毒症的生物标志物,并确定潜在的治疗靶点。
近年来,铁死亡作为一种可调控的细胞死亡方式受到了广泛关注,其主要特征在于细胞内铁离子超载[10],抑制了抗氧化系统[11],导致脂质过氧化物积累[12],从而破坏了细胞膜的结构和功能,进而诱发细胞死亡[13]。研究发现,在脓毒症诱发的急性呼吸窘迫综合征患者中,肺组织中的铁死亡相关基因的表达水平发生明显变化[14],脂质过氧化水平升高,然而使用Ferrostatin-1 (Fer-1)可逆转上述结果,这证实了铁死亡的发生[15]。因此,铁死亡有望成为脓毒症诱发急性肺损伤治疗的新靶点[16]。然而,目前铁死亡与脓毒症诱发急性肺损伤的相关性研究仍然较少见。
本研究拟通过生物信息学手段探究铁死亡相关基因在脓毒症导致的急性肺损伤中的作用,并预测与之密切相关的基因。我们从基因表达数据库中下载了数据集,再根据|log2 FC|>1且P.adj<0.05的条件,筛选出表达差异基因。接着,将这些差异基因与从铁死亡数据库中下载的铁死亡驱动和抑制基因取交集,得到了脓毒症铁死亡相关的差异基因。我们利用R语言、DAVID和STRING等线上工具对Fe-DEGs进行了GO-KEGG功能及通路富集分析,构建了PPI网络。通过构建的PPI网络,我们可以筛选出脓毒症铁死亡相关的差异基因,这些基因的功能及相互作用网络的进一步分析可能为脓毒症的治疗提供新的分子靶点。我们希望通过这一研究,为脓毒症患者的治疗提供新的治疗靶点和策略。在此研究中,我们强调了生物信息学在揭示疾病发病机制中的潜力,这些发现可能为脓毒症的治疗提供新的治疗靶点和策略。
1 材料和方法
1.1 公共数据集获取及差异基因筛选
从美国国家生物技术信息中心GEO数据库(
通过FerrDb(v2.0)平台(
1.2 Fe-DEGs的功能富集分析
我们将1.1所筛选的53个Fe-DEGs利用在线工具DAVID数据库(
1.3 构建蛋白互作网络(PPI)及筛选关键基因
我们将53个Fe-DEGs导入在线工具STRING数据库(
1.4 关键基因筛选
我们利用cytohubba插件进行关键基因的筛选,根据最大团中心性(Maximal Clique Centrality,MCC)算法、最大邻域组件密度(Density of Maximum Neighborhood Component,DMNC)算法、介数中心性(Betweenness Centrality,BETWEENNESS)算法、Degree算法、边渗透组件(Edge Percolated Component,EPC)算法这五种算法筛选出排名前10的基因取交集作为关键基因,并利用Venn软件进行可视化。随后,我们利用在线工具GeneMania(
2 结果
2.1 基于公共数据库筛选DEGs和Fe-DEGs
GEO2R是一种基于网络的工具,用于GEO数据库中表达谱芯片差异表达分析[21]。通过“GEO2R”在线工具比较GSE154653数据集中两组基因集,我们发现,箱线图中,各样本的标准化数据分布较为集中,显示出较好的数据稳定性和一致性(图1a)。此外,UMAP分析结果显示,正常组和LPS诱导脓毒症组的大鼠肺组织样本在二维平面上形成了明显的聚类,且两组样本之间有明显的分离(图1b)。并以|log2 FC|≥1且P.adj<0.05作为入选标准,我们共筛选出表达差异基因

a.GSE154653基因芯片UMAP分析图;b. GSE154653数据归一化图

a. GSE154653基因芯片的火山图,紫点和蓝点代表差异表达基因(紫点代表上调基因,蓝点代表下调基因);b.GSE154653基因芯片的层次聚类热图(红色表示基因表达相对上调,蓝色表示基因表达相对下调;Type中T代表正常组,N代表LPS组)
通过FerrDb数据库获取包含抑制型、驱动型以及标记型共484个基因的数据集,并将其与DEGs相交集得到53个Fe-DEGs,利用在线工具Venn软件可视化Fe-DEGs的Venn图(图3a),热图(图3b)展示出Fe-DEGs的表达情况,并对筛选出来的Fe-DEGs进行分类。结果见表1。

a.Venn图(红色表示铁死亡相关基因,蓝色表示GSE154653差异表达基因,交集部分表示铁死亡相关的差异基因);b.热图(红色表示上调基因,蓝色表示下调基因,Type中T代表正常组,N代表LPS组)

2.2 Fe-DEGs的功能富集分析
2.2.1 GO功能富集分析结果
为了探索Fe-DEGs的GO功能富集分析,我们将2.1中所筛选得到的53个Fe-DEGs通过在线工具DAVID库分别从生物过程、分子功能和细胞组分3个层面进行注释,并根据P<0.05为原则,按富集倍数取各层面的前5条绘制气泡图,见图4a。为了更好地展示Fe-DEGs与功能富集之间的关系,绘制的圈图可见图4b。这些基因在生物过程中主要涉及转录的正向调节、RNA聚合酶II启动子转录的正向调节、细胞因子介导的信号通路以及血管生成的正向调节等。分子功能主要涉及相同的蛋白质结合、转录激活活性以及氧化还原酶活性等。细胞组分主要涉及顶端质膜、线粒体外膜以及细胞外泌体等。此外,这些铁死亡相关基因的表达大部分发生上调。

a.GO功能富集分析的气泡图,圆点大小表示富集数目,颜色深浅程度表示富集结果显著性。b.GO功能分析的圆图。圈图的外圈绿色代表生物过程、橙色代表分子功能、蓝色代表细胞成分;中圈表示富集结果中基因数目,颜色与富集程度显著性相对应;内环表示每个富集结果中差异基因数目;GO:0045893表示转录的正向调节,GO:0045944表示RNA聚合酶II启动子转录的正向调节,GO:0019221表示细胞因子介导的信号通路,GO:0045766表示血管生成的正向调节,GO:0042802表示相同的蛋白质结合,GO:0001228表示转录激活活性,GO:0016491表示氧化还原酶活性,GO:0016324表示顶端质膜,GO:0005741表示线粒体外膜,GO:0070062表示细胞外泌体。
2.2.2 KEGG富集分析结果
通过对脓毒症中的Fe-DEGs进行KEGG通路富集分析,按富集倍数大小取排名前10的通路(P<0.05)。如图5a所示,Fe-DEGs的通路主要富集在铁死亡、低氧诱导因子-1(hypoxia-inducible factor 1,HIF-1)信号通路和高级糖基化终末产物-受体(Advanced glycosylation end products–receptors,AGE-RAGE)信号通路等。此外,绘制的弦图更详细地展示Fe-DEGs与通路富集之间的关系(图5b)。

a.KEGG功能分析的气泡图,圆点大小表示富集数目,颜色深浅程度表示富集结果显著性。b.KEGG功能分析的弦图,左侧字母代表Fe-DEGs,颜色越红代表上调越显著,右侧代表通路。
2.3 构建PPI网络
将所筛选的53个Fe-DEGs导入至STRING数据库中,设置最低交互分数为0.4,获取蛋白-蛋白相互作用的原始数据。随后通过Cytoscape软件将PPI网络进行可视化,所构建的网络如图6a所示。该网络共包含了40个节点蛋白以及117对相互作用。有13个蛋白由于与其他蛋白未存在相互作用而未被纳入网络。在PPI网络中,一般存在比较密集作用区域。接下来,我们通过Cytoscape的MCODE插件进行网络模块构建,最终筛选出9个与脓毒症相关的铁死亡基因,其中8个基因HSPB1、SNCA、HMOX1、CP、IL6、SOCS1、STAT3和IL1B表达上调,1个基因MUC1表达下调(见图3b),可见图6b。

a: Cytoscape构建Fe-DEGs的PPI网络。节点的颜色和大小代表度值,节点颜色越红和尺寸越大表示度值越高。边缘的颜色和粗细代表相互关系,边缘颜色越红和交互线越粗代表相互关系得分越高。b: 通过Cytoscape中的MCODE插件获取到的9个基因。
2.4 关键基因的筛选
通过Cytoscape软件cytohubba插件中的MCC、DMNC、MNC、Degree和EPC这5种算法,分别筛选出排名前10个hub基因(表2),并通过Venn图获取了这5种算法中重叠的基因,并将它们视为关键基因(图7a),包括CYBB、LCN2、HMOX1、TIMP1和CDKN1A。为了探究关键基因功能及相互作用网络,我们将5个关键基因导入“GeneMania”在线工具中,构建了1个由25个基因、461条链组成的假定蛋白-蛋白相互作用网络(图7b)。该网络的GO分析表明,这些关键基因的功能主要参与对NAD(P)H的氧化还原酶活性、对氧化应激的反应、细胞对化学应激的反应、细胞周期蛋白依赖性蛋白激酶活性的调节以及有丝分裂细胞周期G1/S转变的调控等。


a.5种算法中重叠的关键基因;b.通过GeneMania预测关键基因的功能相似的基因PPI网络
3 讨论
在本研究中,我们运用生物信息学方法深入探讨了铁死亡相关基因在脓毒症引起的肺损伤中的作用,并预测了与之密切相关的基因。通过分析GSE154653数据集,我们筛选出了
利益冲突:本研究不涉及任何利益冲突
脓毒症作为一种严重的临床综合征,由炎症反应失调和随后的多器官功能障碍引起[1],其发病机制异常复杂,不仅涉及全身性炎症反应和免疫紊乱[2],还紊乱了多个器官的功能[3]。在重度脓毒症或脓毒性休克患者中,各种器官功能受损[4],其中肺部是最容易受损的器官之一[5]。据报道,约40%的急性肺损伤与脓毒症有关[6]。急性呼吸窘迫综合征是一种常见的脓毒症诱导的急性肺损伤,由肺内外多种因素引起的急性弥漫性炎症性损伤[7]。在脓毒症诱发的急性呼吸窘迫综合征患者中[8],疾病进展迅速,死亡率极高[9]。然而,目前尚无针对脓毒症诱导的急性呼吸窘迫综合征的特异性治疗方法。因此,深入探究其机制有助于寻找早期识别可能发展为急性呼损伤的脓毒症的生物标志物,并确定潜在的治疗靶点。
近年来,铁死亡作为一种可调控的细胞死亡方式受到了广泛关注,其主要特征在于细胞内铁离子超载[10],抑制了抗氧化系统[11],导致脂质过氧化物积累[12],从而破坏了细胞膜的结构和功能,进而诱发细胞死亡[13]。研究发现,在脓毒症诱发的急性呼吸窘迫综合征患者中,肺组织中的铁死亡相关基因的表达水平发生明显变化[14],脂质过氧化水平升高,然而使用Ferrostatin-1 (Fer-1)可逆转上述结果,这证实了铁死亡的发生[15]。因此,铁死亡有望成为脓毒症诱发急性肺损伤治疗的新靶点[16]。然而,目前铁死亡与脓毒症诱发急性肺损伤的相关性研究仍然较少见。
本研究拟通过生物信息学手段探究铁死亡相关基因在脓毒症导致的急性肺损伤中的作用,并预测与之密切相关的基因。我们从基因表达数据库中下载了数据集,再根据|log2 FC|>1且P.adj<0.05的条件,筛选出表达差异基因。接着,将这些差异基因与从铁死亡数据库中下载的铁死亡驱动和抑制基因取交集,得到了脓毒症铁死亡相关的差异基因。我们利用R语言、DAVID和STRING等线上工具对Fe-DEGs进行了GO-KEGG功能及通路富集分析,构建了PPI网络。通过构建的PPI网络,我们可以筛选出脓毒症铁死亡相关的差异基因,这些基因的功能及相互作用网络的进一步分析可能为脓毒症的治疗提供新的分子靶点。我们希望通过这一研究,为脓毒症患者的治疗提供新的治疗靶点和策略。在此研究中,我们强调了生物信息学在揭示疾病发病机制中的潜力,这些发现可能为脓毒症的治疗提供新的治疗靶点和策略。
1 材料和方法
1.1 公共数据集获取及差异基因筛选
从美国国家生物技术信息中心GEO数据库(
通过FerrDb(v2.0)平台(
1.2 Fe-DEGs的功能富集分析
我们将1.1所筛选的53个Fe-DEGs利用在线工具DAVID数据库(
1.3 构建蛋白互作网络(PPI)及筛选关键基因
我们将53个Fe-DEGs导入在线工具STRING数据库(
1.4 关键基因筛选
我们利用cytohubba插件进行关键基因的筛选,根据最大团中心性(Maximal Clique Centrality,MCC)算法、最大邻域组件密度(Density of Maximum Neighborhood Component,DMNC)算法、介数中心性(Betweenness Centrality,BETWEENNESS)算法、Degree算法、边渗透组件(Edge Percolated Component,EPC)算法这五种算法筛选出排名前10的基因取交集作为关键基因,并利用Venn软件进行可视化。随后,我们利用在线工具GeneMania(
2 结果
2.1 基于公共数据库筛选DEGs和Fe-DEGs
GEO2R是一种基于网络的工具,用于GEO数据库中表达谱芯片差异表达分析[21]。通过“GEO2R”在线工具比较GSE154653数据集中两组基因集,我们发现,箱线图中,各样本的标准化数据分布较为集中,显示出较好的数据稳定性和一致性(图1a)。此外,UMAP分析结果显示,正常组和LPS诱导脓毒症组的大鼠肺组织样本在二维平面上形成了明显的聚类,且两组样本之间有明显的分离(图1b)。并以|log2 FC|≥1且P.adj<0.05作为入选标准,我们共筛选出表达差异基因

a.GSE154653基因芯片UMAP分析图;b. GSE154653数据归一化图

a. GSE154653基因芯片的火山图,紫点和蓝点代表差异表达基因(紫点代表上调基因,蓝点代表下调基因);b.GSE154653基因芯片的层次聚类热图(红色表示基因表达相对上调,蓝色表示基因表达相对下调;Type中T代表正常组,N代表LPS组)
通过FerrDb数据库获取包含抑制型、驱动型以及标记型共484个基因的数据集,并将其与DEGs相交集得到53个Fe-DEGs,利用在线工具Venn软件可视化Fe-DEGs的Venn图(图3a),热图(图3b)展示出Fe-DEGs的表达情况,并对筛选出来的Fe-DEGs进行分类。结果见表1。

a.Venn图(红色表示铁死亡相关基因,蓝色表示GSE154653差异表达基因,交集部分表示铁死亡相关的差异基因);b.热图(红色表示上调基因,蓝色表示下调基因,Type中T代表正常组,N代表LPS组)

2.2 Fe-DEGs的功能富集分析
2.2.1 GO功能富集分析结果
为了探索Fe-DEGs的GO功能富集分析,我们将2.1中所筛选得到的53个Fe-DEGs通过在线工具DAVID库分别从生物过程、分子功能和细胞组分3个层面进行注释,并根据P<0.05为原则,按富集倍数取各层面的前5条绘制气泡图,见图4a。为了更好地展示Fe-DEGs与功能富集之间的关系,绘制的圈图可见图4b。这些基因在生物过程中主要涉及转录的正向调节、RNA聚合酶II启动子转录的正向调节、细胞因子介导的信号通路以及血管生成的正向调节等。分子功能主要涉及相同的蛋白质结合、转录激活活性以及氧化还原酶活性等。细胞组分主要涉及顶端质膜、线粒体外膜以及细胞外泌体等。此外,这些铁死亡相关基因的表达大部分发生上调。

a.GO功能富集分析的气泡图,圆点大小表示富集数目,颜色深浅程度表示富集结果显著性。b.GO功能分析的圆图。圈图的外圈绿色代表生物过程、橙色代表分子功能、蓝色代表细胞成分;中圈表示富集结果中基因数目,颜色与富集程度显著性相对应;内环表示每个富集结果中差异基因数目;GO:0045893表示转录的正向调节,GO:0045944表示RNA聚合酶II启动子转录的正向调节,GO:0019221表示细胞因子介导的信号通路,GO:0045766表示血管生成的正向调节,GO:0042802表示相同的蛋白质结合,GO:0001228表示转录激活活性,GO:0016491表示氧化还原酶活性,GO:0016324表示顶端质膜,GO:0005741表示线粒体外膜,GO:0070062表示细胞外泌体。
2.2.2 KEGG富集分析结果
通过对脓毒症中的Fe-DEGs进行KEGG通路富集分析,按富集倍数大小取排名前10的通路(P<0.05)。如图5a所示,Fe-DEGs的通路主要富集在铁死亡、低氧诱导因子-1(hypoxia-inducible factor 1,HIF-1)信号通路和高级糖基化终末产物-受体(Advanced glycosylation end products–receptors,AGE-RAGE)信号通路等。此外,绘制的弦图更详细地展示Fe-DEGs与通路富集之间的关系(图5b)。

a.KEGG功能分析的气泡图,圆点大小表示富集数目,颜色深浅程度表示富集结果显著性。b.KEGG功能分析的弦图,左侧字母代表Fe-DEGs,颜色越红代表上调越显著,右侧代表通路。
2.3 构建PPI网络
将所筛选的53个Fe-DEGs导入至STRING数据库中,设置最低交互分数为0.4,获取蛋白-蛋白相互作用的原始数据。随后通过Cytoscape软件将PPI网络进行可视化,所构建的网络如图6a所示。该网络共包含了40个节点蛋白以及117对相互作用。有13个蛋白由于与其他蛋白未存在相互作用而未被纳入网络。在PPI网络中,一般存在比较密集作用区域。接下来,我们通过Cytoscape的MCODE插件进行网络模块构建,最终筛选出9个与脓毒症相关的铁死亡基因,其中8个基因HSPB1、SNCA、HMOX1、CP、IL6、SOCS1、STAT3和IL1B表达上调,1个基因MUC1表达下调(见图3b),可见图6b。

a: Cytoscape构建Fe-DEGs的PPI网络。节点的颜色和大小代表度值,节点颜色越红和尺寸越大表示度值越高。边缘的颜色和粗细代表相互关系,边缘颜色越红和交互线越粗代表相互关系得分越高。b: 通过Cytoscape中的MCODE插件获取到的9个基因。
2.4 关键基因的筛选
通过Cytoscape软件cytohubba插件中的MCC、DMNC、MNC、Degree和EPC这5种算法,分别筛选出排名前10个hub基因(表2),并通过Venn图获取了这5种算法中重叠的基因,并将它们视为关键基因(图7a),包括CYBB、LCN2、HMOX1、TIMP1和CDKN1A。为了探究关键基因功能及相互作用网络,我们将5个关键基因导入“GeneMania”在线工具中,构建了1个由25个基因、461条链组成的假定蛋白-蛋白相互作用网络(图7b)。该网络的GO分析表明,这些关键基因的功能主要参与对NAD(P)H的氧化还原酶活性、对氧化应激的反应、细胞对化学应激的反应、细胞周期蛋白依赖性蛋白激酶活性的调节以及有丝分裂细胞周期G1/S转变的调控等。


a.5种算法中重叠的关键基因;b.通过GeneMania预测关键基因的功能相似的基因PPI网络
3 讨论
在本研究中,我们运用生物信息学方法深入探讨了铁死亡相关基因在脓毒症引起的肺损伤中的作用,并预测了与之密切相关的基因。通过分析GSE154653数据集,我们筛选出了
利益冲突:本研究不涉及任何利益冲突