引用本文: 章锐, 祝孔俊, 杜秋丽, 袁媛, 阮剑, 赵建国. 利用 TCGA 数据库构建男性乳腺癌的lncRNA-miRNA-mRNA ceRNA 网络. 中国普外基础与临床杂志, 2021, 28(3): 380-384. doi: 10.7507/1007-9424.202005027 复制
男性乳腺癌占所有乳腺癌的 0.5%~1%,美国每年大约有 2 000 名男性被诊断出乳房恶性肿瘤[1-2]。由于缺乏可靠的临床证据,治疗男性乳腺癌的标准通常是来自女性乳腺癌的大量文献资料和临床经验,这些数据可能并不完全适用于男性,男性荷尔蒙环境可能是其独特而强大的风险因素,也是治疗结果和预后的决定因素[3]。在一项纳入了 102 例意大利男性乳腺癌患者的研究中,未发现乳腺癌 1 号基因(BRCA1)或乳腺癌 2 号基因(BRCA2)重排[4],男性乳腺癌可能与 PALB2(partner and localizer of BRCA2)中的雄激素受体(AR)[5]、CYP17 基因编码的 17α 羟化酶(CYP17)[6]和细胞周期检测点激酶 2(CHEK2)[7-8]的突变存在一定的相关性。近几年发现,非编码的 RNA [长链非编码 RNA(lncRNA)、微小 RNA(microRNA,miRNA)等]虽然不编码蛋白质,但在正常的生理功能和病理生理的调控中发挥着重要的作用,例如 lncRNA 能够作为肺癌诊断和预后的生物学标志物[9],miRNA 能参与基因表达调控[10]。Salmena 等[11]提出了竞争性内源 RNA(ceRNA)假说,并被后续实验支持。该假设描述 miRNA 通过结合 mRNA 调控其表达,lncRNA 通过竞争吸附 miRNA 影响 miRNA 的功能[12],但是在男性乳腺癌中 ceRNA 的调控机制并不清楚。本研究对 TCGA 数据库中含有男性乳腺癌和正常乳腺组织的转录组芯片数据进行分析,并构建 ceRNA 网络,为研究男性乳腺癌的发病机制奠定一定的基础。
1 临床资料
1.1 样本及数据分析
从 TCGA 数据库中收集男性乳腺癌的 RNA 表达谱数据,挑选到正常男性乳腺组织 1 例,男性乳腺癌癌组织 12 例。癌组织和正常组织的 lncRNA、mRNA 和 miRNA 数据采用 R 软件提取和标准化处理。
差异表达基因分析:将男性乳腺癌癌组织与正常男性乳腺组织进行差异表达基因分析,利用 R 软件中的“limma”包,按照 |log2FC|>1(FC 表示2 组样品间表达值的比值)、P<0.05,筛选差异基因。
1.2 GO 富集分析和 KEGG 通路分析
利用 DAVID 数据库(The Database for Annotation,Visualization,and Integrated Discovery)将差异基因进行 GO(Gene Ontology)富集分析和 KEGG(KytoKyoto Encyclopedia of Genes and Genomes)通路分析。
1.3 男性乳腺癌 ceRNA 网络构建
男性乳腺癌 ceRNA 网络构建的具体方法参考文献 [9, 13]。将差异 lncRNA 和 miRNA 在 miRcode 数据库中进行配对,基于 miRDB、miRTarbase 和 Targetscan 数据库,利用 starBase 在线软件对筛选出的差异 miRNA 进行靶基因预测,得到 lncRNA-miRNA-mRNA 的 ceRNA 调控网络数据,利用 Cytescape V3.5.2 软件进行可视化分析,制作出 ceRNA 网络图。
1.4 结果
1.4.1 lncRNA、miRNA 和 mRNA 的差异性表达分析
根据 |log2FC|>1 并且 P<0.05 的筛选标准,比较男性乳腺癌癌组织和正常乳腺组织的基因表达量,分别得到差异性表达的 lncRNA、miRNA 和 mRNA。其中 lncRNA 有 275 种,miRNA 有 33 种,mRNA 有 1 675 种,见图1a–1c 和表1。

a–c:lncRNA(a)、miRNA(b)和 mRNA(c)差异性表达的火山图,FDR 为错误发现率,上调基因标记为红色,下调基因标记为绿色;d:差异表达基因富集的前 10 个 GO 条目;e:差异表达基因参与的 9 条 KEGG 通路;f:lncRNA-miRNA-mRNA ceRNA 网络,其中菱形代表 lncRNA,正方形代表 miRNA,圆形代表 mRNA,红色为上调 RNA,绿色为下调 RNA;g:ceRNA 网络中差异表达基因富集的前 10 个 GO 条目;h:ceRNA 网络中差异表达基因参与的 4 条 KEGG 通路

1.4.2 差异表达 mRNA 的 GO 富集分析和 KEGG 通路分析
为了进一步检测差异表达基因在男性乳腺癌中的潜在作用,进行了 mRNA 的 GO 富集分析和 KEGG 通路分析。结果发现,差异表达 mRNA 主要参与了 G 蛋白信号传导、细胞增殖的负调控、对激素刺激的反应等生物学过程(图1d),参与的 KEGG 通路包括过氧化物酶体增殖物激活受体(PPAR)、细胞黏附分子(CAMs)、胰岛素信号通路等信号通路(图1e)。
1.4.3 差异表达基因 ceRNA 网络的构建
基于男性乳腺癌差异性表达的 lncRNA、miRNA 和 mRNA,本研究构建了 ceRNA 网络。总共有 9 个 miRNA 节点,46 个 mRNA 节点,25 个 lncRNA 节点,其中与 hsa-miRNA-183 相互作用的 lnRNA 和 mRNA 种类最多,见图1f。
1.4.4 ceRNA 网络中差异表达基因 mRNA 的 GO 富集分析和 KEGG 通路分析
为了进一步检测 ceRNA 网络中 46 个差异表达 mRNA 在男性乳腺癌中的潜在作用,进行了 GO 富集分析和 KEGG 通路分析。结果发现,46 个差异表达 mRNA 主要参与了与转录因子活性、调节磷酸盐代谢过程、细胞增殖的负调控、转录的负调控、细胞蛋白质代谢过程的调控、细胞迁移的调控、转移酶活性的正调控、调控细胞增殖、激活蛋白激酶活性、间充质细胞增殖的正调控等(图1g)。此外,4 条 KEGG 通路被激活,包括癌症的途径、白细胞跨内皮迁移、丝裂原活化蛋白激酶(MAPK)和神经营养蛋白信号通路(图1h)。上述结果表明,差异表达基因可能在乳腺癌的发生和进展中起重要作用。
2 讨论
美国国家癌症研究所监测的流行病学数据显示,1973 年至 2005 年期间的 5 494 例男性乳腺癌中有 92% 是雌激素受体(ER)阳性[14],但在 838 805 例女性乳腺癌中,只有 78% 是 ER 阳性[15]。在男性乳腺癌的免疫组织化学中发现,AR 阳性率为 34%~95%,雄激素途径比女性乳腺癌更加活跃[16]。一项研究[17]还发现,催乳素受体也涉及男性乳腺癌的发生,但是针对男性乳腺癌的研究仍然不足,缺乏有效的早期诊断标志物,亟需加强对其分子水平的研究,寻找有效的治疗靶点。
越来越多的证据表明,非编码 RNA 在肿瘤的发生和发展中起着重要的调控作用,非编码 RNA 通过多种途径调节基因表达,从而促进肿瘤发生和肿瘤转移[18]。本研究对 TCGA 数据库中的表达谱芯片数据进行了分析,构建了 ceRNA 网络,通过分析提取差异表达的 miRNA、mRNA 和 lncRNA。通过构建的 ceRNA,在既可以通过数据库查询相互作用关系的同时,也能确定这些基因是否是男性乳腺癌的差异基因,使分析结果更为准确[13]。lncRNA OSTN-AS1 以及相关的 ceRNA 调控机制[19]、端粒酶逆转录酶基因(TERT)、TRIML2(tripartite motif family-like 2)、PHBP4、miR-1-3p 及 miR-133a-3p5[20]在三阴性乳腺癌中可能是潜在的治疗靶点和预后指标。lncRNA HCP5 通过 ceRNA 结合 miR-219a-5p,调控杆状病毒 IAP 重复序列 3(BIRC3),影响三阴性乳腺癌细胞的增殖、凋亡、侵袭迁移,从而促进三阴性乳腺癌进展[21]。ceRNA 网络中的 46 个差异表达基因,受到 lncRNA 和 miRNA 的调控,通过参与癌症的途径、白细胞跨内皮迁移、MAPK 和神经营养蛋白信号通路,从而影响男性乳腺癌的进展。
本研究构建的 ceRNA 网络中有 9 个 miRNA 节点,与 lncRNA 和 mRNA 连接较多的为 hsa-miRNA-183、hsa-miRNA-182 和 hsa-miRNA-21。研究[22]证实,hsa-miR-183 的表达水平在乳腺癌中上调,miR-183-5p 的过表达显著增强了 MCF-7 和 MDA-MB-231 细胞的细胞增殖,并抑制了细胞凋亡;hsa-miR-183 负调控程序性细胞死亡基因 4(PDCD4)的表达,PDCD4 的敲低抑制了 p21 和 p27 的表达,从而在乳腺癌中发挥致癌 miRNAs(oncogenic micRNA,oncomiRs)作用。hsa-miR-182 能通过靶向调控基因抑丝蛋白 1 基因(PFN1)促进三阴性乳腺癌的侵袭迁移[23],lncRNA AWPPH 和 miRNA-21 通过作用于 10 号染色体同源丢失性磷酸酶-张力蛋白基因(phosphase and tensin homology deleted on chromosome ten,PTEN)来调节三阴性乳腺癌细胞的增殖和化学敏感性[24-25]。通过 TCGA 男性乳腺癌表达谱数据构建的 ceRNA 网络中男性乳腺癌高表达的 6 种 mRNA—跨膜 γ 羧基酸蛋白 4 基因(PRRG4)、RalA GTP 酶的鸟嘌呤核苷酸交换因子 2 基因(RALGPS2)、包含 α/β 水解酶结构域的蛋白 17C 基因(ABHD17C)、埃兹蛋白基因(EZR)、细胞周期蛋白 B1 基因(CCNB1)和分配缺陷蛋白 6B 基因(partitioning defective protein 6B,PARD6B)中,EZR[26]、CCNB1[27]和 PARD6B[28]是女性乳腺癌的重要预后因素,而 PRRG4、RALGPS2 和 ABHD17C 在乳腺癌中少有文献研究。男性乳腺癌 ceRNA 网络中的 miRNA 和相关的 lncRNA 和 mRNA 构成重要的肿瘤调节通路,虽然目前暂缺乏验证,但是随着男性乳腺癌更加深入的研究,在进一步的实验和大量数据验证后将会对男性乳腺癌的发病机制有更进一步的了解。
重要声明
利益冲突声明:本文全体作者阅读并理解了《中国普外基础与临床杂志》的政策声明,我们没有相互竞争的利益。
作者贡献声明:章锐作为第一作者,主要参与文章撰写和分析工作;赵建国作为通信作者,主要参与拟定研究方向及修订文稿;祝孔俊、杜秋丽、袁媛和阮剑参与分析及修订工作。
男性乳腺癌占所有乳腺癌的 0.5%~1%,美国每年大约有 2 000 名男性被诊断出乳房恶性肿瘤[1-2]。由于缺乏可靠的临床证据,治疗男性乳腺癌的标准通常是来自女性乳腺癌的大量文献资料和临床经验,这些数据可能并不完全适用于男性,男性荷尔蒙环境可能是其独特而强大的风险因素,也是治疗结果和预后的决定因素[3]。在一项纳入了 102 例意大利男性乳腺癌患者的研究中,未发现乳腺癌 1 号基因(BRCA1)或乳腺癌 2 号基因(BRCA2)重排[4],男性乳腺癌可能与 PALB2(partner and localizer of BRCA2)中的雄激素受体(AR)[5]、CYP17 基因编码的 17α 羟化酶(CYP17)[6]和细胞周期检测点激酶 2(CHEK2)[7-8]的突变存在一定的相关性。近几年发现,非编码的 RNA [长链非编码 RNA(lncRNA)、微小 RNA(microRNA,miRNA)等]虽然不编码蛋白质,但在正常的生理功能和病理生理的调控中发挥着重要的作用,例如 lncRNA 能够作为肺癌诊断和预后的生物学标志物[9],miRNA 能参与基因表达调控[10]。Salmena 等[11]提出了竞争性内源 RNA(ceRNA)假说,并被后续实验支持。该假设描述 miRNA 通过结合 mRNA 调控其表达,lncRNA 通过竞争吸附 miRNA 影响 miRNA 的功能[12],但是在男性乳腺癌中 ceRNA 的调控机制并不清楚。本研究对 TCGA 数据库中含有男性乳腺癌和正常乳腺组织的转录组芯片数据进行分析,并构建 ceRNA 网络,为研究男性乳腺癌的发病机制奠定一定的基础。
1 临床资料
1.1 样本及数据分析
从 TCGA 数据库中收集男性乳腺癌的 RNA 表达谱数据,挑选到正常男性乳腺组织 1 例,男性乳腺癌癌组织 12 例。癌组织和正常组织的 lncRNA、mRNA 和 miRNA 数据采用 R 软件提取和标准化处理。
差异表达基因分析:将男性乳腺癌癌组织与正常男性乳腺组织进行差异表达基因分析,利用 R 软件中的“limma”包,按照 |log2FC|>1(FC 表示2 组样品间表达值的比值)、P<0.05,筛选差异基因。
1.2 GO 富集分析和 KEGG 通路分析
利用 DAVID 数据库(The Database for Annotation,Visualization,and Integrated Discovery)将差异基因进行 GO(Gene Ontology)富集分析和 KEGG(KytoKyoto Encyclopedia of Genes and Genomes)通路分析。
1.3 男性乳腺癌 ceRNA 网络构建
男性乳腺癌 ceRNA 网络构建的具体方法参考文献 [9, 13]。将差异 lncRNA 和 miRNA 在 miRcode 数据库中进行配对,基于 miRDB、miRTarbase 和 Targetscan 数据库,利用 starBase 在线软件对筛选出的差异 miRNA 进行靶基因预测,得到 lncRNA-miRNA-mRNA 的 ceRNA 调控网络数据,利用 Cytescape V3.5.2 软件进行可视化分析,制作出 ceRNA 网络图。
1.4 结果
1.4.1 lncRNA、miRNA 和 mRNA 的差异性表达分析
根据 |log2FC|>1 并且 P<0.05 的筛选标准,比较男性乳腺癌癌组织和正常乳腺组织的基因表达量,分别得到差异性表达的 lncRNA、miRNA 和 mRNA。其中 lncRNA 有 275 种,miRNA 有 33 种,mRNA 有 1 675 种,见图1a–1c 和表1。

a–c:lncRNA(a)、miRNA(b)和 mRNA(c)差异性表达的火山图,FDR 为错误发现率,上调基因标记为红色,下调基因标记为绿色;d:差异表达基因富集的前 10 个 GO 条目;e:差异表达基因参与的 9 条 KEGG 通路;f:lncRNA-miRNA-mRNA ceRNA 网络,其中菱形代表 lncRNA,正方形代表 miRNA,圆形代表 mRNA,红色为上调 RNA,绿色为下调 RNA;g:ceRNA 网络中差异表达基因富集的前 10 个 GO 条目;h:ceRNA 网络中差异表达基因参与的 4 条 KEGG 通路

1.4.2 差异表达 mRNA 的 GO 富集分析和 KEGG 通路分析
为了进一步检测差异表达基因在男性乳腺癌中的潜在作用,进行了 mRNA 的 GO 富集分析和 KEGG 通路分析。结果发现,差异表达 mRNA 主要参与了 G 蛋白信号传导、细胞增殖的负调控、对激素刺激的反应等生物学过程(图1d),参与的 KEGG 通路包括过氧化物酶体增殖物激活受体(PPAR)、细胞黏附分子(CAMs)、胰岛素信号通路等信号通路(图1e)。
1.4.3 差异表达基因 ceRNA 网络的构建
基于男性乳腺癌差异性表达的 lncRNA、miRNA 和 mRNA,本研究构建了 ceRNA 网络。总共有 9 个 miRNA 节点,46 个 mRNA 节点,25 个 lncRNA 节点,其中与 hsa-miRNA-183 相互作用的 lnRNA 和 mRNA 种类最多,见图1f。
1.4.4 ceRNA 网络中差异表达基因 mRNA 的 GO 富集分析和 KEGG 通路分析
为了进一步检测 ceRNA 网络中 46 个差异表达 mRNA 在男性乳腺癌中的潜在作用,进行了 GO 富集分析和 KEGG 通路分析。结果发现,46 个差异表达 mRNA 主要参与了与转录因子活性、调节磷酸盐代谢过程、细胞增殖的负调控、转录的负调控、细胞蛋白质代谢过程的调控、细胞迁移的调控、转移酶活性的正调控、调控细胞增殖、激活蛋白激酶活性、间充质细胞增殖的正调控等(图1g)。此外,4 条 KEGG 通路被激活,包括癌症的途径、白细胞跨内皮迁移、丝裂原活化蛋白激酶(MAPK)和神经营养蛋白信号通路(图1h)。上述结果表明,差异表达基因可能在乳腺癌的发生和进展中起重要作用。
2 讨论
美国国家癌症研究所监测的流行病学数据显示,1973 年至 2005 年期间的 5 494 例男性乳腺癌中有 92% 是雌激素受体(ER)阳性[14],但在 838 805 例女性乳腺癌中,只有 78% 是 ER 阳性[15]。在男性乳腺癌的免疫组织化学中发现,AR 阳性率为 34%~95%,雄激素途径比女性乳腺癌更加活跃[16]。一项研究[17]还发现,催乳素受体也涉及男性乳腺癌的发生,但是针对男性乳腺癌的研究仍然不足,缺乏有效的早期诊断标志物,亟需加强对其分子水平的研究,寻找有效的治疗靶点。
越来越多的证据表明,非编码 RNA 在肿瘤的发生和发展中起着重要的调控作用,非编码 RNA 通过多种途径调节基因表达,从而促进肿瘤发生和肿瘤转移[18]。本研究对 TCGA 数据库中的表达谱芯片数据进行了分析,构建了 ceRNA 网络,通过分析提取差异表达的 miRNA、mRNA 和 lncRNA。通过构建的 ceRNA,在既可以通过数据库查询相互作用关系的同时,也能确定这些基因是否是男性乳腺癌的差异基因,使分析结果更为准确[13]。lncRNA OSTN-AS1 以及相关的 ceRNA 调控机制[19]、端粒酶逆转录酶基因(TERT)、TRIML2(tripartite motif family-like 2)、PHBP4、miR-1-3p 及 miR-133a-3p5[20]在三阴性乳腺癌中可能是潜在的治疗靶点和预后指标。lncRNA HCP5 通过 ceRNA 结合 miR-219a-5p,调控杆状病毒 IAP 重复序列 3(BIRC3),影响三阴性乳腺癌细胞的增殖、凋亡、侵袭迁移,从而促进三阴性乳腺癌进展[21]。ceRNA 网络中的 46 个差异表达基因,受到 lncRNA 和 miRNA 的调控,通过参与癌症的途径、白细胞跨内皮迁移、MAPK 和神经营养蛋白信号通路,从而影响男性乳腺癌的进展。
本研究构建的 ceRNA 网络中有 9 个 miRNA 节点,与 lncRNA 和 mRNA 连接较多的为 hsa-miRNA-183、hsa-miRNA-182 和 hsa-miRNA-21。研究[22]证实,hsa-miR-183 的表达水平在乳腺癌中上调,miR-183-5p 的过表达显著增强了 MCF-7 和 MDA-MB-231 细胞的细胞增殖,并抑制了细胞凋亡;hsa-miR-183 负调控程序性细胞死亡基因 4(PDCD4)的表达,PDCD4 的敲低抑制了 p21 和 p27 的表达,从而在乳腺癌中发挥致癌 miRNAs(oncogenic micRNA,oncomiRs)作用。hsa-miR-182 能通过靶向调控基因抑丝蛋白 1 基因(PFN1)促进三阴性乳腺癌的侵袭迁移[23],lncRNA AWPPH 和 miRNA-21 通过作用于 10 号染色体同源丢失性磷酸酶-张力蛋白基因(phosphase and tensin homology deleted on chromosome ten,PTEN)来调节三阴性乳腺癌细胞的增殖和化学敏感性[24-25]。通过 TCGA 男性乳腺癌表达谱数据构建的 ceRNA 网络中男性乳腺癌高表达的 6 种 mRNA—跨膜 γ 羧基酸蛋白 4 基因(PRRG4)、RalA GTP 酶的鸟嘌呤核苷酸交换因子 2 基因(RALGPS2)、包含 α/β 水解酶结构域的蛋白 17C 基因(ABHD17C)、埃兹蛋白基因(EZR)、细胞周期蛋白 B1 基因(CCNB1)和分配缺陷蛋白 6B 基因(partitioning defective protein 6B,PARD6B)中,EZR[26]、CCNB1[27]和 PARD6B[28]是女性乳腺癌的重要预后因素,而 PRRG4、RALGPS2 和 ABHD17C 在乳腺癌中少有文献研究。男性乳腺癌 ceRNA 网络中的 miRNA 和相关的 lncRNA 和 mRNA 构成重要的肿瘤调节通路,虽然目前暂缺乏验证,但是随着男性乳腺癌更加深入的研究,在进一步的实验和大量数据验证后将会对男性乳腺癌的发病机制有更进一步的了解。
重要声明
利益冲突声明:本文全体作者阅读并理解了《中国普外基础与临床杂志》的政策声明,我们没有相互竞争的利益。
作者贡献声明:章锐作为第一作者,主要参与文章撰写和分析工作;赵建国作为通信作者,主要参与拟定研究方向及修订文稿;祝孔俊、杜秋丽、袁媛和阮剑参与分析及修订工作。