基于生物信息学探讨肥胖基因与疾病发生的关联性
Based on Bioinformatics, the Association between Obesity Genes and Disease Occurrence was Investigated
DOI: 10.12677/hjbm.2024.143045, PDF, HTML, XML, 下载: 6  浏览: 7  科研立项经费支持
作者: 刘向睿, 周 学, 许晓风:南京师范大学泰州学院化学与生物工程学院,江苏 泰州
关键词: 生物信息学肥胖小RNA糖尿病乳腺癌Bioinformatics Obesity miRNA Diabetes Breast Cancer
摘要: 方法:利用网络药理学和蛋白质互作网络可视化与富集分析技术,寻找肥胖基因及其互作小RNA与疾病的关联性。运用Disgenet、GeneCards、TTD、OMIM数据库寻找肥胖与糖尿病、乳腺癌的相关基因靶点,再结合Uniprot数据库进行基因去重、映射后得到肥胖和各疾病的关键基因数据。利用Venny在线数据处理平台获取肥胖与各疾病之间的关联基因。将关联基因利用STRING在线分析平台构建靶蛋白相互作用网络图并进行拓扑学分析,并将结果运用Cytoscape软件进一步筛选获得各疾病与肥胖之间具有强关联性的核心靶点基因。将所得核心靶点基因利用DAVID在线数据库和微生信在线分析平台进行GO和KEGG富集分析。结果:肥胖–乳腺癌交集基因460个,肥胖–糖尿病交集基因607个,肥胖–乳腺癌核心基因23个,肥胖–糖尿病核心基因24个。在此基础上预测与肥胖疾病基因相互作用的miRNA,共获得了肥胖与乳腺癌相关核心基因或作miRNA138个;肥胖与糖尿病相关核心基因或作miRNA144个。本研究运用生物信息学方法,对肥胖与糖尿病及乳腺癌之间的关系和潜在作用机制进行研究,再通过对miRNA的研究,为我们了解与肥胖相关的并发症的机制提供了新的视角,也为我们探索和改进治疗方法提供了新思路。
Abstract: Methods: Network pharmacology and protein-protein interaction network visualization and enrichment analysis techniques were used to find the association between obesity genes and their interaction small RNAs and diseases. Disgenet, GeneCards, TTD, and OMIM databases were used to search for gene targets related to obesity, diabetes and breast cancer, and then combined with Uniprot databases for gene deduplication and mapping, the key gene data of obesity and various diseases were obtained. The Venny online data processing platform was used to obtain the associated genes between obesity and various diseases. The associated genes were constructed by using the STRING online analysis platform to construct the target protein interaction network diagram and topoological analysis, and the results were further screened by Cytoscape software to obtain the core target genes with strong associations between various diseases and obesity. The obtained core target genes were enriched by GO and KEGG using the DAVID online database and the online analysis platform of microbiosis. Results: There were 460 obesity-breast cancer intersection genes, 607 obesity-diabetes intersection genes, 23 obesity-breast cancer core genes, and 24 obesity-diabetes core genes. On this basis, a total of 138 core genes or miRNAs related to obesity and breast cancer were obtained. There are 144 core genes or miRNAs related to obesity and diabetes. This study uses bioinformatics methods to study the relationship and potential mechanism of obesity with diabetes and breast cancer, and then provides a new perspective for us to understand the mechanism of obesity-related complications through the study of miRNAs, and also provides new ideas for us to explore and improve treatment methods.
文章引用:刘向睿, 周学, 许晓风. 基于生物信息学探讨肥胖基因与疾病发生的关联性[J]. 生物医学, 2024, 14(3): 409-419. https://doi.org/10.12677/hjbm.2024.143045

1. 引言

肥胖及其相关代谢紊乱现象的日益流行是已经成为全球重大的公共卫生问题。自1980年以来,全世界超重和肥胖的患病率增加了近一倍,目前全世界超过三分之一的人口被归为超重或肥胖,而在中国,也有至少17.5%的成年人超重或肥胖。专家做出预计到2030年,全球高达58%的成年人将超重或肥胖。越来越多的证据表明,肥胖与脂质紊乱疾病如非酒精性脂肪肝(non-alcoholicfattyliverdisease, NAFLD)、2型糖尿病(type2diebetesmellitus, T2DM)、血脂异常和动脉粥样硬化的风险增加密切相关。已知CCAAT/增强剂结合蛋白(C/EBP)和过氧化物酶体增殖剂激活受体(PPARs)等转录因子在前体细胞分化产生脂肪细胞这一过程中起着关键作用[1]。肥胖增加了患多种癌症的风险,其中包括乳腺癌(BC) [2] [3]。其中,肥胖受试者慢性炎症、瘦素分泌量增加(伴有全身瘦素抵抗[4])和脂膜素水平降低,可能会放松细胞分裂和血管生成的调节,并促进癌症的发展[5]

肥胖是体内脂肪过度蓄积和分布异常,往往伴有体重增加[6]。全基因组关联研究发现,超过600个基因位点与肥胖发生相关。其中,英国科学家2007年发现FTO基因与人类肥胖关系密切,被定义为第一个肥胖基因。FTO基因位于第16号染色体,含有9个外显子(真核基因的结构特点,不连续的,有外显性和内含子组成),基因长度为410.50 kb,广泛表达于人体组织的各发育阶段,且在下丘脑、骨骼肌及脂肪等组织中高表[7]。接着随着研究的深入,陆续发现基因OB、LEPR、PC1、POMC和MC4R也于肥胖相关。

microRNA (miRNA)是一类有内源基因编码的长度为19至22个核苷酸的非编码单链RNA分子,参与动植物转录后基因表达调控,具有多种生物学功能,参与细胞发育、分化、凋亡以及免疫应答等[8]。随着近几年来人们对miRNA的关注度提高和研究与日俱增,发现miRNA的失调与肿瘤的发生发展密切相关,而肥胖也是导致肿瘤发生概率激增的一大潜在因素[9]。因此本论文拟利用网络药理学和生物信息学的方法对与疾病相关的肥胖基因及其互作小RNA进行挖掘和分析,最后通过网络药理学的方法获取作用在肥胖基因上潜在的靶点,搜集治疗肥胖的方剂,通过关联规则、聚类及复杂网络分析,并筛选出核心药物,分析治疗肥胖的可能机制。

2. 材料与方法

2.1. 肥胖与疾病关联靶点数据获取

以“Obesity”为关键词,检索DisGeNet (https://www.disgenet.org/)、GeneGards (http://www.genecards.org/)、OMIM (https://omim.org/)和Therapeutic Target Database (TTD, https://bidd.nus.edu.sg/group/cjttd/)数据库获取肥胖相关基因、糖尿病和乳腺癌疾病的相关基因靶点数据,并结合Uniprot数据库中的基因注释数据,对下载的数据进行去重、映射后得到关键基因[10]-[14]。使用Venny在线作图工具(https://bioinfogp.cnb.csic.es/tools/venny/index.html)将肥胖基因分别与糖尿病基因、乳腺癌基因取交集,得到疾病与肥胖有关联性的潜在基因。

2.2. 构建PPI网络图

将获得的肥胖与糖尿病,乳腺癌交集基因放入STRING数据库中选择“multipleproteins”,物种选择“Homosapiens”,将所得结果保存为“string_interactions.tsv”文件,并导入Cytoscape软件中,利用CytoNCA插件分析获取肥胖与乳腺癌、肥胖与糖尿病相关的核心靶点基因,并将获取的核心靶点基因依据节点度(Degree)值大小做成PPI网络图[15]

2.3. GO和KEGG富集分析

将获取的肥胖与糖尿病、乳腺癌关联的核心靶基因导入DAVID数据平台进行分析,选择数据类型为“OFFICIAL-GENE-SYMBOL”,选择物种为“Homosapiens”,点击“SubmitList”,进行GO(Gene Ontology ) 和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集通路分析,其数据库更新于2024年4月30日[16]。根据分析的结果即所得的生物途径(BP)、细胞组分(CC)、分子功能(MF)和KEGG通路数据,选择其中P值最小的前十位(P < 0.05, FDR < 0.05)利用微生信–在线生物信息学分析、可视化云平台(http://www.bioinformatics.com.cn)制作富集气泡图[17]

2.4. miRNA-核心基因调控网络的预测

利用miRTarBase9.0数据库(https://mirtarbase.cuhk.edu.cn/)搜索与核心基因相互作用的miRNA,并将相中作用的数据下载为EXCEL表格[18]。将所获得的核心基因放入EXCEL表格中进行标准化数据筛选预测miRNA,将得到的数据整理导入Cytoscape3.10.2软件作图。

3. 结果与分析

3.1. 原始靶点数据获取

3.1.1. 肥胖基因

以“Obesity”为关键词,分别于DisGeNet、GenGards、OMIM、和Therapeutic Target Database检索肥胖相关基因。在DisGeNet中搜索到所需肥胖基因2822个,在GenGards中搜索到所需肥胖基因1277个,在OMIM中搜索到所需肥胖基因91个,在Therapeutic Target Database中搜索到所需肥胖基因82个。对从四个数据库获取的数据进行标准化处理,最后共获得了3268个有效数据。

3.1.2. 疾病基因

搜索各个数据库经筛选后获得乳腺癌基因1523个,糖尿病基因3218个。经标准化数据处理后,最终筛选获得乳腺癌基因839个,糖尿病基因767个。将之前获得的肥胖相关靶点基因分别与乳腺癌、糖尿病三种疾病基因取交集。最终获得肥胖–乳腺癌相关基因460个(如图1),肥胖–糖尿病相关基因607个(如图2)。

Figure 1. Obesity-Breast Cancer

1. 肥胖–乳腺癌

Figure 2. Obesity-Diabetes

2. 肥胖–糖尿病

3.2. 数据网络图

3.2.1. 构建PPI网络图

利用Cytoscape软件中CytoNCA插件对肥胖与乳腺癌交集关键基因进行Degree值(中心节点度值)计算处理,最终获得前23个肥胖与乳腺癌之间具有强关联性的核心基因。同理做肥胖与糖尿病交集关键基因数据处理,最终获得前24个肥胖与糖尿病之间具有强关联性的核心基因。依据Degree值的大小将核心基因作图,如图3图4。(核心基因靶点大小根据Degree值依次增大,颜色深浅依据Degree值依次增大由浅入深。两两基因之间连线的颜色依据两个基因的关联性强弱由浅入深。)

Figure 3. PPI network diagram of obesity and breast cancer

3. 肥胖与乳腺癌核心靶点PPI网络图

Figure 4. PPI network diagram ofobesity and diabetes

4. 肥胖与糖尿病核心靶点PPI网络图

3.2.2. GO和KEGG富集分析

将DAVID数据分析平台处理得到的P值最小的前十个数据放入微生信–在线生物信息学分析、可视化云平台做GO和KEGG富集分析得到以下数据如图5~8

Figure 5. GO enrichment analysis of obesity and breast cancer disease (−log10 P value as Enrichment score)

5. 肥胖与乳腺癌疾病GO富集分析(以−log10的P值作为Enrichment score)

Figure 6. GO enrichment analysis of obesity and diabetes (−log10 P value was used as Enrichment score)

6. 肥胖与糖尿病疾病GO富集分析(以−log10的P值作为Enrichment score)

Figure 7. KEGG enrichment analysis of obesity and breast cancer diseases

7. 肥胖与乳腺癌疾病KEGG富集分析

Figure 8. KEGG enrichment analysis of obesity and diabetes disease

8. 肥胖与糖尿病疾病KEGG富集分析

3.2.3. 作用的miRNA与肥胖疾病基因及药靶之间的关联性分析

利用miRTarBase在线数据处理平台搜索肥胖与糖尿病和乳腺癌的核心基因的互作miRNA,选择强证明(Strong evidence)条件下三个验证方法(Reporter assay,Western blot,qPCR)都存在的miRNA利用Cytoscape3.10.2软件作图,(如图9图10)。经过去重等方法处理获得如下数据:肥胖与乳腺癌相关核心基因中TG53包括16个miRNA;AKT1包括7个miRNA;EGFR包括21个miRNA;STAT3包括29个miRNA;SRC包括2个miRNA;CTNNB1包括6个miRNA;TG53包括16个miRNA;JUN包括4个

Figure 9. Obesity interacts with core genes in breast cancer

9. 肥胖与乳腺癌核心基因相关互作miRNA

Figure 10. Obesity interacts with diabetes core genes and miRNAs

10. 肥胖与糖尿病核心基因相关互作miRNA

miRNA;EP300包括2个miRNA;ESR1包括9个miRNA;IL6包括8个miRNA;MAPK3包括3个miRNA;MAPK1包括9个miRNA;MYC包括14个miRNA;TNF包括4个miRNA; HSP90AA1包括1个miRNA;BRCA1包括5个miRNA;SMAD3包括14个miRNA;NFKB1包括6个miRNA;RELA包括2个miRNA;MAPK8包括2个miRNA;ERBB2包括7个miRNA;PIK3CA包括6个miRNA;其中CREBBP没有条件符合的miRNA。肥胖与糖尿病相关核心基因中ATK1包括7个miRNA;IL6包括8个miRNA;TP53包括16个miRNA;TNF包括4个miRNA;STAT3包括29个miRNA;TLR4包括10个miRNA;IL1B包括2个miRNA;CTNNB1包括6个miRNA;IFNG包括3个miRNA;ESR1包括9个miRNA;IL6包括8个miRNA;PPARGC1A 包括2个miRNA;NFKB1包括6个miRNA;FOXO1包括19个miRNA;MAPK1包括9个miRNA;IGF1R包括32个miRNA;IRS1 包括4个miRNA;PPARG包括4个miRNA;APOB包括1个miRNA;其中INS、APOA1、PRKACA、ALB、IL10、APOE没有条件符合的miRNA。

4. 讨论

随着人们生活水平的提高和膳食结构的改变,肥胖人群的占比明显增加,目前已成为严重影响我国居民身心健康的主要公共卫生问题。研究发现,肥胖与多种疾病相关,并是多种癌症发生的重要危险因素。本研究通过生物信息学方法,对肥胖与糖尿病及乳腺癌之间的关系和潜在作用机制进行研究。

本研究发现23个肥胖与乳腺癌之间具有强关联性的核心靶基因,24个肥胖与糖尿病之间具有强关联性的核心靶基因。进一步分析发现,有9个核心靶基因同时在肥胖、乳腺癌和糖尿病中存在,包括:AKT1、CTNNB1、ESR1、IL6、MAPK1、NFKB1、STAT3、TNF和TP53。AKT1属于AKT蛋白家族重要成员之一,AKT1蛋白参与调节细胞生长、增殖、分化、凋亡等生物学过程。AKT1蛋白在多种组织和器官中表达,尤其在心脏和脂肪组织中表达较高。AKT1的异常活化与多种疾病的发生密切相关,如肥胖、癌症、糖尿病、心血管疾病等[19] [20]。AKT信号通路在胰岛素信号传导中起关键作用,参与调节葡萄糖代谢和脂肪代谢,通过调节AKT信号通路,可以改善胰岛素抵抗和降低血糖水平,为代谢性疾病的治疗提供新思路[21]。研究发现,IL-6可参与由糖代谢紊乱引起的例如糖尿病、高血脂及肥胖等疾病的发生、发展过程。IL-6可提高骨骼肌细胞葡萄糖摄取和葡萄糖转运体4 (GLUT4)向细胞膜转运,对胰岛素刺激的葡萄糖摄取和代谢起到扩大效应[22]。TNF也被证明在脂肪细胞功能中发挥关键作用,在脂肪组织中TNF的表达水平与肥胖的程度呈正相关,降低TNF的水平可同时降低胰岛素敏感程度、调控糖脂代谢,从而降低肥胖的发生风险[23]

microRNA是一类长度约为22个核苷酸的非编码RNA,通过与靶mRNA互补结合,在转录后水平上调控基因的表达。研究发现,许多miRNA与脂肪细胞的分化密切相关,并且在肥胖症中失调[24]。越来越多的证据表明,肥胖相关和/或脂肪组织衍生的循环miRNA是有望用于治疗肥胖和相关疾病的新治疗靶标。例如:miRNA-122参与NAFLD脂质代谢过程,其作用机制可能是通过调控FAS、ACC、SREBP-1c、HMGCR等脂质生物合成相关基因表达和脂肪酸β-氧化间接参与脂质代谢过程。miR-17-5p通过靶向下调Rb2/p130来加速脂肪细胞分化,是胰岛素分泌分子机制的关键调节因子[25]。本研究工作,发现作用在肥胖-疾病核心靶基因上的miRNA存在差异,如IL-6上有8个miRNA,包括hsa-miR-149-5p、hsa-let-7a-5p、hsa-let-7c-5p、hsa-miR-107、hsa-miR-137、hsa-miR-146b-5p、hsa-miR-340-5p、hsa-miR-98-5p;APOB只被1个miRNA hsa-miR-548p作用。STAT3作用了29个miRNA,包括hsa-miR-17-5p、hsa-miR-148a-3p等。通过对miRNA的研究将为我们了解与肥胖相关的并发症的机制提供了新的视角,并可提供新的和改进的治疗方法。

基金项目

江苏省自然科学基金面上项目“CG18262通过转录调控Imd通路与MAPK通路交互参与先天免疫稳态维持的分子机制”(项目编号:BK20211128);江苏省大学生创新创业训练计划项目“肥胖基因及其互作小RNA与疾病发生的关联性研究”(项目编号:202313843009Y)。

参考文献

[1] Rosen, E.D. and Spiegelman, B.M. (2000) Molecular Regulation of Adipogenesis. Annual Review of Cell and Developmental Biology, 16, 145-171.
https://doi.org/10.1146/annurev.cellbio.16.1.145
[2] 拓嘉怡, 项永兵. 癌症流行现况病因以及营养流行病学的研究进展[J]. 肿瘤, 2023, 43(4): 359-366.
[3] 燕声. 年轻时肥胖, 癌症风险高[N]. 保健时报, 2023-11-16(004).
[4] Könner, A.C. and Brüning, J.C. (2012) Selective Insulin and Leptin Resistance in Metabolic Disorders. Cell Metabolism, 16, 144-152.
https://doi.org/10.1016/j.cmet.2012.07.004
[5] Schwartz, B. and Yehuda-Shnaidman, E. (2014) Putative Role of Adipose Tissue in Growth and Metabolism of Colon Cancer Cells. Frontiers in Oncology, 4, Article 164.
https://doi.org/10.3389/fonc.2014.00164
[6] 李丹丹, 王东梅, 曹卫平, 翟凤婷. 基于生物信息学探讨肥胖与不孕症的关系[J]. 中国生育健康杂志, 2022, 33(5): 415-419.
[7] 宁美微, 刘湘. FTO和ABCG2基因多态性与超重/肥胖和代谢参数的相关性研究[D]: [硕士学位论文]. 武汉: 湖北中医药大学, 2022.
[8] Morton, L.M., Slager, S.L., Cerhan, J.R., Wang, S.S., Vajdic, C.M., Skibola, C.F., et al. (2014) Etiologic Heterogeneity among Non-Hodgkin Lymphoma Subtypes: The Interlymph Non-Hodgkin Lymphoma Subtypes Project. JNCI Monographs, 2014, 130-144.
https://doi.org/10.1093/jncimonographs/lgu013
[9] Gargalionis, A. and Basdra, E. (2013) Insights in Micrornas Biology. Current Topics in Medicinal Chemistry, 13, 1493-1502.
https://doi.org/10.2174/15680266113139990098
[10] Piñero, J., Ramírez-Anguita, J.M., Saüch-Pitarch, J., Ronzano, F., Centeno, E., Sanz, F., et al. (2019) The Disgenet Knowledge Platform for Disease Genomics: 2019 Update. Nucleic Acids Research, 48, D845-D855.
https://doi.org/10.1093/nar/gkz1021
[11] Amberger, J.S. and Hamosh, A. (2017) Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics, 58, 1.2.1-1.2.12.
https://doi.org/10.1002/cpbi.27
[12] Bateman, A., Martin, M., Orchard, S., Magrane, M., Agivetova, R., Ahmad, S., et al. (2020) Uniprot: The Universal Protein Knowledgebase in 2021. Nucleic Acids Research, 49, D480-D489.
https://doi.org/10.1093/nar/gkaa1100
[13] Zhou, Y., Zhang, Y., Zhao, D., Yu, X., Shen, X., Zhou, Y., et al. (2023) TTD: Therapeutic Target Database Describing Target Druggability Information. Nucleic Acids Research, 52, D1465-D1477.
https://doi.org/10.1093/nar/gkad751
[14] Stelzer, G., Rosen, N., Plaschkes, I., Zimmerman, S., Twik, M., Fishilevich, S., et al. (2016) The GeneCards Suite: From Gene Data Mining to Disease Genome Sequence Analyses. Current Protocols in Bioinformatics, 54, 1.30.1-1.30.33.
https://doi.org/10.1002/cpbi.5
[15] Szklarczyk, D., Kirsch, R., Koutrouli, M., Nastou, K., Mehryary, F., Hachilif, R., et al. (2022) The STRING Database in 2023: Protein-Protein Association Networks and Functional Enrichment Analyses for Any Sequenced Genome of Interest. Nucleic Acids Research, 51, D638-D646.
https://doi.org/10.1093/nar/gkac1000
[16] 党春晓, 刘鹏飞, 王鼎, 等. 基于生物信息学分析库欣综合征核心基因与互作miRNA[J]. 中南医学科学杂志, 2023, 51(1): 15-18.
[17] Huang, H., Lin, Y., Cui, S., Huang, Y., Tang, Y., Xu, J., et al. (2021) Mirtarbase Update 2022: An Informative Resource for Experimentally Validated miRNA-Target Interactions. Nucleic Acids Research, 50, D222-D230.
https://doi.org/10.1093/nar/gkab1079
[18] Tang, D., Chen, M., Huang, X., Zhang, G., Zeng, L., Zhang, G., et al. (2023) SRplot: A Free Online Platform for Data Visualization and Graphing. PLOS ONE, 18, e0294236.
https://doi.org/10.1371/journal.pone.0294236
[19] 彭浩原, 郑伟, 许建, 等. 基于网络药理学和分子对接探讨桫椤叶治疗非小细胞肺癌的作用机制[J/OL]. 合成化学: 1-14.
https://doi.org/10.15952/j.cnki.cjsc.1005-1511.23168, 2024-06-06.
[20] 卿菁, 周衡, 陈莉, 赵伟, 吴青, 李珊珊. 香芹酚对2型糖尿病肝损伤的影响及机制[J]. 中华中医药学刊, 2024, 42(2): 131-135.
[21] Jiao, W., Mi, S., Sang, Y., Jin, Q., Chitrakar, B., Wang, X., et al. (2022) Integrated Network Pharmacology and Cellular Assay for the Investigation of an Anti-Obesity Effect of 6-shogaol. Food Chemistry, 374, Article ID: 131755.
https://doi.org/10.1016/j.foodchem.2021.131755
[22] Ghosh, S. (2013) An IL-6 Link between Obesity and Cancer. Frontiers in Bioscience, 5, 461-478.
https://doi.org/10.2741/e628
[23] Tzanavari, T., Giannogonas, P. and Karalis, K.P. (2010) TNF-α and Obesity. In: Kollias, G. and Sfikakis, P.P., Eds., Current Directions in Autoimmunity, Karger, 145-156.
https://doi.org/10.1159/000289203
[24] Ji, C. and Guo, X. (2019) The Clinical Potential of Circulating Micrornas in Obesity. Nature Reviews Endocrinology, 15, 731-743.
https://doi.org/10.1038/s41574-019-0260-0
[25] Chen, R., Xin, G. and Zhang, X. (2019) Long Non-Coding RNA HCP5 Serves as a ceRNA Sponging miR-17-5p and miR-27a/b to Regulate the Pathogenesis of Childhood Obesity via the MAPK Signaling Pathway. Journal of Pediatric Endocrinology and Metabolism, 32, 1327-1339.
https://doi.org/10.1515/jpem-2018-0432