1. 引言
肥胖及其相关代谢紊乱现象的日益流行是已经成为全球重大的公共卫生问题。自1980年以来,全世界超重和肥胖的患病率增加了近一倍,目前全世界超过三分之一的人口被归为超重或肥胖,而在中国,也有至少17.5%的成年人超重或肥胖。专家做出预计到2030年,全球高达58%的成年人将超重或肥胖。越来越多的证据表明,肥胖与脂质紊乱疾病如非酒精性脂肪肝(non-alcoholicfattyliverdisease, NAFLD)、2型糖尿病(type2diebetesmellitus, T2DM)、血脂异常和动脉粥样硬化的风险增加密切相关。已知CCAAT/增强剂结合蛋白(C/EBP)和过氧化物酶体增殖剂激活受体(PPARs)等转录因子在前体细胞分化产生脂肪细胞这一过程中起着关键作用[1]。肥胖增加了患多种癌症的风险,其中包括乳腺癌(BC) [2] [3]。其中,肥胖受试者慢性炎症、瘦素分泌量增加(伴有全身瘦素抵抗[4])和脂膜素水平降低,可能会放松细胞分裂和血管生成的调节,并促进癌症的发展[5]。
肥胖是体内脂肪过度蓄积和分布异常,往往伴有体重增加[6]。全基因组关联研究发现,超过600个基因位点与肥胖发生相关。其中,英国科学家2007年发现FTO基因与人类肥胖关系密切,被定义为第一个肥胖基因。FTO基因位于第16号染色体,含有9个外显子(真核基因的结构特点,不连续的,有外显性和内含子组成),基因长度为410.50 kb,广泛表达于人体组织的各发育阶段,且在下丘脑、骨骼肌及脂肪等组织中高表[7]。接着随着研究的深入,陆续发现基因OB、LEPR、PC1、POMC和MC4R也于肥胖相关。
microRNA (miRNA)是一类有内源基因编码的长度为19至22个核苷酸的非编码单链RNA分子,参与动植物转录后基因表达调控,具有多种生物学功能,参与细胞发育、分化、凋亡以及免疫应答等[8]。随着近几年来人们对miRNA的关注度提高和研究与日俱增,发现miRNA的失调与肿瘤的发生发展密切相关,而肥胖也是导致肿瘤发生概率激增的一大潜在因素[9]。因此本论文拟利用网络药理学和生物信息学的方法对与疾病相关的肥胖基因及其互作小RNA进行挖掘和分析,最后通过网络药理学的方法获取作用在肥胖基因上潜在的靶点,搜集治疗肥胖的方剂,通过关联规则、聚类及复杂网络分析,并筛选出核心药物,分析治疗肥胖的可能机制。
2. 材料与方法
2.1. 肥胖与疾病关联靶点数据获取
以“Obesity”为关键词,检索DisGeNet (https://www.disgenet.org/)、GeneGards (http://www.genecards.org/)、OMIM (https://omim.org/)和Therapeutic Target Database (TTD, https://bidd.nus.edu.sg/group/cjttd/)数据库获取肥胖相关基因、糖尿病和乳腺癌疾病的相关基因靶点数据,并结合Uniprot数据库中的基因注释数据,对下载的数据进行去重、映射后得到关键基因[10]-[14]。使用Venny在线作图工具(https://bioinfogp.cnb.csic.es/tools/venny/index.html)将肥胖基因分别与糖尿病基因、乳腺癌基因取交集,得到疾病与肥胖有关联性的潜在基因。
2.2. 构建PPI网络图
将获得的肥胖与糖尿病,乳腺癌交集基因放入STRING数据库中选择“multipleproteins”,物种选择“Homosapiens”,将所得结果保存为“string_interactions.tsv”文件,并导入Cytoscape软件中,利用CytoNCA插件分析获取肥胖与乳腺癌、肥胖与糖尿病相关的核心靶点基因,并将获取的核心靶点基因依据节点度(Degree)值大小做成PPI网络图[15]。
2.3. GO和KEGG富集分析
将获取的肥胖与糖尿病、乳腺癌关联的核心靶基因导入DAVID数据平台进行分析,选择数据类型为“OFFICIAL-GENE-SYMBOL”,选择物种为“Homosapiens”,点击“SubmitList”,进行GO(Gene Ontology ) 和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集通路分析,其数据库更新于2024年4月30日[16]。根据分析的结果即所得的生物途径(BP)、细胞组分(CC)、分子功能(MF)和KEGG通路数据,选择其中P值最小的前十位(P < 0.05, FDR < 0.05)利用微生信–在线生物信息学分析、可视化云平台(http://www.bioinformatics.com.cn)制作富集气泡图[17]。
2.4. miRNA-核心基因调控网络的预测
利用miRTarBase9.0数据库(https://mirtarbase.cuhk.edu.cn/)搜索与核心基因相互作用的miRNA,并将相中作用的数据下载为EXCEL表格[18]。将所获得的核心基因放入EXCEL表格中进行标准化数据筛选预测miRNA,将得到的数据整理导入Cytoscape3.10.2软件作图。
3. 结果与分析
3.1. 原始靶点数据获取
3.1.1. 肥胖基因
以“Obesity”为关键词,分别于DisGeNet、GenGards、OMIM、和Therapeutic Target Database检索肥胖相关基因。在DisGeNet中搜索到所需肥胖基因2822个,在GenGards中搜索到所需肥胖基因1277个,在OMIM中搜索到所需肥胖基因91个,在Therapeutic Target Database中搜索到所需肥胖基因82个。对从四个数据库获取的数据进行标准化处理,最后共获得了3268个有效数据。
3.1.2. 疾病基因
搜索各个数据库经筛选后获得乳腺癌基因1523个,糖尿病基因3218个。经标准化数据处理后,最终筛选获得乳腺癌基因839个,糖尿病基因767个。将之前获得的肥胖相关靶点基因分别与乳腺癌、糖尿病三种疾病基因取交集。最终获得肥胖–乳腺癌相关基因460个(如图1),肥胖–糖尿病相关基因607个(如图2)。
Figure 1. Obesity-Breast Cancer
图1. 肥胖–乳腺癌
Figure 2. Obesity-Diabetes
图2. 肥胖–糖尿病
3.2. 数据网络图
3.2.1. 构建PPI网络图
利用Cytoscape软件中CytoNCA插件对肥胖与乳腺癌交集关键基因进行Degree值(中心节点度值)计算处理,最终获得前23个肥胖与乳腺癌之间具有强关联性的核心基因。同理做肥胖与糖尿病交集关键基因数据处理,最终获得前24个肥胖与糖尿病之间具有强关联性的核心基因。依据Degree值的大小将核心基因作图,如图3,图4。(核心基因靶点大小根据Degree值依次增大,颜色深浅依据Degree值依次增大由浅入深。两两基因之间连线的颜色依据两个基因的关联性强弱由浅入深。)
Figure 3. PPI network diagram of obesity and breast cancer
图3. 肥胖与乳腺癌核心靶点PPI网络图
Figure 4. PPI network diagram ofobesity and diabetes
图4. 肥胖与糖尿病核心靶点PPI网络图
3.2.2. GO和KEGG富集分析
将DAVID数据分析平台处理得到的P值最小的前十个数据放入微生信–在线生物信息学分析、可视化云平台做GO和KEGG富集分析得到以下数据如图5~8。
Figure 5. GO enrichment analysis of obesity and breast cancer disease (−log10 P value as Enrichment score)
图5. 肥胖与乳腺癌疾病GO富集分析(以−log10的P值作为Enrichment score)
Figure 6. GO enrichment analysis of obesity and diabetes (−log10 P value was used as Enrichment score)
图6. 肥胖与糖尿病疾病GO富集分析(以−log10的P值作为Enrichment score)
Figure 7. KEGG enrichment analysis of obesity and breast cancer diseases
图7. 肥胖与乳腺癌疾病KEGG富集分析
Figure 8. KEGG enrichment analysis of obesity and diabetes disease
图8. 肥胖与糖尿病疾病KEGG富集分析
3.2.3. 作用的miRNA与肥胖疾病基因及药靶之间的关联性分析
利用miRTarBase在线数据处理平台搜索肥胖与糖尿病和乳腺癌的核心基因的互作miRNA,选择强证明(Strong evidence)条件下三个验证方法(Reporter assay,Western blot,qPCR)都存在的miRNA利用Cytoscape3.10.2软件作图,(如图9、图10)。经过去重等方法处理获得如下数据:肥胖与乳腺癌相关核心基因中TG53包括16个miRNA;AKT1包括7个miRNA;EGFR包括21个miRNA;STAT3包括29个miRNA;SRC包括2个miRNA;CTNNB1包括6个miRNA;TG53包括16个miRNA;JUN包括4个
Figure 9. Obesity interacts with core genes in breast cancer
图9. 肥胖与乳腺癌核心基因相关互作miRNA
Figure 10. Obesity interacts with diabetes core genes and miRNAs
图10. 肥胖与糖尿病核心基因相关互作miRNA
miRNA;EP300包括2个miRNA;ESR1包括9个miRNA;IL6包括8个miRNA;MAPK3包括3个miRNA;MAPK1包括9个miRNA;MYC包括14个miRNA;TNF包括4个miRNA; HSP90AA1包括1个miRNA;BRCA1包括5个miRNA;SMAD3包括14个miRNA;NFKB1包括6个miRNA;RELA包括2个miRNA;MAPK8包括2个miRNA;ERBB2包括7个miRNA;PIK3CA包括6个miRNA;其中CREBBP没有条件符合的miRNA。肥胖与糖尿病相关核心基因中ATK1包括7个miRNA;IL6包括8个miRNA;TP53包括16个miRNA;TNF包括4个miRNA;STAT3包括29个miRNA;TLR4包括10个miRNA;IL1B包括2个miRNA;CTNNB1包括6个miRNA;IFNG包括3个miRNA;ESR1包括9个miRNA;IL6包括8个miRNA;PPARGC1A 包括2个miRNA;NFKB1包括6个miRNA;FOXO1包括19个miRNA;MAPK1包括9个miRNA;IGF1R包括32个miRNA;IRS1 包括4个miRNA;PPARG包括4个miRNA;APOB包括1个miRNA;其中INS、APOA1、PRKACA、ALB、IL10、APOE没有条件符合的miRNA。
4. 讨论
随着人们生活水平的提高和膳食结构的改变,肥胖人群的占比明显增加,目前已成为严重影响我国居民身心健康的主要公共卫生问题。研究发现,肥胖与多种疾病相关,并是多种癌症发生的重要危险因素。本研究通过生物信息学方法,对肥胖与糖尿病及乳腺癌之间的关系和潜在作用机制进行研究。
本研究发现23个肥胖与乳腺癌之间具有强关联性的核心靶基因,24个肥胖与糖尿病之间具有强关联性的核心靶基因。进一步分析发现,有9个核心靶基因同时在肥胖、乳腺癌和糖尿病中存在,包括:AKT1、CTNNB1、ESR1、IL6、MAPK1、NFKB1、STAT3、TNF和TP53。AKT1属于AKT蛋白家族重要成员之一,AKT1蛋白参与调节细胞生长、增殖、分化、凋亡等生物学过程。AKT1蛋白在多种组织和器官中表达,尤其在心脏和脂肪组织中表达较高。AKT1的异常活化与多种疾病的发生密切相关,如肥胖、癌症、糖尿病、心血管疾病等[19] [20]。AKT信号通路在胰岛素信号传导中起关键作用,参与调节葡萄糖代谢和脂肪代谢,通过调节AKT信号通路,可以改善胰岛素抵抗和降低血糖水平,为代谢性疾病的治疗提供新思路[21]。研究发现,IL-6可参与由糖代谢紊乱引起的例如糖尿病、高血脂及肥胖等疾病的发生、发展过程。IL-6可提高骨骼肌细胞葡萄糖摄取和葡萄糖转运体4 (GLUT4)向细胞膜转运,对胰岛素刺激的葡萄糖摄取和代谢起到扩大效应[22]。TNF也被证明在脂肪细胞功能中发挥关键作用,在脂肪组织中TNF的表达水平与肥胖的程度呈正相关,降低TNF的水平可同时降低胰岛素敏感程度、调控糖脂代谢,从而降低肥胖的发生风险[23]。
microRNA是一类长度约为22个核苷酸的非编码RNA,通过与靶mRNA互补结合,在转录后水平上调控基因的表达。研究发现,许多miRNA与脂肪细胞的分化密切相关,并且在肥胖症中失调[24]。越来越多的证据表明,肥胖相关和/或脂肪组织衍生的循环miRNA是有望用于治疗肥胖和相关疾病的新治疗靶标。例如:miRNA-122参与NAFLD脂质代谢过程,其作用机制可能是通过调控FAS、ACC、SREBP-1c、HMGCR等脂质生物合成相关基因表达和脂肪酸β-氧化间接参与脂质代谢过程。miR-17-5p通过靶向下调Rb2/p130来加速脂肪细胞分化,是胰岛素分泌分子机制的关键调节因子[25]。本研究工作,发现作用在肥胖-疾病核心靶基因上的miRNA存在差异,如IL-6上有8个miRNA,包括hsa-miR-149-5p、hsa-let-7a-5p、hsa-let-7c-5p、hsa-miR-107、hsa-miR-137、hsa-miR-146b-5p、hsa-miR-340-5p、hsa-miR-98-5p;APOB只被1个miRNA hsa-miR-548p作用。STAT3作用了29个miRNA,包括hsa-miR-17-5p、hsa-miR-148a-3p等。通过对miRNA的研究将为我们了解与肥胖相关的并发症的机制提供了新的视角,并可提供新的和改进的治疗方法。
基金项目
江苏省自然科学基金面上项目“CG18262通过转录调控Imd通路与MAPK通路交互参与先天免疫稳态维持的分子机制”(项目编号:BK20211128);江苏省大学生创新创业训练计划项目“肥胖基因及其互作小RNA与疾病发生的关联性研究”(项目编号:202313843009Y)。