1. 引言
阿尔茨海默病(Alzheimer’s Disease, AD)是一种常见的中枢神经系统退行性疾病,以β淀粉样蛋白沉积形成的细胞外老年斑(Aβ Plaques)及tau蛋白过度磷酸化形成的神经细胞内神经原纤维缠结为主要病理学特征 [1] ,近年来,AD患者人数增加迅速,有相关学者预测,全球范围内AD患者将在2041年突破1.3亿 [2] 。目前为止,最常用的AD诊断技术是神经影像学技术,包括MRI (Magnetic Resonance Imaging)、CBF (Cerebral Blood Flow)、EEG (Electroencephalogram)等 [3] ,然而,这些技术只有在病程发展至β淀粉样蛋白(β-Amyloid Protein, Aβ)沉积形成老年斑时才可以进行明确诊断,但众所周知,AD的病程具有不可逆性,能否早期进行诊断并及时给予干预,对AD患者预后是否良好具有重要意义。因此,可用于诊断AD的生物标志物的发掘对于现阶段AD的早期诊断具有重要意义。传统的高通量测序技术主要在组织水平检测与AD相关的突变和基因表达失调,但是对于脑组织基因组结构变化以及亚克隆的鉴定等方面存在一定的局限性,并且忽略了突变细胞之间的异质性。近年来兴起的单细胞测序技术可以对单个细胞进行高通量和高分辨率的分析 [4] 。本研究通过单细胞测序,加权基因共表达分析(WGCNA, Weighted Correlation Network Analysis),GO及KEGG分析,PPI蛋白互作网络的构建得到可能有助于AD早期诊断与治疗的生物标志物。免疫学是当前各种疾病新型诊疗方式探究的重点领域,有研究显示,AD的发病可能与免疫系统有关 [5] ,其表现为免疫细胞的差异性表达,因此,本研究设计通过CIBERSORT对已聚类模块的基因进行免疫浸润分析,旨在寻找AD的免疫学标志物。综上所述,本研究通过生物信息学方式发掘与AD发病相关的基因及免疫细胞,旨在为AD的早期诊治提供帮助。
2. 方法
2.1. 单细胞测序
通过选取GEO数据库中编号为GSE163577的数据集,对其进行单细胞测序,得到在不同细胞亚群中上调及下调表达的基因及基因表达量。
2.2. WGCNA分析
2.2.1. 原始数据处理,网络构建参数
对单细胞测序得到的数据进行处理,原始数据共计14,037个基因,17个样本,过滤表达量变化波动较低(标准偏差 ≤ 0.1)的基因,最终剩余557个基因,17个样本。设定power值从1~30,分别计算其得到的网络对应的相关系数和网络的平均连接度。其中,相关系数越高(最大为1),网络越接近无尺度网络分布,同时保证一定的基因连接度,经过对比,本次分析结果中所用的power值为:8 (图1)。
![](//html.hanspub.org/file/36-8100108x8_hanspub.png?20240612165635333)
Figure 1. WGCN network construction parameters
图1. WGCN网络构建参数
2.2.2. 模块识别及分析
基于选定的power值,建立加权共表达网络模型,最终将557个基因划分为7个模块,其中灰色模块(Grey)为不能归属到任意模块的基因集合,没有参考意义(图2)。
![](//html.hanspub.org/file/36-8100108x9_hanspub.png?20240612165635333)
Figure 2. Gene clustering tree and module distribution
图2. 基因聚类树及模块分布情况
2.2.3. 筛选模块,进行模块相关绘图
根据模块聚类结果,初步筛选符合本次探究目的的模块。选择好后,根据WGCNA模块划分结果,分别利用聚类图,箱线图和柱形图展示模块基因表达信息(图3、图4、图5)。
![](//html.hanspub.org/file/36-8100108x10_hanspub.png?20240612165635333)
Figure 3. Cluster diagram of module gene expression
图3. 模块基因表达聚类图
![](//html.hanspub.org/file/36-8100108x11_hanspub.png?20240612165635333)
Figure 4. Module gene expression box diagram
图4. 模块基因表达线箱图
![](//html.hanspub.org/file/36-8100108x12_hanspub.png?20240612165635333)
Figure 5. Module gene expression bar chart
图5. 模块基因表达柱状图
2.2.4. 模块性质关联分析
以相关系数绝对值大于等于0.3且p value小于0.05为阈值,筛选各个性状相关的模块。对每个性状相关的模块,分别计算模块基因表达量与对应性状的相关性(Gene Significance, GS),同时计算模块基因表达量与模块特征基因(Eigengene)的相关性,根据以上两个值绘制散点图,结果表明:模块中的基因既与性状具有较高的相关程度,也与模块特征基因具有较高的相关程度(图6)。
![](//html.hanspub.org/file/36-8100108x13_hanspub.png?20240612165635333)
Figure 6. Heat map of trait module association
图6. 性状模块关联热图
2.2.5. 核心基因分析
无尺度网络图中,绝大多数节点(即基因)的连接度较低,只有少数节点连接度较高。一个模块内的核心基因,即该模块中连接度最高的一群基因。本次模块核心基因分析,分别分析了每个模块中连接度最高的前50个基因,展示这些基因之间的关系。结合前文的模块筛选,最终展示出WGCNA分析中“blue”模块的基因关系(图7)。
2.3. KEGG及GO分析
对选定模块进行KEGG及GO分析,确定该模块基因所富集的生物学功能(图8、图9)。
![](//html.hanspub.org/file/36-8100108x15_hanspub.png?20240612165635333)
Figure 8. KEGG analysis results of module genes
图8. 模块基因KEGG分析结果
![](//html.hanspub.org/file/36-8100108x16_hanspub.png?20240612165635333)
Figure 9. Module gene GO analysis results
图9. 模块基因GO分析结果
2.4. PPI网络构建及其可视化
通过对聚类好的模块基因进行蛋白质网络相互作用构建,鉴定出在此模块中起到关键作用的基因。利用Cytoscape将其结果可视化(图10)。
![](//html.hanspub.org/file/36-8100108x17_hanspub.png?20240612165635333)
Figure 10. PPI network construction and result visualization
图10. PPI网络构建及其结果可视化
2.5. CIBERSORT免疫浸润分析
采用CIBERSORT算法。使用R语言计算浸润免疫细胞与诊断基因之间的pearson相关性分析。由图可知,4种免疫细胞在AD和正常样品之间存在显著差异(P < 0.05) (图11、图12)。
![](//html.hanspub.org/file/36-8100108x18_hanspub.png?20240612165635333)
Figure 11. Violin diagram of immune cell infiltration analysis
图11. 免疫细胞浸润分析小提琴图
![](//html.hanspub.org/file/36-8100108x19_hanspub.png?20240612165635333)
Figure 12. Stacking diagram of immune cell infiltration analysis
图12. 免疫细胞浸润分析堆积图
3. 结论
1) 通过单细胞测序、WGCNA分析、KEGG及GO分析、PPI网络构建及其可视化,筛选出可能与AD发病有关的基因:ERG、EPAS1、IGF1R。
2) 通过CIBERSORT免疫浸润分析,得到4种在AD中表达异常的免疫细胞:B cells naive、T cells CD4 memory resting、Macrophages M2、Mast cells resting。
4. 讨论
阿尔茨海默病是一种严重影响到我国乃至全球老年人健康的疾病,且近年来有年轻化的趋势。但在阿尔茨海默病早期,症状并不十分明显,且易与其他疾病混淆。因此,寻找AD早期诊断的生物标志物对AD早期预防与诊疗具有临床意义。
本研究通过单细胞测序,鉴定出AD患者中不同细胞亚群中基因的表达量,将单细胞测序数据进行清洗,将处理好的数据进行WGCNA分析。WGCNA是一种从高通量的表达数据中挖掘模块(module)信息的算法。在该方法中module被定义为一组具有类似表达谱的基因,如果某些基因在一个生理过程或不同组织中总是具有相类似的表达变化,那么我们有理由认为这些基因在功能上是相关的,可以把他们定义为一个module [6] 。本研究通过WGCNA鉴定出了6个有意义的模块,对这些模块内的基因进行GO及KEGG分析,以此得知每个模块基因所富集的生物学功能,最终筛选出一个与AD高度相关的模块,该模块基因的KEGG结果显示其参与MAPK通路。MAPK是一组呈保守进化的丝/苏氨酸蛋白激酶,MAPK级联信号通路作为中心信号通路参与调控多种细胞生物学过程,如细胞增殖、分化、细胞凋亡等基本过程。MAPK由360个氨基酸构成,其信号通路是一个级联磷酸化过程,基本组成主要包括3级激酶模式:MAPK激酶激酶(MAPKKK),MAPK激酶(MAPKK)和MAPK。根据MAPK活性环内的苏氨酸-X-酪氨酸(Thr-X-Tyr)序列的不同,MAPK通路可分为细胞外信号调节激酶(ERK),c-Jun氨基末端激酶(JNK)、p38MAPK等亚族 [7] 。有学者指出,MAPK通路与AD 的发病具有一定的相关性 [8] ,其参与调控海马神经元突触的可塑性。有研究指出,神经元突触的可塑性可由长时程增强(LTP)及长时程抑制(LTD)来表现 [9] 。LTP作为生物学基础参与神经元突触可塑性的调节,其依赖于N-甲基–天冬氨酸(NMDA)的激活 [10] ,而MAPK级联信号通路在NMDA受体激活中发挥了重要作用,因此,MAPK级联通路与本模块内的基因及AD的发病,三者存在一定的相关性。选取本模块进行后续分析。将选取好的模块基因进行PPI蛋白互作网络构建,并通过Cytoscape对PPI蛋白互作网络构建的结果进行可视化处理,筛选出与AD发病有关的关键基因。
此外,还有研究指出,AD的发病与与基因调控、免疫基因的表达有关 [5] 。外周免疫系统与中枢神经系统是相互影响的,各种类型所导致的外周免疫炎症反应,如高胆固醇饮食、高糖饮食、手术、慢性高血压、睡眠障碍等均可诱导外周免疫炎症反应,从而导致认知功能障碍 [11] [12] [13] [14] [15] 。在外周免疫炎症的反应过程中,有许多类型的免疫细胞在AD的病理学改变中起到重要作用,例如来自外周血的单核细胞过度活化产生自由基、巨噬细胞分化后被激活产生大量的促炎细胞因子、中性粒细胞可被吸引到淀粉样β斑块、T细胞可与浸润大脑的胶质细胞直接对话分泌促炎介质间接促进神经炎症等 [16] [17] [18] [19] 。为了进一步验证AD的发病机制与免疫系统的关系,本研究对WGCNA分析后的模块基因进行了免疫浸润分析,通过对已知免疫细胞特征基因表达谱的训练来估计混杂细胞样本中各个免疫细胞亚群的相对丰度,最终得到此次样本中在AD患者中呈差异性表达的4种免疫细胞。这些细胞有助于AD标志物的发掘并得到相关基因与免疫细胞的关系。
目前,在AD的诊断方式中,最具有可靠性的是脑脊液中tau蛋白水平的检测,例如脑脊液中Aβ1-42、T-tau和p-tau的浓度。然而,脑脊液样本的采样方法是有创的,AD患者几乎全部为老年人群,对于侵入性检查的耐受度不足。有创的采样方式和高发群体的低耐受度在一定程度上限制了脑脊液tau蛋白水平检测在临床实践中的传播和应用。与脑脊液标志物相比,血液中的生物标志物获取较为容易,操作创伤小,患者耐受程度高,操作简单,这些优势代表着血液中生物标志物的检测更适用于AD的早期筛查和诊断,但血液中目前仍没有十分理想的AD生物标志物 [3] 。此外,其他类型的检查,例如影像学提示海马体萎缩、行为学检查见认知功能减退等,在早期无法准确诊断AD,一旦这些检查提示被检查者呈现出AD的特征性改变,可作为确诊指标时,患者往往已进入疾病的中后期,生活质量已经受到严重影响,且AD的病程发展不可逆,故病程早期的及时诊断与尽早干预对提高患者预后水平具有重要意义。因此,探究可用于AD早期诊断的血液标志物成为当下研究的关键目标之一。
本研究基于AD患者外周血单细胞RNA测序结果,首先,进行WGCNA分析,鉴定出6个相关模块,对这些模块进行筛选,最终选取一个关键模块,得到该模块内的基因共表达网络,得出连接度较高的关键基因,之后,将此关键模块内的基因使用STRING数据库生成关键蛋白质–蛋白质相互作用网络,通过Cytoscape将结果可视化,得到模块内关键基因下游蛋白的相关程度。最后,通过CIBERSORT免疫浸润分析,得到4种在AD中表达异常的免疫细胞。
综上所述,本研究指出了ERG、EPAS1、IGF1R基因及B cells naive、T cells CD4 memory resting、Macrophages M2、Mast cells resting免疫细胞在AD发病方面的重要作用。但其在临床方面的表现仍有待探究,需对临床AD患者的样本进行进一步检测,从而验证其是否具有实际临床意义,可以作为生物标志物用于进一步的早期临床诊断。
基金项目
2023年大学生创新创业训练项目(编号:S202310092024);2023年大学生创新创业训练项目(编号:XJ2023009);河北省医学科学研究课题(编号:20240254)。
NOTES
*通讯作者。