引用本文: 杨呈浩, 王伟, 罗小彬, 邹勇, 张明辉. 昼夜节律和代谢途径在抑郁症中的角色:生物标志物的发现与新药物的预测. 华西医学, 2024, 39(9): 1457-1464. doi: 10.7507/1002-0179.202310239 复制
抑郁症最早记载于我国经典医学著作《黄帝内经》,其对“郁”解释为心情抑郁、情绪不宁。近现代对于其病因、发病机制仍不清楚,但目前大多数人一致认为其和体内的生物化学、遗传、社会因素有关,通过对多数病例进行分析,研究发现其具有发病率高、复发率高、致残率高、自杀率高等特点[1]。据世界卫生组织估计,2017 年全世界约有 3.22 亿抑郁症患者[1]。预计至 2030 年抑郁症将成为全球疾病负担的首位[2]。有研究发现,有 1/5 的中国人具有抑郁相关症状,但抑郁症患者中系统治疗者仅占 1/10[3]。目前抑郁症的治疗方式有药物、心理、物理、替代与补充治疗,但治疗效果仍不理想。近年来,随着生物信息学的发展,利用生物信息学对疾病的诊断和治疗生物标志物的筛选成为一种新方法[4]。生物信息学特别在探索疾病的分子机制和识别新的治疗靶点方面显示出巨大潜力。尽管如此,将这些生物标志物转化为实际治疗手段仍面临重大挑战。此外,昼夜节律失衡与抑郁症之间的联系逐渐成为研究焦点,暗示着调节生物钟可能成为未来治疗策略的关键。本研究旨在通过生物信息学方法探索抑郁症的潜在致病机制,并探索可能用于抑郁症治疗的潜在药物,为抑郁症的诊断和治疗提供新的线索和思路。
1 资料与方法
1.1 数据收集与质量评估
本研究于 2022 年 11 月—2024 年 1 月期间,持续跟踪 Gene Expression Omnibus 数据库中的相关数据,并多次检索关键词“Depression”以获取符合研究目的的数据集。最终发现 GSE182193 数据集与本研究目的契合,因此选择其进行后续分析。该数据集包括 6 名抑郁症患者和 6 名健康志愿者,抑郁症患者年龄 24~59 岁,健康志愿者年龄 25~64 岁,每组男女性各 3 例,箱线图提示基线稳定(图1),可以进行后续分析。

本研究还检索并下载了 GSE217811 数据集。该数据集包含 10 名未用药的青少年重度抑郁症患者和 10 名年龄、性别匹配的健康对照样本,用于血浆外泌体来源的转录组表达分析,所有参与者的年龄在 15~19 岁,其中男性患者 4 名,抑郁症患者均符合《精神障碍诊断与统计手册(第 5 版)》抑郁症诊断标准[5]。此外,本研究还选取了 GSE144136 数据集,该数据集通过 10X Genomics Chromium 平台对大脑背外侧前额叶皮质(BA9)中的细胞核进行单核 RNA 测序,分析了 17 名抑郁症自杀患者与 17 名健康对照者的差异表达基因,所有样本均为男性,患者平均年龄为 41 岁。通过这两个数据集的联合分析,以进一步揭示抑郁症的潜在分子机制。
1.2 差异表达基因的筛选与验证
下载 GSE182193 的表达矩阵数据后,使用 GPL22120 平台对其进行探针注释,以得到基因名称;下载 Gencode 的基因注释文件第 38 版对获得基因进行区分,以筛选出编码 mRNA 的基因,并以 R 包对其进行差异分析。为确保分析的准确性和可靠性,本研究设置了明确的筛选标准:差异表达基因的选择基于绝对对数变化倍数(|log2FC|)≥1 且 P<0.05。其后,利用 GSE217811 的表达矩阵数据,采用同样的分析流程对上述差异表达基因进行验证。
1.3 差异表达基因的蛋白质相互作用(protein-protein interaction, PPI)网络的构建
将得到的差异表达基因通过在线数据库 STRING(版本 11.5)进行共表达网络的构建,构建过程中隐藏网络中断开连接的节点后得到 PPI 网络,使用 Cytoscape 软件(版本 3.8.2)的插件 Cytohubba(版本 0.1)对网络图进行连接度(Degree)计算,连接度越高,该基因在抑郁症中就越重要[6]。
1.4 差异表达基因的富集分析
使用“clusterProfiler”“org.Hs.eg.db”“enrichplot”“ggplot2”包对上述差异表达基因进行基因本体论(Gene Ontology, GO)、京都基因和基因组数据库(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析[7],筛选出其中上调和下调的基因分别进行富集分析,其中筛选术语和通路标准为 P<0.05,最后可视化相关术语和通路。
1.5 单细胞测序分析
为深入探究抑郁症的分子机制,并探索在抑郁症发病过程中可能涉及的关键细胞类型和分子通路,本研究利用单细胞测序分析数据在细胞层面上探究抑郁症的分子机制,揭示特定细胞类型中的病理过程。利用 Seurat 软件包对 GSE144136 数据集中的单细胞 RNA 测序数据进行预处理,包括数据的标准化、细胞周期效应校正、数据降维和细胞群体的聚类分析。为了提高细胞类型识别的准确性,使用 SingleR 软件对单细胞测序数据进行进一步的标注,对差异表达基因在不同细胞类型中的分布情况进行详细的映射。
1.6 孟德尔随机化分析
为理解差异表达基因与抑郁症易感性之间的关联性,以及这些基因如何在遗传层面上影响抑郁症的风险,本研究采用孟德尔随机化分析评估差异表达基因与抑郁症易感性之间的因果关系。首先,利用 R 包 gwasrapidd,从已知的差异表达基因中提取与抑郁症相关的单核苷酸多态性(single nucleotide polymorphism, SNP)。将这些 SNP 作为工具变量,用于分析基因在抑郁症易感性中的作用。随后,使用基于总结数据的孟德尔随机化分析工具根据所提取的 SNP 列表,获取进行孟德尔随机化分析所需的相关数据。孟德尔随机化分析是通过 TwoSampleMR 进行的,其中暴露组的数据来自于全基因组关联研究数据库 UK Biobank 项目的 ukb-b-12064 数据集。采用多种统计方法进行分析,包括 MR Egger 分析、加权中位数法、逆方差加权法、简单模式和加权模式,以确保结果具有稳健性。
1.7 药物预测
使用 Cmap 在线数据库对抑郁症中的关键基因进行药物预测,Cmap 是由美国麻省理工学院和美国哈佛大学共同创建并维护用于小分子药物预测的在线数据库[8]。当富集分数为正时,其表示药物会诱导相关生物过程,反之,则表明药物可以逆转相关生物过程,发挥治疗作用。因此,我们的筛选标准为富集分数<–0.7、P<0.05 代表结果具有统计学意义。
1.8 统计学方法
所有分析均使用 R 4.3.2 软件完成,差异分析使用 Wilcoxon 秩和检验,检验水准 α=0.05。
2 结果
2.1 差异分析结果
GSE182193 数据集中共有差异表达基因 110 个(上调 74 个,下调 36 个)。以数据集 GSE217811 对 110 个差异表达基因进行验证,6 个基因(SALL2、AKAP12、GCSAML、CPA3、FCRL3 和 MS4A3)仍满足筛选标准(|log2FC|≥1,P<0.05)。见图2。

a. GSE182193 数据集中差异表达基因的火山图,FC:差异倍数;b. GSE182193 数据集与 GSE217811 数据集差异表达基因的韦恩图
2.2 PPI 网络的构建
对 GSE182193 数据集中的 110 个差异表达基因进行 PPI 网络构建,通过 STRING 在线网络工具,去除没有连接的点后,获得含 50 个点、58 条边的 PPI 网络,通过 Cytohubba 对连接点进行筛选选出了 10 个连接度最高的基因(CPA3、HDC、FCER1A、IL3RA、ENPP3、PTGDR2、VTN、SPP1、SERPINE1 和 S100A8),并进行差异分析,结果显示 10 个基因中,有 8 个基因(CPA3、HDC、IL3RA、ENPP3、PTGDR2、VTN、SPP1 和 SERPINE1)在健康志愿者和抑郁症患者中表达具有差异(P<0.05)。见图3。

a. 通过差异表达基因构建的蛋白质相互作用网络;b. 前 10 个关键基因的蛋白质相互作用网络;c. 前 10 个关键基因的差异分析结果,对照组为健康志愿者样本,抑郁组为抑郁症患者样本,*代表
2.3 差异基因的富集分析
2.3.1 GO 富集分析
GO 富集分析结果显示,上调的基因在生物学过程(biological process, BP)主要富集在生理节律的维持中,如节律过程、昼夜节律、机械感觉行为;细胞组分(cellular component, CC)主要富集在各种细胞器上;分子功能(molecular function, MF)主要富集在各种蛋白结合,尤其是 Wnt-蛋白质结合。下调的基因在 BP 主要集中在炎症反应中,如正向调节炎症反应、对真菌的反应等;同上调的 CC,下调的 CC 也主要富集在各种细胞器中;在 MF 中,其主要富集在各种受体的结合,尤其是钙依赖蛋白结合、晚期糖基化终产物受体结合、Toll 样受体结合。见图4。

a. 在抑郁症患者中上调的差异表达基因的富集分析结果;b. 在抑郁症患者中下调的差异表达基因的富集分析结果。GO:基因本体论;BP:生物学过程;CC:细胞组分;MF:分子功能;RAGE:晚期糖基化终产物受体;TLR:Toll 样受体;GeneRatio:基因比率
2.3.2 KEGG 富集分析
KEGG 通路富集分析结果显示,上调的基因主要富集在多通路的代谢失调,尤其是癌症中的转录失调、昼夜节律、烟酸和烟酰胺代谢、嘧啶代谢、FcεRI 信号通路。下调的基因主要富集在细胞外基质-受体相互作用、白细胞介素-17 信号通路、Toll 样受体信号通路以及癌症中的转录失调通路。见图5。

a. 在抑郁症患者中上调的差异表达基因的富集分析结果;b. 在抑郁症患者中下调的差异表达基因的富集分析结果。KEGG:京都基因与基因组数据库;ECM:细胞外基质;IL-17:白细胞介素-17;TLR:Toll 样受体;GeneRatio:基因比率
2.4 单细胞测序分析
对 6 个获验证的差异表达基因(SALL2、AKAP12、GCSAML、CPA3、FCRL3 和 MS4A3)在不同细胞类型中的分布情况进行详细的映射,除了 FCRL3 未在映射结果中观察到外,其他 5 个差异表达基因主要在星形胶质细胞和神经细胞中显著表达。见图6。

a~e. 分别为
2.5 孟德尔随机化分析
全部差异表达基因相关 SNP 的孟德尔随机化分析结果表明,不同方法得到的 β 系数和标准误差各异。MR Egger 方法的 β 系数为
考虑到较高的异质性,我们对 6 个与抑郁症差异表达基因(SALL2、AKAP12、GCSAML、CPA3、FCRL3 和 MS4A3)相关的 SNP 进行了孟德尔随机化分析,以探讨这些基因在抑郁症遗传易感性中的作用。分析结果显示,大多数基因与抑郁症之间的关联无统计学意义(P>0.05)。然而,FCRL3 基因的两种分析方法(加权中位数法和逆方差加权法)表明该基因与抑郁症之间的关联有统计学意义(P=
2.6 药物预测
8 个关键基因中,因 ENPP3 基因进行探针转换时没有找到其对应探针,因此只纳入了 7 个基因进行 Cmap 药物预测,通过对 Cmap 数据库的结果进行筛选,前 10 个潜在的抑郁症治疗药物分别是头孢替安、骆驼蓬醇、坎那定、CP-863187、2-氨基苯磺酰胺、林可霉素、病毒唑、苯噻林、α-育亨宾、杆菌肽(表1)。

3 讨论
本研究通过对抑郁症患者和健康志愿者的基因表达进行差异分析,找到其潜在的致病基因,分别是 CPA3、HDC、FCER1A、IL3RA、ENPP3、PTGDR2、VTN、SPP1、SERPINE1 和 S100A8,其中 S100A8、FCER1A 在健康志愿者和抑郁症患者中差异无统计学意义(P>0.05)。综合目前的研究,Han 等[9]研究发现在肝癌和抑郁症中 SERPINE1 基因表达具有差异,可能与细胞死亡或凋亡有关。有趣的是,本研究未发现 S100A8 基因在健康志愿者和抑郁症患者之间存在差异表达,但现有研究显示,S100A8 基因可能与抑郁症患者刺激性行为有关[10]。S100A8 和 FCER1A 在本研究中未显示出有统计学意义的差异,这可能指向抑郁症病理机制的复杂性及个体间的异质性。此外,考虑到抑郁症的多因素性质,未来研究中探索与这些基因相互作用的其他生物标志物,可能揭示更加细致的病理过程。
通过对抑郁症差异表达的基因进行 GO、KEGG 富集分析,我们发现上调的基因在 GO 术语的 BP 中主要富集在生理节律的维持,CC 主要富集在各种细胞器上,MF 主要富集在各种蛋白结合,下调的基因在 GO 术语的 BP 中主要集中在炎症反应中,CC 主要富集在各种细胞器中,MF 主要富集在各种受体的结合,由于抑郁症与体内的生物化学反应相关,我们推测其可能与生理节律失调、炎症反应有关。另外,KEGG 通路富集分析显示昼夜节律紊乱明显。另外,相关研究发现昼夜节律紊乱是抑郁症的病理生理学基础[11-12],这与我们的研究相一致。重要的是,在烟酸和烟酰胺代谢通路中,Ma 等[13]研究发现绿原酸可以调节该通路而发挥其抗抑郁作用。此外,Zhao 等[14]研究发现抑郁症大学生的心率变异性与嘧啶代谢途径有关。并且,中药大黄素可能通过白细胞介素-17 信号通路发挥其抗抑郁的作用[15]。另外,Toll 样受体信号通路可能与针灸发挥抗抑郁作用有关[16]。以上通路均与抑郁症有关,因此,研究相关的靶向药物可能对改善抑郁症患者的症状提供依据。
在本研究中,FCRL3 基因在抑郁症患者与健康对照组之间表现出差异性表达。鉴于近年来研究发现抑郁症可能与身体炎症状态相关,我们猜想 FCRL3 可能通过影响炎症反应途径,间接参与到抑郁症的发病机制中[17]。虽然在单细胞测序数据分析中未检测到 FCRL3 的特定表达模式,这可能由于样本的选择或细胞类型的限制。然而,通过孟德尔随机化分析,我们发现与 FCRL3 相关的特定 SNP 在抑郁症的遗传易感性中显示出明显的相关性,为 FCRL3 在抑郁症中可能扮演的角色提供了初步证据。这一点强调了 FCRL3 作为一个潜在的双重功能靶点,在免疫调节和精神障碍发病机制中的重要性。
有研究通过使用 Cmap 数据库对潜在治疗抑郁症药物进行预测,发现骆驼蓬醇中的吲哚生物碱与神经递质血清素有关[18],它可以通过 γ-氨基丁酸受体发挥抗抑郁的作用[19]。令人诧异的是,结合当下的研究,我们发现在丙型病毒性肝炎患者中利巴韦林和聚乙二醇干扰素可诱发抑郁发作[20]。其余药物均未发现其用于治疗抑郁症。因此,本研究可为药物生产企业研发控制抑郁症药物提供参考。
综上所述,本研究鉴定了与抑郁症相关的差异表达基因,并通过富集分析揭示了其可能涉及的致病通路。进一步分析中,我们识别出抑郁症的 10 个潜在关键基因,其中 8 个基因(CPA3、HDC、IL3RA、ENPP3、PTGDR2、VTN、SPP1 和 SERPINE1)在健康志愿者和抑郁症患者之间的表达水平存在差异,并基于这些基因进行了药物预测,得到了若干可能用于抑郁症治疗的候选药物。此外,本研究结果提示昼夜节律紊乱可能是抑郁症发病的重要机制之一。整体而言,本研究为抑郁症的病理机制和潜在治疗靶点提供了新的见解,有望改善抑郁症患者的预后,提高生活质量,并减轻家庭和社会的负担。
利益冲突:所有作者声明不存在利益冲突。
请扫描本文首页二维码后在“补充材料”中下载查看附件。
抑郁症最早记载于我国经典医学著作《黄帝内经》,其对“郁”解释为心情抑郁、情绪不宁。近现代对于其病因、发病机制仍不清楚,但目前大多数人一致认为其和体内的生物化学、遗传、社会因素有关,通过对多数病例进行分析,研究发现其具有发病率高、复发率高、致残率高、自杀率高等特点[1]。据世界卫生组织估计,2017 年全世界约有 3.22 亿抑郁症患者[1]。预计至 2030 年抑郁症将成为全球疾病负担的首位[2]。有研究发现,有 1/5 的中国人具有抑郁相关症状,但抑郁症患者中系统治疗者仅占 1/10[3]。目前抑郁症的治疗方式有药物、心理、物理、替代与补充治疗,但治疗效果仍不理想。近年来,随着生物信息学的发展,利用生物信息学对疾病的诊断和治疗生物标志物的筛选成为一种新方法[4]。生物信息学特别在探索疾病的分子机制和识别新的治疗靶点方面显示出巨大潜力。尽管如此,将这些生物标志物转化为实际治疗手段仍面临重大挑战。此外,昼夜节律失衡与抑郁症之间的联系逐渐成为研究焦点,暗示着调节生物钟可能成为未来治疗策略的关键。本研究旨在通过生物信息学方法探索抑郁症的潜在致病机制,并探索可能用于抑郁症治疗的潜在药物,为抑郁症的诊断和治疗提供新的线索和思路。
1 资料与方法
1.1 数据收集与质量评估
本研究于 2022 年 11 月—2024 年 1 月期间,持续跟踪 Gene Expression Omnibus 数据库中的相关数据,并多次检索关键词“Depression”以获取符合研究目的的数据集。最终发现 GSE182193 数据集与本研究目的契合,因此选择其进行后续分析。该数据集包括 6 名抑郁症患者和 6 名健康志愿者,抑郁症患者年龄 24~59 岁,健康志愿者年龄 25~64 岁,每组男女性各 3 例,箱线图提示基线稳定(图1),可以进行后续分析。

本研究还检索并下载了 GSE217811 数据集。该数据集包含 10 名未用药的青少年重度抑郁症患者和 10 名年龄、性别匹配的健康对照样本,用于血浆外泌体来源的转录组表达分析,所有参与者的年龄在 15~19 岁,其中男性患者 4 名,抑郁症患者均符合《精神障碍诊断与统计手册(第 5 版)》抑郁症诊断标准[5]。此外,本研究还选取了 GSE144136 数据集,该数据集通过 10X Genomics Chromium 平台对大脑背外侧前额叶皮质(BA9)中的细胞核进行单核 RNA 测序,分析了 17 名抑郁症自杀患者与 17 名健康对照者的差异表达基因,所有样本均为男性,患者平均年龄为 41 岁。通过这两个数据集的联合分析,以进一步揭示抑郁症的潜在分子机制。
1.2 差异表达基因的筛选与验证
下载 GSE182193 的表达矩阵数据后,使用 GPL22120 平台对其进行探针注释,以得到基因名称;下载 Gencode 的基因注释文件第 38 版对获得基因进行区分,以筛选出编码 mRNA 的基因,并以 R 包对其进行差异分析。为确保分析的准确性和可靠性,本研究设置了明确的筛选标准:差异表达基因的选择基于绝对对数变化倍数(|log2FC|)≥1 且 P<0.05。其后,利用 GSE217811 的表达矩阵数据,采用同样的分析流程对上述差异表达基因进行验证。
1.3 差异表达基因的蛋白质相互作用(protein-protein interaction, PPI)网络的构建
将得到的差异表达基因通过在线数据库 STRING(版本 11.5)进行共表达网络的构建,构建过程中隐藏网络中断开连接的节点后得到 PPI 网络,使用 Cytoscape 软件(版本 3.8.2)的插件 Cytohubba(版本 0.1)对网络图进行连接度(Degree)计算,连接度越高,该基因在抑郁症中就越重要[6]。
1.4 差异表达基因的富集分析
使用“clusterProfiler”“org.Hs.eg.db”“enrichplot”“ggplot2”包对上述差异表达基因进行基因本体论(Gene Ontology, GO)、京都基因和基因组数据库(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析[7],筛选出其中上调和下调的基因分别进行富集分析,其中筛选术语和通路标准为 P<0.05,最后可视化相关术语和通路。
1.5 单细胞测序分析
为深入探究抑郁症的分子机制,并探索在抑郁症发病过程中可能涉及的关键细胞类型和分子通路,本研究利用单细胞测序分析数据在细胞层面上探究抑郁症的分子机制,揭示特定细胞类型中的病理过程。利用 Seurat 软件包对 GSE144136 数据集中的单细胞 RNA 测序数据进行预处理,包括数据的标准化、细胞周期效应校正、数据降维和细胞群体的聚类分析。为了提高细胞类型识别的准确性,使用 SingleR 软件对单细胞测序数据进行进一步的标注,对差异表达基因在不同细胞类型中的分布情况进行详细的映射。
1.6 孟德尔随机化分析
为理解差异表达基因与抑郁症易感性之间的关联性,以及这些基因如何在遗传层面上影响抑郁症的风险,本研究采用孟德尔随机化分析评估差异表达基因与抑郁症易感性之间的因果关系。首先,利用 R 包 gwasrapidd,从已知的差异表达基因中提取与抑郁症相关的单核苷酸多态性(single nucleotide polymorphism, SNP)。将这些 SNP 作为工具变量,用于分析基因在抑郁症易感性中的作用。随后,使用基于总结数据的孟德尔随机化分析工具根据所提取的 SNP 列表,获取进行孟德尔随机化分析所需的相关数据。孟德尔随机化分析是通过 TwoSampleMR 进行的,其中暴露组的数据来自于全基因组关联研究数据库 UK Biobank 项目的 ukb-b-12064 数据集。采用多种统计方法进行分析,包括 MR Egger 分析、加权中位数法、逆方差加权法、简单模式和加权模式,以确保结果具有稳健性。
1.7 药物预测
使用 Cmap 在线数据库对抑郁症中的关键基因进行药物预测,Cmap 是由美国麻省理工学院和美国哈佛大学共同创建并维护用于小分子药物预测的在线数据库[8]。当富集分数为正时,其表示药物会诱导相关生物过程,反之,则表明药物可以逆转相关生物过程,发挥治疗作用。因此,我们的筛选标准为富集分数<–0.7、P<0.05 代表结果具有统计学意义。
1.8 统计学方法
所有分析均使用 R 4.3.2 软件完成,差异分析使用 Wilcoxon 秩和检验,检验水准 α=0.05。
2 结果
2.1 差异分析结果
GSE182193 数据集中共有差异表达基因 110 个(上调 74 个,下调 36 个)。以数据集 GSE217811 对 110 个差异表达基因进行验证,6 个基因(SALL2、AKAP12、GCSAML、CPA3、FCRL3 和 MS4A3)仍满足筛选标准(|log2FC|≥1,P<0.05)。见图2。

a. GSE182193 数据集中差异表达基因的火山图,FC:差异倍数;b. GSE182193 数据集与 GSE217811 数据集差异表达基因的韦恩图
2.2 PPI 网络的构建
对 GSE182193 数据集中的 110 个差异表达基因进行 PPI 网络构建,通过 STRING 在线网络工具,去除没有连接的点后,获得含 50 个点、58 条边的 PPI 网络,通过 Cytohubba 对连接点进行筛选选出了 10 个连接度最高的基因(CPA3、HDC、FCER1A、IL3RA、ENPP3、PTGDR2、VTN、SPP1、SERPINE1 和 S100A8),并进行差异分析,结果显示 10 个基因中,有 8 个基因(CPA3、HDC、IL3RA、ENPP3、PTGDR2、VTN、SPP1 和 SERPINE1)在健康志愿者和抑郁症患者中表达具有差异(P<0.05)。见图3。

a. 通过差异表达基因构建的蛋白质相互作用网络;b. 前 10 个关键基因的蛋白质相互作用网络;c. 前 10 个关键基因的差异分析结果,对照组为健康志愿者样本,抑郁组为抑郁症患者样本,*代表
2.3 差异基因的富集分析
2.3.1 GO 富集分析
GO 富集分析结果显示,上调的基因在生物学过程(biological process, BP)主要富集在生理节律的维持中,如节律过程、昼夜节律、机械感觉行为;细胞组分(cellular component, CC)主要富集在各种细胞器上;分子功能(molecular function, MF)主要富集在各种蛋白结合,尤其是 Wnt-蛋白质结合。下调的基因在 BP 主要集中在炎症反应中,如正向调节炎症反应、对真菌的反应等;同上调的 CC,下调的 CC 也主要富集在各种细胞器中;在 MF 中,其主要富集在各种受体的结合,尤其是钙依赖蛋白结合、晚期糖基化终产物受体结合、Toll 样受体结合。见图4。

a. 在抑郁症患者中上调的差异表达基因的富集分析结果;b. 在抑郁症患者中下调的差异表达基因的富集分析结果。GO:基因本体论;BP:生物学过程;CC:细胞组分;MF:分子功能;RAGE:晚期糖基化终产物受体;TLR:Toll 样受体;GeneRatio:基因比率
2.3.2 KEGG 富集分析
KEGG 通路富集分析结果显示,上调的基因主要富集在多通路的代谢失调,尤其是癌症中的转录失调、昼夜节律、烟酸和烟酰胺代谢、嘧啶代谢、FcεRI 信号通路。下调的基因主要富集在细胞外基质-受体相互作用、白细胞介素-17 信号通路、Toll 样受体信号通路以及癌症中的转录失调通路。见图5。

a. 在抑郁症患者中上调的差异表达基因的富集分析结果;b. 在抑郁症患者中下调的差异表达基因的富集分析结果。KEGG:京都基因与基因组数据库;ECM:细胞外基质;IL-17:白细胞介素-17;TLR:Toll 样受体;GeneRatio:基因比率
2.4 单细胞测序分析
对 6 个获验证的差异表达基因(SALL2、AKAP12、GCSAML、CPA3、FCRL3 和 MS4A3)在不同细胞类型中的分布情况进行详细的映射,除了 FCRL3 未在映射结果中观察到外,其他 5 个差异表达基因主要在星形胶质细胞和神经细胞中显著表达。见图6。

a~e. 分别为
2.5 孟德尔随机化分析
全部差异表达基因相关 SNP 的孟德尔随机化分析结果表明,不同方法得到的 β 系数和标准误差各异。MR Egger 方法的 β 系数为
考虑到较高的异质性,我们对 6 个与抑郁症差异表达基因(SALL2、AKAP12、GCSAML、CPA3、FCRL3 和 MS4A3)相关的 SNP 进行了孟德尔随机化分析,以探讨这些基因在抑郁症遗传易感性中的作用。分析结果显示,大多数基因与抑郁症之间的关联无统计学意义(P>0.05)。然而,FCRL3 基因的两种分析方法(加权中位数法和逆方差加权法)表明该基因与抑郁症之间的关联有统计学意义(P=
2.6 药物预测
8 个关键基因中,因 ENPP3 基因进行探针转换时没有找到其对应探针,因此只纳入了 7 个基因进行 Cmap 药物预测,通过对 Cmap 数据库的结果进行筛选,前 10 个潜在的抑郁症治疗药物分别是头孢替安、骆驼蓬醇、坎那定、CP-863187、2-氨基苯磺酰胺、林可霉素、病毒唑、苯噻林、α-育亨宾、杆菌肽(表1)。

3 讨论
本研究通过对抑郁症患者和健康志愿者的基因表达进行差异分析,找到其潜在的致病基因,分别是 CPA3、HDC、FCER1A、IL3RA、ENPP3、PTGDR2、VTN、SPP1、SERPINE1 和 S100A8,其中 S100A8、FCER1A 在健康志愿者和抑郁症患者中差异无统计学意义(P>0.05)。综合目前的研究,Han 等[9]研究发现在肝癌和抑郁症中 SERPINE1 基因表达具有差异,可能与细胞死亡或凋亡有关。有趣的是,本研究未发现 S100A8 基因在健康志愿者和抑郁症患者之间存在差异表达,但现有研究显示,S100A8 基因可能与抑郁症患者刺激性行为有关[10]。S100A8 和 FCER1A 在本研究中未显示出有统计学意义的差异,这可能指向抑郁症病理机制的复杂性及个体间的异质性。此外,考虑到抑郁症的多因素性质,未来研究中探索与这些基因相互作用的其他生物标志物,可能揭示更加细致的病理过程。
通过对抑郁症差异表达的基因进行 GO、KEGG 富集分析,我们发现上调的基因在 GO 术语的 BP 中主要富集在生理节律的维持,CC 主要富集在各种细胞器上,MF 主要富集在各种蛋白结合,下调的基因在 GO 术语的 BP 中主要集中在炎症反应中,CC 主要富集在各种细胞器中,MF 主要富集在各种受体的结合,由于抑郁症与体内的生物化学反应相关,我们推测其可能与生理节律失调、炎症反应有关。另外,KEGG 通路富集分析显示昼夜节律紊乱明显。另外,相关研究发现昼夜节律紊乱是抑郁症的病理生理学基础[11-12],这与我们的研究相一致。重要的是,在烟酸和烟酰胺代谢通路中,Ma 等[13]研究发现绿原酸可以调节该通路而发挥其抗抑郁作用。此外,Zhao 等[14]研究发现抑郁症大学生的心率变异性与嘧啶代谢途径有关。并且,中药大黄素可能通过白细胞介素-17 信号通路发挥其抗抑郁的作用[15]。另外,Toll 样受体信号通路可能与针灸发挥抗抑郁作用有关[16]。以上通路均与抑郁症有关,因此,研究相关的靶向药物可能对改善抑郁症患者的症状提供依据。
在本研究中,FCRL3 基因在抑郁症患者与健康对照组之间表现出差异性表达。鉴于近年来研究发现抑郁症可能与身体炎症状态相关,我们猜想 FCRL3 可能通过影响炎症反应途径,间接参与到抑郁症的发病机制中[17]。虽然在单细胞测序数据分析中未检测到 FCRL3 的特定表达模式,这可能由于样本的选择或细胞类型的限制。然而,通过孟德尔随机化分析,我们发现与 FCRL3 相关的特定 SNP 在抑郁症的遗传易感性中显示出明显的相关性,为 FCRL3 在抑郁症中可能扮演的角色提供了初步证据。这一点强调了 FCRL3 作为一个潜在的双重功能靶点,在免疫调节和精神障碍发病机制中的重要性。
有研究通过使用 Cmap 数据库对潜在治疗抑郁症药物进行预测,发现骆驼蓬醇中的吲哚生物碱与神经递质血清素有关[18],它可以通过 γ-氨基丁酸受体发挥抗抑郁的作用[19]。令人诧异的是,结合当下的研究,我们发现在丙型病毒性肝炎患者中利巴韦林和聚乙二醇干扰素可诱发抑郁发作[20]。其余药物均未发现其用于治疗抑郁症。因此,本研究可为药物生产企业研发控制抑郁症药物提供参考。
综上所述,本研究鉴定了与抑郁症相关的差异表达基因,并通过富集分析揭示了其可能涉及的致病通路。进一步分析中,我们识别出抑郁症的 10 个潜在关键基因,其中 8 个基因(CPA3、HDC、IL3RA、ENPP3、PTGDR2、VTN、SPP1 和 SERPINE1)在健康志愿者和抑郁症患者之间的表达水平存在差异,并基于这些基因进行了药物预测,得到了若干可能用于抑郁症治疗的候选药物。此外,本研究结果提示昼夜节律紊乱可能是抑郁症发病的重要机制之一。整体而言,本研究为抑郁症的病理机制和潜在治疗靶点提供了新的见解,有望改善抑郁症患者的预后,提高生活质量,并减轻家庭和社会的负担。
利益冲突:所有作者声明不存在利益冲突。
请扫描本文首页二维码后在“补充材料”中下载查看附件。