admin管理员组

文章数量:1037775

Nature Mental Health:精神分裂症的转录组、脑结构与临床表型的变异性

摘要:理解遗传变异与大脑异常之间的关系对于揭示精神分裂症(SCZ)的跨尺度病理生理机制至关重要。这项横断面研究确定了精神分裂症患者基因表达个体差异的大脑结构相关性及其临床意义。本研究收集了 43 名精神分裂症患者的血液样本 RNA 测序数据、磁共振成像扫描数据和临床评估数据,以及 60 名健康对照的数据。通过 RNA 测序数据,我们发现精神分裂症患者与健康对照之间存在基因水平和亚型水平的表达改变。我们还发现,差异基因表达与精神分裂症相关的基因组变异相关和差异大脑基因表达。结合基因表达和大脑成像的多变量相关分析表明,精神分裂症患者中差异表达基因的转录水平与认知大脑网络的额叶和颞叶区域的灰质体积显著相关。研究结果表明,精神分裂症患者的基因组变异与转录组的改变相关,这在宏观大脑结构和认知的个体差异中发挥作用,有助于建立用于评估精神分裂症的综合多组学标志物。

1. 引言

精神分裂症是一种主要的精神障碍,具有很强的遗传背景。该疾病具有高度遗传性,其遗传机制复杂,涉及常见变异、罕见拷贝数变异和罕见编码变异。这些基因组变异已知会影响脑组织中基因表达的时空动态模式,精神分裂症患者大脑转录组中的差异表达和剪接就是证明。改变的转录谱意味着中枢神经系统内生物途径的变化,这可能进一步与大脑的宏观结构和功能异常相关。从遗传学到宏观大脑表型再到行为的跨尺度数据整合,对于理解精神分裂症的复杂病因以及开发精确的评估和治疗方法至关重要。将遗传学与神经影像学联系起来的研究已经指出,精神分裂症相关变异的功能后果与大脑形态学特性有关。例如,精神分裂症的多基因风险与皮质体积的个体间差异以及大脑结构和功能连接性相关。最近的研究表明,转录组学和神经影像学表型之间的关系表明,精神分裂症风险基因在大脑中的转录与大脑区域和回路中疾病相关脆弱性的模式重叠。然而,目前这些观察到的关联都依赖于神经影像学数据和基因表达数据的组平均模式,这不足以描述精神分裂症患者个体基因表达的变异。目前尚不清楚精神分裂症患者基因表达的个体差异是否以及如何与个体大脑结构异常相关。

鉴于血液和大脑之间基因表达的对应性,检查血液样本中的基因表达为在体内研究参与者水平的转录组 - 神经影像学关联提供了一种可行的方法。因此,我们收集了一个跨尺度的队列,包括血液RNA 测序(RNA-seq)、磁共振成像(MRI)、认知和症状数据,以研究精神分裂症患者个体转录组变异与大脑结构变异及其临床意义(图 1)。

图片

图1 方法框架

2. 结果

2.1 精神分裂症中的差异表达基因

本研究收集了 43 名精神分裂症患者和 60 名年龄和性别匹配的健康对照的 RNA-seq 数据、MRI 数据和症状严重程度评分。对血液来源的 RNA-seq 数据进行 DESeq2 差异表达分析,得到 17,999 个基因的标准化计数和精神分裂症患者与健康对照之间的表达改变。与先前的研究一致,我们观察到精神分裂症患者中普遍存在差异表达基因(DEGs),其中 1,248 个基因表现为下调表达,588 个基因表现为上调表达。DEGs 与精神分裂症的微阵列数据荟萃分析中报道的血液来源的 DEGs 一致,与参考文献 21 中的247 个基因有 59 个重叠,与参考文献 20 中报道的 2,145 个基因有 267 个重叠。我们检查了在血液样本中观察到的 DEGs 在精神分裂症患者大脑样本中是否也显示出差异基因表达(n = 559)。超几何检验表明,下调的 DEGs 子集(n = 1,248)包含 117 个与先前在大脑样本的 RNA-seq 数据中报道的 DEGs 重叠的基因。我们在血液样本中观察到的上调 DEGs 没有发现与大脑组织中上调的 DEGs 显著富集,对于整个 DEGs 集无论其效应方向如何也没有显著富集。血液来源的 DEGs 也显著富集了在先前精神分裂症个体的转录组全关联研究中发现的 DEGs。FUMA GENE2FUNC 基因集富集分析表明,DEGs 在基因本体论细胞成分中显著富集,并且在全基因组关联研究目录中包括的全基因组关联研究报告的基因集 “微粒体积”、“血小板体积”、“体重指数”、“大脑形态(MOSTest)” 和 “精神分裂症” 中也显著富集。

然后,我们检查了药物使用是否在精神分裂症患者的基因表达改变中起作用。将 DEGs 的基因表达水平与药物剂量相关联,没有发现关联(FDR 调整后 P>0.05)。在较高药物剂量亚组和较低药物剂量亚组之间进行 DESeq2 分析,只发现一个显著的 DEG,这表明我们报道的 DEGs 不是由药物使用驱动的。

我们还将基因水平分析扩展到转录亚型水平,因为在亚型水平的分析可能会捕捉到更大的疾病效应。在 87,232 个亚型中,我们观察到 1,104 个亚型在精神分裂症患者中存在差异转录表达(FDR 调整后 P<0.05),其中 840 个亚型表现为下调表达,264 个亚型表现为上调表达(图 2)。精神分裂症患者的亚型水平表达变化显著大于基因水平。值得注意的是,亚型水平分析确定了 226 个差异表达的转录本,这些转录本在基因水平上没有显示出差异表达。

图片

图2 DEGs 和亚型

2.2 精神分裂症中 DEGs 与基因组变异的关联

我们接着检查了 DEGs 在多大程度上与精神分裂症中观察到的基因组变异相关。从精神病基因组学联盟(PGC;第三波)获得了最近精神分裂症全基因组关联研究的汇总统计数据,包括 76,755 名精神分裂症患者和 243,649 名对照。MAGMA 基因特性分析依赖于基因水平的多元回归模型,该模型将所有基因的连续 logFC作为响应变量,结果表明基因表达改变与全基因组关联研究结果显著相关。当检查在东亚人群中进行的最近一项精神分裂症全基因组关联研究的汇总统计数据(n = 22,778)时,也观察到了类似的结果。这些结果证实,在精神分裂症全基因组关联研究中观察到的基因在血液样本中显示出更大的基因表达变化。使用来自其他五种常见精神健康状况(即双相情感障碍(BD)、注意缺陷多动障碍(ADHD)、自闭症谱系障碍(ASD)、重度抑郁症(MDD)和失眠)的全基因组关联研究汇总统计数据,我们检查了这一发现的特异性。发现基因表达的改变与 BD2S相关的基因组变异显著相关,但与 ADHD、ASD、MDD或失眠(β = 0.030,P = 0.289)无关,这表明我们观察到的常见基因组变异与基因表达改变之间的关联相对特异性地与精神分裂症和 BD 相关,这可能是由于这两种疾病之间的遗传重叠较高。

接下来,我们关注 DEGs 集,发现在 1,836 个DEGs 中,409 个基因与从精神分裂症基因组位点通过位置映射、表达定量性状位点映射和三维染色质相互作用映射确定的全基因组关联研究衍生的精神分裂症风险基因重叠(P<0.001,超几何检验)。对于所有三种单核苷酸多态性(SNP) - 基因映射方法,DEGs 在全基因组关联研究衍生基因中的富集仍然显著。分别考虑下调(n = 1,248)和上调(n = 588)的 DEGs,也得到了类似的结果。我们还进行了连锁不平衡分数回归(LDSC)分区遗传力分析,该分析确定了 DEGs 对精神分裂症 SNP 遗传力的贡献程度。在总 DEGs 集中观察到显著的遗传力富集,这表明这些区域的变异所传递的遗传力是对照组的1.497 倍(h2),对于下调的 DEGs 也观察到类似的结果,但对于上调的 DEGs 则没有。

2.3 基因表达的 DEGs 与大脑灰质体积的协变

大脑体积减少是精神分裂症最确定的特征之一。在建立了血液来源的 DEGs 与脑组织中的基因组变异和转录之间的联系后,我们接下来检查了标准化血液中精神分裂症相关 DEGs 的个体水平、跨尺度关联与大脑灰质体积(GMV)改变之间的关系。我们发现血液来源的 DEGs 的基因表达水平与 GMV 显著相关(图 3a)。第一个 LC(LC1)解释了转录 - GMV 协方差的 42%,并描述了精神分裂症患者和健康对照个体水平转录复合得分与大脑 GMV 复合得分之间的正相关。在所有 DEGs 中,1,183 个(64.6%)对 LC1 有显著贡献,其中 1,183 个 DEGs 中有 942个显示出正的 PLS 加载,241 个 DEGs 显示出负的 PLS 加载(这表明负贡献)。使用随机选择的具有 DEGs 平均表达水平的 DEGs 进行排列检验,表明 LC1 的显著性,这表明在精神分裂症患者中 DEGs 的个体间变异与皮质大脑体积改变的个体间差异之间观察到的关联具有特异性。为了确定对 LC1 贡献最重要和最稳健的基因,我们进行了五重交叉验证的 LASSO 回归,将 LC1 复合得分作为响应变量。

接下来,我们想检查特定大脑区域对这种观察到的个体间 DEG - GMV 关联的贡献。转录复合得分(见方法)与双侧额中回(r = 0.655和 0.733)、中颞回(r = 0.565 和 0.654)和顶上回的皮质体积呈正相关(图 3b)。同时,在双侧距状皮层、海马旁回和内嗅皮层中发现负相关。在健康对照中,个体转录复合得分与双侧颞叶、下顶叶、中央前回 / 中央后回和视觉皮层的皮质体积相关(图 3c)。然而,检查诊断和转录复合得分对大脑体积的交互效应没有显示出显著效应。

图片

图3 基因转录与大脑 GMV 的关联

事后分析比较了在大脑认知和初级网络背景下精神分裂症中区域对转录 - GMV 协方差的贡献(即 LC1 中的 PLS 显著性),结果表明高级认知网络区域(即默认模式网络、额顶网络和显著网络)显示出比初级视觉网络和感觉运动网络(SMN)更高的贡献水平(图 3d)。在健康对照中没有观察到这种效应,这表明这种关系可能是精神分裂症特有的。此外,LC1 中区域对转录 - GMV 协方差的贡献的空间模式与精神分裂症患者和健康对照之间 GMV 差异的标准空间模式显著相关(图 3e),这表明精神分裂症中的转录 - GMV 协方差也与精神分裂症中的大脑体积改变程度平行。在健康对照中没有观察到这种效应。

我们还检查了1,104 个差异表达转录本的亚型水平表达与大脑 GMV 的关系。PLS 相关分析再次揭示了一个显著的 LC1,解释了转录 - GMV 协方差的 42.8%。在LC1 中,632 个亚型显示出正的 PLS 加载,80 个亚型显示出负的 PLS 加载。检查不同大脑区域对转录 - GMV 协方差的贡献也揭示了与基因水平分析相似的大脑区域。

2.4 DEG - GMV 协方差与精神分裂症基因表达模式一致

使用 GAMBA 在艾伦人类大脑图谱(AHBA)的 15,071 个基因的全脑基因表达谱背景下,进一步检查了转录-GMV 协方差的空间模式。显示最高正相关的前 500 个基因涉及 118 个由精神分裂症全基因组关联研究确定的基因,这超过了随机预期。使用保留空间自相关性的替代大脑图谱进一步证实了这种富集。对于前 200 个基因(P = 0.033)和前 1,000 个基因(P = 0.019)也观察到了类似的结果。在 DEGs 集中没有观察到显著的富集(P = 0.363),这可能是由于 AHBA 的数据样本有限。

2.5 DEGs 的基因表达与 SMN 大脑连接性的协变

考虑到先前的研究表明精神分裂症相关基因的转录谱与大脑连接异常相关,我们接下来检查了患者个体水平的基因表达是否与大脑连接性的变化平行。PLS 分析表明,精神分裂症组中转录复合得分与双侧中央前回和中央后回、左顶叶上小叶和后扣带皮层的区域解剖连接呈正相关(图 4a)。事后检查在静息态网络中区域贡献的空间分布(即 PLS 显著性)表明,在 SMN 区域的贡献最高(图 4a)。在功能连接的 PLS 分析中也观察到 SMN 的显著相关性(图 4b)。

图片

图4 转录、GMV 和大脑连接性的关联

2.6 转录、大脑和认知之间的关联

为了检查跨尺度生物特征如何共同影响精神分裂症患者的临床特征,我们进行了 PLS 分析,以检查精神分裂症患者中转录、GMV、临床症状和认知分数之间的关联。在这里,转录数据的 20 个主成分(解释方差为 95.7%)与 114 个皮质区域的 GMV 分数连接起来,形成第一个输入数据矩阵,在 PLS 分析中,韦氏成人智力量表(WAIS)测试分数作为另一个输入数据矩阵。观察到一个显著的 LC,表明个体的 GMV 与 WAIS测试中的认知表现显著正相关(图 5a)。事后分析表明,这种相关性主要由双侧额上回、岛叶、前扣带皮层、左额下回和右眶额回的 GMV 驱动(图 5b)。我们没有观察到对阳性和阴性症状量表(PANSS)分数的进一步特定效应(P>0.109)。

图片

图5 转录、GMV 和 WAIS 测试表现的关联

3. 讨论

个体血液来源的基因表达和神经影像学数据的整合已经建立了精神分裂症大脑体积改变的转录组相关性。在这里,我们进行了一项多组学研究,检查了精神分裂症患者的血液转录组数据、神经影像学数据以及临床症状和认知障碍的数据。基因表达水平的个体差异与精神分裂症患者的宏观大脑体积个体差异相关。此外,大脑体积和转录与患者认知能力的临床指标相关。这项研究在个体参与者水平上展示了精神分裂症中体内转录组 - 大脑体积的关联。

基因表达与大脑体积的关联表明,精神分裂症患者中 DEGs 的低表达与额颞叶区域 GMV 的减少相关。先前的研究广泛报道了精神分裂症患者额颞脑区的受累情况,与健康对照相比,精神分裂症患者的灰质、表面积和皮层厚度减少。转录组研究检查死后大脑材料时,反过来注意到精神分裂症患者中免疫相关基因的下调。我们在参与者水平上报告的转录组 - 神经影像学关联进一步证实了将基因表达与基于群体的大脑体积数据联系起来的研究结果,例如,先前观察到的与中枢神经系统发育相关的基因与精神分裂症中大脑体积变化的全球模式相关的基因重叠。转录与大脑体积的关联可能归因于精神分裂症风险基因在人类大脑发育中的关键调节作用。与此一致的是,已知神经元和星形胶质细胞 / 少突胶质细胞前体细胞相关基因在精神分裂症皮质厚度异质性的转录组和多基因表现中发挥重要作用。我们在精神分裂症患者中观察到的个体水平上基因转录与大脑体积变化的关系显示,在精神分裂症患者中,在个体水平上整合多组学特征具有巨大潜力。

我们的发现表明,SMN 的结构和功能连接性变化与精神分裂症风险基因的基因转录和 GMV 相关。SMN 在先前的神经影像学研究中经常被报道,显示精神分裂症患者中存在不同的功能连接性。我们报告的关联与这些先前的研究一致,并与表明结构连接性与大脑区域之间转录谱的紧密耦合相关的研究一致。精神分裂症风险基因也被报道显示出与白质连接性破坏的空间模式重叠的大脑转录谱。精神分裂症基因表达与大脑连接异常的关联支持了精神分裂症中广泛连接性破坏的遗传起源。

患者的认知障碍被发现与转录组和神经影像学测量的个体差异相关,主要涉及默认模式网络的区域。这一结果扩展了精神分裂症患者大脑结构与认知领域之间的关系。转录、大脑和认知指标之间的关联与智力和精神分裂症之间共享遗传位点的观察结果一致,个体认知表现的个体间差异与个体精神分裂症风险等位基因相关,并与精神分裂症多基因风险评分相关。

精神分裂症患者的认知功能障碍与血液样本中测量的免疫基因表达改变有关。我们通过提供认知能力、GMV 和基因表达之间关联的实证证据,补充了这些结果。将遗传学与神经影像学相结合是识别精神分裂症新遗传标志物和提高疾病可预测性的关键。

我们报告的精神分裂症患者血液样本中 DEGs 与常见变异以及患者大脑表达改变之间的关系表明,血液转录组数据对于研究精神分裂症中的转录组 - 神经影像学关联具有参考价值。精神分裂症与大脑形态测量之间的遗传关联已经得到了很好的证明,但识别该疾病的转录组 - 神经影像学关联的一个障碍是,随后对转录组和 MRI 数据的分析目前主要基于不同来源的数据。我们的研究试图通过分析来自一组精神分裂症患者的跨尺度数据来解决这个问题。观察到的血液来源的 DEGs 与大脑来源的 DEGs 之间的对应关系与人类血液和大脑之间基因表达密切相关的报道一致。观察到的血液 DEGs 与精神分裂症风险基因之间的关联进一步表明,血液 DEGs 可能受到共同基因组变异的调节。我们的研究揭示了在精神分裂症患者中,通过转录组全关联分析确定的 61 个基因中有 11 个重叠基因,揭示了一组可能代表该疾病真正易感性因素的特定基因。

在解释我们的结果时,应考虑几个因素。第一个限制是静脉血和脑组织来源的转录组之间的差距。我们确实通过显示血液 DEGs 在大脑 DEGs 中的富集,并使用来自 GTEx 的基因表达数据表明血液 DEGs 和大脑 DEGs 之间存在关系,但它们仍然不相等,计算出的重叠是基于不同来源的数据。从接受脑外科手术的患者中获取少量脑组织(例如,癫痫或肿瘤神经外科手术期间的常见程序)提供了研究血液来源和大脑来源基因表达之间直接联系的机会。其次,在我们的研究中,大脑表型仅基于结构 T1 成像获得。其他研究将结构 MRI 与正电子发射断层扫描等方法相结合,揭示了例如首发精神病患者海马形态改变与小胶质细胞活化之间的宝贵关联。第三,本研究中血液采集没有严格的时间框架,尽管众所周知,昼夜节律和膳食摄入会影响血液基因表达水平。尽管观察到的精神分裂症 DEGs 与转录-GMV 之间的关联并不是特别由昼夜基因或与膳食相关的基因驱动,但在未来的研究中,固定血液样本的采集时间和禁食时间将是更好的选择。第四,本研究没有包括其他组学数据,例如微小 RNA。最近的研究表明,外周流体中的微小 RNA,包括微泡,可以追溯到中枢神经系统来源,并且对精神分裂症具有潜在的诊断价值和潜在的治疗应用。第五,本研究阐明了血液基因表达与宏观大脑结构之间的关联,不能确定不同尺度的变量是否遵循顺序或更复杂的关系。新的计算方法,如具有多块建模的稀疏广义典型相关分析,可能会提供进一步的证据来确定基因转录、大脑成像和行为表型之间的相互作用。最后,使用 AHBA 和 DEG - GMV 协方差图,我们确定了富含全基因组关联研究衍生的精神分裂症基因但不含血液 DEGs 的基因。这可能归因于 AHBA 的数据样本有限,即 AHBA 包含来自六个没有任何精神障碍的大脑捐赠者的死后大脑样本。与全基因组关联研究衍生的精神分裂症基因相比,根据基因集分析,报道的精神分裂症血液 DEGs 参与突触组织的程度较低,因此没有观察到 DEGs 的富集。

总之,我们在个体患者水平上展示了精神分裂症患者血液基因表达与大脑 GMV 之间的关联,提供了该疾病的神经遗传特征。建立大脑结构的转录组相关性有望建立改善精神分裂症诊断和评估的生物标志物。

4. 方法

4.1 参与者

本研究收集了 43 名精神分裂症患者和 60 名年龄、性别匹配的健康对照的多组学 RNA-seq 数据、MRI 数据和症状严重程度评分。患者从中国西安西京医院精神科招募,健康对照从当地社区招募。纳入和排除标准在补充方法中有详细描述。没有预先应用统计方法来确定样本量,但我们的样本量与先前研究中报道的样本量可比。基于模拟的功效分析表明,鉴于当前的样本量和数据样本的协方差结构,有 80% 的功效。精神分裂症患者完成了一系列临床评估和认知测试,包括评估临床症状严重程度的阳性和阴性症状量表(PANSS)和评估一般认知能力的中国版韦氏成人智力量表(WAIS-RC)。WAIS-RC 也在健康对照中进行。行为评估、大脑扫描和血液采集在同一天进行。记录抗精神病药物的类型和每日剂量,并转换为奥氮平等效剂量。本研究获得了第四军医大学第一附属医院机构伦理委员会的批准(编号 KY20183113-1),所有参与者都提供了参与本研究的书面知情同意书。参与者获得了交通补偿。

4.2 RNA-seq 数据

4.2.1 数据采集

从 2020 年 4 月到 2020 年 9 月,从每位参与者的上前臂采集静脉血。血液样本在 MRI 扫描当天采集,无需确切的采集时间和禁食。将 2.5ml 血液样本收集到 BD Vacutainer PAXgene RNA 管中,该管含有专有 RNA 稳定试剂,并立即在 - 80°C 下冷冻。从全血中提取总 RNA,并在同一批次中进行分析。使用 Illumina Novaseq 6000 进行 RNA-seq。使用 fastp(v.0.18.0)过滤低质量读段,使用 HISAT2.2.4(参考文献 76)将过滤后的读段映射到人类参考基因组 hg19。使用 StringTie(v.1.3.1)组装每个样本的映射读段。RNA-seq 数据收集和分析的细节在补充方法中有描述。

4.2.2 差异表达分析

使用 DESeq2 差异表达分析对 20,313 个基因的未标准化原始计数数据进行分析,这些数据代表序列读段的数量。使用 R 中实现的 apeglm 包对标准化的 DESeq2 分析进行 FC 收缩,得到 17,999 个基因的标准化计数及其在精神分裂症患者和健康对照之间的转录改变。DESeq2通过将计数除以由基因计数相对于每个基因的几何平均值的中值比确定的样本特异性大小因子来计算标准化计数。将年龄和性别作为无关协变量纳入,并且这里不适用批次效应,因为所有样本都在同一批次中进行分析。为每个基因计算 FC 以描述转录变化,并使用 FDR Benjamini - Hochberg 程序调整多重比较的 P 值。根据 FDR 调整后的 P 值低于 0.05 来鉴定 DEGs。

4.3 MRI 数据

4.3.1 数据采集

使用 GE Discovery MR750 3.0T 扫描仪采集 T1 加权 MRI、扩散加权成像(DWI)和静息态功能 MRI(fMRI)数据。扫描参数在参考文献 50 中有描述,并在补充表 10 中列出。

4.3.2 形态测量指标

使用 FreeSurfer(v.6.0)对T1 加权 MRI 数据进行预处理,以分割脑组织并重建皮质表层。经验丰富的研究人员手动检查 FreeSurfer 的输出。使用总脑体积来检查是否存在样本异常值,异常值根据比平均值大三倍标准差来定义。根据 Desikan - Killiany 图谱的细分,将重建的皮质表层划分为 114 个不同的区域(即每个半球 57 个区域)。在以下分析中使用 FreeSurfer 管道中自动生成的区域体积。使用原始的 Desikan - Killiany 图谱的 68 个皮质区域进行验证。

4.4 连接性指标

使用 FSL(v.6.0)和 CATO(v.3.1.2)对 DWI 数据和fMRI 数据进行连接组重建。DWI 数据和 fMRI 数据的详细处理步骤在补充方法中有描述。为每个参与者分别生成一个 114×114 的结构连接矩阵,该矩阵描述流线密度(即两个区域之间的流线数量除以区域体积)和一个 114×114 的功能连接矩阵,该矩阵描述在提取的血氧水平依赖(BOLD)时间序列之间每两个区域之间的相关性。区域连接性强度计算为每个区域的所有连接的总和强度。

4.5 统计分析

我们使用 MAGMA 进行基因特性分析,以检查基因表达改变与先前发表的精神分裂症全基因组关联研究中报道的基因水平统计数据在多大程度上相关(图 1a)。简而言之,首先对纳入的全基因组关联研究汇总统计数据进行 MAGMA 基因分析,并通过将 SNP 映射到基因(如果 SNP 位于基因内)来获得基于基因的统计数据。然后,使用 MAGMA 基因分析的输出和本研究中处理的基因表达改变(即 log₂FC),基于线性模型进行 MAGMA 基因特性分析。

进行多变量 PLS 相关分析,以检查 DEGs 的基因表达(即标准化计数)与成像衍生的表型之间的关联(图 1b)。PLS 已被广泛用于通过最大化两个数据矩阵之间的协方差来寻找 LCs。使用线性回归将年龄和性别作为无关协变量从两个数据矩阵中回归出去。分别在每个组内进行标准化,通过去均值并将数据除以组标准差。这样,组差异被忽略,使得观察到的相关性不是由组差异驱动的,并且转录 - 成像相关性的共同和不同效应在精神分裂症和健康对照组中都存在。

从 PLS 中得出的 LC 描述了输入数据矩阵中每个变量的奇异值(表示解释方差的水平)和权重(称为 PLS 显著性)的组合。使用排列检验来统计评估观察到的相关性,并使用自助抽样(5,000次采样)来估计 LCs 的所得 PLS 显著性是否稳健。接下来,我们通过从每个排列中的 17,999 个基因池中随机选择基因来进行排列检验,以检查精神分裂症 DEGs 的特异性。分别计算基因表达和成像衍生表型的个体水平复合得分。基因表达和成像复合得分之间的相关性显示了基因和成像表型的所有可能线性组合之间可以观察到的最大相关性水平。使用单样本 Kolmogorov - Smirnov 检验检查数据正态性,表明所有 114 个区域的大脑 GMV 都来自正态分布(P>0.073),并且 1,647 个(1,836 个中的)基因的基因表达数据也来自正态分布(未校正 P>0.05)。使用 1,647 个基因的表达数据显示与完整的 1,836 个基因相似的结果。由于相关性是在每个组内计算的,没有进行组比较,因此没有测试方差齐性。

对观察到的相关性模式进行事后分析,在基于 AHBA 的大脑认知网络、组间大脑体积差异和基因表达谱的背景下进行。对于任何 LC,分别计算基因表达和成像衍生表型的个体水平复合得分,以评估 LC 捕获的协方差水平。使用 myPLS进行 PLS 分析。为了验证目的,将数据集随机分为两半,分别在每一半中重复进行 PLS 分析。

参考文献:Associated transcriptional, brain and clinical variations in schizophrenia.

Nature Mental Health:精神分裂症的转录组、脑结构与临床表型的变异性

摘要:理解遗传变异与大脑异常之间的关系对于揭示精神分裂症(SCZ)的跨尺度病理生理机制至关重要。这项横断面研究确定了精神分裂症患者基因表达个体差异的大脑结构相关性及其临床意义。本研究收集了 43 名精神分裂症患者的血液样本 RNA 测序数据、磁共振成像扫描数据和临床评估数据,以及 60 名健康对照的数据。通过 RNA 测序数据,我们发现精神分裂症患者与健康对照之间存在基因水平和亚型水平的表达改变。我们还发现,差异基因表达与精神分裂症相关的基因组变异相关和差异大脑基因表达。结合基因表达和大脑成像的多变量相关分析表明,精神分裂症患者中差异表达基因的转录水平与认知大脑网络的额叶和颞叶区域的灰质体积显著相关。研究结果表明,精神分裂症患者的基因组变异与转录组的改变相关,这在宏观大脑结构和认知的个体差异中发挥作用,有助于建立用于评估精神分裂症的综合多组学标志物。

1. 引言

精神分裂症是一种主要的精神障碍,具有很强的遗传背景。该疾病具有高度遗传性,其遗传机制复杂,涉及常见变异、罕见拷贝数变异和罕见编码变异。这些基因组变异已知会影响脑组织中基因表达的时空动态模式,精神分裂症患者大脑转录组中的差异表达和剪接就是证明。改变的转录谱意味着中枢神经系统内生物途径的变化,这可能进一步与大脑的宏观结构和功能异常相关。从遗传学到宏观大脑表型再到行为的跨尺度数据整合,对于理解精神分裂症的复杂病因以及开发精确的评估和治疗方法至关重要。将遗传学与神经影像学联系起来的研究已经指出,精神分裂症相关变异的功能后果与大脑形态学特性有关。例如,精神分裂症的多基因风险与皮质体积的个体间差异以及大脑结构和功能连接性相关。最近的研究表明,转录组学和神经影像学表型之间的关系表明,精神分裂症风险基因在大脑中的转录与大脑区域和回路中疾病相关脆弱性的模式重叠。然而,目前这些观察到的关联都依赖于神经影像学数据和基因表达数据的组平均模式,这不足以描述精神分裂症患者个体基因表达的变异。目前尚不清楚精神分裂症患者基因表达的个体差异是否以及如何与个体大脑结构异常相关。

鉴于血液和大脑之间基因表达的对应性,检查血液样本中的基因表达为在体内研究参与者水平的转录组 - 神经影像学关联提供了一种可行的方法。因此,我们收集了一个跨尺度的队列,包括血液RNA 测序(RNA-seq)、磁共振成像(MRI)、认知和症状数据,以研究精神分裂症患者个体转录组变异与大脑结构变异及其临床意义(图 1)。

图片

图1 方法框架

2. 结果

2.1 精神分裂症中的差异表达基因

本研究收集了 43 名精神分裂症患者和 60 名年龄和性别匹配的健康对照的 RNA-seq 数据、MRI 数据和症状严重程度评分。对血液来源的 RNA-seq 数据进行 DESeq2 差异表达分析,得到 17,999 个基因的标准化计数和精神分裂症患者与健康对照之间的表达改变。与先前的研究一致,我们观察到精神分裂症患者中普遍存在差异表达基因(DEGs),其中 1,248 个基因表现为下调表达,588 个基因表现为上调表达。DEGs 与精神分裂症的微阵列数据荟萃分析中报道的血液来源的 DEGs 一致,与参考文献 21 中的247 个基因有 59 个重叠,与参考文献 20 中报道的 2,145 个基因有 267 个重叠。我们检查了在血液样本中观察到的 DEGs 在精神分裂症患者大脑样本中是否也显示出差异基因表达(n = 559)。超几何检验表明,下调的 DEGs 子集(n = 1,248)包含 117 个与先前在大脑样本的 RNA-seq 数据中报道的 DEGs 重叠的基因。我们在血液样本中观察到的上调 DEGs 没有发现与大脑组织中上调的 DEGs 显著富集,对于整个 DEGs 集无论其效应方向如何也没有显著富集。血液来源的 DEGs 也显著富集了在先前精神分裂症个体的转录组全关联研究中发现的 DEGs。FUMA GENE2FUNC 基因集富集分析表明,DEGs 在基因本体论细胞成分中显著富集,并且在全基因组关联研究目录中包括的全基因组关联研究报告的基因集 “微粒体积”、“血小板体积”、“体重指数”、“大脑形态(MOSTest)” 和 “精神分裂症” 中也显著富集。

然后,我们检查了药物使用是否在精神分裂症患者的基因表达改变中起作用。将 DEGs 的基因表达水平与药物剂量相关联,没有发现关联(FDR 调整后 P>0.05)。在较高药物剂量亚组和较低药物剂量亚组之间进行 DESeq2 分析,只发现一个显著的 DEG,这表明我们报道的 DEGs 不是由药物使用驱动的。

我们还将基因水平分析扩展到转录亚型水平,因为在亚型水平的分析可能会捕捉到更大的疾病效应。在 87,232 个亚型中,我们观察到 1,104 个亚型在精神分裂症患者中存在差异转录表达(FDR 调整后 P<0.05),其中 840 个亚型表现为下调表达,264 个亚型表现为上调表达(图 2)。精神分裂症患者的亚型水平表达变化显著大于基因水平。值得注意的是,亚型水平分析确定了 226 个差异表达的转录本,这些转录本在基因水平上没有显示出差异表达。

图片

图2 DEGs 和亚型

2.2 精神分裂症中 DEGs 与基因组变异的关联

我们接着检查了 DEGs 在多大程度上与精神分裂症中观察到的基因组变异相关。从精神病基因组学联盟(PGC;第三波)获得了最近精神分裂症全基因组关联研究的汇总统计数据,包括 76,755 名精神分裂症患者和 243,649 名对照。MAGMA 基因特性分析依赖于基因水平的多元回归模型,该模型将所有基因的连续 logFC作为响应变量,结果表明基因表达改变与全基因组关联研究结果显著相关。当检查在东亚人群中进行的最近一项精神分裂症全基因组关联研究的汇总统计数据(n = 22,778)时,也观察到了类似的结果。这些结果证实,在精神分裂症全基因组关联研究中观察到的基因在血液样本中显示出更大的基因表达变化。使用来自其他五种常见精神健康状况(即双相情感障碍(BD)、注意缺陷多动障碍(ADHD)、自闭症谱系障碍(ASD)、重度抑郁症(MDD)和失眠)的全基因组关联研究汇总统计数据,我们检查了这一发现的特异性。发现基因表达的改变与 BD2S相关的基因组变异显著相关,但与 ADHD、ASD、MDD或失眠(β = 0.030,P = 0.289)无关,这表明我们观察到的常见基因组变异与基因表达改变之间的关联相对特异性地与精神分裂症和 BD 相关,这可能是由于这两种疾病之间的遗传重叠较高。

接下来,我们关注 DEGs 集,发现在 1,836 个DEGs 中,409 个基因与从精神分裂症基因组位点通过位置映射、表达定量性状位点映射和三维染色质相互作用映射确定的全基因组关联研究衍生的精神分裂症风险基因重叠(P<0.001,超几何检验)。对于所有三种单核苷酸多态性(SNP) - 基因映射方法,DEGs 在全基因组关联研究衍生基因中的富集仍然显著。分别考虑下调(n = 1,248)和上调(n = 588)的 DEGs,也得到了类似的结果。我们还进行了连锁不平衡分数回归(LDSC)分区遗传力分析,该分析确定了 DEGs 对精神分裂症 SNP 遗传力的贡献程度。在总 DEGs 集中观察到显著的遗传力富集,这表明这些区域的变异所传递的遗传力是对照组的1.497 倍(h2),对于下调的 DEGs 也观察到类似的结果,但对于上调的 DEGs 则没有。

2.3 基因表达的 DEGs 与大脑灰质体积的协变

大脑体积减少是精神分裂症最确定的特征之一。在建立了血液来源的 DEGs 与脑组织中的基因组变异和转录之间的联系后,我们接下来检查了标准化血液中精神分裂症相关 DEGs 的个体水平、跨尺度关联与大脑灰质体积(GMV)改变之间的关系。我们发现血液来源的 DEGs 的基因表达水平与 GMV 显著相关(图 3a)。第一个 LC(LC1)解释了转录 - GMV 协方差的 42%,并描述了精神分裂症患者和健康对照个体水平转录复合得分与大脑 GMV 复合得分之间的正相关。在所有 DEGs 中,1,183 个(64.6%)对 LC1 有显著贡献,其中 1,183 个 DEGs 中有 942个显示出正的 PLS 加载,241 个 DEGs 显示出负的 PLS 加载(这表明负贡献)。使用随机选择的具有 DEGs 平均表达水平的 DEGs 进行排列检验,表明 LC1 的显著性,这表明在精神分裂症患者中 DEGs 的个体间变异与皮质大脑体积改变的个体间差异之间观察到的关联具有特异性。为了确定对 LC1 贡献最重要和最稳健的基因,我们进行了五重交叉验证的 LASSO 回归,将 LC1 复合得分作为响应变量。

接下来,我们想检查特定大脑区域对这种观察到的个体间 DEG - GMV 关联的贡献。转录复合得分(见方法)与双侧额中回(r = 0.655和 0.733)、中颞回(r = 0.565 和 0.654)和顶上回的皮质体积呈正相关(图 3b)。同时,在双侧距状皮层、海马旁回和内嗅皮层中发现负相关。在健康对照中,个体转录复合得分与双侧颞叶、下顶叶、中央前回 / 中央后回和视觉皮层的皮质体积相关(图 3c)。然而,检查诊断和转录复合得分对大脑体积的交互效应没有显示出显著效应。

图片

图3 基因转录与大脑 GMV 的关联

事后分析比较了在大脑认知和初级网络背景下精神分裂症中区域对转录 - GMV 协方差的贡献(即 LC1 中的 PLS 显著性),结果表明高级认知网络区域(即默认模式网络、额顶网络和显著网络)显示出比初级视觉网络和感觉运动网络(SMN)更高的贡献水平(图 3d)。在健康对照中没有观察到这种效应,这表明这种关系可能是精神分裂症特有的。此外,LC1 中区域对转录 - GMV 协方差的贡献的空间模式与精神分裂症患者和健康对照之间 GMV 差异的标准空间模式显著相关(图 3e),这表明精神分裂症中的转录 - GMV 协方差也与精神分裂症中的大脑体积改变程度平行。在健康对照中没有观察到这种效应。

我们还检查了1,104 个差异表达转录本的亚型水平表达与大脑 GMV 的关系。PLS 相关分析再次揭示了一个显著的 LC1,解释了转录 - GMV 协方差的 42.8%。在LC1 中,632 个亚型显示出正的 PLS 加载,80 个亚型显示出负的 PLS 加载。检查不同大脑区域对转录 - GMV 协方差的贡献也揭示了与基因水平分析相似的大脑区域。

2.4 DEG - GMV 协方差与精神分裂症基因表达模式一致

使用 GAMBA 在艾伦人类大脑图谱(AHBA)的 15,071 个基因的全脑基因表达谱背景下,进一步检查了转录-GMV 协方差的空间模式。显示最高正相关的前 500 个基因涉及 118 个由精神分裂症全基因组关联研究确定的基因,这超过了随机预期。使用保留空间自相关性的替代大脑图谱进一步证实了这种富集。对于前 200 个基因(P = 0.033)和前 1,000 个基因(P = 0.019)也观察到了类似的结果。在 DEGs 集中没有观察到显著的富集(P = 0.363),这可能是由于 AHBA 的数据样本有限。

2.5 DEGs 的基因表达与 SMN 大脑连接性的协变

考虑到先前的研究表明精神分裂症相关基因的转录谱与大脑连接异常相关,我们接下来检查了患者个体水平的基因表达是否与大脑连接性的变化平行。PLS 分析表明,精神分裂症组中转录复合得分与双侧中央前回和中央后回、左顶叶上小叶和后扣带皮层的区域解剖连接呈正相关(图 4a)。事后检查在静息态网络中区域贡献的空间分布(即 PLS 显著性)表明,在 SMN 区域的贡献最高(图 4a)。在功能连接的 PLS 分析中也观察到 SMN 的显著相关性(图 4b)。

图片

图4 转录、GMV 和大脑连接性的关联

2.6 转录、大脑和认知之间的关联

为了检查跨尺度生物特征如何共同影响精神分裂症患者的临床特征,我们进行了 PLS 分析,以检查精神分裂症患者中转录、GMV、临床症状和认知分数之间的关联。在这里,转录数据的 20 个主成分(解释方差为 95.7%)与 114 个皮质区域的 GMV 分数连接起来,形成第一个输入数据矩阵,在 PLS 分析中,韦氏成人智力量表(WAIS)测试分数作为另一个输入数据矩阵。观察到一个显著的 LC,表明个体的 GMV 与 WAIS测试中的认知表现显著正相关(图 5a)。事后分析表明,这种相关性主要由双侧额上回、岛叶、前扣带皮层、左额下回和右眶额回的 GMV 驱动(图 5b)。我们没有观察到对阳性和阴性症状量表(PANSS)分数的进一步特定效应(P>0.109)。

图片

图5 转录、GMV 和 WAIS 测试表现的关联

3. 讨论

个体血液来源的基因表达和神经影像学数据的整合已经建立了精神分裂症大脑体积改变的转录组相关性。在这里,我们进行了一项多组学研究,检查了精神分裂症患者的血液转录组数据、神经影像学数据以及临床症状和认知障碍的数据。基因表达水平的个体差异与精神分裂症患者的宏观大脑体积个体差异相关。此外,大脑体积和转录与患者认知能力的临床指标相关。这项研究在个体参与者水平上展示了精神分裂症中体内转录组 - 大脑体积的关联。

基因表达与大脑体积的关联表明,精神分裂症患者中 DEGs 的低表达与额颞叶区域 GMV 的减少相关。先前的研究广泛报道了精神分裂症患者额颞脑区的受累情况,与健康对照相比,精神分裂症患者的灰质、表面积和皮层厚度减少。转录组研究检查死后大脑材料时,反过来注意到精神分裂症患者中免疫相关基因的下调。我们在参与者水平上报告的转录组 - 神经影像学关联进一步证实了将基因表达与基于群体的大脑体积数据联系起来的研究结果,例如,先前观察到的与中枢神经系统发育相关的基因与精神分裂症中大脑体积变化的全球模式相关的基因重叠。转录与大脑体积的关联可能归因于精神分裂症风险基因在人类大脑发育中的关键调节作用。与此一致的是,已知神经元和星形胶质细胞 / 少突胶质细胞前体细胞相关基因在精神分裂症皮质厚度异质性的转录组和多基因表现中发挥重要作用。我们在精神分裂症患者中观察到的个体水平上基因转录与大脑体积变化的关系显示,在精神分裂症患者中,在个体水平上整合多组学特征具有巨大潜力。

我们的发现表明,SMN 的结构和功能连接性变化与精神分裂症风险基因的基因转录和 GMV 相关。SMN 在先前的神经影像学研究中经常被报道,显示精神分裂症患者中存在不同的功能连接性。我们报告的关联与这些先前的研究一致,并与表明结构连接性与大脑区域之间转录谱的紧密耦合相关的研究一致。精神分裂症风险基因也被报道显示出与白质连接性破坏的空间模式重叠的大脑转录谱。精神分裂症基因表达与大脑连接异常的关联支持了精神分裂症中广泛连接性破坏的遗传起源。

患者的认知障碍被发现与转录组和神经影像学测量的个体差异相关,主要涉及默认模式网络的区域。这一结果扩展了精神分裂症患者大脑结构与认知领域之间的关系。转录、大脑和认知指标之间的关联与智力和精神分裂症之间共享遗传位点的观察结果一致,个体认知表现的个体间差异与个体精神分裂症风险等位基因相关,并与精神分裂症多基因风险评分相关。

精神分裂症患者的认知功能障碍与血液样本中测量的免疫基因表达改变有关。我们通过提供认知能力、GMV 和基因表达之间关联的实证证据,补充了这些结果。将遗传学与神经影像学相结合是识别精神分裂症新遗传标志物和提高疾病可预测性的关键。

我们报告的精神分裂症患者血液样本中 DEGs 与常见变异以及患者大脑表达改变之间的关系表明,血液转录组数据对于研究精神分裂症中的转录组 - 神经影像学关联具有参考价值。精神分裂症与大脑形态测量之间的遗传关联已经得到了很好的证明,但识别该疾病的转录组 - 神经影像学关联的一个障碍是,随后对转录组和 MRI 数据的分析目前主要基于不同来源的数据。我们的研究试图通过分析来自一组精神分裂症患者的跨尺度数据来解决这个问题。观察到的血液来源的 DEGs 与大脑来源的 DEGs 之间的对应关系与人类血液和大脑之间基因表达密切相关的报道一致。观察到的血液 DEGs 与精神分裂症风险基因之间的关联进一步表明,血液 DEGs 可能受到共同基因组变异的调节。我们的研究揭示了在精神分裂症患者中,通过转录组全关联分析确定的 61 个基因中有 11 个重叠基因,揭示了一组可能代表该疾病真正易感性因素的特定基因。

在解释我们的结果时,应考虑几个因素。第一个限制是静脉血和脑组织来源的转录组之间的差距。我们确实通过显示血液 DEGs 在大脑 DEGs 中的富集,并使用来自 GTEx 的基因表达数据表明血液 DEGs 和大脑 DEGs 之间存在关系,但它们仍然不相等,计算出的重叠是基于不同来源的数据。从接受脑外科手术的患者中获取少量脑组织(例如,癫痫或肿瘤神经外科手术期间的常见程序)提供了研究血液来源和大脑来源基因表达之间直接联系的机会。其次,在我们的研究中,大脑表型仅基于结构 T1 成像获得。其他研究将结构 MRI 与正电子发射断层扫描等方法相结合,揭示了例如首发精神病患者海马形态改变与小胶质细胞活化之间的宝贵关联。第三,本研究中血液采集没有严格的时间框架,尽管众所周知,昼夜节律和膳食摄入会影响血液基因表达水平。尽管观察到的精神分裂症 DEGs 与转录-GMV 之间的关联并不是特别由昼夜基因或与膳食相关的基因驱动,但在未来的研究中,固定血液样本的采集时间和禁食时间将是更好的选择。第四,本研究没有包括其他组学数据,例如微小 RNA。最近的研究表明,外周流体中的微小 RNA,包括微泡,可以追溯到中枢神经系统来源,并且对精神分裂症具有潜在的诊断价值和潜在的治疗应用。第五,本研究阐明了血液基因表达与宏观大脑结构之间的关联,不能确定不同尺度的变量是否遵循顺序或更复杂的关系。新的计算方法,如具有多块建模的稀疏广义典型相关分析,可能会提供进一步的证据来确定基因转录、大脑成像和行为表型之间的相互作用。最后,使用 AHBA 和 DEG - GMV 协方差图,我们确定了富含全基因组关联研究衍生的精神分裂症基因但不含血液 DEGs 的基因。这可能归因于 AHBA 的数据样本有限,即 AHBA 包含来自六个没有任何精神障碍的大脑捐赠者的死后大脑样本。与全基因组关联研究衍生的精神分裂症基因相比,根据基因集分析,报道的精神分裂症血液 DEGs 参与突触组织的程度较低,因此没有观察到 DEGs 的富集。

总之,我们在个体患者水平上展示了精神分裂症患者血液基因表达与大脑 GMV 之间的关联,提供了该疾病的神经遗传特征。建立大脑结构的转录组相关性有望建立改善精神分裂症诊断和评估的生物标志物。

4. 方法

4.1 参与者

本研究收集了 43 名精神分裂症患者和 60 名年龄、性别匹配的健康对照的多组学 RNA-seq 数据、MRI 数据和症状严重程度评分。患者从中国西安西京医院精神科招募,健康对照从当地社区招募。纳入和排除标准在补充方法中有详细描述。没有预先应用统计方法来确定样本量,但我们的样本量与先前研究中报道的样本量可比。基于模拟的功效分析表明,鉴于当前的样本量和数据样本的协方差结构,有 80% 的功效。精神分裂症患者完成了一系列临床评估和认知测试,包括评估临床症状严重程度的阳性和阴性症状量表(PANSS)和评估一般认知能力的中国版韦氏成人智力量表(WAIS-RC)。WAIS-RC 也在健康对照中进行。行为评估、大脑扫描和血液采集在同一天进行。记录抗精神病药物的类型和每日剂量,并转换为奥氮平等效剂量。本研究获得了第四军医大学第一附属医院机构伦理委员会的批准(编号 KY20183113-1),所有参与者都提供了参与本研究的书面知情同意书。参与者获得了交通补偿。

4.2 RNA-seq 数据

4.2.1 数据采集

从 2020 年 4 月到 2020 年 9 月,从每位参与者的上前臂采集静脉血。血液样本在 MRI 扫描当天采集,无需确切的采集时间和禁食。将 2.5ml 血液样本收集到 BD Vacutainer PAXgene RNA 管中,该管含有专有 RNA 稳定试剂,并立即在 - 80°C 下冷冻。从全血中提取总 RNA,并在同一批次中进行分析。使用 Illumina Novaseq 6000 进行 RNA-seq。使用 fastp(v.0.18.0)过滤低质量读段,使用 HISAT2.2.4(参考文献 76)将过滤后的读段映射到人类参考基因组 hg19。使用 StringTie(v.1.3.1)组装每个样本的映射读段。RNA-seq 数据收集和分析的细节在补充方法中有描述。

4.2.2 差异表达分析

使用 DESeq2 差异表达分析对 20,313 个基因的未标准化原始计数数据进行分析,这些数据代表序列读段的数量。使用 R 中实现的 apeglm 包对标准化的 DESeq2 分析进行 FC 收缩,得到 17,999 个基因的标准化计数及其在精神分裂症患者和健康对照之间的转录改变。DESeq2通过将计数除以由基因计数相对于每个基因的几何平均值的中值比确定的样本特异性大小因子来计算标准化计数。将年龄和性别作为无关协变量纳入,并且这里不适用批次效应,因为所有样本都在同一批次中进行分析。为每个基因计算 FC 以描述转录变化,并使用 FDR Benjamini - Hochberg 程序调整多重比较的 P 值。根据 FDR 调整后的 P 值低于 0.05 来鉴定 DEGs。

4.3 MRI 数据

4.3.1 数据采集

使用 GE Discovery MR750 3.0T 扫描仪采集 T1 加权 MRI、扩散加权成像(DWI)和静息态功能 MRI(fMRI)数据。扫描参数在参考文献 50 中有描述,并在补充表 10 中列出。

4.3.2 形态测量指标

使用 FreeSurfer(v.6.0)对T1 加权 MRI 数据进行预处理,以分割脑组织并重建皮质表层。经验丰富的研究人员手动检查 FreeSurfer 的输出。使用总脑体积来检查是否存在样本异常值,异常值根据比平均值大三倍标准差来定义。根据 Desikan - Killiany 图谱的细分,将重建的皮质表层划分为 114 个不同的区域(即每个半球 57 个区域)。在以下分析中使用 FreeSurfer 管道中自动生成的区域体积。使用原始的 Desikan - Killiany 图谱的 68 个皮质区域进行验证。

4.4 连接性指标

使用 FSL(v.6.0)和 CATO(v.3.1.2)对 DWI 数据和fMRI 数据进行连接组重建。DWI 数据和 fMRI 数据的详细处理步骤在补充方法中有描述。为每个参与者分别生成一个 114×114 的结构连接矩阵,该矩阵描述流线密度(即两个区域之间的流线数量除以区域体积)和一个 114×114 的功能连接矩阵,该矩阵描述在提取的血氧水平依赖(BOLD)时间序列之间每两个区域之间的相关性。区域连接性强度计算为每个区域的所有连接的总和强度。

4.5 统计分析

我们使用 MAGMA 进行基因特性分析,以检查基因表达改变与先前发表的精神分裂症全基因组关联研究中报道的基因水平统计数据在多大程度上相关(图 1a)。简而言之,首先对纳入的全基因组关联研究汇总统计数据进行 MAGMA 基因分析,并通过将 SNP 映射到基因(如果 SNP 位于基因内)来获得基于基因的统计数据。然后,使用 MAGMA 基因分析的输出和本研究中处理的基因表达改变(即 log₂FC),基于线性模型进行 MAGMA 基因特性分析。

进行多变量 PLS 相关分析,以检查 DEGs 的基因表达(即标准化计数)与成像衍生的表型之间的关联(图 1b)。PLS 已被广泛用于通过最大化两个数据矩阵之间的协方差来寻找 LCs。使用线性回归将年龄和性别作为无关协变量从两个数据矩阵中回归出去。分别在每个组内进行标准化,通过去均值并将数据除以组标准差。这样,组差异被忽略,使得观察到的相关性不是由组差异驱动的,并且转录 - 成像相关性的共同和不同效应在精神分裂症和健康对照组中都存在。

从 PLS 中得出的 LC 描述了输入数据矩阵中每个变量的奇异值(表示解释方差的水平)和权重(称为 PLS 显著性)的组合。使用排列检验来统计评估观察到的相关性,并使用自助抽样(5,000次采样)来估计 LCs 的所得 PLS 显著性是否稳健。接下来,我们通过从每个排列中的 17,999 个基因池中随机选择基因来进行排列检验,以检查精神分裂症 DEGs 的特异性。分别计算基因表达和成像衍生表型的个体水平复合得分。基因表达和成像复合得分之间的相关性显示了基因和成像表型的所有可能线性组合之间可以观察到的最大相关性水平。使用单样本 Kolmogorov - Smirnov 检验检查数据正态性,表明所有 114 个区域的大脑 GMV 都来自正态分布(P>0.073),并且 1,647 个(1,836 个中的)基因的基因表达数据也来自正态分布(未校正 P>0.05)。使用 1,647 个基因的表达数据显示与完整的 1,836 个基因相似的结果。由于相关性是在每个组内计算的,没有进行组比较,因此没有测试方差齐性。

对观察到的相关性模式进行事后分析,在基于 AHBA 的大脑认知网络、组间大脑体积差异和基因表达谱的背景下进行。对于任何 LC,分别计算基因表达和成像衍生表型的个体水平复合得分,以评估 LC 捕获的协方差水平。使用 myPLS进行 PLS 分析。为了验证目的,将数据集随机分为两半,分别在每一半中重复进行 PLS 分析。

参考文献:Associated transcriptional, brain and clinical variations in schizophrenia.

本文标签: Nature Mental Health精神分裂症的转录组脑结构与临床表型的变异性