泛癌单细胞分析再上大分!中山大学第五附属医院团队:超新颖思路结合33种癌症类型,干湿结合强势发柳叶刀子刊!






泛癌单细胞分析再上大分!中山大学第五附属医院团队:超新颖思路结合33种癌症类型,干湿结合强势发柳叶刀子刊!

馆长  生信果  2024-05-16 19:00:54

有同学来找馆长帮忙,想发单细胞文章,但是经费不足,怎么用公共数据尽可能发高分?那问到这个,就肯定要从数据量上多下功夫啦。不过泛癌分析要做的出彩,数据量是一方面,好思路也是必不可少的!之前馆长也分享过不少泛癌分析的高分好文,不妨一起收藏看看哦~~

今天馆长选的文章从饮食节制切入,研究其相关分子活动在癌症中的作用。作者提出了一种计算方法来量化饮食限制相关分子活动,并在 27,320 份样本中对 33 种癌症类型和 30 种正常组织中的这些活动进行了描述。接着深入研究了饮食限制相关分子活动与各种因素(包括肿瘤微环境、免疫表型、基因组特征和临床预后)之间的关联。同时,发现了两个具有预测肝细胞癌预后潜力的饮食限制基因,并在 90 例患者中通过免疫组化检测验证了这两个基因。文章的切入点十分新颖,获取了大量的单细胞公共数据,以及bulk RNA和其他多组学数据,分析内容和分析方法都十分丰富,又进行了实验验证,干湿结合发到11分+令人佩服!!还在寻找生信发文好思路的同学们快快收藏,高分文章等着你!(ps:想要了解最新的生信思路,来找馆长就对了,这里有不仅有热点方向还有创新思路,想思路复现可以直接扫码call馆长,等你哦!)


● 题目:对肿瘤微环境中饮食限制分子特征的泛癌症综合分析
● 杂志:eBioMedicine
● 影响因子:IF=11.1
● 发表时间:2024年3月          

研究背景

饮食限制(DR)是节食的总称,已被证明是减少癌症发生的有效干预措施。与膳食限制相关的分子活动是介导其抗癌作用的关键,但目前仍缺乏对这些活动在泛癌症层面的全面探索。
          
数据来源
数据集/队列
数据库
数据类型
详细信息
TCGA
TCGAbiolinks
多组学数据
体细胞突变数据、RNA-seq数据以及33种癌症类型(9938个样本)的相关临床数据
UCSC Xena
多组学数据
蛋白质组数据和30种组织类型(17382个样本)的基因表达矩阵
CCLE
DepMap Data        
RNA-seq数据
31 种癌症类型的 1348 个细胞系的基因表达矩阵
GSE93157
GEO
微阵列数据
非小细胞肺癌、头颈部鳞状细胞癌和黑色素瘤中的程序性死亡 1 受体阻断和免疫相关基因表达谱
GSE115821
GEO
RNA-seq数据
31 个用抗 PD-1 处理的黑色素瘤样本
GSE14520
GEO
微阵列数据
22 名肝细胞患者的肿瘤和配对非肿瘤样本
GSE63117
GEO
微阵列数据
10 名年龄在 20-34 岁之间的健康年轻男性和 9 名年龄在 64-85 岁之间的健康老年男性
GSE69039
GEO
微阵列数据
4名正常体重
7名轻度肥胖、7名中度肥胖受试者
PRJEB23709
CNCB
RNA-seq数据
单独接受抗 PD-1 或联合抗 PD-1 和抗 CTLA-4 免疫治疗的转移性黑色素瘤患者
PRJNA482620
NCBI
RNA-seq数据
抗PD1免疫治疗的胶质母细胞瘤
PRJEB25780
ENA
RNA-seq数据
帕博利珠单抗治疗的转移性胃癌
GSE161529
GEO
scRNA-seq
4 个 TNBC、4 个 BRCA1 TNBC、6 个 HER+ 肿瘤、19 个 ER+ 肿瘤和 6 个 ER+ 肿瘤的淋巴结转移,13 名无乳腺癌正常患者的乳腺、11 名正常患者的上皮乳腺细胞以及 4 名具有 BRCA1 突变的癌前患者的乳腺
GSE138709
GEO
scRNA-seq
5个肝内胆管癌样本以及3个配对的相邻非肿瘤组织
GSE166555
GEO
scRNA-seq
12 例结直肠癌患者的肿瘤和癌旁组织
GSE160269
GEO
scRNA-seq
60 个食管鳞状细胞癌肿瘤和 4 个相邻的正常组织样本
GSE159115
GEO
scRNA-seq
8 个肾肿瘤标本和 6 个良性人肾标本
GSE117570
GEO
scRNA-seq
4名非小细胞肺癌患者的肿瘤与邻近的正常组织
CRA001160
GEO
scRNA-seq
24个原发性PDAC肿瘤和11个正常胰腺
GSE176031
GEO
scRNA-seq
3 名不同患者的 6 例前列腺活检、4 例患者的纯肿瘤样本和4 例患者的匹配正常样本        
GSE134520
GEO
scRNA-seq
3 名不同患者的 6 例前列腺活检、4 例患者的纯肿瘤样本和4 例患者的匹配正常样本
GSE123813
GEO
scRNA-seq
基底细胞癌抗 PD-1 治疗前后患者
GSE145281
GEO
scRNA-seq
II 期试验 IMvigor210 的膀胱癌患者的外周血单核细胞
GSE120575
GEO
scRNA-seq
48 个接受检查点抑制剂治疗的黑色素瘤患者肿瘤样本
ST
Datadryad
空间转录组数据
16 位胶质母细胞瘤患者的 16 个病理切片
          

研究思路

在本研究中,作者通过对 33 种癌症类型和 30 种正常组织进行全面的多组学分析,开发并验证了一种定量指标,用于评估 DR 相关分子活动的水平。首先在泛癌症水平上确定了 DR 与基因组变异和免疫分子特征的特定关联。此外,对 939,718 份单细胞图谱的调查显示,DR 相关分子活动表现出瘤内异质性,并与肿瘤细胞和免疫细胞之间的细胞-细胞旁分泌通讯有关。此外,DR 相关分子活性水平与肿瘤免疫调节有显著关联,有望预测各种癌症类型的免疫疗法反应。重要的是,研究结果表明,较高水平的DR相关分子活性与总生存期(OS)和癌症特异性生存期(CSS)的改善有关。
          
主要结果
1. DR 相关分子活动的量化
为了量化与 DR 相关的分子活动,从 GenDR 数据库中获得了 276 个与 DR 相关的基因。对于该数据集,将因实施 DR 而上调的基因归类为与 DR 正相关的基因,而下调的基因则被视为与 DR 负相关。假设与 DR 相关的更活跃的分子特征会使与 DR 正相关的基因和与 DR 负相关的基因之间的活性产生更明显的差异。采用 GSVA 算法来推断每个样本中与 DR 正相关和负相关基因的活性,然后定义了 “DR 评分”,它可以反映这两组活性之间的差异(图 1a)。
   

然后,计算了 TCGA 数据库中 33 种癌症类型的 9938 个样本和 CCLE 数据库中 31 种癌症类型的 1348 个细胞系的 DR 评分。图 1c 显示了每种癌症类型特有的 DR 相关分子活动的分布情况。一般来说,TCGA 数据库和 CCLE 数据库中的大多数癌症类型的 DR 平均得分都低于 0。与相应的正常组织相比,TCGA 中几乎所有癌症类型的肿瘤组织中的 DR 评分都明显较低,这表明肿瘤微环境中 DR 相关分子活性水平的升高可能会抵消肿瘤的生长(图 1e)。通常与葡萄糖代谢活跃有关的组织,如脑、肝、肾和甲状腺肿瘤,在 TCGA 和 GTEx 队列中都表现出相对较高的 DR 评分。TCGA和GTEx中DR得分的一致趋势表明,组织类型可能在决定DR相关分子活动的程度方面起着至关重要的作用。    

图1 全面量化癌症和组织中与 DR 相关的分子活动

2. DR评分的异质性以及与肿瘤免疫微环境的关系
采用了10个scRNA-seq数据集,共830,178个细胞,涉及10种实体瘤,分别来自173名癌症患者和65名正常供体,以评估DR评分的异质性以及DR评分与肿瘤微环境之间的关联。与bulk RNA 序列数据一致,与肿瘤微环境中的细胞相比,正常组织中的细胞通常表现出更高的 DR 评分(图 2a)。此外,在比较肿瘤细胞和正常细胞时,在 4 个细胞系中观察到较高的 DR 评分,仅在基质细胞和淋巴细胞中观察到统计学意义(图 2b)。为了探索不同癌症类型的 DR 评分异质性,比较了正常组织和肿瘤中不同细胞类型的 DR 评分(图 2c 和 d)。正如预期的那样,与正常组织中的细胞相比,肿瘤微环境中的大多数基质细胞和免疫细胞表现出较低的 DR 评分,这表明肿瘤微环境中与 DR 相关的分子活性偏好降低。这也可能表明,肿瘤细胞会夺走周围正常组织细胞的营养,导致这些细胞的 DR 评分降低。
   
为了研究肿瘤微环境中 DR 相关分子活性的瘤内异质性的影响,分析了 8 例 KIRC 患者(GSE159115)的 15,000 个细胞的 DR 评分。该数据集中的癌细胞和免疫细胞被分为高DR、中DR和低DR。研究结果表明,DR 评分的升高与肿瘤细胞的新陈代谢密切相关(图 2e)。此外,高DR组对异种生物刺激的反应增强,可能会影响免疫细胞的趋化活动(图2e)。此外,肿瘤内较低水平的DR评分与肿瘤血管生成增加有关,这表明低DR肿瘤细胞可能在很大程度上促进了肿瘤的生长(图2e)。此外,细胞-细胞旁分泌通讯分析显示,DR评分与肿瘤细胞间的细胞-细胞相互作用数量呈负相关。低 DR 组的肿瘤细胞相互作用次数最多,这表明它们在肿瘤微环境中的活性增强(图 2f)。同时,高 DR 组的免疫细胞参与了细胞氧化物解毒过程,该过程对氧化还原系统至关重要,并与抗肿瘤发生有关。此外,还发现低 DR 组免疫细胞与肿瘤细胞之间的相互作用增加,这表明低 DR 组免疫细胞受到了肿瘤细胞的巨大影响(图 2h)。

然后,利用来自 16 名 GBM 患者的 16 个病理切片、51,850 个斑点的 ST 数据集,进一步研究了 DR 评分与肿瘤免疫微环境在空间层面上的相关性。根据免疫细胞的空间分布,将其分为三组:肿瘤内、界面上和基质中(图 3a)。肿瘤内的免疫细胞平均 DR 评分最低,而基质中的免疫细胞平均 DR 评分最高(图 3b)。随着免疫细胞与肿瘤细胞距离的增加,DR评分显著下降。此外,通过细胞间的相互作用,发现肿瘤内的免疫细胞与其他位置的免疫细胞相比具有更高的网络得分,这表明它们积极参与了与肿瘤的交流(图 3c)。这些结果凸显了 DR 分数反映肿瘤微环境中免疫细胞活跃状态的能力,强调了免疫细胞与正常组织中的免疫细胞相比的独特状态。    

   

图2 肿瘤微环境中 DR 相关分子活动的异质性

图3 空间转录组揭示了 DR 评分与肿瘤免疫微环境之间的关联

3. DR 与特定癌症类型基因组变异的关系
基因组不稳定性被广泛认为是癌症和衰老的一个特征。然而,不同类型癌症的基因组改变在多大程度上会随 DR 相关分子活动水平的变化而变化,这一点仍有待阐明。在本研究中,调查了 DR 评分与两类基因组改变之间的关联:SNV 和 CNV。

对于SNVs,首先通过一个根据年龄、性别和种族进行调整的多元线性回归模型研究了DR评分与突变负荷之间的关系。癌症特异性分析表明,在 8 种癌症类型中,DR 评分与突变负荷呈显著负相关(图 4a)。随后,分别检测了每组中前 20 个突变的致癌基因(图 4b 和 c)。TP53、TTN、MUC16和PIK3CA突变是两组中观察到的前四个突变事件,但低DR组中这些基因的突变频率几乎是高DR组的两倍。数据显示,低 DR 组肿瘤中的 PIK3CA 发生有害突变的概率可能更高,从而使癌细胞对 DR 的反应性降低。此外,在低 DR 组前 20 个发生突变的致癌基因中,发现了与肿瘤进展密切相关的突变,如 APC 和 FAT3 中的突变,这表明低 DR 患者的肿瘤恶性程度更高。 
   
与 SNV 相似,观察到 DR 评分与近一半癌症类型中 CNV 事件的发生呈负相关,如 LIHC、KIRC和 COAD(图 4d)。此外,还发现癌症类型特异性臂水平 CNV 事件相对集中于 DR 评分较低的 LIHC 患者的某些染色体臂(图 4e 和 f)。先前的研究表明,19q 和 20q 的扩增以及 3p、13q 和 17p 的缺失与 LIHC 患者的转移和不良预后相关。

进一步研究了基因组异质性与 DR 评分之间的相关性。如图 4g 所示,发现 DR 评分与大多数癌症类型的肿瘤纯度呈正相关,这与单细胞分析显示肿瘤微环境中非肿瘤细胞的 DR 评分降低相吻合。此外,尽管存在异质性,但在几种癌症类型(包括 LIHC、KIRC 和 BRCA)中,DR 评分与肿瘤倍性、肿瘤突变负荷 (TMB)、HRD 和 LOH 呈负相关。这些研究结果表明,DR评分较低的特定癌症类型(如LIHC)更有可能表现出基因组不稳定性。    

图4 泛癌症层面上 DR 评分与基因组变异之间的关联

4. DR与免疫浸润和预后的关系
在 TCGA-LIHC 队列中,高 DR 组患者的总生存期明显优于低 DR 组(图 5a)。此外,DR 相关分子活性水平越高,肿瘤分级和 T 分期越好(图 5b)。鉴于肿瘤中大量的免疫浸润通常被视为预后因素,进一步研究了 DR 评分与免疫浸润之间的关系。通过ssGSEA算法,对肿瘤中16种免疫细胞的组成进行了分卷,并量化了13种免疫功能通路的活性。DR评分高的患者肿瘤中的免疫浸润水平明显较低(图 5c)。相反,DR评分低的患者则表现出免疫功能通路的活性增加(图 5d)。
   

为了验证观察结果,根据 276 个 DR 相关基因的转录组表达进行了共识聚类分析。根据共识矩阵,LIHC 患者被分为两组(k = 2)(图 5e)。第一组主要由高 DR 评分的患者组成(约 75%),而第二组中约 70% 的患者为低 DR 评分(图 5f)。Kaplan-Meier 分析显示,与群组 1 相比,群组 2 患者的预后较差(图 5g)。KEGG 通路中免疫相关通路的层次聚类分析显示,大多数第 2 组患者普遍存在免疫激活模式(图 5h)。研究结果表明,DR 相关分子活性与免疫浸润呈负相关,而与生存期延长呈正相关。    

图5 确定 DR 评分的临床相关性

5. DR 与泛癌中免疫检查点和免疫调节的关系
在大多数癌症类型中(33 种癌症中有 21 种),总免疫细胞的免疫浸润丰度与 DR 评分显著相关,而且大多数癌症的免疫浸润与 DR 评分呈负相关(图 6a)。然而,特定免疫细胞的浸润在不同癌症类型中各不相同,DR 评分与免疫浸润之间的相关性也相应不同。例如,在 LIHC 中,DR 评分与免疫抑制调节性 T 细胞(Tregs)的浸润呈负相关,但并非所有癌症类型都是如此。这一结果表明,在DR评分较低的LIHC患者肿瘤中存在免疫抑制微环境。 
   
为了进一步研究 DR 与免疫特征之间的关系,分析了 DR 评分与免疫检查点基因表达之间的相关性。如图 6b 所示,在大多数癌症类型中,DR 评分与免疫检查点基因的表达呈显著负相关。观察到大多数癌症类型,如 LIHC、LUAD、BLCA、BRCA 和 GBM,在低 DR 组中都表现出 PD-L1 转录物和蛋白的表达增强(图 6c 和 d)。此外,还研究了 DR 评分与免疫细胞溶解活性(CYT)评分之间的相关性。CYT 评分是根据粒酶 A(GZMA)和穿孔素(PRF1)转录本的平均值计算得出的,它是通过评估 T 细胞细胞毒性浸润来预测免疫反应的生物标记物。这些研究结果表明,DR评分低、PD-L1表达高且细胞溶解性T细胞充足的肿瘤可能会在相应的微环境中表现出对免疫疗法更高的敏感性。

研究结果表明,DR相关分子活性水平较低的患者可能具有以显著免疫抑制为特征的肿瘤微环境,这可能会导致预后不良。这些患者表现出大量的免疫浸润和与抗肿瘤免疫相关的强大分子特征。因此,DR 评分有望成为一种宝贵的工具,用于识别对免疫疗法产生有利反应可能性较高的患者。    

图6 特定癌症类型的 DR 评分与肿瘤免疫力之间的关联

6. DR作为免疫疗法反应的潜在预测指标
在不同的DR评分中观察到的免疫改变使我们相信,DR评分可能具有预测免疫检查点阻断疗法(ICB)反应的潜力。为了更深入地了解情况,在基底细胞癌的 scRNA-seq 数据集中比较了 ICB 反应者和 ICB 非反应者在免疫治疗前原发肿瘤样本的 DR 评分(图 7a)。与免疫治疗前的非应答者细胞相比,应答者细胞的 DR 评分较低(图 7b)。对细胞类型的进一步分析表明,DR评分的差异主要出现在免疫细胞和基质细胞中(图 7c)。随后扩大了分析范围,比较了免疫治疗前血液免疫细胞在 ICB 反应者和 ICB 非反应者之间的 DR 评分(图 7d)。与在实体瘤中观察到的结果一致,也得到了类似的结果,即应答者细胞的 DR 评分低于非应答者细胞(图 7e)。
   

最后,研究了 DR 评分在来自多个队列的bulk RNA-seq 样本中的预测能力。DR 评分在预测不同癌症类型的 ICB 反应方面达到了约 0.69 的平均 AUC(图 7f)。这表明 DR 评分有可能成为鉴别 ICB 反应者的预测工具。    

图7 DR 评分与免疫疗法反应的关系

7. 构建并验证肝细胞癌饮食限制相关预测因子
为了开发简化的 DR 预测模型并确定关键基因,收集了 3 个 LIHC 队列(TCGA-LIHC、ICGC-LIRI-JP 和 GSE14520)共 815 名患者的数据来开发 Cox 比例危险回归模型,并利用三种机器学习算法来选择关键基因。TCGA-LIHC队列作为训练队列,其他队列作为外部验证队列。在 TCGA-LIHC 队列中,LASSO、RFB 和 XGBoost 算法分别发现了 2、21 和 25 个与 DR 相关的关键基因(图 8a)。最后,提取了两个基因(FZD1, G6PD)来构建 LIHC-DR 预测因子。对 LIHC-DR 预测因子定义如下:LIHC-DR 预测因子 = 0.001906 ×(FZD1 的表达)+ 0.000974 ×(G6PD 的表达)。在所有三个队列中,LIHC-DR预测因子较高的患者预后明显较差(图 8b)。LIHC-DR预测因子预测1年和3年进展的平均AUC约为0.65。
   
为了验证LIHC-DR预测因子的预测效果,招募了90名LIHC患者,并对FZD1和G6PD进行了免疫组化(IHC)染色(图8c和d)。LIHC-DR预测器可以预测LIHC-DR评分与肿瘤分化等级呈正相关(图8e)。在IHC验证队列中,LIHC-DR预测因子能有效地将预后较差的LIHC患者归入高危组,观察到低危组和高危组LIHC患者的OS存在显著差异(图8f)。

总之,这些结果表明,DR相关分子活动与特定癌症类型(包括LIHC)的预后相关。此外,LIHC-DR预测因子与不同队列的LIHC患者的临床结果有显著相关性,这表明FZD1和G6PD有可能成为LIHC的预后生物标志物。    

图8 DR 基因是预测肝癌患者预后的潜在指标

文章小结

本研究通过整合DR相关基因并提出指标(DR评分)来说明肿瘤微环境中DR相关调控和分子特征,在泛癌水平上对DR相关分子活性进行了全面评估。在这项研究中,作者提出了一种DR相关分子活性定量的综合方法,并揭示了这些活性与特定癌症类型中肿瘤微环境、免疫表型、基因组特征和临床预后之间的关联。研究结果为增强对肿瘤微环境中DR相关调节的理解建立了一个框架,促进对DR相关机制和临床应用的进一步研究。文章选择的切入点非常新颖,收集的大量分析数据皆公开可用,采用了多种分析方法,整体分析思路清晰,逻辑严谨,干湿结合拿下10分+高分当之无愧!!(ps:发文还缺好思路的同学们,欢迎来找馆长,超多新颖的分析思路供你选择哦!)

小果还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询小果,竭诚为您的科研助力!


定制生信分析

服务器租赁

扫码咨询小果



往期回顾

01

1024G存储的生信服务器,两人成团,1人免单!

02

单个数据库用腻了?多数据库“组合拳”带你打开免疫浸润新思路!

03

孟德尔随机化的准备工作,GWAS数据的网站下载方法

04

跟着小果学复现-手把手带你拿下IF=46.9Nature 级别的主成分分析(PCA)图!!