还有高手?最新单细胞挖掘思路!南昌大学余鹏团队7.1分:机器学习+多组学整合+预后预测,效果杠杠滴!
宝子们,单细胞数据挖掘也开始内卷了,单纯生信不够用啦!是时候整点小妙招了!今天小途给大家带来一篇单细胞数据结合机器学习方法,并用生信分析做辅助,构建了一个精准预测预后特征和治疗反应的全新模型,数据均采纳于公共数据库。多组学的数据融合在一起,并且技术分析环环相扣,实现了不错的性能。(这篇思路非常巧妙,分析方法别具一格还好复现!让我们一起跟随小途,探索这篇文章的精彩之处吧~)
1,本文中开发了一个新的程序性细胞死亡(PCD)相关预后标志物,即CDI,该模型基于七个关键生物标志物,通过整合这些生物标志来预测黑色素瘤(CM)患者的预后和治疗反应;
2,本文中不仅结合了基因组学、批量转录组和单细胞转录组数据,还利用这些数据来构建更全面的生物信息学模型,提供了对CM更深层次的理解和管理;
3,本文构建了一个临床诺莫图,这是一个综合多个临床指标和CDI模型的工具,用以提高对CM患者生存结果预测的准确性;
4,本研究对CDI模型中的关键生物标志物在实际临床样本中进行验证,确保了模型的实验基础和临床应用的可靠性。想要发表高分SCI的小伙伴们也可以借鉴一下本文的研究思路哦~ (ps:如何更好的将单细胞挖掘和机器学习轻松复现并且应用到临床医学药学相关领域呢?有兴趣的小伙伴快扫码交流吧!!)。
l题目:探索一种特殊的程序性细胞死亡模式,通过机器学习预测皮肤黑色素瘤免疫治疗的预后和敏感性
l杂志:Apoptosis
l影响因子:IF=7.2
l发表时间:2024年4月
研究背景
作者主要关注皮肤黑色素瘤(CM),起源于黑色素细胞。紫外线暴露、遗传因素与每年CM的发病率和死亡率上升有关,尽管免疫疗法和靶向治疗已经改善了无法通过手术移除的晚期黑色素瘤,并且这两种策略相比化疗都显著提高了生存率,但CM的治疗无效和预后不良的挑战依然存在,这强调了进一步进行临床试验和研究的必要性。免疫疗法在治疗CM方面的有效性源于其高免疫原性,但随着肿瘤细胞的适应,它们可能对免疫疗法产生抵抗。程序性细胞死亡(PCD)可以抑制肿瘤的生长和扩散。为了防止黑色素瘤细胞逃避细胞死亡并持续增殖,深入了解这些细胞死亡模式对于开发更有效的治疗策略至关重要。所以作者提出了一个新的标志物,细胞死亡指数(CDI),用于评估预后、异质性及对不同治疗策略的响应。
图1 作者研究的程序框架
数据来源
数据集 |
数据库 |
详细信息 |
数量 |
肿瘤样本 |
TCGA、GEO、TIGER |
涵盖12个不同队列(表1) |
1831 |
表112个研究队列的详细信息
研究思路
在本研究中,作者首先从三个公共数据库下载了1831个肿瘤样本,涵盖12个不同的队列,包括癌症基因组图谱(TCGA)、基因表达综合数据库(GEO)和肿瘤免疫治疗基因表达资源(TIGER),同时下载了813个正常皮肤组织的转录组数据用于比对。通过这些数据,作者关注于PCD的多种形式,收集了与PCD相关的1515个基因,并通过单样本基因集富集分析(ssGSEA)来评估每种PCD模式的权重。作者采用一元Cox回归分析和Kaplan-Meier曲线来检测每种PCD模式的预后特性。通过共识聚类分析,作者识别了与PCD相关的CM亚群,并进一步评估了这些亚群在免疫治疗响应方面的差异。此外,作者对TCGA-SKCM队列进行TIDE评分以预测患者对免疫治疗的响应,并比较了不同PCD相关亚群间的功能和预后差异。作者还运用多种机器学习方法建立了基于PCD特征的预后模型,并通过多变量Cox回归分析,结合表达值和相关系数,构建了细胞死亡指数(CDI)模型来预测CM患者的预后特征。最后,作者通过功能富集分析和单细胞数据分析进一步探讨了PCD在不同细胞亚群中的表达和影响,以及通过各种临床信息构建了综合的预后名模图以验证CDI作为独立预后因素的有效性。
主要结果
1. CM中PCD的总体景观
为了全面探索CM中PCD的景观,作者在TCGA-SKCM队列中使用包含1515个PCD的基因集来计算14种PCD模式水平。基于这些程度,作者绘制了每种PCD模式的Kaplan-Meier曲线,以展示PCD在CM中的预后特性。大部分模式均显示出显著的预后作用。作者进行了单变量Cox回归分析,将硫键死亡识别为最显著的风险因素,而坏死、热凋亡、凋亡和自噬被定义为主要的保护因素(图2)。因此,这五种显著的PCD模式被选为后续分析的对象。
图2 全面探索PCD模式的预后景观
2. 获得两个不同的PCD相关的CM簇,并探索两个簇之间的预后和免疫治疗
根据五种PCD模式的ssGSEA程度,对TCGA-SKCM队列中的所有457个肿瘤样本基于K值进行了聚类,被分为两个不同的PCD相关簇,对应的CM集合为C1和C2。两个簇之间在预后特征上存在显著差异,C1的总生存期和疾病特异性生存期均优于C2,表明C2与较差的预后相关。此外,免疫治疗的响应率在C1中高于C2。C1的功能失调得分显著更高,而排除得分显著更低。同时,预测免疫治疗效果的两个标记物,肿瘤突变负荷(TMB)和微卫星不稳定性(MSI),在C1中也更高,且C1中9种常见免疫检查点(ICKs)的表达水平均显著高于C2(图3)。C1相比C2在免疫治疗的敏感性和效果上更为显著。
图3 PCD相关的两个CM簇的识别
3. 两个PCD相关簇的差异
两个PCD集合(C1和C2)在免疫治疗景观中的显著差异,并且C1中免疫细胞的浸润显著更为丰富。此外,肿瘤微环境(TME),作为预测黑色素瘤免疫治疗效果的另一个关键生物标志物,也在两个集合中进行了研究。为了全面探索TME的特性,作者采用了四种算法进行分析。ssGSEA算法显示,与C2相比,C1集合的免疫细胞浸润显著更为丰富。同时,通过ESTIMATE算法计算的Stromal得分、免疫得分和ESTIMATE得分在C1中也都更高,而肿瘤纯度在C1中更低,表明C2中的CM肿瘤恶性程度更高,TME较差。CIBERSORT的结果也强调了C1与C2相比拥有更显著和更丰富的TME。TIMER算法展示了C1中6种免疫细胞的更高浸润(图4)。这些结果揭示了PCD相关簇C1中肿瘤微环境的活跃性对提高免疫治疗的有效性具有关键意义。
图4 两个与PCD相关的CM簇之间的TME的不同景观。
4. 共识预测模型构建
为了探索两个PCD集合(C1和C2)之间的免疫治疗响应差异以及PCD的景观,作者在转录组水平上进行了差异表达分析。结果识别出963个差异表达基因。将这些DEG与五种显著PCD模式相关的1006个基因重叠,识别出56个关键PCD特征基因。基于这些分析,作者进一步开发了一个以PCD为介导的预后模型,称为CDI,以阐明PCD在CM免疫治疗响应和预后中的关键作用。首先,作者通过单变量Cox回归分析,筛选出了47个显著的预后相关PCD特征。然后,利用这47个特征的表达水平,生存时间和状态作为输入数据,应用101种算法模式组合通过10种机器学习方法在TCGA-SKCM队列中进行训练。模型结果显示,高CDI值的患者可能表现出较差的预后(图5)。这一研究表明,PCD特征和CDI模型在预测和改进CM患者的治疗结果方面具有潜在的重要价值。
图5构建和验证预后特征
5. 对CDI模型的预测准确性和生物学特性的系统探索
作者收集了39个先前发表的与各种生物过程相关的预后模型。随后,作者在所有预后模型的训练集、测试集和验证集上进行了单变量Cox回归分析。其中只有七个模型,包括CDI,被确认为在所有四个队列中一致的风险因素,凸显了作者CDI模型的准确性。此外,作者比较了每个模型的C指数与CDI模型的C指数,并观察到只有CDI在训练集、测试集和验证集中表现出优越性。其他一些模型仅在其各自的训练集中显示出准确的预测(高C指数),进一步突出了CDI的优越特性(图6)。这一研究表明,CDI模型在预测CM患者的预后方面具有显著的有效性和普适性。
图6比较CDI特征与其他已发表的CM模型之间的预后准确性。
6. 在CDI模型中的免疫景观和免疫治疗反应的准确预测
为了探索通过CDI介导的免疫景观,作者首先在GSE115978数据集中研究了单细胞水平上CDI的特定分布。在对质量较差的细胞进行筛选后,识别出10种主要细胞类型。几乎所有细胞类型中的CDI水平都较高。作者观察到高CDI组显示出更高比例的多样化T细胞,而其他细胞类型在低CDI组中更为普遍,这与富集分析的结果一致。此外,作者比较了高和低CDI组之间的肿瘤突变负荷(TMB)和微卫星不稳定性(MSI),发现这两个预测免疫治疗效果的标记在低CDI组中较高(图7)。结果强调了CDI在理解和预测黑色素瘤免疫反应中的潜在价值。
图7CDI在CM和其他癌症队列中的预测特征
作者进一步研究了其在四个CM患者队列中预测响应的能力。低CDI的患者显示出更高的免疫治疗响应可能性,低CDI组的响应率在四个队列中均显著更高。作者将CDI模型的预测特性扩展到其他癌症,收集了四个其他癌症的免疫治疗队列。CDI模型在所有四个队列中展示了显著的预后作用,高CDI的患者与较差的预后相关。同样,低CDI组的响应率也更高(图8)。结果证实了CDI模型在预测多种癌症患者免疫治疗反应方面具有广泛的应用潜力。
图8CDI在TME和免疫治疗中的作用
6. 强调CDI的预后作用,并将诺莫根风险模型与临床信息的整合
为了减少仅依赖CDI预测CM患者预后的不稳定性和潜在偏见,作者扩展了分析范围,将五个临床指标与CDI一起深入预测CM的预后。首先,单变量和多变量Cox回归分析都强调了CDI的关键预后作用。随后,作者整合了各种临床信息和CDI进行多变量Cox回归和逐步回归分析,构建了TCGA-SKCM队列中的一个综合评分模型(诺莫图)。基于诺莫图的公式,计算出每位患者的总分,并在KM曲线中展示了诺莫图的预后特性。特定时间间隔的总分AUC一致性最高,进一步强调了诺莫图的关键作用(图9)。这一研究证明了结合CDI和临床指标的诺莫图模型在提高CM患者预后预测准确性方面具有显著优势。
图9CDI的临床特征及临床列线图的构建
6. CDI模型预测黑色素瘤患者对靶向治疗和化疗药物的敏感性
作者评估了两种常用靶向治疗药物的IC50值。分析显示,达伯拉芬在低CDI组中的IC50值较低,显示出与CDI的显著正相关,而曲美替尼在高CDI组中的IC50值较低,也展示了与CDI的显著相关性(图10)。总的来说,低CDI的CM患者可能对BRAF抑制剂有更好的反应,而高CDI的患者可能更可能对MEK抑制剂有反应。
图10探索CM的潜在治疗策略和7个关键模型特征的验证
文章小结
在本研究中,引入一个新的与PCD相关的预后标志物CDI,该指数利用了在CM患者中指导治疗方法的潜力。这个预后标志物基于七个PCD相关特征(CD28, CYP1B1, JAK3, LAMP3, SFN, STAT4, 和 TRAF1)。CDI模型提供了对预后、免疫治疗反应和治疗策略的指导。此外,还构建了临床诺莫图以更准确地预测生存结果。另外,这七个PCD相关特征在内部队列中的表达得到了验证,进一步强调了其潜在的准确性和临床意义。总体上,结合基因组学、批量转录组和单细胞转录组数据,作者为临床智能和新的CM管理方法提供了独特的机会。这篇机器学习结合临床数据进行预测的思路也非常巧妙!小途一直都在不断推送最新的生信思路哦!如果你想要学习这些思路,或者想要定制更多创新性思路,那么就直接联系小途吧!我们会全力以赴,为你的科研工作提供帮助!速速联系小途吧~
小果还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询小果,竭诚为您的科研助力!
定制生信分析
服务器租赁
扫码咨询小果
往期回顾
01 |
02 |
03 |
04 |