10种机器学习99种组合算法!这样的高分思路不允许你不知道!青大附院牛海涛团队:机器学习联合多组学分析,8.8分好文,小白可复现






10种机器学习99种组合算法!这样的高分思路不允许你不知道!青大附院牛海涛团队:机器学习联合多组学分析,8.8分好文,小白可复现

馆长  生信果  2024-03-14 19:01:12

不是实验做不起,而是生信更有性价比,机器学习和多组学联合分析是现在生信的热点思路。用好了机器学习,组学分析简直像开了挂一样,直接原地起飞。

今天馆长给大家带来一篇青岛大学附属医院牛海涛团队的一区8.8分文章。作者通过整合多组学数据和机器学习方法,为肌肉侵袭性尿路上皮癌(MUC)的分子亚型和预后提供了更精细的划分。通过10种聚类算法对多组学数据进行共识聚类,识别出三种具有预后意义的癌症亚型研究开发了一种共识机器学习驱动的签名(CMLS),揭示了其在预后意义上的重要性及在免疫治疗预测中的潜力。通过多个队列的验证,证实了CMLS在预测患者结果和指导治疗策略中的实用性,包括为高CMLS患者识别潜在的治疗药物。涉及到的数据库依然是我们常见的TCGA和GEO数据库,显然论文思路创新而又可靠,8+的文章当之无愧,这个实验思路很容易复现,研究其他疾病的小伙伴可以尝试复现。

PS:要想了解机器学习或者多组学分析流程,或复现这篇文章的小伙伴可以联系馆长!这里有一大波最新的热点创新思路。馆长最擅长指点迷津。感兴趣的直接扫码联系我吧!


   


题目: 整合多组学分析和机器学习精细化肌肉侵袭性尿路上皮癌的分子亚型和预后

杂志: Molecular Therapy-Nucleic Acids

影响因子:8.8

发表时间:2023年6月



研究背景

肌肉侵袭性尿路上皮癌(MUC)预后差,死亡率高,没有良好效果的治疗方法,由于患者之间的异质性多数患者在治疗中无法受益。作者基于多组学数据结合机器学习方法分析识别生物标志因子,以期改善患者预后和治疗效果。


数据来源

数据集/队列

数据库

数据类型

样本信息

TCGA-MUC

TCGA

完整转录组表达数据+DNA甲基化+体细胞突变数据+临床信息        

386个MUC样本

IMvigor210-MUC

IMvigor210

RNA-seq+临床信息

MUC患者

META-MUC

GEO/ArrayExpress/SAR

RNA-seq数据/微阵列+临床

GSE13507, GSE31684,

GSE32548, GSE32894, GSE48075,

GSE48276,

E-MTAB-18032

          

分析流程

 

  

主要研究结果


1 MUC的多组学共识预后相关分子亚型

作者通过PCA来分析处理去批次前后的数据。从10种多组学集成聚类算法中独立鉴定出3个亚型,综合参考聚类预测指数、差距统计分析、轮廓评分和以往研究经验确定亚型数量。然后,通过共识集成方法将聚类结果与转录组(mRNA、lncRNA 和 miRNA)、表观遗传甲基化和体细胞突变的独特表达分子模式进一步结合(图2A-2C)。作者创建的分类系统与总生存期(OS)密切相关,癌症亚型2(CS2)在所有评估的亚型中表现出最有利的生存结果(图2D)。


2分子亚型的划分

通过ssGSEA算法测量了样本中不同分子特征的富集情况发现免疫抑制致癌途径等通路在CS2中显着富集,而CS3可能更有可能从放疗或靶向治疗等治疗中受益(图 3A)为了进一步研究转录组差异,作者分析了与癌症染色质重塑相关的潜在调节因子和 MUC 的 23 种转录因子(图3B)。调控子活性增加进一步突出了 CS 之间差异调控的潜在模式,表明表观遗传驱动的转录网络可能是这些分子亚型的重要分化因子。量化了微环境细胞的浸润水平,并表明免疫细胞浸润在 CS1 和 CS3 中显着增加,但在 CS2 中相对较低(图3C)。作者选择了20个针对每种亚型特异性上调的基因作为分类器,并在多个外部队列中对其进行验证,以进一步验证亚型的稳定性。NTP将外部队列中的每个样本归类为已识别的CS之一。META-MUC合并8个队列中的CS2在所有亚型中预后最好,在其他队列中也获得了类似的结果(图3D和3E)。还评估了CS与NTP和围绕中心体分区(PAM)算法的一致性(图3F-3J)。

3构建预后模型CMLS

从共识基因IMvigor210队列IMvigor-MUC、癌症基因组图谱TCGA-MUC和META-MUC中筛选了32个表达与OS显著相关的SPRG。随后,SPRG被纳入集成框架以执行CMLS。在IMvigor-MUC训练队列中,基于99种算法组合构建了一致的模型,并计算了所有队列中每个模型的平均C指数,以评估所有模型的预测能力(图4A)。CoxBoost算法识别出最有价值的SPRGs,逐步Cox算法过滤出最有价值的模型,该模型由12个枢纽基因构建(图4B和4C)。然后计算所有队列每个样本的CMLS分数。高CMLS患者在TCGA、META、IMvigor和联合队列中的临床结局较差(图4D-4G)。


4 CMLS与其他模型相比

作者对过去5年内发表的相关文献进行了系统检索,并最终将22个不同的签名纳入比较。CMLS在TCGA-MUC、IMvigor-MUC和META-MUC数据集中显示出优于几乎所有模型的C指数性能(图5A-5C)。作者还通过独立预后分析筛选了MUC的潜在独立预后因素并将它们整合在一起,以网络计算器的形式构建了全面的列线图(https://the-nomogram.shinyapps.io/CMLS-DynNomapp/;图5D)。标定曲线证明列线图的精度与实际情况一致(图5E)。决策曲线分析(DCA)表明,列线图对患者的临床获益明显高于单独使用CMLS(图5 F和5G),且时间依赖性C指数进一步证明列线图具有更好的预测性能(图5H)。


5 CMLS免疫特征

作者对MUC的肿瘤微环境(TME) 进行了综合分析,观察到低CMLS患者的免疫细胞浸润水平(包括T细胞、B细胞和巨噬细胞)明显高于高CMLS患者,表明存在免疫激活状态(图6)。这说明以低CMLS水平为特征的MUC更有可能被归类为“热肿瘤”。成纤维细胞和中性粒细胞主要富集于高CMLS患者中,与免疫抑制和排除相关的分子标志物(如EMT通路)也主要富集于高组,呈现免疫抑制状态(图6B和6C)。这意味着高CMLS MUC更倾向于成为“冷肿瘤”。低CMLS组的TMB、TNB和M1巨噬细胞富集度较高,这意味着低组可能具有较高的免疫原性(图6E-6H)。生存分析还表明,CMLS 可以作为 TMB、TNB和M1巨噬细胞的有效补充因子,以区分患者预后(图6I-6K)。CMLS越低,TMB或TNB或M1巨噬细胞浸润越高,MUC患者的生存预后越好。

  


6 CMLS对免疫治疗反应的预测能力

为了全面评估CMLS在MUC免疫治疗中的作用,进行系统分析,作者对该患者群体进行了IMvigor-MUC队列分析。与许多先前的研究不同,作者通过比较两组在6个月和12个月时的受限平均生存期(RMS),同时评估治疗3个月后患者之间的长期生存差异,来解释免疫治疗的延迟临床效应(图7A和7B)。低CMLS组表现出显著差异,与上述分析的结果一致。此外,采用肿瘤免疫功能障碍和排除(TIDE)算法评估患者对免疫治疗的反应,在低CMLS组中表现出更好的反应性。对另一组接受免疫治疗的黑色素瘤患者进行了亚类映射算法,结果还表明,低 CMLS对 PD-1 治疗的反应更好(图 7F)。最后,在多个免疫治疗验证队列中用预后信息重新验证了上述的结论。在免疫治疗后人群中,低CMLS往往具有更好的预后(图7G,H),低CMLS往往与更好的免疫治疗结果相关(图7I)。   


7筛选潜在的治疗药物

高CMLS和低CMLS人群的预后存在显着差异,GSEA还显示血管生成,EMT,缺氧和其他途径在高CMLS患者中显着激活(图8A)。鉴于高CMLS患者对免疫治疗的反应较差,作者采用了顺铂(一种广泛使用的膀胱癌治疗方法)作为验证算法衍生的敏感性是否与既定临床实践一致的手段。结果表明以低ERCC1表达水平为特征的患者对顺铂治疗表现出更强烈的反应,从而为患者化疗带来潜在益处(图8B)。然后,高CMLS患者的潜在药物(图8C)。最后,作者筛选了一种CTRP衍生的药物达沙替尼(图8D)和两种PRISM衍生药物:罗米地辛和伊斯平斯。然后,评估了候选药物在肿瘤组织和正常组织中的表达水平的差异(图8F和8G)。倍数变化越大表明候选药物治疗的潜力越大。总体而言,达沙替尼和罗米地辛被认为是治疗高CMLS患者的有前途的潜在药物。

小结

综上所述,本研究通过集成多组学分析和机器学习技术,为肌肉侵袭性尿路上皮癌(MUC)的分子亚型和预后提供了新的见解。研究者识别出三种与预后相关的癌症亚型,并开发了一个具有强大预测能力的共识机器学习驱动签名(CMLS),能够精准预测患者预后和免疫治疗的响应性。这一成果有望为临床实践提供重要指导,特别是在个性化治疗和免疫治疗选择方面。思路选对,事半功倍!纯生信的文章重在方法思路,有需要的同学速速联系馆长,赶快行动起来吧! 

小果还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询小果,竭诚为您的科研助力!


定制生信分析

服务器租赁

扫码咨询小果


往期回顾

01

1024G存储的生信服务器,两人成团,1人免单!

02

单个数据库用腻了?多数据库“组合拳”带你打开免疫浸润新思路!

03

孟德尔随机化的准备工作,GWAS数据的网站下载方法

04

跟着小果学复现-手把手带你拿下IF=46.9Nature 级别的主成分分析(PCA)图!!