​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!

​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!

小伙伴们大家好呀!这里是最爱搜罗前沿生信好文的小云!眨眼间2024年已经快过去一半咯,不知道大家的文章都“ACCEPT”了吗?还没有接收或还在构思文章的同学不用着急!小云这就给大家带来一篇多组学纯生信文章!多组学相比目前常见的单一组学分析,可以更系统地描述肿瘤、疾病的生物调控过程!

来自北京协和医学院的薛明教授团队,通过多组学分析+机器学习+免疫微环境的思路,轻轻松松就拿下8分+高分期刊!那么这篇文章都有哪些优点值得咱们借鉴?小云这就给您揭晓!(关注小云,获取更多生信前沿思路、生信数据库分享!)

1、代谢重编程+多组学分析+机器学习!肿瘤内的代谢途径近年来逐渐受到研究者们的重视,而作者通过蛋白质组学、转录组学分析的方式,对子宫内膜癌的代谢特征进行分析,并通过随机森林模型建立了子宫内膜癌预后模型!作者团队的选题十分新颖!是文章拿下8分期刊的最重要原因之一!PS:多组学分析中常涉及大量的数据批处理过程,此时小云的服务器将给予您最大的帮助!介绍一下我们生信侠团队的服务器:【压箱底】16T存储独享服务器,拼团价来袭!

2、基因集变异分析+免疫微环境分作者还根据基因集变异评分,将子宫内膜癌患者分为三种代谢亚型,并分别进行了免疫微环境分析以及免疫治疗预测!上述方法可复性很高!同学们也可以在自己的生信文章的使用噢!  

​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!
定制生信分析

云服务器租赁

(加微信备注99领取试用)

 

​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!

题目:子宫内膜癌中基于代谢途径的分型:通过多组学分析和机器学习算法进行的综合研究

杂志:Molecular Therapy – Nucleic Acids

影响因子:8.8

发表时间:2024年2月
关注公众号,后台发送“123”可以直接获取原文PDF,文献编号:240601

研究背景

子宫内膜癌(EC)是女性生殖系统中第二常见的恶性肿瘤,其基因组异质性日益受到关注。尽管代谢紊乱被认为是EC发生和进展的一个重要因素,但对其代谢特征的理解仍然有限。本研究旨在通过综合多组学分析(转录组、蛋白质组和代谢组),探讨EC中的代谢异常,并运用机器学习算法开发基于代谢因子的预后特征,以增进对EC的预后预测和指导精准治疗策略的制定。

数据来源

数据来源

内容描述

TCGA

548个子宫内膜癌患者的RNA-seq数据

CCLE        

子宫内膜癌细胞系的RNA-seq数据和代谢组学数据

GEO

GSE17025和GSE106191两个子宫内膜癌RNA-seq数据集

CPTAC

131个子宫内膜癌和正常组织样本的蛋白质组学数据,包括1,161个代谢相关蛋白

GSE17025

91个子宫内膜癌和8个正常组织的RNA-seq数据

GSE106191

7个子宫内膜癌和7个旁癌内膜增生组织的RNA-seq数据

          

研究思路

​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!    

主要结果

1、转录组学和蛋白质组学谱揭示了子宫内膜癌的代谢重编程

为了研究子宫内膜癌(EC)中是否发生了代谢重编程,作者首先进行了主成分分析(PCA),将正常(子宫旁和正常子宫内膜)与肿瘤组织进行比较,并发现了不同的代谢转录谱(图1A,B)。随后,作者进一步对EC与正常/癌前组织之间的差异表达基因(DEGs)进行基因集富集分析(GSEA)分析。作者发现,3个数据集的前 10 个上调途径中,在糖酵解/糖异生和叶酸生物合成途径中都观察到一致的激活(图1C)。随后,在蛋白质水平上,与基于蛋白质水平代谢途径的正常组织相比,EC表现出独特的代谢特征(图1D)。

​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!

图1转录组学和蛋白质组学谱显示了EC的代谢重编程

2、基于代谢途径的 EC 亚型    

为了揭示EC的代谢异质性,作者对84条代谢通路的基因集变异分析(GSVA)衍生的富集评分进行了共识聚类和NbClust检验分析,并确定了3个为TCGA队列中的最佳聚类数。共有 548 名患者被分为 3 个不同的基于代谢途径的亚组 (MPS) 集群:MPS1、MPS2和MPS3(图2A,B)。其中,MPS1表现出“热”的代谢特征,几乎涵盖了所有代谢类别。MPS2 在特定脂质代谢和氨基酸代谢途径中表现出上调,包括初级胆汁酸生物合成、类固醇激素生物合成和亚油酸代谢等。相比之下,与其他两个簇相比,MPS3显示出相对“冷”的代谢表型(图2C)。

          

​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!

图2 EC的代谢途径相关分层

3、MPS 亚组之间不同的免疫微环境浸润和对免疫治疗的异质性反应

据报道,各种代谢变化和表观遗传修饰通过驱动免疫逃逸或阻碍免疫监视在肿瘤进展中发挥重要作用。在作者的研究中,滤泡辅助性T细胞,M1和M2巨噬细胞,活化的肥大细胞和中性粒细胞的水平相对较低(图3A)。而通过单样本GSEA(ssGSEA)算法,MPS3亚组的免疫浸润水平较低,而MPS2亚组中发挥抗肿瘤或促肿瘤作用的总免疫细胞均增加(图3B)。    

​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!

图3 MPS对免疫治疗的不同免疫微环境和异质性反应

4、使用机器学习算法开发代谢相关预后风险模型

作者试图通过使用先进的机器学习技术来开发预测模型,以定量评估代谢基因表达的预后相关性(图4A)。结合单因素Cox回归分析、Lasso回归分析等方法,作者最终识别了 22 个关键基因(图4B)。随后,作者通过网格搜索实现最佳随机森林模型,设置ntree=200和nsplit=5,最终使得错误率低于0.20(图4C)。最后,使用多变量Cox回归分析,考虑13个选定基因的所有可能组合,并根据其各自的AUC值分为5个簇,从而构建出宏基因特征(图4D)。最后,作者根据中位宏基因评分,将EC患者分为两组(>中位宏基因评分,高风险;<中位宏基因评分,低风险)。    

​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!

图4 使用机器学习算法开发代谢相关预后风险模型

5、预后模型临床特征

在随后的检查中,作者深入研究了宏基因特征的潜在临床意义。值得注意的是,低风险组的免疫评分、估计评分和基质评分显着升高,同时 CTLA4 和 PDCD1 表达水平升高,表明对免疫治疗的反应更有利(图5A,B)。在高危组中,患者在多个队列中表现出较高的 TIDE 评分和较低的免疫治疗反应率(图5C)。

​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!

图5 预后模型的临床特征

文章小结

与正常细胞相比,癌细胞不仅具有独特的代谢特征,而且还表现出显着的代谢多样性和可塑性。作者的研究致力于通过利用多组学并将 EC 分类为具有不同代谢特征、预后、基因组改变和对各种疗法的敏感性的三种异质亚型来揭示 EC 代谢重塑和异质性。而小云认为,作者团队在文中所应用到的免疫微环境浸润分析、免疫治疗反应预测(TIDE评分)、随机森林模型等方法可复性极高!同学们可以选取其中部分优秀方法应用于自己的生信文章!而在实验流程设计、生信分析中遇到困难的同学,欢迎扫码联系小云 !

​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!

定制生信分析

云服务器租赁

热点推荐

孟德尔随机化

临床公共数据分析

单细胞测序

肿瘤免疫与微环境

机器学习

单基因分析

生信云服务器

代码合集(点击查看)

培训班系列(点击查看)

原文始发于微信公众号(云生信学生物信息学):​一年发文狂发30000+的机器学习又建奇功!联合多组学,纯生信立马上8+!思路极易复现!