被夸爆的机器学习在这里!南中医刘劲松6分+新作,10种机器学习的101种组合+多组学鉴定免疫原性细胞死亡,0实验创新思路MAX!






被夸爆的机器学习在这里!南中医刘劲松6分+新作,10种机器学习的101种组合+多组学鉴定免疫原性细胞死亡,0实验创新思路MAX!

小途  生信果  2024-05-10 19:00:41

机器学习作为人工智能领域的核心技术之一,在医学科研领域也表现出了巨大的潜力和影响力,为无实验数据人员发表更多高质量文章,提供了更多可能性!
今天小途跟小伙伴们分享一篇创新性思路的机器学习类文章。这篇文章采用了深度学习算法来开发和训练了10个机器学习算法及其101组合,用于透明细胞肾细胞癌(ccRCC)预后预测、靶向预防和个性化医疗。这篇文章为什么能发表6分+呢?小途带小伙伴们一起揭秘一下吧~
1,本研究采用了一种创新性的研究方法,使用机器学习ccRCC进行预测模型,用于ccRCC预后预测、靶向预防和个性化医疗
2,本研究使用了10种机器学习算法及其101组合开发了一种新的计算框架;并对ccRCC进行了全面的多组学分析,包括基因组、单细胞转录组和批量转录组,揭示了该特征在多个组学水平上的分子基础和潜在机制,证实了共识免疫原性细胞死亡相关特征(ICDRS)与ccRCC的发展和预后的密切关联。
3,本研究采用了一种新的生物信息学方法,该方法结合了AddModuleScore,ssGSEAWGCNA算法,以在单细胞和批量转录组上鉴定免疫原性细胞死亡 (ICD)相关基因,为ICD背景下的ccRCC提供潜在的治疗靶点。思路严谨,方法易复制,想要发表高分SCI的小伙伴们也可以借鉴一下本文的研究思路哦~(ps:也想试试机器学习却没有思路的小伙伴可以来扫码找小途噢!)。    

l题目:在 3P 医学背景下,基于 101 组合机器学习计算框架,对透明细胞肾细胞癌免疫原性细胞死亡相关特征的多组学鉴定
l杂志:EPMA Journal
l影响因子:IF=6.5
l发表时间:2023年5月
研究背景
肾细胞癌是一种常见的恶性肿瘤,其中透明细胞肾细胞癌是最常见的亚型。尽管手术是最有效的治疗方法,但部分患者会出现转移。免疫疗法成为一种有前途的治疗方法,但仅少数患者获益。细胞死亡命名委员会定义了多种形式的程序性细胞死亡,其中免疫原性细胞死亡对免疫的调节至关重要。诱导免疫原性细胞死亡被认为是一种有前途的抗癌免疫治疗策略,可能成为患者预后和治疗反应的生物标志物。
数据来源
数据集/队列
数据库
数据类型
详细信息
GSE53757
GEO
RNA-seq数据
72个ccRCC样本和72个正常样本
GSE36895        
GEO
RNA-seq数据
9个ccRCC样本和23个正常样本
研究思路
通过评估共识免疫原性细胞死亡相关特征(ICDRS)是否能预测透明细胞肾细胞癌(ccRCC)的发生、发展和转移以促进ICDRS的应用;再构建了ICDRS整合列线图,为临床实践中每位患者的预后提供定量工具。ICDRS的机制研究在大量转录组、基因组和单细胞转录组水平上进行,揭示了ICDRS与ccRCC的预后和免疫状态之间的密切关联。最后进一步研究了不同风险亚组对免疫检查点抑制剂(ICI)治疗的反应以及对RCC一线药物的敏感性,包括酪氨酸激酶抑制剂(TKI)和 mTOR 抑制剂。
主要结果
1.单细胞免疫原性细胞死亡特征分析
对早期ccRCC患者进行了单细胞RNA测序,得到了34,155个细胞数据。使用Harmony包消除批量效应,成功整合七个样本(图1a,b)。进行主成分分析(PCA)和t-SNE降维,将细胞聚合成40个簇,标记为10个主要细胞类型(图1c)。研究展示了每个细胞群的标记基因。    
图1单细胞免疫原性细胞死亡特征分析
2. 与ICD相关的枢纽模块和基因分析
使用ssGSEA算法评估TCGA-KIRC数据集中每个样品的ICD活性评分,并将其作为后续WGCNA分析的表型数据。利用WGCNA分析确定与ICD分数显着相关的模块,在单细胞水平鉴定出836个ICD相关DEG,构建共表达网络(图2a)。通过调整参数选择最佳软阈值和构建共表达网络(图2b),最终获得四个模块,其中MEblue模块与ICD评分密切相关(图2c);此外,蓝色模块的基因显著性(GS)与模块隶属度(MM)的散点图显示出显著的相关性(图2d)。在批量RNA测序中,建立TCGA-KIRC肿瘤和正常肾组织中的差异表达基因(图2e),MEblue模块中的基因与免疫原性细胞死亡相关,经过交叉分析鉴定出131个ICDRgenes(图2f)。对131个ICDRgenes进行单因素Cox回归分析,鉴定出39个显著基因,进一步与外部数据集进行验证并提取共享基因(图2h)。分析这些基因的拷贝数变异频率,发现其中RNF130的拷贝数增加超过22%(图2i)。    
图2 与ICD相关的枢纽模块和基因分析    
3. 集成机器学习的预后模型构建
通过使用101种机器学习算法分析从单变量Cox回归分析中获得的37个预后基因,构建了共识免疫原性细胞死亡相关签名(ICDRS)(图3a)。使用十倍交叉验证框架和最小化部分似然偏差,确定了 LASSO 分析中的最佳 λ 值 0.035695(图3b,c)。通过将六个基因的表达与Cox模型中的回归系数进行加权来计算每个患者的风险评分(图3d),这样能够根据中位风险评分将所有患者分配到高风险组或低风险组。通过LASSO分析中系数为非零的基因进行逐步Cox比例风险回归分析(向后)鉴定出一组6个基因(图3e)。同时,随着风险评分的增加,死亡患者的数量也逐渐增加(图3f)。此外,在训练集、内部验证集和 E-MTAB-1980 数据集中,高危组患者的总生存期 (OS) 明显低于低危组(p < 0.001;图3g-i)。同样,低风险组的无进展生存期(PFS)和疾病特异性生存期(DSS)显著优于高风险组(p < 0.001;图 3j,k)。    
图3 Hub基因的识别
4. ICDRS模型性能分析
ICDRS在训练集、内部验证集和E-MTAB-1980数据集中展现出较强的辨别能力,其曲线下面积分别为0.746至0.808、0.760至0.723和0.827至0.732(图4a-c)。与其他临床特征相比,ICDRS的AUC显著更优。通过评估ICDRS与临床特征在ccRCC患者预后评估中的相关性,观察到高危组和低危组在等级、分期、T和M分布上存在显著差异(图4d,f)。M1、III-IV期、G3-4和T3-4患者的风险评分明显高于M0、I-II期、G1-2和T1-2患者(图4e)。这些发现暗示ICDRS可能与ccRCC患者的不良预后相关。此外,ICDRS 预测 ccRCC 患者 M 期的 AUC 为 0.721(图4g,h),表明其在临床实践中预测 ccRCC 转移发展的潜在应用。通过KM曲线分析,ICDRS在按各种临床特征(包括年龄、性别、分期、分级和T)分层的亚组中表现出强大的ccRCC预后能力(图4i-l)。    
   
图4 ICDRS模型性能分析
5. ICDRS模型临床特征效果分析
通过对TCGA-KIRC 数据集中的 OS、PFS 和 DSS 进行单因素和多因素 Cox 回归分析。在单因素分析中,ICDRS是OS、PFS和DSS的重要危险因素;在多因素分析中,ICDRS仍然是OS、PFS和DSS的独立预后因素,表明其在ccRCC患者中具有强大的预后能力(图5a-c)。通过对E-MTAB-1980 数据集中的 OS 进行了单因素和多因素 Cox 回归分析(图5d),表明ICDRS是ccRCC患者的独立预后因素。根据ICDRS和临床特征构建的列线图(图5e)在ccRCC的个性化预后预测中显示出较高的预测准确性,具有稳定和稳健的预测能力,优于其他临床特征(图5f)。该列线图在1年、3年和5年间隔内的AUC分别达到0.867、0.830和0.814,决策曲线分析显示其具有更好的净临床获益,为临床实践提供了可靠的工具(图5g-i)。    
图5 ICDRS模型临床特征效果分析
文章小结
看完这篇文章思路有没有觉得肿瘤免疫方向的研究还有很多可做之处?这篇文章通过利用可公开获取的大样本量临床数据,同时利用生信+实验相结合的方法,既可以省一定的时间和经费,又可以丰富文章,再结合使用多种机器学习及其组合就可完成这篇6分+的纯数据分析文章。想在肿瘤免疫方向做点新东西的小伙伴,不要错过这个好思路,可以换个癌种复现,还可以拓展做国自然课题,一举两得,有需要的小伙伴可以来找小途做设计哟~  

 

小果还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询小果,竭诚为您的科研助力!


定制生信分析

服务器租赁

扫码咨询小果


往期回顾

01

1024G存储的生信服务器,两人成团,1人免单!

02

单个数据库用腻了?多数据库“组合拳”带你打开免疫浸润新思路!

03

孟德尔随机化的准备工作,GWAS数据的网站下载方法

04

跟着小果学复现-手把手带你拿下IF=46.9Nature 级别的主成分分析(PCA)图!!