苦于文章数据难寻、文章被拒的小伙伴们看过来啦!小云最近为了帮助大家轻松发文不断努力,终于又找到一篇宝藏文!今天小云要跟大家分享的是一篇关于机器学习的高分生信文章,众所周知,机器学习在医学界扮演着越来越重要的角色,它可以通过分析医学影像、生物标记物和临床数据帮助医生更准确地诊断疾病,本篇基于人工智能衍生的预后指数(AIDPI)确定角鲨烯环氧化酶在高危骨肉瘤中的代谢易感性。想必大家已经迫不及待的想知道,本篇究竟是用什么“手段”拿下10分+了!话不多说,接下来小云就带大家一起揭开本篇文章的神秘面纱!
1、大样本数据增加文章可靠性:本篇将10种机器学习算法组合成101种组合,从中建立了基于254个样本转录组谱预测总生存的最佳模型。
2、多因素结合突显文章创新性:本文将AIDPI与临床因素合并,模型生成的人工智能衍生预后指数(AIDPI)是一种独立的预后生物标志物,优于临床病理因素和先前发表的特征。将AIDPI与临床因素合并可提高预测准确性。
3、干湿结合验证结论准确性:本文实验结果高AIDPI组的患者表现出化疗耐药性,同时MYC和SQLE过表达,mTORC1信号通路增加,PI3K-Akt信号通路中断,免疫浸润减少,有效证实了本文实验结论,表明AIDPI是识别OSA患者的一个可靠的生物标志物。
想发高分文章的小伙伴们,赶紧码住这些思路行动起来吧~(ps:小云这里有新鲜出炉的生信热点,还有好用的服务器供你使用,欢迎来call哦)
云服务器租赁
(加微信备注99领取试用)
发表时间:2024年1月
研究背景
骨肉瘤(OSA)是一个临床挑战,其5年生存率较低。目前,由于缺乏先进的分层模型,使个性化治疗变得困难。本研究旨在寻找新的生物标志物,对高危OSA患者进行分层并指导治疗。
数据来源
数据集/队列 |
数据库 |
数据类型 |
详细信息 |
GSE21257 |
GEO |
RNA-seq数据 |
n=53 |
GSE33382 |
GEO |
RNA-seq数据 |
n=82 |
GSE16091 |
GEO |
RNA-seq数据 |
n=34 |
GSE14827 |
GEO |
RNA-seq数据 |
n=27 |
GSE87437 |
GEO |
RNA-seq数据 |
n=21 |
GSE42352 |
GEO |
RNA-seq数据 |
3个成骨细胞[OBs],12个间充质干细胞[MSCs]和19个OSA细胞系 |
GSE16089 |
GEO |
RNA-seq数据 |
抗MTX的Saos2及其亲本细胞系,分别有3个重复 |
GSE9967 |
GEO |
RNA-seq数据 |
来自18例患者的OSA样本和配对的正常骨组织的RNA-seq数据 |
GSE238110 |
GEO |
RNA-seq数据 |
186例初级犬OSA样本的RNA-seq数据 |
CCLE-23Q2 |
CCLE |
细胞系多组学 |
批量RNAseq、基因水平拷贝数数据和模型信息 |
PRJNA681896 |
Sra |
scRNA-seq |
6个OSA活检样本单细胞RNA测序的原始数据 |
PRJNA698672 |
Sra |
scRNA-seq |
包括来自4名患者的OSA组织和配对的邻近正常组织 |
研究思路
主要结果
1、AIDPI的开发和验证
本文将两个队列,GSE21257-OSA和GSE16091-OSA合并为GEO-OSA队列,并减轻了批效应,并将该队列作为训练集。同时,目标-osa作为的验证集,确定了在训练集和验证集之间共享的18个cpg。这些cpg被输入到一个机器学习框架中,以在训练集中生成多个预测模型。在训练集、验证集和独立测试集(GSE33382-OSA)进行评价后,选择CoxBoost和GBM组合建立的模型作为最优模型,其平均C-index(0.817)最高(图1A)。由于微阵列数据集中的基因命名改变和基因缺失,在至少在一个队列中只有53个已发表标记和AIDPI进行了测试,结果在热图中可视化(图1N)。这些发现表明,AIDPI可以预测OSA患者的预后,并优于先前建立的标记。(ps:这里的大样本数据是这篇文章获得高分的一个关键点,小伙伴们尽可能多的收集更多样本数据和临床数据,也是让自己文章冲刺高分的一个不错选择)
图1 人工智能衍生的预后指数(AIDPI)的开发和验证
2、在高AIDPI患者中识别调节失调的通路
在高AIDPI组中,有7个AIDPI基因表达显著上调,有5个AIDPI基因表达显著下调,其中3个与免疫评分呈正相关(图2A)。GSEA确定了高AIDPI组中增强的基因集,包括MYC靶向V2、MYC靶向V1、胆固醇稳态和mTORC1信号转导。相比之下,细胞凋亡和特异性免疫反应的基因集呈负富集(图2B)。KEGG对DEGs的富集分析突出了OSA进展的重要途径(图2C)。富集图突出显示了一个包含PI3K-Akt信号通路、病灶黏附和ECM受体相互作用的重要簇(图2D)。
图2 识别高人工智能衍生的预后指数(AIDPI)患者中的失调通路
3、确定高AIDPI患者的治疗靶点
本文评估了6个OSA活检样本的scRNA-seq数据集。在预测的OSA细胞中观察到明显的染色体扩增和缺失(图3A)。scGate包促进了自动免疫细胞注释,最终允许对9个主要簇进行注释(图3B)。定义每个簇的标记基因通过气泡图显示了它们的表达模式(图3C)。基于scRNA-seq数据集中的DEA结果展示了每个细胞簇中表达阳性表达的基因(PEGs)(图3D)。本文发现只有8%的DEGs主要在OSA细胞中表达(图3E)。12个AIDPI基因与DEGs和PEGs的交集突出了3个常见的基因(图3F),其表达模式随后通过特征图显示出来(图3G)。
图3 确定高人工智能衍生的预后指数(AIDPI)患者的治疗靶点
4、SQLE基因敲低抑制了体外和体内的OSA
本文为了阐明SQLE在OSA中的作用,构建了4个shRNA,并选择了最优的MNNG和U2OS细胞中沉默SQLE(图4A)。SQLE基因的敲低抑制了这些细胞的恶性表型,包括增殖(图4B)、集落形成(图4C)、迁移(图4D)和侵袭(图4E)。在异种移植模型中,发现沉默SQLE可以抑制肿瘤的生长,并降低肿瘤的重量和胆固醇水平(图4K-M)。IHC分析证实,在SQLE沉默后,SQLE蛋白丰度降低和ki-67阳性细胞减少(图4N,O)。(ps:本文后续干湿结合是文章发高分的一个助力点,尽量通过多角度实验进行验证,能让实验结论更具说服力哦)
图4 角鲨烯环氧化酶(SQLE)的敲低可抑制骨肉瘤(OSA)在体外和体内的进展
5、SQLE沉默通过降低胆固醇和抑制FAK/PI3K/Akt/mTOR通路来抑制OSA
GSEA显示,SQLE沉默后胆固醇稳态基因集显著下调(图5A),这与SQLE敲低后MNNG和U2OS细胞内胆固醇降低的结果一致(图5B)。在KEGG富集DEGs后,PI3K-Akt信号通路显著富集,其基因比例最高(图5C)。在MNNG和U2OS细胞中,SQLE的沉默导致关键蛋白的磷酸化水平降低。然而,补充胆固醇(100 μg/mL)恢复了这些磷酸化模式(图5F,G),并抵消了SQLE敲低对这些OSA细胞恶性表型的抑制作用(图5H)。这些发现表明,SQLE沉默通过降低胆固醇水平,进而抑制FAK/PI3K/Akt/mTOR通路来抑制OSA。
图5 角鲨烯环氧化酶(SQLE)沉默通过降低胆固醇和抑制FAK/PI3K/Akt/mTOR通路来抑制骨肉瘤(OSA)
6、药理SQLE抑制OSA进展并提高化疗疗效
本文分析表明,FR194738在U2OS和MNNG细胞中诱导了增殖和集落形成的剂量依赖性抑制(图6A,B)。利用携带MNNG的异种移植物模型进行的体内疗效评估证实了我们的体外观察结果。FR194738抑制了受试者的肿瘤生长和胆固醇含量,但没有导致体重下降(图6C-F)。解剖后的肿瘤重量比较显示,TGI率为59.67%(图6E)。此结果突出了SQLE药理抑制对OSA的治疗潜力。
图6 药理角鲨烯环氧化酶(SQLE)抑制可抑制骨肉瘤(OSA)的进展,提高化疗疗效
文章小结
读完这篇文章想必大家一定受益匪浅。本文不仅利用大样本数据,将10种机器学习算法组合成101种组合,使文章更真实可靠性,还利用多因素结合方式将AIDPI与临床因素合并,突出文章创新性,最后干湿结合验证结论准确性,有效证实了本文实验结论,不仅可以节省发文时间,还可以使你的文章内容更加丰富!如果你掌握了这几条关键点,冲刺10分+文章一定也变得轻而易举啦,小伙伴们是不是已经跃跃欲试了呢?那就赶快行动起来,大胆复现吧~小云随时待命!
定制生信分析
云服务器租赁
热点推荐
代码合集(点击查看)
原文始发于微信公众号(云生信学生物信息学):同济大学医学院张春林教授带领团队又卷起来了!10种机器学习101种组合+AI衍生技术,实力拿下1区10.6高分!