哈喽大家好呀,小云发现生信又多了一个大火的赛道,小伙伴们要不要猜猜是什么呢?小云给一个提示——大数据。相信不少小伙伴们都猜到了吧,这个大火的赛道就是——机器学习!小云和小伙伴们也不能落后呀!这不,小云刚挖掘到一篇结合机器学习的生信好文,已经迫不及待地分享给大家啦!PS:使用机器学习进行数据挖掘可是如今生信的大热门哟,还没有掌握这项技能的小伙伴赶紧来找小云学习吧!扫描下方二维码就可以找到小云哦!
今天小云分享的文章来自安徽医科大学基础医学院杨武林研究团队,他们利用机器学习模型对基因表达数据进行差异分析,研究结果于今年4月发表在SCI期刊《American Journal of Pathology》上~
1.研究团队首先收集了基因表达数据,然后进行基因差异表达分析,以找出正常间皮细胞和胸膜间皮瘤细胞之间的基因表达差异。接着,他们利用机器学习算法筛选出潜在的诊断标志物,并通过免疫组化实验证实其有效性。
2.研究使用了来自Gene Expression Omnibus数据库(GEO)的数据集,总计248例基因样本,包含了大量的基因表达信息。
3.这项研究的创新之处在于结合了生物信息学和机器学习技术,通过大数据分析和实验验证相结合的方式,发现了ACADL作为一种新的诊断标志物。不知道大家对这种综合性的研究方法感不感兴趣呢?SCI审稿人可是对这种跨学科方法很感兴趣哦,小伙伴们对这种方法心动了吗?心动的想复现的就扫码联系小云吧!

云服务器租赁
(加微信备注99领取试用)
发表时间:2024年04月
研究背景
传统上,对于间皮瘤等疾病的诊断和治疗,特异性标记物的发现至关重要。然而,对于间皮细胞,尤其是具有反应性增生的细胞的特定标记物的研究仍然缺乏。因此,该研究旨在利用机器学习算法筛选出潜在的诊断标志物,并通过实验验证(免疫组化实验)来验证这些标志物。通过这项研究,研究团队希望为间皮瘤的差异诊断提供新的方法和线索,从而为该疾病的诊断和治疗提供更准确和有效的手段。
数据来源
研究人员主要从基因表达数据库GEO获得数据,并将其划分为训练集和验证集。同时,研究人员还获取了24例石蜡包埋样本,其中15例诊断为间皮增生,9例诊断为恶性间皮瘤及其邻近正常组织。
|
来源 |
数量 |
训练集 |
GSE2549、GSE12345、GSE51024 |
104例样本,50例对照 |
验证集 |
GSE42977、GSE112154 |
84例样本,10例对照 |
石蜡包埋样本 |
—— |
24例 |
研究思路
研究人员首先整合来自GEO的数据集,分析正常间皮细胞和间皮瘤细胞之间的差异表达基因(DEGs),并构建蛋白质相互作用网络。随后利用机器学习算法筛选出四个共有候选标记物,包括ACADL、EMP2、GPD1L和HMMR。最后,通过免疫组化实验证实了这些标记物在区分间皮细胞和间皮瘤细胞方面的潜力,为间皮瘤的诊断提供了新的生物标志物筛选方法,并为相关疾病的诊断和治疗提供了重要线索。
主要结果
1.基因差异表达分析
为了识别正常间皮细胞和间皮瘤细胞之间的基因表达差异,本研究结合了三个基因表达数据库(GSE2549、GSE12345和GSE51024)的基因表达矩阵,进行了基因差异表达分析。差异表达基因结果如图所示。随后研究人员使用Cytoscape识别蛋白质相互作用网络中的关键节点和子网络(PPI)。研究结果显示,与细胞增殖(BUB1B、NCAPG)或代谢稳态维持(PPARG)相关的基因是间皮瘤发展和进程中的核心基因。
差异表达基因结果图
2.功能富集分析
功能富集分析结果显示,差异表达基因参与多种生物过程和通路。它们帮助构建细胞外基质,维护细胞内结构(比如内质网),并参与分子层面的活动,如调节受体配体活性和信号受体的激活。通路分析显示这些基因与细胞外基质的形成和体液免疫反应有关,同时疾病分析显示这些基因与非小细胞肺癌和泌尿系统疾病有关。此外,对基因富集分析进行进一步分析显示,在正常组织中,这些基因可能与脂肪酸代谢和神经信号传递相关,但在癌症组织中,它们更可能参与调控细胞的增殖和DNA复制,这暗示了间皮瘤细胞具有强烈的增殖活性。
差异表达基因的功能性富集分析结果图
3.基于机器学习的诊断生物标志物筛选与验证
研究人员通过LASSO回归算法、随机森林算法和支持向量机算法来探究能够区分正常间皮细胞和间皮瘤细胞的可能诊断标志物。经过综合分析,研究人员确定了ACADL、EMP2、GPD1L和HMMR四个关键基因,并发现ACADL、EMP2、GPD1L和HMMR在诊断方面表现出色,其中ACADL的表现最佳。进一步验证发现,ACADL和GPD1L在正常组织中高表达,在恶性间皮瘤组织中低表达;而HMMR在恶性间皮瘤组织中高表达,在正常组织中低表达。虽然EMP2的表达在验证中有些不一致,但其他基因的诊断能力都很好,证明了它们可能成为有效的诊断标志物。
用于筛选诊断生物标志物的机器学习方法结果图
4.免疫细胞浸润分析
研究人员比较了恶性间皮瘤组织和正常组织中的免疫细胞组成。结果显示,正常组织中有更多的CD4 T细胞、单核细胞、静息树突状细胞和中性粒细胞,而恶性间皮瘤组织中则有更多的CD8 T细胞、滤泡辅助T细胞和M1、M2型巨噬细胞。不同免疫细胞之间也有一定的关联。进行进一步机器学习分析发现ACADL、EMP2和GPD1L基因的表达与嗜酸性粒细胞、单核细胞、活化树突状细胞、中性粒细胞、CD4T细胞和静息自然杀伤细胞呈正相关,而与HMMR基因呈负相关。此外,使用TIMER2.0工具进行的免疫浸润分析显示,ACADL基因表达与单核细胞、中性粒细胞和CD4 T细胞的浸润水平呈正相关,而与巨噬细胞的浸润水平呈负相关。研究结果表明这些基因的表达变化可能会影响肿瘤微环境中免疫细胞的分布和浸润。
免疫细胞浸润分析结果图
5.ACADL在反应性间皮细胞中的表达
研究人员发现ACADL表现出强大的诊断能力,表明其可能是潜在的间皮细胞标志物。免疫组化实验显示,ACADL在单层浆膜和反应性增生组织中的间皮细胞呈强阳性染色,但在恶性间皮瘤组织中呈阴性。基于阳性面积比例和染色强度的免疫组化结果定量分析显示,ACADL能够显著区分正常间皮细胞组织和恶性间皮瘤组织,在反应性增生间皮细胞中尤其表现出强烈的阳性染色。这些结果表明,ACADL可以作为反应性间皮细胞的标志物。
ACADL表达的免疫组学分析
文章小结
这篇文章通过机器学习算法筛选出ACADL作为潜在的间皮细胞标记物。免疫组化实验证实ACADL在区分良性间皮细胞和恶性间皮瘤细胞方面具有潜力。这项研究为间皮瘤的诊断提供了新的生物标志物筛选方法,为相关疾病的诊断和治疗提供了重要线索。又学习完一篇SCI啦,小伙伴们觉得这篇文章如何呢?在小云看来这篇文章的研究思路非常成熟、非常经典,“收集数据-分析数据-实验验证”这种科研思路非常适合一时半会儿想不出好idea的科研人,稳扎稳打绝不会出错哦!所以小伙伴们一定要自己动手复现这篇文章的数据分析哟!PS:小云这里还有一大波类似的经典SCI文章等你复现,保证量大管饱,快来找小云获取吧~只需要长按扫码二维码就可以找到小云哟!

定制生信分析
云服务器租赁
热点推荐
代码合集(点击查看)