寻遍各期刊,终于为大家带来一本“武功秘籍”!小云时刻关注热点,发现同学们关于肿瘤方向的研究层出不穷。可是,如何在短时间内发文?小云分析得出结合生信手段是最稳妥的方向,因此,“武功秘籍”是一篇发表在Cancer Cell International上的文章,这篇文章的分析思路缜密且简单,采用多种机器分析策略,单细胞研究手段,生物信息学方面的知识简单的研究出舌鳞状细胞癌潜在的标志物。想了解如何快速有效的发文吗?今天就为大家整理了一篇能够帮助您迅速发文的生信文章。
舌鳞状细胞癌(TSCC)有调节肠道微生物群的作用,研究者运用生信的相关方法研究TSCC的生物标志物,这篇文章创新点很足:
1、选题:在舌鳞状细胞癌治疗手段不佳的情况下,作者通过生物信息学及机器学习等手段寻找TSCC潜在的生物标志物,立意清晰,想法明确。
2、内容:通过基因表达综合数据库筛查、机器学习确定枢纽基因、受试者工作特征评估诊断价值,方法简单有效。(运用机器学习发文的小伙伴,想要获取更多创意文章思路和生信热点的小伙伴们可以扫描下方二维码联系我哦!)
定制生信分析
云服务器租赁
(加微信备注99领取试用)
题目:综合生物信息学分析,用机器学习策略评估SEMA3C在舌鳞状细胞癌中的作用
杂志:Cancer Cell International
影响因子:IF=5.8
舌鳞状细胞癌(TSCC)是一种口腔恶性肿瘤,全球每年约有35万新发病例。其在临床上侵蚀性强,复发率高,五年生存率低于60%。目前的治疗方式主要是手术切除、化疗和放疗。但这些治疗方法选择有限,并且这种功能障碍对生活质量具有重大影响。识别和验证TSCC潜在的生物标志物是解决个性化医疗服务问题的关键。
本文通过基因表达综合数据库(GEO)中检查了TSCC个体的临床和RNA表达信息,进行差异表达分析和功能分析。采用机器学习策略来筛选和确定枢纽基因。并使用受试者工作特征分析(ROC)来评估诊断价值。
1、TSCC和正常组织中差异表达基因(DEGs)的鉴定。
寻找TSCC和正常的DEGs,进行差异表达分析。发现GSE31056中有2070个差异表达基因,其中935个上调基因和1135个下调基因(图1a和d)。在GSE134105中,总共鉴定了2592个基因,其中944个上调基因和1648个下调基因(图1b和e)。用火山图来表示DEGs的分布(图1a和b),并描绘GSE31056中的10个上调基因和20个下调基因以及GSE34105中的20个上调基因和10个下调基因(图1c和f),并且对两个数据集进行了韦恩分析。显示329个重叠的下调基因和214个重叠的基因与TSCC相关的上调基因(图1g)。
通过基因本体论(GO)和基因组百科全书(KEGG)分析鉴别DEGs的生物学功能。GO分析结果显示:在生物过程方面(BP),肌动蛋白组织、外部包封结构组织、伤口愈合、细胞外基质组织和细胞外结构组织显著富集。细胞组分(CC)方面含胶原细胞外基质、细胞顶端部分、顶端质膜、细胞前缘和黏着斑显著富集。分子功能(MF)而言,信号受体激活剂活性、受体配体活性、肌动蛋白结合、硫化合物结合和细胞因子活性显著富集。KEGG通路分析结果显示:药物代谢细胞色素p450、1L-17信号通路、ECM-受体相互作用、细胞因子-细胞因子受体相互作用和曲化因子信号通路是最富集的通路。总之,DEGs在功能上与肿瘤的恶性进展相关。
研究中应用了三种不同的机器学习算法,RF、LASSO逻辑回归和WGCNA,来识别关键标记基因,显示使用RF算法识别出89个基因。LASSO逻辑回归算法识别出8个基因。采用WGCNA来识别13个显著表达模块。对模块性状相关性的调查表明,多个模块与TSCC相关,在这些模块中,绿松石模块与TSCC的正相关性最强,因此重点筛选绿松石模块中的基因,并成功鉴别出2014个基因。使用韦恩图进行分析表明:SEMA3C(semaphorin3C)是所有三种算法识别出的重叠基因,因此,SEMA3C被定义为TCSS标记和靶标的最佳候选基因。
4、单细胞RNA测序数据分析和人类TSCC样本验证
通过查询scRNA-sep数据库识别在TSCC中表达SEMA3C mRNA的细胞群。质量控制和细胞筛选后进行无偏聚类分析,发现细胞标记物在相应细胞中表达量相对较高(图4a)。并确定了10个亚群(图4b),在TSCC细胞中,超过90%SEMA3C表达细胞是肿瘤细胞(图4c),表明SEMA3C的治疗副作用小。SEMA3C在TSCC临床样本中特异性表达如图。SEMA3C的IHC染色显示在TSCC中显著阳性,在正常组中呈阴性或低染色。
这篇文章将临床上困扰的舌鳞状细胞癌搬到生信的研究平台,通过机器学习、生物信息学、分子水平和体外细胞研究。初步筛选了TSCC的关键标志基因,揭示了SEMA3C如何参与TSCC的发生。通过体外实验证明了SEMA3C的缺失会抑制TSCC细胞的生长、迁移和侵扰。这项研究不仅在临床有着极大的作用,也进一步证明生信手段在临床应用中能发挥着举足轻重的作用。小伙伴要赶紧抓住机会,利用生信助攻临床难点研究,缩短研究周期,尽早发文,想复现思路的朋友扫描下方二维码快快联系小云吧!
原文始发于微信公众号(云生信学生物信息学):成为一名生信“追风者”!首都医科大学苏莹莹团队教你运用生物信息学和机器学习策略轻轻松松发文