单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~

单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~
各位小伙伴们大家好,今天给大家分享一篇聚焦单基因分析与机器学习的干活满满的文章!
很多小伙伴肯定对单基因分析很熟悉,因为有那么一阵子单基因分析加上简单的生信分析,再来点湿实验就可以轻松发高分,小云也是用这个方法帮了不少小伙伴完成了发SCI的KPI呢!但2024了,生信分析方法越来越多,生信发文也越来越卷,好多小伙伴也在疑惑单基因分析是不是out了?是不是没有发文竞争力?那小塔大声的告诉大家,大漏特漏!要知道单基因分析也算经典的生信发文思路了,路子经典,那只要加点新花样,比如结合时下大火的机器学习,那发文的战斗力还是杠杠的!
小云这么说可是有根据的哦,毕竟天天遨游、浸泡、沉溺于Pubmed的小塔可是看到不少人就是这么干的,比如安徽医科大学研究团队新发的这篇6分文章就是一个经典的例子。文章利用GEO数据库的数据,通过机器学习结合免疫组织化学实验,鉴定和验证了ACADL是有效区分良性间皮瘤细胞与恶性间皮瘤细胞的有效生物标志。文章思路清晰简单,那主要特色都有啥呢,让小云带大家一起看看~
1.利用多种机器学习方法进行分析众所周知机器学习是一种高效科学的分析方法,不仅可以大规模的处理数据,还能进行预测和决策,更是筛选关键基因的绝佳方法,而作者不仅利用了机器学习,更是通过三种不同的算法筛选出各自确定的特征基因,交集后更准确地定位目标基因,进而使研究结合科学而可靠    
2.公共数据集和湿实验双重验证。为了验证结果的准确性,作者不仅利用GEO公共数据库的数据集进行验证,更是进行了免疫组织化学实验来进一步验证结论,双重验证的加持,尤其是湿实验的加入,使研究结果更有说服力
3.研究意义重大。作者通过研究鉴定了ACADL是有效区分良性间皮瘤细胞与恶性间皮瘤细胞的有效生物标志,从而为间皮瘤的鉴别诊断提供了一种新的途径,具有重要的临床价值
4.进行了免疫细胞浸润分析该分析方法可以有效的评估肿瘤组织中免疫细胞的浸润程度,而作者将通过机器学习获得的四种特征标记物与免疫细胞浸润进行相关性分析,不仅丰富了研究结果,也从侧面证实了研究结果的可信度。看到这小伙伴们恍然大悟了吧,就算思路是经典的老思路,但是只要结合点新方法,发SCI还是很简单的嘛!而思路经典也给小伙伴们复现提供了便利之路哦,所以感兴趣的小伙伴赶紧码住思路行动起来吧~ps:通过生信分析获得肿瘤标志物进行发文可以说是永不过时且行之有效的经典之法,而与机器学习结合,更能大大的提高发文竞争力,所以有这方面需求的小伙伴可以尝试一下复现哦,而要是复现有困难或者时间不足就来扫码联系小云寻求帮助吧~   
单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~
定制生信分析

云服务器租赁

(加微信备注99领取试用)


单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~
题目:综合生物信息学和机器学习分析鉴定ACADL是反应性间皮细胞的有效生物标志物
杂志:Am J Pathol
影响因子:IF=6
发表时间:2024年4月
研究背景
恶性间皮瘤是一种起源于间皮瘤细胞的罕见肿瘤。其潜伏期长,预后差,患者中位生存期为4 ~ 12个月。间皮瘤通常与接触石棉有关。吸入石棉纤维会导致细胞因子和活性氧的产生,通过引起局部炎症,导致癌症的产生。间皮瘤细胞学诊断的难点在于恶性间皮瘤中的肿瘤细胞与反应性间皮瘤细胞、腺癌等恶性肿瘤在形态上有重叠。免疫组织化学标志物在一定程度上可以起到辅助诊断的作用。同时通过寻找特异性标记物,可以在单一免疫标记物的基础上区分反应性增生性间皮细胞和间皮瘤细胞,大大简化了组织病理诊断过程。因此本研究旨在通过机器学习结合免疫组织化学实验,鉴定和验证区分间皮瘤细胞和间皮瘤细胞的潜在生物标志物。
数据来源
数据集/队列
数据库
数据类型
详细信息
训练集:GSE2549、GSE12345、GSE51024
GEO
基因表达矩阵(微阵列数据)
104例恶性间皮瘤组织和50例正常胸膜组织或配对肺实质组织
验证集:GSE42977
GEO
基因表达矩阵(微阵列数据)
39例恶性胸膜间皮瘤组织和7例正常胸膜组织
验证集:GSE112154
GEO
基因表达矩阵(微阵列数据)
45例弥漫性腹膜恶性间皮瘤组织和3例正常腹膜组织
石蜡包埋标本
石蜡包埋标本
间皮瘤增生15例,恶性间皮瘤及其邻近正常组织9例11
研究方法
作者首先整合了数据集GSE2549、GSE12345和GSE51024的基因表达矩阵,分析了正常和间皮瘤组织中基因表达的差异并进行了功能富集分析。然后采用最小绝对收缩和选择算子、支持向量机递归特征消除和随机森林三种机器学习算法筛选得到ACADL、EMP2、GPD1L和HMMR四个候选标志物。而后在另外两个独立的数据集(GSE42977和GSE112154)中验证这些候选基因的表达和诊断性能,表明ACADL、GPD1L和HMMR的性能在训练数据集和验证数据集之间是一致的。接下里将机器学习获得的特征标记物与免疫细胞浸润进行相关系分析,证明这些基因表达的变化可能对微环境中免疫细胞的浸润产生影响。最后作者通过免疫组化实验验证最佳候选标记物为ACADL。 
主要结果
1. 基因差异表达分析
为了确定正常间皮细胞和间皮瘤细胞之间的基因表达差异,作者结合三个基因表达数据集的基因表达矩阵进行基因差异表达分析(图1 A)。其中火山图显示了差异表达基因(DEGs)的名称(图1B)。同时作者构建所有DEGs的蛋白质相互作用网络,并识别蛋白质相互作用网络中的关键节点和子网络。发现与细胞增殖相关的基因(BUB1B, NCAPG)或代谢稳态维持相关基因(PPARG)是间皮瘤发生和进展的核心基因。此外,先前报道的间皮瘤标志物KIAA0101也在核心子网络中被发现,这意味着上述分析在生物标志物筛选中是有用的。综上所述,作者对获取的公共数据进行了差异表达分析,并证明了生物标志物筛选方法的有效性
单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~图1 恶性间皮瘤组织与正常组织基因差异表达分析
2.功能富集分析    
随后作者对DEGs进行了功能富集分析。GO分析结果如图2A所示,发现生物过程主要富集于细胞外基质构建,细胞组分主要富集于内质网和细胞外基质,分子功能主要富集于受体-配体活性等。KEGG通路分析显示,这些DEGs主要参与细胞外基质组织和体液免疫反应。此外通过疾病本体富集分析明确了DEGs与疾病的关系,发现其与非小细胞肺癌、泌尿系统疾病有显著相关性(图2B)。此外,通过基因集富集分析证实了这些DEGs所涉及的生物学过程,发现在癌组织中,差异基因在细胞周期和DNA复制中显著富集,表明间皮瘤细胞具有较强的增殖活性(图2C、2D)。综上所述,作者对DEGs进行了详细的功能富集分析,阐明了它们参与的生物学过程和途径
单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~图2 差异表达基因的功能富集分析    
3.用机器学习方法筛选和验证诊断性生物标志物
接下来作者使用三种机器学习方法来筛选潜在的诊断标记。分别利用LASSO回归算法选择30个基因(3 A),随机森林算法选择30个基因(图3B),支持向量机算法选择25个基因(图3C)。取交集后,ACADL、EMP2、GPD1L、HMMR四个基因被确定为潜在的诊断标记(图3D)。受试者工作特征分析显示,ACADL的AUC为0.976,EMP2的AUC为0.943,GPD1L的AUC为0.962,HMMR的AUC为0.956(图3E-H)。此外,上述筛选的特征基因在两个独立的测试集中得到验证(图4)。结果表明:ACADL和GPD1L在正常组织中高表达,在恶性间皮瘤组织中低表达,HMMR在恶性间皮瘤组织中高表达,在正常组织中低表达。然而,EMP2在两个数据集中的表达不一致(图4A、4C )。综上所述,作者利用机器学习方法筛选潜在的诊断标记,有效地区分训练集中的正常间皮瘤细胞和间皮瘤细胞,并在验证集中得到了验证    
单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~
图3 筛选诊断性生物标志物的机器学习方法
单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~图4 4个基因在试验组的表达及受试者工作特征(ROC)曲线分析
4.免疫细胞浸润分析
鉴于间皮瘤的发展与石棉暴露引起的局部炎症有关,因此作者探讨了恶性间皮瘤组织和正常组织中免疫细胞的组成(图5 A)。研究发现,CD4+记忆静息T细胞等四种细胞在正常组织中较高。CD8 + T细胞等四种细胞在恶性间皮瘤组织中较高(图5A)。此外计算22种免疫细胞类型的相关性(图5B),结果表明静息树突状细胞与嗜酸性粒细胞呈正相关,CD8 + T细胞与CD4+记忆静息T细胞呈显著负相关。同时机器学习获得的四种特征标记物与免疫细胞浸润的相关性分析显示,ACADL、EMP2和GPD1L与嗜酸性粒细胞等六中细胞呈显著正相关,而这些免疫细胞与HMMR呈显著负相关(图5C)。此外对间皮瘤的免疫浸润进行分析,结果显示单核细胞等三种细胞的免疫浸润水平与ACADL表达呈正相关,而巨噬细胞的免疫浸润水平与ACADL表达呈负相关。这说明这些基因表达的变化可能对微环境中免疫细胞的浸润产生影响。
单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~图5免疫细胞浸润分析    
5. ACADL在反应性间皮细胞中显著表达
作者基于机器学习的筛选发现ACADL显示出较强的诊断能力,可能是一种潜在的间皮细胞标志物,因此作者进一步在临床标本中使用免疫组化进行验证。免疫组化实验表明,ACADL 在单层浆膜间皮细胞和增生性组织反应性间皮细胞中呈强阳性染色,而在恶性间皮瘤组织中呈阴性(图6 A)。根据阳性面积比例和染色强度对免疫组化结果进行定量分析,发现ACADL能明显区分正常间皮瘤组织和恶性间皮瘤组织。与反应性增生性间皮细胞相比,反应性增生性间皮细胞中的阳性染色尤其强烈(图6B、6C)。这些结果表明ACADL可以作为反应性间皮细胞的标记物。 
单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~图6 ACADL表达的免疫组化分析
文章小结
文章通过分析公共数据库数据并结合机器学习来筛选鉴定良性间皮瘤细胞与恶性间皮瘤细胞的有效生物标志,并用简单的湿实验进行了验证。经典的肿瘤标志物筛选方式搭配上机器学习大大的提高了文章的亮点,而干湿结合的思路更是使结果更加的夯实可靠,可以说是用来快速发文的绝佳复现模板,所以感兴趣的小伙伴可千万别错过,小塔希望下篇看到的此类文章就是你发的哦~(ps:经典的生信思路有很多,但是如此“省心”容易复刻的并不多见哦,所以有想法有方向的小伙伴们快快跟着思路着手分析吧,但是要是时间不足或者技术受限,再或者是想在思路上拔拔高都可以联系小云寻求帮助哦~
单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~

定制生信分析

云服务器租赁

热点推荐

孟德尔随机化

临床公共数据分析

单细胞测序

肿瘤免疫与微环境

机器学习

单基因分析

生信云服务器

代码合集(点击查看)

培训班系列(点击查看)

原文始发于微信公众号(云生信学生物信息学):单基因分析out了?NoNoNo!安徽医科大6分新作:机器学习+公共数据+简单验证,换个疾病又是一篇~