仅一月接收!0实验的单基因泛癌!香港中文大学团队:完全可复现的GO、GSEA分析,还不来学?






仅一月接收!0实验的单基因泛癌!香港中文大学团队:完全可复现的GO、GSEA分析,还不来学?

馆长  生信果  2024-03-26 19:01:02

面对一种无法靶向治疗的疾病,最有前景的研究是筛选出关键基因,然后将关键基因进行验证、生物信息分析等。而分析关键基因的思路是很值得多多参考学习的,同时只要学会了这种思路,复现大佬文章是完全可以实现的!如果你苦恼于有了关键基因,但不知道该如何分析的话,那就跟馆长来看看这篇文章是怎么做到的吧!

今天馆长给大家带来的是香港中文大学SH-Ho泌尿外科中心等团队发表在International Journal of Molecular Sciences的“GLIS1, Correlated with Immune Infiltrates, Is a Potential Prognostic Biomarker in Prostate Cancer”,探讨了GLIS1在前列腺癌(PCa)中的表达和预后价值,进而检测了GLIS1表达和PCa免疫浸润之间的关系。那么,一起来看看这篇文章的亮点吧~

1.本研究的创新思路在于利用生信分析探究前列腺癌的预后生物标志物,并且探究了GLIS1与免疫浸润的相关性;

2.本文使用了GEO、miRTarBase、miRWalk、TargetScan、ENCORI、TCGA、GTEx数据库中的大量数据进行分析和研究,使得本研究具有很好的可靠性;

3.本研究首次表明GLIS1的确有作为预后生物标志物和治疗靶点的很好的前景,全面地针对GLIS1进行各项分析。(ps:没有创新思路的同学来扫码找馆长哦,有超多个性化的GO和KEGG分析方案可以给你参考~)

   

● 题目:GLIS1与免疫浸润相关,是前列腺癌的潜在预后生物标志

● 杂志:International Journal of Molecular Sciences

● 影响因子:IF=5.6

● 发表时间:2023年12月29日

研究背景

前列腺癌作为一种第二常见的恶性肿瘤,在中国和其他国家的发病率均在升高,且由于其临床表现不明晰,经常出现诊断时已是晚期的情况,故找到有效的治疗靶点十分必要。此前前列腺癌的治疗方法主要为手术切除或放疗等,无法延缓前列腺癌的发展,近来免疫疗法逐渐走进了研究者的视野,但研究发现靶向PD-1或CTLA-4的单克隆抗体治疗效果并不好,所以探索一个免疫调节因子使其单克隆抗体与抗PD-1或抗CTLA-4联合治疗是当务之急。

数据来源

数据集/队列

数据库

数据类型

详细信息

GSE183019

GEO

mRNA

样本数超过30的组织样本

GSE134073

GEO

mRNA

样本数超过30的组织样本

GSE69223

GEO

mRNA

样本数超过30的组织样本

GSE88808

GEO

mRNA

样本数超过30的组织样本

GSE89193

GEO

miRNA

样本数超过30的组织样本

GSE60117        

GEO

miRNA

样本数超过30的组织样本

                  

miRTarBase、miRWalk、TargetScan、ENCORI

tDEM TGs

                  

                  

TCGA

RNA-seq

499个肿瘤组织样本的基因表达矩阵和临床数据

                  

GTEx

                  

正常组织的基因表达矩阵和临床数据

研究思路

从GEO数据库中得到mRNA和miRNA表达数据集,用UpSet和Venn图得到数据集中重叠的上调或下调的DEG/DEMs,将上调和下调组合得到tDEGs/tDEM,并对其进行GO和KEGG分析。利用Wilcoxon秩和检验检测TCGA和GTEx的数据。用GSEA进行统计学分析。利用Wilcoxon秩和检验和Pearson相关性评估GLIS1表达与免疫细胞浸润的相关性。Shapiro-Wilk检验数据的正态性。用Kaplan-Meier构建生存曲线。用Cox比例风险模型进行变量分析。

主要结果

1.tDEG、tDEM和tDEM-TG的鉴定

采用信使核糖核酸和miRNA靶向策略筛选表达差异的关键基因,用Upset图可视化四个mRNA数据集中的上调或下调的DEG 的交叉点,共获得198个DEG(tDEG),其中50个基因上调,148个基因下调(图1A、B),对miRNA进行相同操作共获得18个DEM(tDEM),包括7个上调和11个下调的miRNA(图1C、D)。然后用TargetScan、miRWalk、miRTarBase和ENCORI数据库预测tDEM的靶基因(图1E),通过Venn分析得到tDEM TGs(图1F)。    

2.比较肿瘤组织和正常组织中GLIS1的表达水平

使用TCGA数据库的RNA-seq数据分析(图2A)。将来自GTEx数据库中的正常样本数据和TCGA数据库的肿瘤组织数据进行比较(图2B)。利用ROC曲线表示GLIS1表达和总生存时间之间的关系(图2C)。    

3.GLIS1表达和临床病理特征及各参数之间的关系

根据中位值将GLIS1在PRAD中的mRNA表达水平分为低表达或高表达,通过TCGA-PRAD数据表示GLIS1表达和临床病理参数之间的关系(图3A)。PCa组的GLIS1mRNA的表达明显低于正常组的表达水平(图3B)。通过ROC和生存分析来评估GLIS1的应用前景(图3C-E)。采用Wilcoxon秩和检验和logistic回归分析研究了GLIS1表达与临床病理特征的相关性,随着肿瘤T分期、N分期、Gleason评分、PSA值和阳性残留肿瘤的增加,PCa组的GLIS1的表达水平显著降低(图3F-J)。    

4.GLIS1表达样品的GO和KEGG分析

在高表达和低表达GLIS1的样本中发现1011个DEG,其中858个基因上调,153个基因下调,DEGs的表达在火山图和热图中表示(图4A、B)。使用GO富集和KEGG通路分析预测前列腺癌患者的共表达功能。在生物学过程中,DEG被显著地聚集到与肌肉组织系统相关的项目,包括“肌肉收缩”、“肌肉系统过程”和“平滑肌收缩”,剩下的生物学过程包括“激素代谢过程”、“突触组装的调节”和“第二信使介导的信号传导”等(图4C)。DEGs相关的细胞成分是“含胶原细胞外基质”和其他肌肉组织相关术语,包括Z盘、I带、收缩纤维、肌节和肌节。“跨膜转运蛋白复合物”和“突触膜的内在成分”也是重要的细胞成分术语(图4D)。前10个重要的分子功能术语主要与通道活动有关,包括“被动跨膜转运蛋白活动”、“底物特异性通道活动”、“离子门控通道活动”等(图4E)。对于KEGG分析,这些DEGs主要富集于神经活性配体-受体相互作用、cAMP信号通路、钙信号通路、局灶性粘附、血管平滑肌收缩、cGMP-PKG信号通路、蛋白质消化和吸收、胰腺分泌、化学致癌和药物代谢(图4F)。    

文章小结

这篇文章将纯生信分析和恶性肿瘤的治疗和预后很好地结合在一起,仅用数据分析就能形成一篇非常完善的文章!这个创新思路性价比高、发文章快,看到这里你还不心动?!心动不如行动!有需要复现的同学快来后台找馆长吧!

小果还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询小果,竭诚为您的科研助力!


定制生信分析

服务器租赁

扫码咨询小果


往期回顾

01

1024G存储的生信服务器,两人成团,1人免单!

02

单个数据库用腻了?多数据库“组合拳”带你打开免疫浸润新思路!

03

孟德尔随机化的准备工作,GWAS数据的网站下载方法

04

跟着小果学复现-手把手带你拿下IF=46.9Nature 级别的主成分分析(PCA)图!!