一分钟教你GSEA轻松绘图——enrichplot
“
点击蓝字 关注我们
GSEA简介
基因集富集分析 (Gene Set Enrichment Analysis, GSEA)是一种用于识别基因或蛋白质集中那些在大量基因或蛋白质中呈过量表达的方法。具体来说,GSEA会分析这些特定类别的基因或蛋白质是否可能与表型差异有关,例如生物体的生长模式或者疾病状态。
GSEA主要需要两部分的输入数据。一是具有已知功能的参考基因集,此参考基因集可以采用多种注释格式,如基因本体论(Gene Ontology, GO)或者Molecular Signatures Database (MsigDB)等。二是表达矩阵,该矩阵包含了各基因或蛋白质的表达水平信息。
在GSEA分析中,基因会根据其与表型的关联程度进行排序,由小到大。接着GSEA会检验被测基因是否集中于表型相关度排名的前部或者后部。通过这种方式,GSEA能够揭示出那些对表型差异有显著贡献的基因集,它们在表型变化中起了重要的作用。
尽管可以利用GSEA的官方客户端进行分析,这个工具实现简便快捷,但其输出的图片分辨率较低,也不适于编辑。除此之外我们还可以选择使用R包进行GSEA分析,如fgsea、clusterProfiler和GSEAbase等。这些R包在功能实现上更为强大,研究者可以根据自己的需求进行选择使用。
enrichplot包
今天介绍一个cluserProfiler作者南方医科大学教授余光创开发的enrichplot包,可以方便快捷地绘制出漂亮的GSEA分析图片,可直接用于高水平论文的插图。
enrichplot包实现了几种可视化方法,用于解释从ORA或GSEA分析中获得的功能富集结果。
因为是同一个作者开发的,它主要设计用于与“clusterProfiler”包套件配合使用。扩展了clusterProfiler的功能,使其在功能富集结果的可视化方面更加强大。
enrichplot绘图函数
enrichplot包包括几种主要的绘制函数,如:
-
dotplot函数:显示单个富集项目的点图,点的大小表示基因数量,颜色表示p值。
-
barplot函数:呈现一个条形图,一条线对应一个富集项目,颜色表示p值。
-
cnetplot函数:以网络图形式展示富集项目和基因之间的关系,圆点大小表示基因数量,颜色表示p值。
-
emapplot函数:展示富集项目间的相互关系,颜色表示p值。
-
gseaplot函数:生成GSEA图像,展示基因聚集在表型前后的趋势。
enrichplot包安装
安装enrichplot包非常简单,在R环境中,只需要
运行install.packages("BiocManager"),然后BiocManager::install("enrichplot")即可。
if (!require("BiocManager", quietly = TRUE)) install.packages("BiocManager")BiocManager::install("enrichplot")
dot图
显示单个富集项目的点图,点的大小表示基因数量,颜色表示p值。
dotplot(egmt)
gsea图
生成GSEA图像,展示基因聚集在表型前后的趋势。
gseaplot2(egmt, geneSetID = "CHEN_LVAD_SUPPORT_OF_FAILING_HEART_UP", pvalue_table = T)
cnet图
以网络图形式展示富集项目和基因之间的关系,圆点大小表示基因数量,颜色表示p值。
cnetplot(egmt)
使用enrichplot包进行GSEA分析,可以大大提高分析的效率,更加直观地理解分析结果。
除此之外,enrichplot包还有很多强大的功能,研究者可以根据自己的需求灵活使用。
你是否学会了呢,欢迎在评论区下方留言讨论~
云生信平台还有更多方便实用的工具,快来看看吧
云生信平台链接:
http://www.biocloudservice.com/home.html
E
N
D