GO富集分析傻瓜式教程






GO富集分析傻瓜式教程

小师妹  生信果  2023-06-14 19:00:13

{ 点击蓝字,关注我们 }

众所周知,在富集分析这一块,GO和KEGG两大巨头牢牢占据着舞台中央。当差异分析获得了大量的差异基因或者蛋白时,就需要GO富集分析将基因活蛋白分为几个大类,同故宫观察这几大类的区别,相较于上百个基因或蛋白的差异要更加直观,分析的难度也会降低,这个过程就是富集分析。


好啦,那么废话不多说,咱开始实操吧。


首先咱先把bioconductor和GO相关包安装了

if (!require("BiocManager", quietly = TRUE))install.packages("BiocManager")options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")BiocManager::install("DO.db")BiocManager::install("BiocUpgrade")BiocManager::install('clusterProfiler')BiocManager::install("fastmatch")BiocManager::install("gridExtra")BiocManager::install("ggraph")BiocManager::install("UpSetR")BiocManager::install("cowplot")BiocManager::install("ggridges")BiocManager::install("org.Hs.eg.db")BiocManager::install("topGO")BiocManager::install("Rgraphviz")


如果报错:

Warning message: In file(filename, "r", encoding = encoding) : InternetOpenUrl failed: '操作超时'

跟着小师妹把源修改了即可。


或者咱来手高级的,修改Rprofile.site.

R.home()#查看R安装在哪

根据上述命令指出来的路径修改镜像

查找X:XXXR-X.X.Xetc 路径下的Rprofile.site文件,用记事本的方式打开,写入如下命令:

还有可能报错:package ‘XXX’ is not available (for R version X.X.X)


这个报错的问题一般是版本的问题,很大可能就是依赖bioconductor的包使用了r命令install.packages安装(看啥,就是你,老老实实跟着小师妹走,代码都是测试过的,出问题的概率不大,小师妹可可爱爱,还能害了你不成)


安装好软件后,go富集分析正式开始:

install.packages(xlsx)install.packages(readxl)library(xlsx)library(readxl)model<-read.xlsx("F:/download/38gene.xlsx",1,header=F)model<-data.frame(model)library(clusterProfiler)GENEID_model = bitr(model, fromType="SYMBOL", toType="ENTREZID", OrgDb="org.Hs.eg.db")#GENID_LIST=as.vector(t(GENEID_model))go_model <- enrichGO(GENEID_model, OrgDb = org.Hs.eg.db, ont='ALL',pAdjustMethod = 'BH',pvalueCutoff = 0.05,               qvalueCutoff = 0.2,keyType = 'ENTREZID')write.csv((as.data.frame(go_model)),"F:/download/GENEID_model.csv",row.names =F)###go富集结果barplot图barplot(go_model,showCategory=20,drop=T)####go富集结果点图dotplot(go_model,showCategory=50)###绘制GO的网络关系图go.BP <- enrichGO(go_model, OrgDb = org.Hs.eg.db, ont='CC',pAdjustMethod = 'BH', pvalueCutoff = 0.05, qvalueCutoff = 0.2, keyType = 'ENTREZID')plotGOgraph(go.BP)###ont='CC'也可以改为ont='BP'或ont='MF'

小师妹这强调一下,以上教程基于clusterProfile,目前只支持19个常见的物种,其他非模式生物稍微复杂些,关注小师妹,咱会在日后把这些都安排上。