GO富集分析傻瓜式教程
{ 点击蓝字,关注我们 }
众所周知,在富集分析这一块,GO和KEGG两大巨头牢牢占据着舞台中央。当差异分析获得了大量的差异基因或者蛋白时,就需要GO富集分析将基因活蛋白分为几个大类,同故宫观察这几大类的区别,相较于上百个基因或蛋白的差异要更加直观,分析的难度也会降低,这个过程就是富集分析。
好啦,那么废话不多说,咱开始实操吧。
首先咱先把bioconductor和GO相关包安装了
if (!require("BiocManager", quietly = TRUE))
install.packages("BiocManager")
options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/")
BiocManager::install("DO.db")
BiocManager::install("BiocUpgrade")
BiocManager::install('clusterProfiler')
BiocManager::install("fastmatch")
BiocManager::install("gridExtra")
BiocManager::install("ggraph")
BiocManager::install("UpSetR")
BiocManager::install("cowplot")
BiocManager::install("ggridges")
BiocManager::install("org.Hs.eg.db")
BiocManager::install("topGO")
BiocManager::install("Rgraphviz")
如果报错:
Warning message: In file(filename, "r", encoding = encoding) : InternetOpenUrl failed: '操作超时'。
跟着小师妹把源修改了即可。
或者咱来手高级的,修改Rprofile.site.
R.home()#查看R安装在哪
根据上述命令指出来的路径修改镜像
查找X:XXXR-X.X.Xetc 路径下的Rprofile.site文件,用记事本的方式打开,写入如下命令:
还有可能报错:package ‘XXX’ is not available (for R version X.X.X)
这个报错的问题一般是版本的问题,很大可能就是依赖bioconductor的包使用了r命令install.packages安装(看啥,就是你,老老实实跟着小师妹走,代码都是测试过的,出问题的概率不大,小师妹可可爱爱,还能害了你不成)
安装好软件后,go富集分析正式开始:
install.packages(xlsx)
install.packages(readxl)
library(xlsx)
library(readxl)
model<-read.xlsx("F:/download/38gene.xlsx",1,header=F)
model<-data.frame(model)
library(clusterProfiler)
GENEID_model = bitr(model, fromType="SYMBOL", toType="ENTREZID", OrgDb="org.Hs.eg.db")
#GENID_LIST=as.vector(t(GENEID_model))
go_model <- enrichGO(GENEID_model, OrgDb = org.Hs.eg.db, ont='ALL',pAdjustMethod = 'BH',pvalueCutoff = 0.05,
qvalueCutoff = 0.2,keyType = 'ENTREZID')
write.csv((as.data.frame(go_model)),"F:/download/GENEID_model.csv",row.names =F)
###go富集结果barplot图
barplot(go_model,showCategory=20,drop=T)
####go富集结果点图
dotplot(go_model,showCategory=50)
###绘制GO的网络关系图
go.BP <- enrichGO(go_model, OrgDb = org.Hs.eg.db, ont='CC',pAdjustMethod = 'BH', pvalueCutoff = 0.05, qvalueCutoff = 0.2, keyType = 'ENTREZID')
plotGOgraph(go.BP)
###ont='CC'也可以改为ont='BP'或ont='MF'
小师妹这强调一下,以上教程基于clusterProfile,目前只支持19个常见的物种,其他非模式生物稍微复杂些,关注小师妹,咱会在日后把这些都安排上。