3分钟教你使用SingleR包自动化鉴定单细胞亚群
点击蓝字 关注我们
今天小花为大家分享一个自动化鉴定单细胞亚群的一个权威R包SingleR。
其之前发过nature,收到了非常多人的认可,是鉴定与注释单细胞亚群的number one。
截至目前饮用量已达1286次。
SingleR的使用文档,非常详细。
使用 SingleR 分配单元格类型 (bioconductor.org)
原理示意图
原理
一、准备
(一)软件安装与加载
BiocManager::install("SingleR")
library(SingleR)
(二)参考基因库
他现在有七个库,主要有人和小鼠的
#下载数据
library(celldex)
ref <- celldex::HumanPrimaryCellAtlasData() #下载人类细胞数据
今天使用的案例是用外周血细胞可以用Monaco Inunene Data。目前 singler 已经将这些数据库打包到 celldex 包中,可以通过安装 celldex 包进行安装和下载。下载的数据为 SummarizedExperiment 类对象,可以通过添加 Ensemble=TRUE,下载 Ensemble 类型基因 ID,通过添加 cell.ont = c(“all”, “nonna”, “none”) 添加 Cell Ontology terms 信息。
(三)参考基因初探
列是每个细胞,共713种。
二、SingleR注释
(一)读取数据
#读取seurat包分析的单细胞数据
pbmc.data <- readRDS(“xxx.rds")
#获得单细胞表达feature_barcode矩阵
query <- pbmc@assays$RNA@data
通过查看可以发现是矩阵格式。
行名是基因,列是单细胞的barcode的一个稀疏矩阵。
(二)注释细胞名
#SingleR注释
pred.pbmc<-SingleR(test=query,assay.type.test=1,ref=ref,clusters=pbmc@active.ident,labels=ref$label.fine)
具体详细的参数信息,可以输入?SingleR查看帮助文档
注释好的数据
#查看注释结果
View(as.data.frame(pred.pbmc))
#输出注释的细胞
pred.pbmc$pruned.labels
#细胞类别统计
table(pred.pbmc$pruned.labels)
共计7个细胞类
(三)使用注释的细胞名称
#创建一个新的变量储存细胞名称
new.cluster.ids <- pred.pbmc$labels
9种细胞名称
#替换level为细胞名,将level从数字替换成细胞名称
names(new.cluster.ids) <- levels(pbmc)
pbmc <- RenameIdents(pbmc,new.cluster.ids)
levels(pbmc)
(四)绘图
#查看注释结果
plotScoreHeatmap(pred.pbmc)
由紫到黄,相关性从低到高。分成了其中细胞。
(五)为细胞群添加注释
#绘制umap图
DimPlot(pbmc, reduction = "umap", label = TRUE, pt.size = 0.5) + NoLegend()
#绘制t-SNE图
DimPlot(pbmc, reduction = "tsne", label = TRUE, pt.size = 0.5) + NoLegend()
可以看到成功将细胞类型注释到细胞群上了。你学会了吗!下期小花将为大家带来基于OrthoFinder结果开展的系统发育基因组学分析的教程,感兴趣的可以持续关注本公众号哦!
欢迎使用:云生信 – 学生物信息学 (biocloudservice.com)
如果想用服务器可以联系微信:18502195490(快来联系我们使用吧!)
(点击阅读原文跳转)
点一下阅读原文了解更多资讯