3分钟教你使用SingleR包自动化鉴定单细胞亚群






3分钟教你使用SingleR包自动化鉴定单细胞亚群

小花  生信果  2023-08-27 19:00:38

点击蓝字 关注我们

今天小花为大家分享一个自动化鉴定单细胞亚群的一个权威R包SingleR。


其之前发过nature,收到了非常多人的认可,是鉴定与注释单细胞亚群的number one。


截至目前饮用量已达1286次。

SingleR的使用文档,非常详细。

使用 SingleR 分配单元格类型 (bioconductor.org)

原理示意图


原理

1.计算参考数据集中各个细胞类型基因表达谱的可变基因,对于每一个需要鉴定的细胞,计算单个细胞与参考数据集中各个细胞类型基因在可变基因上的Spearman相关性;

2.根据参考基因集的命名注释聚合每个细胞类型的多重相关系数,每种细胞类型的评分默认选择相关系数值的80%,此时可以筛选得到每个细胞最可能的细胞定义类型;

3.计算来自参考数据集中最可能的细胞类型基因表达谱的可变基因,并计算单个细胞与最可能细胞类型在可变基因上的Spearman相关性,去除最低值的细胞(或是比最高值低于0.05的细胞),重复此步骤,直到只保留两种细胞类型。最后一次运行后,相关系数值最高的细胞类型则作为需要鉴定的细胞的定义。


一、准备

(一)软件安装与加载

BiocManager::install("SingleR")library(SingleR)

(二)参考基因库

他现在有七个库,主要有人和小鼠的


#下载数据library(celldex)ref <- celldex::HumanPrimaryCellAtlasData() #下载人类细胞数据


今天使用的案例是用外周血细胞可以用Monaco Inunene Data。目前 singler 已经将这些数据库打包到 celldex 包中,可以通过安装 celldex 包进行安装和下载。下载的数据为 SummarizedExperiment 类对象,可以通过添加 Ensemble=TRUE,下载 Ensemble 类型基因 ID,通过添加 cell.ont = c(“all”, “nonna”, “none”) 添加 Cell Ontology terms 信息。


(三)参考基因初探

列是每个细胞,共713种。


二、SingleR注释

(一)读取数据

#读取seurat包分析的单细胞数据pbmc.data <- readRDS(“xxx.rds")#获得单细胞表达feature_barcode矩阵query <- pbmc@assays$RNA@data


通过查看可以发现是矩阵格式。


行名是基因,列是单细胞的barcode的一个稀疏矩阵。


(二)注释细胞名

#SingleR注释pred.pbmc<-SingleR(test=query,assay.type.test=1,ref=ref,clusters=pbmc@active.ident,labels=ref$label.fine)


Test 输入表达矩阵

Ref 下载好的参考数据

Cluster 细胞分群数

Lab 使用数据自带的细胞名


具体详细的参数信息,可以输入?SingleR查看帮助文档


注释好的数据


#查看注释结果View(as.data.frame(pred.pbmc))#输出注释的细胞pred.pbmc$pruned.labels


#细胞类别统计table(pred.pbmc$pruned.labels)

共计7个细胞类


(三)使用注释的细胞名称

#创建一个新的变量储存细胞名称new.cluster.ids <- pred.pbmc$labels

9种细胞名称


#替换level为细胞名,将level从数字替换成细胞名称names(new.cluster.ids) <- levels(pbmc)pbmc <- RenameIdents(pbmc,new.cluster.ids)levels(pbmc)


(四)绘图

#查看注释结果plotScoreHeatmap(pred.pbmc)

由紫到黄,相关性从低到高。分成了其中细胞。



(五)为细胞群添加注释

#绘制umap图DimPlot(pbmc, reduction = "umap", label = TRUE, pt.size = 0.5) + NoLegend()


#绘制t-SNE图DimPlot(pbmc, reduction = "tsne", label = TRUE, pt.size = 0.5) + NoLegend()


可以看到成功将细胞类型注释到细胞群上了。你学会了吗!下期小花将为大家带来基于OrthoFinder结果开展的系统发育基因组学分析的教程,感兴趣的可以持续关注本公众号哦!


欢迎使用:云生信  – 学生物信息学 (biocloudservice.com)


如果想用服务器可以联系微信:18502195490(快来联系我们使用吧!)



(点击阅读原文跳转)

 点一下阅读原文了解更多资讯