生物信息学习之Seurat的安装与使用

生物信息学习之Seurat的安装与使用

  1. 什么是Seurat?

Seurat是R语言中被用于单细胞RNA-seq质控、分析的一个r包。从而时用户可以鉴定来自单细胞转录本测定的异质性来源。

其中,Seurat包的应用主要包含了:数据导入、数据过滤、数据归一化、特征选择、数据缩放、数据降维、聚类、数据可视化以及差异表达基因分析的功能。

本文主要讲解Seurat包的安装以及其简单的应用,包括数据导入、数据过滤、数据特征可视化。

  1. Seurat的安装

1.安装命令

> install.packages(‘Seurat’)

注意:目前Seurat最高版本是3.0版本,需要适配的R的版本在3.4及以上,如果你的R版本在3.4以上,即可直接在R中安装。

2.安装成功后引用R包可能会出现的错误

1678772716116

此时,我们需要再安装spatstat.data这个包:

> install.packages(‘spatstat.data’)

当安装spatstat.data包时,可能还会出现spatstat.utils和spatstat.data版本不适配的问题,导致spatstat.data无法正确被安装。

安装时报错信息:

Error: package or namespace load failed for ‘Seurat’ in loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]):

载入了名字空间‘spatstat.utils’ 3.0-1,但需要的是>= 3.0.2

此时,我们需要重新下载对应版本的spatstat.utils,并在下载之前删除原来版本的spatstat.utils。

>remove.packages(“spatstat.utils”)

删除原来版本的r包后,我们需要首先去下载好对应R包的压缩包,这里需要特别注意的是,下载好的必须是.tar,而不能是.zip。这里贴下我下载的链接:

https://mirrors.sjtug.sjtu.edu.cn/cran/web/packages/spatstat.utils/index.html

下载好后,运行以下命令:

>install.packages(“C:/下载/spatstat.utils_3.0-1.tar.gz”, repos = NULL, type = “source”)

(第一个空就填写你下载好的压缩包所在的绝对路径即可)

如果你成功安装了Rtools并且和R以及Rstudio在同一目录下,即可成功安装,如果这一步仍然报错,那么你需要检查以下是否正确安装了Rtools,同时也要注意R和RStudio的版本对应问题哦~

以上问题解决后,当我们在R中引用Seurat包就不会报错了!

  1. Seurat包的简单使用

经过一番周折,我们成功安装了Seurat包。接下来我们要学习怎样使用Seurat包。

1.导入数据/创建Seurat对象

>library(dplyr)

>library(Seurat)

#导入pbmc数据

>pbmc.data <- Read10X(data.dir=”Rdata/filtered_gene_bc_matrices/hg19/”)

>pbmc <- CreateSeuratObject(counts = pbmc.data, project = “pbmc3k” , min.cells = 3,min.features = 200)

>pbmc

1678772876662

提示信息告诉我们,生成的pbmc对象中有13714个基因,2700个细胞。

导入成功后,我们也可以在Rstudio中查看pbmc对象的整体结构如下:

  1. 数据过滤/质量控制

下面,我们以人的数据为例,以MT-开头的所有基因集座位线粒体基因集,利用小提琴图可视化质控指标(过滤条件:过滤线粒体基因占比大于5%的细胞、过滤UMI数大于2500或小于200的细胞)。

>pbmc[[“percent.mt”]]<-PercentageFeatureSet(pbmc,pattern = “^MT-“)

>VlnPlot(pbmc,features = c(“nFeature_RNA”,”nCount_RNA”,”percent.mt”),ncol = 3)

>pbmc<-subset(pbmc,subset=nFeature_RNA>20 & nFeature_RNA <2500 & percent.mt<5)

>head(pbmc@meta.data, 5)

  1. 特征-特征之间关系可视化

接下来,我们可以用FeatureScatter函数可书画特征与特征之间的关系。

>plot3 <- FeatureScatter(pbmc,feature1 = “nCount_RNA”,feature2 = “percent.mt”)

>CombinePlots(plots= list(plot3))

以上,就是我们对Seurat包的安装与基本使用方法的总结,不知道有没有帮助到你呢~