R语言带你探索单细胞表型信息

R语言带你探索单细胞表型信息

今天,小果要带大家继续探索单细胞测序相关R包的学习。之前为我们学习了scRNAseq包的安装和简单使用,那你知道如何使用它们并展示每个细胞基本的表型信息吗。那就和小果一起来看一下吧!

  • scRNAseq包中有哪些数据?

首先,scRNAseq包中存放的是人类单细胞细胞,并将其分为四类细胞,这四类细胞分别是:

  1. neural progenitor cell (由pluripotent stem cells分化而成)
  2. GW16
  3. GW21
  4. GW21+3 (孕期细胞)

如果想要深入了解这些R包,同学们可以自行查阅资料了解,但如果是偏技术开发的同学也可以跳过这一部分的介绍哦,我们直接进入下面的正题。那就和小果一起来看一下吧!

  • 数据载入

接下来,小果带大家一起通过scRNAseq包来导入数据。

library(scRNAseq)
data(fluid) #创建数据流名称
fluid<-ReprocessedFluidigmData() #从scRNAseq中导入数据
ct <- floor(assays(fluid)$rsem_counts)
ct[1:4,1:4]
sample <- as.data.frame(colData(fluid))
DT::datatable(sample)

表格

描述已自动生成 现在让我们一起看一下导入后的数据矩阵吧!

  • 数据的表型信息

在上面的描述中提到,scRNAseq包中将人类单细胞分为四大类细胞,本次实验的数据集来自130个数据库,其中每个细胞的测序深度均不同,那么我们怎么能直观的看到每个细胞的具体统计指标呢?接下来小果用ggplot中的箱线图来给大家展示一下!

library(ggplot2)
box <- lapply(colnames(sample_ann[,1:19]), function(i){
dat <- sample_ann[,i,drop=F]
dat$sample=rownames(dat)
##绘制boxplot
ggplot(dat,aes(‘all cells’,get(i)))+
geom_boxplot()+
xlab(NULL)+ylab(i)
})
plot_grid(plotlist=box,ncol=5)

注意啦!最后可视化的plot_grid()函数来自cowplot包哦,同学们需要提前下载并导入哦,不然最后一定会报错!

现在让我们一起看看结果吧:

    • 需要注意的小问题:

小果在一开始进行可视化的时候,系统报错:

因为想到同学们也可能和小果犯同样的错误,所以小果在这里先给大家做个预防!

图形用户界面, 应用程序

描述已自动生成 其实这不是什么很大的问题,如果经常用R工具包画图,就可能会报这样的错误哦,所以只要为我们把后台的图片缓存进行清理即可解决!