10×genomics单细胞测序分析(二)Cell Ranger结果报告解读

小果上一期带大家进行了单细胞测序分析的实战教学。从环境搭建开始,到下载数据,跑通流程,最后成功输出了结果。这期小果来对结果进行详细的解读。

结果概况

结果在样本名/out目录下

这些就是输出的结果文件。

web_summary.html

网页格式的输出总结,下一部分我们会用浏览器打开来看。

metrics_summary.csv

Csv格式的总结摘要,里面的信息网页版都会包含。

比如这些数字从左到右依次是,估计有1231个细胞,等等

possorted_genome_bam.bam

possorted_genome_bam.bam.bai

这两个文件是比对后生成的bam格式,及其索引bai文件。Possorted意为按照position位置来进行排序。

raw_feature_bc_matrix.h5

barcode矩阵。H5文件为跨平台存储的数据文件,可以被其他的软件读取分析。

raw_feature_bc_matrix/

该目录下是原始的数据结果,包含以下文件。

后续很多软件下游的分析都是基于这个结果。

Barcode是细胞的信息

Features是基因的信息

所以Matrix这个矩阵叫做feature barcode矩阵,它的行是基因名,列是barcode每个单细胞。

filtered_feature_bc_matrix/

这里我们要这个过滤掉背景后的结果。

analysis/

该目录为cellranger分析的结果。

它做的分析有聚类,差异表达,pca主成分分析,tsne,umap这些都有。

cloupe.cloupe

这个文件也很重要,可以直接放到上期下载的cloupe browser里交互式查看。

总结报告纵览

打开web_summary.html文件

以下是该样本的测序信息统计与分析报告

这是网页版的结果总结。一共检测到1231个细胞,每个细胞平均有54104条reads,平均每个细胞检测到3235个基因。

测序映射与样本

测序Sequencing,Q30有94%说明测序质量很好。

映射Mapping,有96.1%比对上了基因组,比对结果良好。

单细胞质控

这部分的结果很重要。

小果之前介绍了10×genomics平台分选细胞包样品的技术原理,其采用了微流控GEM技术。通常情况下,每个油滴会包裹一个细胞。但有小概率会包裹两个细胞或多个(大量的UMI数),还有不包裹细胞(空载,也会有少量的UMI)。而样本有时候会有裂解死亡的细胞,空载的GEM会捕获游离的RNA,这部分就是背景(上图灰色线的部分)。

这个图的横坐标是barcodes也就是细胞数目,横坐标是UMI counts也就是测序reads, 过低的reads(1-2位数)大概率捕获游离RNA。Cell Ranger会采用算法将其过滤掉,保证单细胞数据的质量。最后留下来的数据就是上图蓝色线部分。

这里是细胞个部分指标。比如总共检测到的基因数24694个,每个细胞的基因中位数3235,每个细胞的UMI Counts中位数等

点击Cells旁的问好,是对各项指标的详细解释。

基因表达信息

t-SNE

(左图)这里显示的是每个细胞条形码的 UMI 总计数。与 UMI 数量较少的细胞相比,UMI 数量较多的细胞可能具有较高的 RNA 含量。轴对应于 t-SNE 算法产生的二维嵌入。在这个空间中,相距较近的细胞对比相距较远的细胞对具有更相似的基因表达谱。

(右图)这是自动聚类算法将每个细胞条形码分配到群组中。聚类将具有相似表达谱的细胞组合在一起。轴对应于 t-SNE 算法产生的二维嵌入。在这个空间中,相距较近的细胞对比相距较远的细胞对具有更相似的基因表达谱。显示仅限于随机的细胞子集。

右上角可以选择根据K-means分类,K代表分类的数目。

细胞类之间差异表达基因

这个表是cluster1相较于其他的Cluster,哪些差异表达基因。

饱和度

该图显示了测序饱和度指标与下采样测序深度(以每个细胞的平均读数衡量)的函数关系,直至观察到的测序深度。测序饱和度是对观察到的文库复杂性的衡量,当所有转化的 mRNA 转录本都测序完毕时,测序饱和度接近 1.0(100%)。曲线在终点附近的斜率可被解释为增加测序深度后所获收益的上限。虚线画在合理接近饱和点的值上。

每个细胞的基因中位数

该图显示了每个细胞基因中位数与下采样测序深度的函数关系(以每个细胞平均读数表示),直至观察到的测序深度。曲线在终点附近的斜率可以解释为在此点之后增加测序深度所能获得收益的上限。

好了以上就是Cell ranger所有输出结果报告的内容了,下期小果会用loupe browser进行数据探索。

单细胞测序分析内容欢迎尝试本公司开发的云平台生物信息分析工具,零代码完成分析,云平台网址:http://www.biocloudservice.com/home.html