基因数据存在污染?不要怕!三分钟教会你使用decontam包,让你的数据干净无比!!
公众号后台回复“111”
领取本篇代码、基因集或示例数据等文件
文件编号:240314
需要租赁服务器的小伙伴可以扫码添加小果,此外小果还提供生信分析,思路设计,文献复现等,有需要的小伙伴欢迎来撩~
if (!require("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("decontam") # 在BiocManager环境下安装decontam
查看是否安装成功
packageVersion("decontam") # 查看decontam版本
library(phyloseq); packageVersion("phyloseq") # 载入phyloseq包并查看phyloseq包版本。
library(ggplot2); packageVersion("ggplot2") # 载入ggplot2包并查看ggplot2包版本。
library(decontam); packageVersion("decontam") # 载入decontam包并查看decontam包版本。
ps <- readRDS(system.file("extdata", "MUClite.rds", package="decontam")) # 提取MUClite.rds文件数据到ps变量
ps # 显示ps数据信息
head(sample_data(ps)) # 查看原始样本数据
contamdf.freq <- isContaminant(ps, method="frequency", conc="quant_reading") # 使用frequency方法识别污染序列
head(contamdf.freq) # 显示结果
显示如下图所示:
set.seed(100) # 设置参数
plot_frequency(ps, taxa_names(ps)[sample(which(contamdf.freq$contaminant),3)], conc="quant_reading") + xlab("DNA Concentration (PicoGreen fluorescent intensity)") # 做出被判定为污染物的ASV的frequences 分布图
ps.noncontam <- prune_taxa(!contamdf.freq$contaminant, ps) # 去除污染物,赋值给新的变量。
ps.noncontam # 展示去除结果
小果还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询小果,竭诚为您的科研助力!
定制生信分析
服务器租赁
扫码咨询小果
往期回顾
01 |
02 |
03 |
04 |