FastQC——转录组数据质控的得力助手
生信人R语言学习必备
立刻拥有一个Rstudio账号
开启升级模式吧
(56线程,256G内存,个人存储1T)
-
在RNA-seq数据分析中,数据能否使用是最基本的问题,因此进行质量控制(Quality Control, QC)是不可或缺的步骤
FastQC是一个免费使用的质量控制工具,能够对高通量测序数据进行快速、准确的评估。在这篇文章中,小果将以拟南芥转录组数据为例,详细介绍FastQC在RNA-seq数据质控方面的应用。
conda create –name fastqc###创建环境
conda activate fastqc###激活环境
conda install -c bioconda fastqc###安装
fastqc -version###验证否安装成功
上一期我们对拟南芥的3组共9个转录组测序rawdata进行了过滤,这一期,小果继续用上次的数据带大家进行质量控制,当然啦,正确的做法是先对数据进行质量控制,然后根据结果报告来进行数据的过滤处理。小果先对数据进行了处理,然后进行了数据质控。
这一步操作很简单,进入文件所在目录
fastqc -t 4 *_paired.fq.gz
或者
nohup fastqc -t 4 -o ~/my_folder/trimm/ninanjie_output/ninanjie_qc *_paired.fq.gz &
这一程序会在后台运行,并对所有以 _paired.fq.gz 结尾的文件进行质控,同时使用4个线程进行计算,结果输出到给定目录。
这一步可以根据自己的实际修改命令。
可以看到程序在后台并给出了进程ID,可以进入输出目录查看结果,下面是部分,结果,慢慢等待即可。
程序结束后我们会看到每个样本都生成了read1和read2的.html报告和压缩文件,我们可以打开.html查看报告。
好啦,不多说了,今天的内容就到这里了,你学会了吗!
欢迎使用:云生信 – 学生物信息学 (biocloudservice.com)
如果想用服务器可以联系微信:18502195490(快来联系我们使用吧!)
微信号 | 18502195490
知乎 | 生信果
点击“阅读原文”立刻拥有
↓↓↓