GWAS的meta分析:控制假阳的常见手段之一






GWAS的meta分析:控制假阳的常见手段之一

小果  生信果  2023-08-14 19:02:48

生信人R语言学习必备

立刻拥有一个Rstudio账号

开启升级模式吧

(56线程,256G内存,个人存储1T)


还在为如何入门生信而彷徨吗?还在为Linux系统而感到无助吗?快关注小果的微信公众号,小果手把手带你入门生信,没有门槛、没有难度,跟着效果走,啥问题都没有。


相信各位小伙伴在学习GWAS原理时对GWAS的作图群体有了一定的了解,在林木、农作物等生长时间较长的物种来说,构建子代、RIL甚至NAM群体需要较长的时间,在群体构建完成之前,GWAS是少有的自然群体适合做的分析之一。尽管如此,受限于自然群体的特性,自然群体无法获得明确的谱系,一般都是通过基因型PCA确定亲缘关系,减少假阳性。因此当群体出现分层时,常规手段是将分层的群体独立进行分析,最后再做meta分析。


数据准备


1、如何判断群体是否分层


首先使用plink计算PCA,具体方法详见小果往期公众号。

绘制出不同群体PC1、PC2的双标图后,就可以观察群体之间是否明显分开,如果群体明显分层了,需要单独进行关联分析,最后在做meta分析。


2、如何做meta分析


这里小果推荐使用metal进行meta分析,原因当然是简单好用,还有windows版呢。下载链接如下:

http://csg.sph.umich.edu/abecasis/metal/download/

metal支持三个平台,小果这里还是以最常见的Linux举例,下载命令如下:

wget

http://csg.sph.umich.edu/abecasis/metal/download/Linux-metal.tar.gz

解压软件:

tar -zxvf Linux-metal.tar.gz

分析的文件来源于metal的示例数据,解压后的文件夹中包含两个示例文件,咱使用./generic-metal/examples/GlucoseExample下的数据进行演示

示例文件中运行meta分析的文档分别为DGI_three_regions.txt和magic_SARDINIA.tbl,

DGI_three_regions.txt如下所示



magic_SARDINIA.tbl如下所示



运行分析前需要准备一个metal.txt文件,如下图所示



其中MARKER对应的是DGI_three_regions.txt文档的SNP列名;

WEIGHT对应的是DGI_three_regions.txt文档的SNP列名;

其他的以此类推;相当于metal分析的config文件。

运行代码

metal metal.txt

进行meta分析,meta分析后会生成两个文件,分别是METAANALYSIS1.TBL和 METAANALYSIS1.TBL.info

其中METAANALYSIS1.TBL 是meta分析的结果文档;



我们一般主要专注meta分析后的pvalue。

METAANALYSIS1.TBL.info文件主要是对METAANALYSIS1.TBL的注释,感兴趣的可以仔细阅读。


好啦,meta分析到这就结束了,关注小果,小果带你学习更多生信分析。


这里推荐一下小果新开发的零代码云生信分析工具平台包含超多零代码小工具,上传数据一键出图,感兴趣的小伙伴欢迎了解~

网址:http://www.biocloudservice.com/home.html


今天小果的分享就到这里,欢迎大家和小果一起讨论学习,下期再见哦!




小果友情推荐

好用又免费的工具安利