超详细!一文带你读懂孟德尔随机化结果 小图 生信果 2024-01-11 19:00:44 转自公众号:生信图http://mp.weixin.qq.com/s?__biz=MzkxODUxNDgzNA==&mid=2247486043&idx=1&sn=dac41add614c51a950f68d7cd5591a13 孟德尔随机化(Mendelian Randomization, MR)是流行病学研究中评估病因推断的数据分析技巧,它是利用与暴露因素具有强相关的遗传变异作为工具变量,来评估暴露因素与结局之间的因果关系。在前几期的推文内容中,小果个大家介绍了,如何利用公共数据库查询并下载GWAS summary数据、如何读取暴露数据进行工具变量的筛选、进行MR分析,以及对MR分析结果进行稳健性检验。 那么孟德尔随机化结果怎么看,在MR分析中常见的有以下四张图 那小果一张张来给大家进行解读 今天我们的暴露因素是睡眠时间,结局是冠心病 首先这张图是工具变量,也就是SNP的森林图。每一条水平实线反应的是单个SNP,利用Wald ratio方法估计出来的结果,实线完全在0左边,说明由这个SNP估计出来的结果,是睡眠时间增加,能降低冠心病的发病风险,实线完全在0右边,说明由这个SNP估计出来的结果是睡眠时间增加能增加冠心病的发病风险,那些跨过0的结果说明不明显,但是单个SNP的结果并不稳健,因为这里的睡眠时间是由多个SNP影响的,所以需要把结果综合起来看,也就是最底下的红线,下方红线可看出,睡眠时间的升高,可以降低冠心病的发病风险 (注:x轴代表SNP对暴露的影响,y轴代表SNP对结局的影响。斜率小于0,代表暴露因素是结局的有利因素) 这张图表示的是暴露因素与结局因素之间的MR分析结果,每一个点代表了一个工具变量SNP每个点上的线,实际反应的是95%的置信区间,横坐标是SNP对暴露因素(睡眠时间)的效应;纵坐标是SNP对结局因素(冠心病)的效应,两个效应做比值,即暴露对结局的效应,也就是上图中彩色线的斜率,不同颜色的线表示的是不同的算法,结果显示,不同算法的线总体是斜向下的,这就意味着随着睡眠时间的升高,冠心病的发病风险在降低。 (注:判断每个SNP对孟德尔随机化分析结果的影响,如果有离群值需要去掉后重新分析) MR结果分析之后需要进行敏感性分析来检验分析结果的可靠性与稳定性,逐个剔除检验就是其中的一中。逐个剔除检验,指的是逐步剔除每个SNP,计算剩余SNP的meta效应,观察剔除每个SNP后结果是否发生变化,如果剔除了某一个SNP后,结果改变很大,说明存在某一个SNP对结果影响很大,有异常值需要剔除掉,如上图所示,剔除每个SNP后,总体的误差 线变化不大,也就是所有的误差线均在0的右侧,或者所有的误差线都在0的左侧,说明结果是可靠的。 漏斗图可以看SNP的异质性,与meta分析中的漏斗图类似,主要关注IVW线的左右两边的点是否大致对称,如果有特别离群的点说明有离群值,可以去除后再次进行MR分析。 至此今天的分享到这里就结束了,后面小果会继续为大家分享每个步骤的具体操作和一些注意事项,欢迎大家继续关注哦。 想要更好的学习和交流,快来加入小果的微信公众号(生信图)和云生信生物信息学平台( http://www.biocloudservice.com/home.html),在这里你可以向小果提问、帮你制定相应分析操作。点击这里加入吧! 往期推荐 1.搭建生信分析流水线,如工厂一样24小时运转Snakemake——进阶命令 2.比blast还优秀的序列比对工具?HMMER来了 3.对单细胞分析毫无头绪?让popsicleR领你入门 4.小果带你绘制ROC曲线评估生存预测能力 5.软件包安装、打怪快又好,1024G存储的生信服务器;还有比这更省钱的嘛!!!