各位朋友大家好,其实小云一直都想开一个专题,对基因组研究进行总结,一直没有勇气,现在刚好有空余时间,那小云就将自己眼中的基因组研究给大家讲讲吧。
现在技术的发展致使测序数据成倍增加,这也促进了比较基因组学的发展,比较基因组学的目标是通过目标物种的测序数据与已测序物种的基因组数据进行比较,以解析获得目标物种的基因组结构特点、编码蛋白以推测其分化时间和对环境变化的适应性,旨在汇总全部的基础数据,以尝试对物种起源、物种进化提出相应见解。
通常我们比较基因组学的研究分为数据准备、数据比对、构建物种进化树、推测分化时间、推测物种的扩张与收缩情况以及对正选择基因进行计算,对待特殊物种我们还可以鉴定物种的基因组的加倍情况,这些都有益于解析物种的适应性进化。
那小云这就开始对我们比较基因组的研究进行介绍。
首先是数据准备,我们既然要做比较基因组,那我们就要准备所需的基因组数据,目前主流的基因组获取方法有三个数据库
1:Ensemble:https://ensemblgenomes.org
2:NCBI:https://www.ncbi.nlm.nih.gov
在这里小云又要提醒大家了,关于基因组的研究所需要的算力和存储空间较大,自己的电脑肯定带不起来,这一步一定要使用服务器进行运算,而且在比较基因组学的研究中,大部分软件对Linux系统更加友好,因此大家一定要登录自己的服务器,如果还没有服务器的话可以联系小云进行租赁哦~
云服务器租赁
(加微信备注99领取试用)
Ensemble
我们不用管这个网址是谁创建的,怎么来的,咱们直接研究要怎么从上面获得我们所需要的数据,其次是这个网站中已收录物种的基因组数据还是很全面和准确的,大家可以方形使用。
https://ensemblgenomes.org
可以发现,该数据库将不同的物种的基因组数据分别放在了不同的目录下,今天我们就以拟南芥来(Arabidopsis thaliana)作为演示,其实它已经在主页面有所表现,但为让大家能全面认识这个数据库,我们需要进入植物基因组数据页面查看。
2:点击Go to Ensemble Plants
(以下为收费内容)
原文始发于微信公众号(云生信学生物信息学):【比较基因组学分析第一弹】–两种方法从NCBI、Ensemble数据库获得基因组数据