1 Circos简介
相信大家和小果一样在查阅文献时往往惊叹于文中图片的绚烂多彩和简明扼要,正所谓“一图胜千言”,一张结果图往往可以让读者更直观明白的了解文献的成果,但是往往众多的图片又让读者目不暇接,有没有办法将多个图片组合为一张图呢?Circos说:我可以!
Circos是一个非常强大的基因组数据可视化软件,不仅可以将基因组信息展示在一个个同心圆上,还能通过连接线的方式展示基因组区块之间的关系。Circos之父是一位加拿大的生物信息学家Martin Krzywinski,他还有第二个身份,摄影师,这就不难理解为什么Circos图能在展示数据的同时又颇具美感了。
2 Circos安装
因为Circos的安装和运行需要相当多的依赖模块(Perl),小果这里推荐在Ubuntu环境下使用conda命令安装Circos,还有什么比一键安装更省心的呢?
conda search circos #使用conda搜索circos信息
conda install circos #conda会自动安装最新版本的Circos
这样conda就会自动安装好Circos及其需要的依赖模块。但是也有个别小伙伴跟小果反应,这样仍然会出现依赖模块缺失的现象。出现这种问题的小伙伴可以在执行上述两行命令前加两条命令:
conda create -n Circos #使用conda创建一个名为Circos的环境
conda activate Circos #进入我们创建的这个Circos环境
注意看这时的环境名称就由base变成Circos了。
这样再进行安装就不会出现依赖模块缺失的问题了。
Circos的操作命令十分简单:
circos -conf circos.conf
circos.conf是Circos运行所需的配置文件,下面小果提供一个简单的配置文件:
karyotype = data/karyotype/karyotype.human.txt
<ideogram>
<spacing>
default = 0.005r
</spacing>
radius = 0.90r
thickness = 20p
fill = yes
stroke_color = dgrey
stroke_thickness = 2p
</ideogram>
<image>
# Included from Circos distribution.
<<include etc/image.conf>>
</image>
<<include etc/colors_fonts_patterns.conf>>
<<include etc/housekeeping.conf>>
如果Circos正常运行并出图的话,那恭喜你,已经成功收获了画图神器—Circos!
工欲善其事必先利其器。既然我们成功安装了Circos,那下面就和小果一起 揭开Circos作图的神秘面纱吧
3 Circos的配置文件
有些小伙伴已经发现小果上面的Circos图与其他文献中的图相差甚远,这是因为Circos作图,难的从来不是运行,而是输入文件的处理和准备配置文件。下面小果就带领大家了解一下Circos作图所需的配置文件。
首先,我们需要给Circos准备一个染色体核型的配置文件,只有先画出基因组的染色体,才能后续在染色体上描述众多的基因组数据。染色体核型的配置文件如下图所示,分为7列。
各列的含义是:
Chr/band:chr,这一列定义表明这是一个染色体;band表明这是一个条带。
-/DOMAIN:短线占位符,这个占位符通常用来定义所属关系,对于染色体来说,没有所属;DOMAIN表明所属的区段或者染色体
染色体编号ID: ID是染色体唯一且不能重复的标识。如果一个染色体组型文件里面包含多个不同来源的染色体组,设置ID最好的办法就是使用前缀。
图片名称:Label是将来用于显示在图上的文本。Label主要是在图中显示的名称,小果这里就直接使用1,2, …表示,但是如果有多个物种的基因组,或者来自不同的品系,还是要加以区分。
起始、结束:START和END值,定义了染色体的大小。对于染色体核型文件,需要指明的是,这里的START和END应该是染色体本身的大小,而不是你想绘制部分的起止位置。指定绘制部分将由其它文件来定义。
颜色 :COLOR,是于定义显示的颜色。对于人类基因组而言,circos预设了与染色体相同的名字做为颜色名,比如chr1,chr2, …chrX,chrY.
明白了这些,大家就可以用自己的数据准备染色体核型文件了,是不是很简单呢?
如果有生信分析的需要可以看看我们推出的生信云平台哦
网址:云生信 – 学生物信息学 (biocloudservice.com)
如果小伙伴有其他数据分析需求,可以尝试使用本公司新开发的生信分析小工具云平台,零代码完成分析,非常方便奥,云平台网址为:(http://www.biocloudservice.com/home.html),其中也包括了通路表达分析(http://www.biocloudservice.com/313/313.php),单细胞的基因共表达分析(http://www.biocloudservice.com/906/906.php)等各种小工具哦~,有兴趣的小伙伴可以登录网站进行了解。