哈喽小伙伴们大家好~小果在之前给大家介绍如何使用STRING数据库构建PPI网络,是不是非常的实用呢~不仅操作简单,还非常美观,在论文中作为“装修道具”也是非常的哇塞!那么今天小果就给大家带来进阶级的步骤:筛选PPI网络节点。今天我们要用到的软件是CYTOSCAPE,是一个非常方便好用的生信一站式做图工具。经过筛选之后,不仅我们的PPI网络更加美观,更加有层次感,最重要的是可以更加专业地帮我们筛选出特定的节点,在后续的GO和KEGG分析过程中好处多多哦。那么废话不多说,我们赶紧开始吧~
(小伙伴们有任何生信相关的问题欢迎随时来找小果哦~小果在生信耕耘十余年,非常乐意帮助生信路上新的小伙伴们,热点、思路、分析方法,来找小果应有尽有!另外如果有需要服务器的小伙伴们也可以来找小果租,小果专门搭建的用于生信分析的服务器性价比拉满哦)
CYTOSCAPE
Cytoscape是一款专注于开源网络可视化和分析的软件。它的核心功能是提供基础的网络布局和查询功能,将网络数据可视化为图形。网络的每个节点可以是基因、miRNA或蛋白质等,而节点与节点之间的连接(边)则代表着这些节点之间的相互作用,如蛋白与蛋白相互作用(pp)、DNA与蛋白相互作用(pd)等。
Cytoscape也非常便于操作,它支持多种网络描述格式,也可以用以Tab制表符分隔的文本文档或Microsoft Excel文件作为输入,或者利用Cytoscape软件本身的编辑器模块直接构建网络,操作方式便捷。我们还可以自定义节点和边的样式、颜色、形状等,以及对网络进行布局和排列。
这里小果将我们刚刚的tsv文件导入后,得到了一个网络图形。在左边的文件名后显示目前有225个节点和4464条边:
接下来我们下载centiscape2.2插件,这是小果常用的一个筛选插件,里面有很多筛选因素,小果在这里跟大家详细介绍一下我们要用到BETWENESS、CLOSENESS和DEGREE的筛选机制和效果:
DEGREE
在生物学术语中,度评估节点的调控相关性。在信号网络中,度非常高的蛋白质与多个其他信号蛋白质相互作用,暗示该蛋白质是一个中心调控角色,即它可能是调控的“枢纽”。
CLOSENESS
在生物网络如蛋白质信号网络中,接近中心性反映了蛋白质与其他蛋白质功能相关的概率。具有高接近中心性的蛋白质可能作为调控中心,但也可能对某些蛋白质的活动没有影响。同时,低接近中心性的蛋白质可能作为网络间的连接点。
BETWEENESS
在生物网络分析中,S.-P. 介数中心性可以用来评估蛋白质在信号传递中的作用。具有高S.-P. 介数中心性的蛋白质可能在组织和调节分子间的通信中扮演关键角色,它们能够将远距离的蛋白质连接起来,对于维持信号机制的功能和一致性至关重要。因此,这种中心性指标有助于识别在生物过程中起核心作用的蛋白质。
小果一般使用degree、closness和betweenness三个因素进行筛选,这三个因素筛选出来的蛋白大概率是中心调控角色,与其他蛋白的功能表达密切相关。这里小果也拿这三个因素作为示范来告诉大家如何筛选靶点基因。
筛选完毕后在界面的右边会显示出筛选的结果面板,我们把它解除固定后放大来查看筛选的数值:
筛选结束后右下角显示了得到的参数,我们点击右侧中间栏最右边的按钮将其导出到excel中
可以看到目前有225个节点,然后我们根据结果面板阈值(threshold)的值在excel中进行筛选
对三列都筛选完毕后还剩44个节点(见左下角及右下角)
我们在filter中新建三个column filter,随后选择我们筛选的三个参数并将阈值输入进去。
由于我们的阈值为最小值,即我们想要得到的数据应该为大于等于该阈值的数据,则我们将阈值作为最小值输入进去后得到的即为我们不需要的数据,全部输入完成后黄色的即为筛选出小于阈值的靶点,使用鼠标可以拖动,将其直接全部删除后剩余的即为符合我们要求的靶点。
这里小果提醒大家,要养成随时记录的好习惯哦。以小果的数据为例,在刚导入CYTOSCAPE时是225个节点和4464条边,筛选条件为closeness大于0.002334653906034231,betweenness大于213.02222222221678,degree大于39.68。筛选后剩余44个节点,829条边。
小果先将节点们按照圆形排列,这样方便我们观察,操作如下图所示:
操作完毕后得到以下图形:
在左侧的style栏中我们可以调整图形的风格,这里小果按个人喜好将节点调整为绿色的圆形节点,因为这样可以更加有助于看到文字,比较重要的一点是记得将文字调整为醒目的颜色和大小,因此小果这里也把文字调整为更大的24号字号以及纯黑色。
因为这个图形的边太错综复杂并且没有优先级结构,不方便我们看,所以小果在这里教大家如何将它优化一下。首先我们可以筛选出一些更加重要的节点,例如,小果在这里使用filter将betweeness的筛选阈值放大到776.85,这样就筛选出了一些调控枢纽节点。
标黄的节点就是已经选择到的节点,我们直接用鼠标将他们拖到图形的中间,并且将选中的节点再按圆形排列
看了一眼效果,小果觉得中心的节点还是有点少,于是再次降低阈值到467.2,多选择几个节点并重复刚刚的操作。
将这些节点按原型排列后,将他们拖走,以便直接选中剩余节点,然后让他们也按照圆形排列。
随后再将枢纽节点拖动回来
比起最开始的图形,现在的图形里面多了一层,是不是更加有逻辑了呢?但是小果还想让它再多一层结构,于是再提高阈值到928.86筛选几个节点放置到最内层。
将第三层的节点拖走后让他们按圆形排列,随后控制filter选中剩余第二层的节点,让他们按圆形排列,随后再将第二层节点拖动走
这样我们就得到了三个不同大小的圆,然后我们依次选中三个圆让他们颜色区别开来,更加有助于区分。小果一般习惯于重要的节点标红,反之标绿
颜色设置好后拖动回来,我们就得到了层次分明并且醒目的网络图,
最后再根据自己的喜好调整一下风格,例如小果这里将节点图形的heights调高让它更圆,并将边设置为虚线让它不再那么嘈杂,小伙伴们按自己的信息设置完成后可以点击中间栏的按钮将它导出为网络或图片。
小果提醒大家,记得随时将我们的筛选条件记录一下:最内层betweeness的筛选阈值为大于等于928.86,第二层betweeness的筛选阈值为大于等于467.2,最外层betweeness的筛选阈值为大于等于213.02,closeness均为大于0.002334653906034231,degree均为大于39.68。
这时筛选过的靶点图就制作完毕啦。但是小果教大家一招可以让我们的筛选工作更加直观,那就是制作一个筛选前后的对比图。我们首先需要将未筛选的225个节点导出为方便观察的图片,首先我们需要在如图所示的左下角layout tools可以设置排列的样式,我们先将节点们分散开一点以便观察:
这时我们通过不断调节节点的高度、宽度和字号来寻找最适合观察的样式,这一步非常麻烦,我们需要不断地调整,然后导出为图片,观察目前的图片里的节点大小和字号是否美观,这就需要我们不断地调整。小果将小果调整了十几次后的参数和效果给大家展示一下~
虽然仍然有些混乱,但是碍于节点太多,已经是相对美观的样子啦。然后我们还需要将筛选后的节点们制作为方形网格图,这样可以对比出我们制作三层圆形图的效果~
最后,我们将三幅图放在一起并注明我们筛选的条件,一副美观又清晰的流程图就制作完毕啦~怎么样,是不是非常美观呢~
那么今天的分享就到这里啦,是不是非常详尽呢~这么方便的一站式网络药理学作图软件小伙伴们快去抓紧时间上手吧!!!比起自己研究代码,不断debug,有这么一种好用的一站式工具平台不是很香嘛!不过话说回来,小果开发的一站式生信工具也是非常方便快捷、毫不逊色哦~(http://www.biocloudservice.com/home.html)小伙伴们如果在平时的生信学习中遇到了什么不懂的问题欢迎大家随时来找小果哦~小果在生信耕耘十余年,非常乐意帮助生信路上新的小伙伴们~那么我们下一次再见啦~