从STRING到Cytoscape,小果带你看PPI网络的构建






从STRING到Cytoscape,小果带你看PPI网络的构建

小花  生信果  2024-01-12 19:00:24

 

经常做分析的小伙伴应该都接触过PPI网络吧,通过PPI网络可以观察到各基因蛋白之间的相互作用关系,这是个很有意思的分析,它比较简单,只需要输入基因名就可以了,算是比较简单的分析了,下面就跟随小果的脚步来看看PPI是怎么一步步构建起来的吧。
首先我们要准备一些基因名,准确的说应该是蛋白名,然后进入STRING的网站,网址是https://cn.string-db.org/,就是下面这个界面。
这里左边选择输入数据的类型,Protein by name就是输入蛋白的名字,输入一个蛋白名,进行与其有相互作用蛋白的预测,而我们常用的是Multiple Protein,可以输入多个基因名。
下面Organisms可以选择物种,常见的有人和小鼠,小画这次用到是小鼠的蛋白名,简单说一下,一般来说,人的蛋白名是英文大写字母加数字,而小鼠的蛋白名首字母大写,后面的小写,当然了,这个并不绝对,选好之后就可以进行分析了。    
然后进入这个界面,主要是确认一下输入的蛋白名,有的可能在库里没有,或者需要换成其他的名字,没有问题就继续了,countinue。
之后就是结果页面了,这个页面主要说两点,一点是settings,这个是用来设置的。
主要是minimum required interaction score这个选项,这个控制的是相关性分数,蛋白和蛋白之间会计算一个相互作用的分数,这里可以设置阈值,达到阈值之后才会用线链接,分数一般有0.15,0.4,0.7,0.9这几个挡位,如果网络里线太少可以调低阈值,同理,线太多也可以适当提高阈值。    
然后就是导出文件了。
这里可以直接导出图片,格式就是png和svg,svg可以用AI另存为pdf,如果要继续美化的画就要导出tsv格式的文件,这里面主要是记载了有相互作用的基因以及相互作用的分数。Tsv有两种,一种是单向的线,另一种是双向的线,小果比较习惯单向的线。
下载下来之后就需要我们的另一个主角登场了,那就是Cytoscape,这是一个软件,图标是这样的。
打开之后界面如下。    
导入文件的位置是那个三点两线,旁边有个下箭头的图标。
选择我们导出的tsv文件就可以构建网络了。    
前两列就表示参与网络的蛋白节点,处于同一行的就说明这两个节点之间被线连着,如果我们要自己构建网络的话,要至少两列数据,就是这里的前面两列,列标题也要和这个一样,分别是#node1和node2。
读进来就是上图这个网络,看上去很简陋,需要美化一下。这里就需要插件了,处理PPI最常用的插件就是cytoHubba。插件需要安装,安装方法就是点击App,然后在弹出的这个框里搜索需要安装的插件。    
安装好之后就可以在坐标工具栏里找到了。    
分析方法也比较简单,直接点击Calculate,就可以计算分析了。    
这里选择展示的节点,小果一般喜欢全都展示出来,这里有51个节点,所以小果就选择了51,下面可以选择按照什么指标进行颜色深浅的设定,小果习惯使用Degree,比较直观,就是节点周围的连线数,连线数越多,颜色就越深,设定好之后就可以点击提交了。
这就是调整后的图片了,是不是感觉上色之后就好看多了呢。
cytoHubba计算出了很多指标,这些指标可以用于关键节点的筛选,比较常见的除了Degree之外还有MNC和MCC等。   
可以选择将文件导出,但要注意导出的文件没有节点的名字,可以手动复制粘贴添加过去。
到这里,从STRING到最后PPI网络图的构建就基本完成了,但还有一些细节可以调整,这些小果会在后续的教程里继续教大家的,小伙伴们要有耐心哟,好了,这就是今天的主要内容了,小伙伴们有什么问题和想法都可以来和小云分享讨论哟。

往期推荐

1.搭建生信分析流水线,如工厂一样24小时运转Snakemake——进阶命令
2.比blast还优秀的序列比对工具?HMMER来了
3.对单细胞分析毫无头绪?让popsicleR领你入门
4.小果带你绘制ROC曲线评估生存预测能力
5.软件包安装、打怪快又好,1024G存储的生信服务器;还有比这更省钱的嘛!!!