R包“Peptides”:难以置信的神奇工具,轻松揭秘生物大分子‘蛋白质’的奥秘!你敢相信这R语言的计算力量吗?






R包“Peptides”:难以置信的神奇工具,轻松揭秘生物大分子‘蛋白质’的奥秘!你敢相信这R语言的计算力量吗?

小师妹  生信果  2024-02-16 19:00:25

在生物信息学中,除了DNA、RNA等生物大分子,蛋白质也扮演着重要的角色。蛋白质,是生命的基石,是身体内不可或缺的力量之一。它们由氨基酸组成,是身体结构、功能和代谢的关键组成部分,对于人体的生长、修复和维护至关重要。
然而,在这个科技横扫的时代,生物信息学正在以惊人的速度揭示蛋白质的神秘面纱!蛋白质的结构预测、模拟,蛋白质之间的相互作用网络如同未解之谜的密码;功能注释与通路分析,宛如探险家在探寻身体内的神秘大陆;而药物设计与疾病研究,正如科学家们在战胜疾病的征途上的利剑!
生信工作者们,计算数据量大得有点像数星星,得有个强大的望远镜才能搞定!租赁服务器就像是生信界的超级计算战士,为你的数据提供一座高速数据高速跑道,让计算任务飞起来!记住,大数据时代,有个强力伙伴,分分钟变身数据大侠!如有需要,欢迎联系!
需要租赁服务器的小伙伴可以扫码添加小果,此外小果还提供生信分析,思路设计,文献复现等,有需要的小伙伴欢迎来撩~

而今,为了让大家轻松畅游于目标蛋白的神秘世界,小果惊艳登场,奉上R语言包——“Peptides”!这个神奇工具,仿佛是生物信息学的魔法杖,让你轻松揭示蛋白质的各种超凡理化性质。现在就跟着我们一起,揭开蛋白质之谜的面纱吧!
小果这次主要介绍下面几个R包“Peptides”的几种常用函数及其实现功能,这些蛋白质的性质都是在做生物信息学有关研究时常用的哦~:
aaComp():   计算蛋白质序列的氨基酸组成
aaSMILES   ():从氨基酸序列创建字符串    
Charge():计算蛋白质序列的理论净电荷
Lengthpep():计算蛋白质序列的氨基酸长度
Mw():   计算蛋白质序列的分子量
pI():计算蛋白质序列的等电点                               
要使用R包“Peptides”,首先药在R中使用以下命令进行安装和加载:
install.packages('Peptides')library('Peptides')       
这里会有一个警告,来告诉我们还要安装另一个包“Rcpp”,但不用担心,它会自动帮我们装好的!如果没有自动装好,仅仅需要将上面的命令稍作改动,改为安装载入“Rcpp”即可!加载好R包“Peptides”之后就可以正常使用啦。
         
如果你感觉在蛋白质的海洋中有些无所适从?别担心,我马上来给你介绍几个“大神函数”具体用法,让你的蛋白质性质分析之旅变得轻松又有趣!

aaComp()
 

功能作用概述:
此函数计算特定类别的氨基酸数量,并根据其大小和R-基团,使用浮雕“pepstat”中实现的相同函数将其分类为:微小的、小的、脂肪族的、芳香的、非极性的、极性的、带电的、碱性的和酸性的。输出是一个特定类别的氨基酸数量和百分比矩阵。    
语法用法:
aaComp(seq)
参数说明:
seq : 氨基酸序列
代码示例:
print('aaComp输出')aaComp(seq= "KWKLFKKIGIGKFLHSAKKFX")
输出示例: 
  Number  Mole%Tiny           4 19.048Small          4 19.048Aliphatic      5 23.810Aromatic       5 23.810NonPolar      11 52.381Polar          9 42.857Charged        8 38.095Basic          8 38.095Acidic         0  0.000
上面这段输出就展示了微小的、小的、脂肪族的、芳香的、非极性的、极性的、带电的、碱性的和酸性的氨基酸在输入蛋白质中的比例,是不是非常清晰明了呀!

aaSMILES  ()
 

功能作用概述:
此功能将肽与氨基酸的一个字母缩写转换为表示结构的字符串。
语法用法:
aaSMILES(seq)
 参数说明:
seq : 单字母氨基酸编码的特征向量
代码示例:
aaSMILES(seq= "KWKLFKKIGIGKFLHSAKKFX")
输出示例:
"N[C@@]([H])(CCCCN)C(=O)N[C@@]([H])(CC(=CN2)C1=C2C=CC=C1)C(=O)N[C@@]([H])(CCCCN)C(=O)N[C@@]([H])(CC(C)C)C(=O)N[C@@]([H])(Cc1ccccc1)C(=O)N[C@@]([H])(CCCCN)C(=O)N[C@@]([H])(CCCCN)C(=O)N[C@@]([H])([C@]([H])(CC)C)C(=O)NCC(=O)N[C@@]([H])([C@]([H])(CC)C)C(=O)NCC(=O)N[C@@]([H])(CCCCN)C(=O)N[C@@]([H])(Cc1ccccc1)C(=O)N[C@@]([H])(CC(C)C)C(=O)N[C@@]([H])(CC1=CN=C-N1)C(=O)N[C@@]([H])(CO)C(=O)N[C@@]([H])(C)C(=O)N[C@@]([H])(CCCCN)C(=O)N[C@@]([H])(CCCCN)C(=O)N[C@@]([H])(Cc1ccccc1)C(=O)NAO"
这个函数可以直接输出目标蛋白质的SMILES编码,不需要任何基础知识就可以轻松获得蛋白质的结构啦!

Charge()
 

功能作用概述:
这个函数根据Moore,D.S.(1985)描述的Henderson-Hasselbalch方程计算蛋白质序列的净电荷。净电荷可在规定的pH值下使用9种可用pKa量表之一计算:Bjellqvist、Dawson、EMBOSS、Lehninger、Murray、Rodwell、Sillero、Solomon或Stryer。
语法用法:
charge(seq, pH = 7, pKscale = "Lehninger")
参数说明:
seq : 氨基酸序列
pH : pH值    
pKscale : 指定要使用的pKa比例的字符串;必须是“Bjellqvist”、“Dawson”、“EMBOSS”、“Lehninger”、“Murray”、“Rodwell”、“Sillero”、“Solomon”或“Stryer”之一
代码示例:
charge(seq= "FLPVLAGLTPSIVPKLVCLLTKKC",pH= 5, pKscale= "EMBOSS")charge(seq= "FLPVLAGLTPSIVPKLVCLLTKKC",pH= seq(from = 5,to = 9,by = 2), pKscale= "EMBOSS")
输出示例:
3.0373983.0373984 2.9141123 0.7184524
借助这个魔法函数,谁都可以轻松揭开蛋白质分子的电荷秘密!       

Lengthpep()
 

功能作用概述:
这个函数计算蛋白质序列中氨基酸的数量
语法用法:
lengthpep(seq)
参数说明:
seq : 氨基酸序列
代码示例:
lengthpep(seq = "QWGRRCCGWGPGRRYCVRWC")
输出示例:
20
这个函数看起来非常简单平平无奇,但是在处理非常大的蛋白质分子时也能发挥巨大的作用呢!    

Mw()
 

功能作用概述:
这个函数计算蛋白质序列的分子量。使用Compute pI/Mw工具上可用的刻度,将其计算为每个氨基酸的质量之和。它还支持使用预定义或定制的稳定同位素质量标签计算蛋白质的质量。
语法用法:
mw(seq, monoisotopic = FALSE, label = "none", aaShift = NULL)
参数说明:
seq : 氨基酸序列
monoisotopic : 逻辑值“真”或“假”,表示是否应使用氨基酸的单同位素重量
label : 设置预定义的重同位素标签。接受“无”、”hsa05120″$OR2T8$1¥、”hsa04740″+9999999hCG_1776980$1¥和“15n”。覆盖aaShift中的输入。
aaShift : 将给定氨基酸的质量差(道尔顿)定义为命名载体。使用氨基酸一个字母的代码作为名称和质量转移道尔顿作为值。
代码示例:
mw(seq = "QWGRRCCGWGPGRRYCVRWC",monoisotopic = FALSE)
输出示例:
2485.911
分子量在蛋白质研究的多个方面都扮演着关键的角色,为科学家提供了理解和探索蛋白质特性的重要工具,通过这个函数我们在蛋白质纯度评估、蛋白质结构和功能研究、蛋白质相互作用、蛋白质表达和纯化、药物开发和生物工程等方面获得极大的便宜!如果您觉得敲代码是一件难事,只需要动动小手点开我们的生信工具平台云生信  - 学生物信息学 (biocloudservice.com),页面清晰,工具种类繁多,简单易上手哦!              

pI()
 

功能作用概述:
等电点(pI)是特定分子或表面不带净电荷的pH值。
语法用法:
pI(seq, pKscale = "EMBOSS")
参数说明:
seq : 氨基酸序列
pKscale : 指定要使用的pK刻度的字符串;必须是“Bjellqvist”、“EMBOSS”、“Murray”、“Sillero”、“Solomon”、“Stryer”、“Lehninger”、“Dawson”或“Rodwell”之一
代码示例:
pI(seq= "QWGRRCCGWGPGRRYCVRWC",pKscale= "Bjellqvist")
输出示例:
9.881
等电点就像是蛋白质的生日派对,它们在这个 pH 的“生日”上净电荷为零,非常引人注目!在蛋白研究领域,了解等电点就像知道明星最喜欢的派对地点一样重要。而更酷的是,通过这个特殊的函数,我们可以轻松地算出蛋白质的等电点,就像数 1、2、3 一样简单!科学研究也可以有趣起来,对吧?    
以上就是对于计算蛋白质理化性质的R包“Peptides”中几种常用函数的相关介绍啦,今天有学到新知识嘛~
想要继续了解R语言内容可以持续关注小小果哦~~或者也可以关注我们的官网也会持续更新的哦~
http://www.biocloudservice.com/home.html 

小果还提供思路设计、定制生信分析、文献思路复现;有需要的小伙伴欢迎直接扫码咨询小果,竭诚为您的科研助力!


定制生信分析

服务器租赁

扫码咨询小果


往期回顾

01

1024G存储的生信服务器,两人成团,1人免单!

02

单个数据库用腻了?多数据库“组合拳”带你打开免疫浸润新思路!

03

孟德尔随机化的准备工作,GWAS数据的网站下载方法

04

跟着小果学复现-手把手带你拿下IF=46.9Nature 级别的主成分分析(PCA)图!!