师妹大课堂:三分钟实学会字符串处理函数






师妹大课堂:三分钟实学会字符串处理函数

小师妹  生信果  2023-07-18 19:00:20

点击蓝字

关注我们

大家好,本期小师妹将向大家介绍R语言中的字符串处理函数。跟着小师妹每天进步一点点吧!

paste函数:用来把自变量连成字符串,中间用相应的分隔符(可以设置sep、collapse参数

举个栗子:

split函数

strsplit:用来把它的自变量按分隔符(split表示分隔符)分割成多字符串

举个栗子:

大小写转换:toupper(x)   tolower(x)

字符串截取函数:substr(x,start,stop)

举个栗子:

  字符串匹配:grep(pattern,x);grepl(pattern,x)

  字符串替换:gsub(pattern,replacement,x,…)

举个栗子:

接下来我们介绍一下R语言的字符串匹配:正则表达式


正则表达式是描述文本串模式的一种方法。正则表达式中常见的元字符有:. () [] {} ^ $ * + ?


如果想在正则表达式中让元字符恢复其字面意思,则需要在该字符前添加一个反斜线。又因为反斜线本身也是一个元字符,所以我们首先需要添加一个反斜线让反斜线本身回复其字面意思。所以在R语言中如果要在正则表达式中恢复元字符的字面意义,我们需要在元字符前添加双斜线。


举个栗子:sub()函数用于替换字符串中模式的第一个匹配项


R语言中,出现在一个字符常量中的反斜线用于标示转义字符串的开始。R语言中合法的转义字符串有下面一些:



n 换行、

r 回车符

f 换页符

t 制表符

v 垂直制表符(tab)

等等

如果反斜线后的转义字符不在范围内,系统就会报错。例如,要在字符常量中输入反斜线,我们需要输入两个反斜线,即\。


大家学会了吗?以上就是本期的内容啦!小师妹再给大家介绍一个单细胞分析的小工具:单细胞分析(http://www.biocloudservice.com/366/366.php),能够在线输入数据,并快速输出结果,大家一起来使用吧。欢迎来和小师妹交流讨论哦。


文末阅读原文查看哦~