处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本.R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍.幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理. nchar 字符的个数 toupper 转换为大写字符 tolower 转换为小写字符 substr 求字符串的字串 grep 基于正则表达式的匹配 sub 基于正则表达式的替换 strsplit 字符串分割 paste 字符向量连接 match…
R语言拆分字符串 aaa<-"aa;bb;cc"ccc<-strsplit(aaa,split=";") bbb<- unlist(strsplit(aaa,split=";")) ; bbbbbb[2]str(bbb)length(bbb)…
R语言字符串的拼接 content<-paste("124235","789","124",sep="@") 运行的结果:…
字符串存入数组 文本内容: line1_1 line1_2line2_1 line2_2line3_1 line3_2line4_1 line4_2line5_1 line5_2line6_1 line6_2 C代码: 1 #include <stdlib.h> 2 #include <stdio.h> 3 #include <string.h> 4 #define LEN 100 5 6 void readFile(void) 7 { 8 FILE *fp=fopen…
在R语言中 paste 是一个很有用的字符串处理函数,可以连接不同类型的变量及常量. 函数paste的一般使用格式为: paste(..., sep = " ", collapse = NULL) 1 1 其中…表示一个或多个R可以被转化为字符型的对象:参数sep表示分隔符,默认为空格:参数collapse可选,如果不指定值,那么函数paste的返回值是自变量之间通过sep指定的分隔符连接后得到的一个字符型向量:如果为其指定了特定的值,那么自变量连接后的字符型向量会再被连接成一个字符串…
这是原始数据的格式,当运行完下面的命令的时候,结果如下图 x=read.table("C:/Users/Administrator/Desktop/s1.txt") x=as.matrix(x) x 显然x是个字符串矩阵,如果我要删去x的第一列, y=x[,-1] y 结果如图 显然,y还是一个字符串矩阵,,如何将字符串矩阵转化为数值矩阵呢?使用apply()函数 y=apply(y,2,as.numeric) apply()函数里面的第2个值,如果为1,则修改的为行,如果取2则表示修…
nchar 取字符数量的函数 length与nchar不同,length是取向量的长度 # nchar表示字符串中的字符的个数 nchar("abcd") [1] 4 # length表示向量中元素的个数 length("abcd") [1] 1 length(c("hello", "world")) [1] 2 chartr 字符替换 chartr(old="a", new="c",…
这个函数提取字符串的一部分. 语法 substring()函数的基本语法是: substring(x,first,last) 以下是所使用的参数的说明: x - 是字符向量输入. first - 是第一个字符要被提取的位置. last - 是最后一个字符要被提取的位置. 示例 # Extract characters from 5th to 7th position. result <- substring("Extract", 5, 7) print(result) 当我们上面…
函数计算字符数量,包括在一个字符串的空格的个数. 语法 nchar()函数的基本语法是: nchar(x) 以下是所使用的参数的说明: x - 向量输入. 示例 result <- nchar("Count the number of characters") print(result) 当我们上面的代码执行时,它产生以下结果: [1] 30…
R语言:文本(字符串)处理与正则表达式 (2014-03-27 16:40:44) 转载▼ 标签: 教育 分类: R 处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本.R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍.幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理. R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用.高效处理文本少不了正则表达式(r…