R的grep和grepl

grep(pattern, x, ignore.case = FALSE, perl = FALSE, value = FALSE, fixed = FALSE, useBytes = FALSE, invert = FALSE) grepl(pattern, x, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE) 参数取值说明 ignore.case 是否区分大小写 perl 是否使用perl规则 fixe…

R语言学习笔记：字符串处理

想在R语言中生成一个图形文件的文件名,前缀是fitbit,后面跟上月份,再加上".jpg",先不百度,试了试其它语言的类似语法,没一个可行的: C#中:"fitbit" + month + ".jpg" VB:"fitbit" & month & ".jpg" Haskell:"fitbit" ++ month ++ ".jpg" 还想到concat之…

R的变量类型和常用函数

一.R的变量类型也可以说是数据存储方式,有: Vector: 一维阵列 Matrics: 二维阵列,其中所有元素是同一数据类型. factor: 种类变量,可使用levels函数来规定种类变量的各级别的名称.例如:levels(factor_vector) <- c("name1", "name2",...) Dataframe:二维阵列,每一列中的元素是同一数据类型,不同列的数据类型可以不同. List : 一个List中可包含多个类型对象,包括List本…

R语言︱文本（字符串）处理与正则表达式

处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本.R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍.幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理. nchar 字符的个数 toupper 转换为大写字符 tolower 转换为小写字符 substr 求字符串的字串 grep 基于正则表达式的匹配 sub 基于正则表达式的替换 strsplit 字符串分割 paste 字符向量连接 match…

R语言中的字符串处理函数

内容概览尽管R是一门以数值向量和矩阵为核心的统计语言,但字符串有时候也会在数据分析中占到相当大的份量. R语言是一个擅长处理数据的语言,但是也不可避免的需要处理一些字符串(文本数据).如何高效地处理文本数据,将看似杂乱无章的数据整理成可以进行统计分析的规则数据,是『数据玩家』必备的一项重要技能. 在编程语言里,文本处理绝对是一大热门,作为数据统计分析最热门的R语言,虽然处理方法没有其他的文本的编程语言丰富,但其处理文本的能力也是非常实用的.特别是在文本数据挖掘日趋重要的背景下,在数…

正则表达式及R字符串处理之终结版

http://yphuang.github.io/blog/2016/03/15/regular-expression-and-strings-processing-in-R/ 0.动机:为什么学习字符串处理传统的统计学教育几乎没有告诉过我们,如何进行文本的统计建模分析.然而,我们日常生活中接触到的大部分数据都是以文本的形式存在.文本分析与挖掘在业界中也有着非常广泛的应用. 由于文本数据大多属于非结构化的数据,要想对文本数据进行传统的统计模型分析,必须要经过层层的数据清洗与整理. 今天我们要介…

R语言-正则表达式1

R语言的正则表达式主要用来处理文本资料,比如进行查找.替换等等. 首先是一些处理文本时会用到的函数: 字符串分割:strsplit() 字符串连接:paste(),paste0() 计算字符串长度:nchar(),length() 字符串截取:substr(),substring() 查看是否存在某个字符:grep(p,x) <返回匹配到的元素的下标(位置),p是一个正则表达式 grepl(p,x)<返回逻辑值false or true 举个栗子: s<-c("123abc\\…

R中的sub替换函数【转】

R中的grep.grepl.sub.gsub.regexpr.gregexpr等函数都使用正则表达式的规则进行匹配.默认是egrep的规则,也可以选用Perl语言的规则.在这里,我们以R中的sub函数为例(因为该函数可以返回替换字符串后的具体内容)介绍正则表达式的用法. 对该函数的逻辑参数都使用默认值(ignore.case = FALSE,表示大小写敏感:extended = TRUE,表示使用egrep规则:perl = FALSE,表示不使用Perl规则:fixed = FALSE,表示不…

R语言：文本（字符串）处理与正则表达式

R语言:文本(字符串)处理与正则表达式 (2014-03-27 16:40:44) 转载▼ 标签: 教育分类: R 处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本.R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍.幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理. R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用.高效处理文本少不了正则表达式(r…

R语言函数化学习笔记6

R语言函数化学习笔记 1.apply函数可以让list或者vector的元素依次执行一遍调用的函数,输出的结果是list格式 2.sapply函数原理和list一样,但是输出的结果是一个向量的形式 3.vapply 这个函数输出的结果更加详细,但是函数使用的时候需要多写一个几个参数来控制 Use vapply Before you get your hands dirty with the third and last apply function that you'll learn abo…

R中的Regex

Description grep.grepl.regexpr.gregexpr和regexec在字符向量的每个元素中搜索与参数模式匹配的参数:它们在结果的格式和详细程度上有所不同. sub和gsub分别替换第一个匹配项和所有匹配项. Usage grep(pattern, x, ignore.case = FALSE, perl = FALSE, value = FALSE, fixed = FALSE, useBytes = FALSE, invert = FALSE) grepl(patte…

R语言中的正则表达式（转载：http://blog.csdn.net/duqi_yc/article/details/9817243）

转载:http://blog.csdn.net/duqi_yc/article/details/9817243 目录 Table of Contents 1 正则表达式简介 2 字符数统计和字符翻译 2.1 nchar和length 2.2 tolower,toupper和chartr 3 字符串连接 3.1 paste函数 4 字符串拆分 4.1 strsplit函数 5 字符串查询: 5.1 grep和grepl函数: 5.2 regexpr.gregexpr和regexec 6 字符串替换…

grep如何忽略.svn目录，以及如何忽略多个目录

grep如何忽略.svn目录,以及如何忽略多个目录这是我在网上看到的文章,不过里面还有问题,我的不支持,需要更换架包 grep -r 'function_name' * (*表示当前目录下所有文件,-r表示递归查找,使用的模式较为简单,仅作参考)由于现在的很多项目都使用subversion作为版本管理工具,因此每个源码目录下都会有一个.svn 目录,其中包含了很多源码信息.不出意外,你很快会得到满屏幕的打印信息,但是其中大部分的信息都来自于 .svn 目录下的文件.有如下两种选择可以去除来自…

find grep 组合使用

1. 查找所有".h"文件 find /PATH -name "*.h" 2. 查找所有".h"文件中的含有"helloworld"字符串的文件 find /PATH -name "*.h" -exec grep -in "helloworld" {} \; find /PATH -name "*.h" | xargs grep -in "helloworl…

grep,awk和sed的常用命令和语法

Grep的常用命令语法 1. 双引号引用和单引号引用在g r e p命令中输入字符串参数时,最好将其用双引号括起来.例如:“m y s t r i n g”.这样做有两个原因,一是以防被误解为 s h e l l命令,二是可以用来查找多个单词组成的字符串,例如:“jet plane”,如果不用双引号将其括起来,那么单词 p l a n e将被误认为是一个文件,查询结果将返回“文件不存在”的错误信息.在调用变量时,也应该使用双引号,诸如: g r e p“$ M Y VA R”文件名,如果不这样,…

shell 中grep命令详解

用‘grep’搜索文本文件如果您要在几个文本文件中查找一字符串,可以使用‘grep’命令.‘grep’在文本中搜索指定的字符串.举个例子:假设您正在‘/usr/src/linux/Documentation’目录下搜索带字符串‘magic’的文件: $ grep magic /usr/src/linux/Documentation/*sysrq.txt:* How do I enable the magic SysRQ key? sysrq.txt:* How do I use the magi…

grep时排除指定的文件和目录

参考:http://winterth.duapp.com/notes/ar03s04.htmlhttp://blog.sina.com.cn/s/blog_7169c8ce0100qkyf.html --exclude=FILE_PATTERN skip files and directories matching FILE_PATTERN --exclude-from=FILE skip files matching any file pattern from FILE --exclude-d…

linux中find指令与grep命令的组合使用

linux下find与grep管道命令的组合使用: 一.使用find与grep 1. 查找所有".h"文件(非组合命令) find /PATH -name "*.h" 2. 查找所有".h"文件中的含有"helloworld"字符串的文件(组合命令) find /PATH -name "*.h" -exec grep -in "helloworld" {} \; find /PATH -…

经验分享：如何用grep对PHP进行代码审计

这是一个常见的误解- 企业需要购买复杂和昂贵的软件来发现应用程序中安全漏洞:而这些专门的软件应用程序,无论是黑盒或白盒,开源或商业,都能很快的发现安全漏洞. 事实是:所有这些专业的漏洞扫描工具都有其特定的优势和劣势.有些可能是ASP为中心的,而其他工具更倾向于PHP.开发团队可能会因为提高扫描速度的要求,会忽略不值得被报告的漏洞.如果你想在一定时间内找到尽可能多的安全漏洞,需要使用所有的工具. 没有一个漏洞扫描器或技术会发现你应用程序中100%的安全漏洞,即便你使用了各种工具和技术.这篇文章中我…

grep Pocket Reference读记

1 简介 grep的基本命令格式如下: grep [options] [regexp] [filename] 如果regexp中含有空格,应该使用单引号或双引号括起来.单引号和双引号的区别在于在双引号中可以使用SHELL变量. 有很多不同风格的正则表达式,但实际上它们都非常相近,下面介绍grep中使用的正则表达式. 表1 正则表达式元字符元字符元字符名称匹配匹配单个字符的元字符 . Dot 任意一个字符 [...] Character class 方括…

grep 笔记

-a :将 binary 文件以 text 文件的方式搜寻数据-c :计算找到 '搜寻字符串' 的次数-i :忽略大小写的不同,所以大小写视为相同-n :顺便输出行号-v :反向选择,亦即显示出没有 '搜寻字符串' 内容的那一行!--color=auto :可以将找到的关键词部分加上颜色的显示喔!-r -w 全子匹配-E 使用egrep功能,多字匹配 grep -E? ?'aaaaa|bbbbbb' grep -E 'SIGNAL|OFL Hit' logcat -s MiSysSrv MiMw…

Linux 三剑客 -- awk sed grep

本文由本人收集整理自互联网供自己与网友参考,参考文章均已列出,如有侵权,请告知! 顶配awk,中配sed,标配grep awk 参考 sed 参考 grep 参考在线查看linux命令速记表 appropos , history two long didn't read 整理我们都知道,在Linux中一切皆文件,比如配置文件,日志文件,启动文件等等.如果我们相对这些文件进行一些编辑查询等操作时,我们可能会想到一些vi,vim,cat,more等命令.但是这些命令效率不高,这就好比一块空地准备…

R语言之——字符串处理函数

nchar 取字符数量的函数 length与nchar不同,length是取向量的长度 # nchar表示字符串中的字符的个数 nchar("abcd") [1] 4 # length表示向量中元素的个数 length("abcd") [1] 1 length(c("hello", "world")) [1] 2 chartr 字符替换 chartr(old="a", new="c",…

linux find grep组合使用

一.常用组合 1. 查找所有".h"文件 find /PATH -name "*.h" 2. 查找所有".h"文件中的含有"helloworld"字符串的文件 find /PATH -name "*.h" -exec grep -in "helloworld" {} \; find /PATH -name "*.h" | xargs grep -in "he…

Find and Grep

grep递归查找子目录

想要在各种文件里面找一个指定的文本,本来的方法太土了,在网上搜了一下,发现个好的方法,不过也有些问题.原文如下: 第一个,这个是看别人脚本的,配合find实现,-maxdepth指定深度,如果查找到底,就把-maxdepth删掉find /var/log/httpd/* -maxdepth 1 -type f -mtime +14 -print | egrep '.*\.gz$' | xargs -r /bin/rm 第二个,也是别人脚本,粗糙点,原先我是用这个来查找当前目录的,修改为`ls -…