grep【global regular expression print】        print lines matching a pattern

grep [options] regex [file...]

regex 是指一个正则表达式

grep选项列表:

-i          忽略大小写--ignore-case

-v          invert match

-c          打印匹配的数量,而不是文本行本身--count

-l          打印包含匹配项的文件名,而不是文本行本身 --files-with-matches      

-L          相似于-l 选项,但是只是打印不包含匹配项的文件名--files-without-match

-n          打印相应的行号--line-number

-h          应用于多文件搜索,不输出文件名--no-filename

  • 元义字符和原字符

^ $ . [ ] { } - ? * + ( ) | \
注意:正如我们所见到的,当 shell 执行展开的时候,许多正则表达式元字符,也是对 shell 有特殊 含义的字符。把元字符用引号引起来至关重要, 这样可以阻止 shell 试图展开它们。

.        匹配在此位置的任意一个字符
^        锚点,行开头
$        锚点,行结尾
[***]      字符集合,元字符被放置到中括号里面后会失去了它们的特殊含义。^表示否定,-表示范围。

注意:
  • 要包含-:可将-放在开头[-***]
  • 字典顺序和ASCII 顺序不同,[A-Z]不总是工作【查看LANG变量】
  • POSIX字符集

[:alnum:]          字符数字字符,在ASCII中等价于[A-Za-z0-9]

[:word:]           增加了下划线

[:alpha:]          字母字符

[:blank:]          包含空格和tab

[:cntrl:]          ASCII的控制码,0-31,127

[:digit:]          0-9

[:graph:]          可视字符,33-126

[:lower:]          小写字母

[:punct:]          标点符号字符

[:print:]          可打印字符,在[:graph:]中的所有字符,再加上空格字符。

[:space:]          在 ASCII 中, 等价于[ \t\r\n\v\f]

[:upper:]          大写字母

[:xdigit:]          表示十六进制数字的字符

locale命令,查看locale操作。

  • POSIX基本的 Vs.扩展的正则表达式

BRE:

可以识别 ^ $ . [ ] *

字符“(”,“)”,“{”,和 “}”用反斜杠转义后,被看作是元字符

ERE:

添加了 ( ) { } ? + |

在任意元字符之前加上反斜杠会导致其被看作是一个文本字符

  • egrep 【grep -E】

echo "AAA" | grep -E 'AAA|BBB|CCC'

为了把 alternation 和其它正则表达式元素结合起来,我们可以使用()来分离 alternation。

grep -Eh '^(bz|gz|zip)' dirlist*.txt

  • 限定符

?          匹配零个或者一个元素

eg:^\(?[0-9][0-9][0-9]\)?  [0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$

通常圆括号都是元字符(在 ERE 中),所以我们在圆括号之前加上了反斜杠,使它们成为文本字符

*          匹配零个或多个元素

[[:upper:]][[:upper:][:lower:] ]*.

+          匹配一个或多个元素

^([[:alpha:]]+ ?)+$

{}          匹配特定个数的元素

{n} n次, {n,m} n到m次, {n,}大于等于n次, {,m}小于等于m次

  • find

find . -regex '.*[^-\_./0-9a-zA-Z].*'

注意:

当某一行包含的字符串匹配上了一个表达式的时候,grep 命令会打印出这一行

find 命令要求路径名精确地匹配这个正则表达式

  • locate查找文件

locate 程序支持基本的(--regexp 选项)和扩展的(--regex 选项)正则表达式

  • 在less和vim中查找文本

vim 支持基本的正则表达式

在扩展表达式中,许多被认为是元字符的字符在基本的表达式中被看作是文本字符,

只有用反斜杠把它们转义之后,它们才被看作是元字符。

正则表达式【TLCL】的更多相关文章

  1. JS正则表达式常用总结

    正则表达式的创建 JS正则表达式的创建有两种方式: new RegExp() 和 直接字面量. //使用RegExp对象创建 var regObj = new RegExp("(^\\s+) ...

  2. Python高手之路【五】python基础之正则表达式

    下图列出了Python支持的正则表达式元字符和语法: 字符点:匹配任意一个字符 import re st = 'python' result = re.findall('p.t',st) print( ...

  3. C# 正则表达式大全

    文章导读 正则表达式的本质是使用一系列特殊字符模式,来表示某一类字符串.正则表达式无疑是处理文本最有力的工具,而.NET提供的Regex类实现了验证正则表达式的方法.Regex 类表示不可变(只读)的 ...

  4. C#基础篇 - 正则表达式入门

    1.基本概念 正则表达式(Regular Expression)就是用事先定义好的一些特定字符(元字符)或普通字符.及这些字符的组合,组成一个“规则字符串”,这个“规则字符串”用来判断我们给定的字符串 ...

  5. JavaScript正则表达式,你真的知道?

    一.前言 粗浅的编写正则表达式,是造成性能瓶颈的主要原因.如下: var reg1 = /(A+A+)+B/; var reg2 = /AA+B/; 上述两个正则表达式,匹配效果是一样的,但是,效率就 ...

  6. Python 正则表达式入门(中级篇)

    Python 正则表达式入门(中级篇) 初级篇链接:http://www.cnblogs.com/chuxiuhong/p/5885073.html 上一篇我们说在这一篇里,我们会介绍子表达式,向前向 ...

  7. 【JS基础】正则表达式

    正则表达式的() [] {}有不同的意思. () 是为了提取匹配的字符串.表达式中有几个()就有几个相应的匹配字符串. (\s*)表示连续空格的字符串. []是定义匹配的字符范围.比如 [a-zA-Z ...

  8. JavaScript 正则表达式语法

    定义 JavaScript定义正则表达式有两种方法. 1.RegExp构造函数 var pattern = new RegExp("[bc]at","i"); ...

  9. [jquery]jquery正则表达式验证(手机号、身份证号、中文名称)

    数字判断方法:isNaN()函数 test()方法 判断字符串中是否匹配到正则表达式内容,返回的是boolean值 ( true / false ) // 验证中文名称 function isChin ...

随机推荐

  1. pycharm 相关设置问题

    pycharm设置自动换行 file→settings→Editor→General→勾选 Use soft wraps in eitor → ok

  2. A1231. Crash的数字表格(贾志鹏)

    A1231. Crash的数字表格(贾志鹏) 时间限制:2.0s   内存限制:512.0MB   总提交次数:410   AC次数:154   平均分:63.93   将本题分享到:        ...

  3. 动态代理:JDK原生动态代理(Java Proxy)和CGLIB动态代理原理+附静态态代理

    本文只是对原文的梳理总结,以及自行理解.自己总结的比较简单,而且不深入,不如直接看原文.不过自己梳理一遍更有助于理解. 详细可参考原文:http://www.cnblogs.com/Carpenter ...

  4. chardet库:识别文件的编码格式

    chardet库文档 http://chardet.readthedocs.io/en/latest/usage.html 小文件的编码判断 detect函数只需要一个 非unicode字符串参数,返 ...

  5. delphi ----日期控件运用,日期问题,日期时间比较

    一.日期控件 1.DateTimePicker 1)只显示年月 DateMode:dmUpDown format:yyyy-MM 2)将DateTimePicker的Format属性中加入日期格式设成 ...

  6. IO流入门-概述

    纲要 Java流概述 文件流 缓冲流 转换流 打印流 对象流 File类 流的概念 按方向划分:输入流和输出流,是相对内存而言的.从内存出来是输出,到内存中就是输入.输入流又叫做InputStream ...

  7. django之contenttype

    平时开发过程中,我们会经常遇到这么一个类似的场景,比如 不同的课程,有不同的价格策略 不同的课程可使用不同的优惠券(满减券,通用券,专用券) 不同的评论区,支持的评论 就拿  不同的课程,有不同的价格 ...

  8. jenkins 升级

    升级Jenkins Jenkins的开发迭代非常快,每周发布一个开发版本,长期支持版每半年更新一次(ps:大版本更新).如此频繁的更新,怎么升级呢? war:下载新版的war文件,替换旧版本war文件 ...

  9. Python生成器是什么

    生成器是 Python 初级开发者最难理解的概念之一,虽被认为是 Python 编程中的高级技能,但在各种项目中可以随处见到生成器的身影,你得去理解它.使用它.甚至爱上它. 提到生成器,总不可避免地要 ...

  10. python 自动获取(打印)代码中的变量的名字字串

    方法一: import inspectimport re def varname(p): for line in inspect.getframeinfo(inspect.currentframe() ...