linux中的正则表达式知识梳理
1. 正则表达式
1.1 正则表达式使用
正则表达式是开发者为了处理大量的字符串和文本而定义的一套规则和方法,使用正则表达式可以提高效率,快速获取想要的内容.
正则表达式常用于linux三剑客grep,sed,awk,用来处理文本数据,也适用于普通命令.
三剑客中使用正则表达式处理文本时,是以行为单位的.
1.2 基本的正则表达式及扩展的正则表达式
正则表达式及扩展的正则表达式及其含义,如下表:
######字符匹配(仅仅匹配单个字符) | |
. | 匹配任意单个字符(通配符的 ? 代表单个字符) |
[abc] | 匹配集合内任意单个字符 |
[^abc] | 匹配集合外的任意单个字符(非,正则表达式不支持!,!会被当做一个字符) |
.* | 匹配任意长度的任意字符,即匹配所有内容 |
######匹配次数(仅仅是次数,不是表示字符) | |
*t |
匹配t前一个字符任意次(连续出现多少次的意思,前面的字符可以没有, 匹配0次,即空,则匹配了所有内容) |
\?t | 匹配t前一个字符0次或1次(至多1次,前面的字符可有可无),反斜线是转义 |
\+t | 匹配t前面的字符至少1次(1次或多次),反斜线是转义 |
a\{m\}t | 匹配t前一个字符a,m次(具体的次数),反斜线是转义 |
a\{m,n\}t | 匹配t前一个字符a至少m次,至多n次,反斜线是转义 |
a\{0,n\}t | 匹配t前一个字符a至多n次,可以没有,0可以省略不写,反斜线是转义 |
a\{1,n\}t | 匹配t前一个字符a至少1次,至多n次,反斜线是转义 |
a\{m,\}t | 匹配t前一个字符a至少m次,多则不限制,反斜线是转义 |
######位置锚定 | |
^ | 行首锚定 |
$ | 行尾锚定 |
^PATTERN$ | 模式匹配整行(具体的字符串匹配整行) |
^$ | 匹配 空行 |
[[:space:]]*$ | 匹配多个以空白结尾(空白可以没有)的行 |
\< 或 \b | 词首锚定(单词模式的左侧,单词可以是字符串或者数字,不能是特殊符号) |
\> 或 \b | 词尾锚定(单词模式的右侧,单词可以是字符串或者数字,不能是特殊符号) |
\<PATTERN>\ | 匹配整个单词 |
######分组及引用 | |
\(\) |
将一个或者多个字符捆绑在一起,当做一个整体来处理,如\(xy\)*匹配前面 的xy任意次 |
\(ab\+\(xy\)*\) | \1: ab+\(xy\)* |
\2: xy |
1.3 重复1.2
###基本的正则表达式:
^ #<===用法 ^keyword,匹配以keyword开头的行
$ #<===用法 keyword$,匹配以keyword结尾的行
^$ #<===匹配空行
. #<===表示任意单个字符
\ #<===转义字符,还原字符原本的意思
* #<===匹配前一个字符0次或多次(前一个字符0次时,匹配所有内容)
.* #<===匹配所有内容
^.* #<===匹配以任意多个字符开头的内容
.*$ #<===匹配以任意多个字符结尾的内容
[abc] #<===匹配集合内任意单个字符
[^abc] #<===匹配集合外的任意单个字符
###扩展的正则表达式(使用egrep无需加\转义):
\+ #<===匹配前一个字符1次或1次以上(至少1次)
\[:/\]+ #<===匹配[]内:/(或其他特殊符号)的字符1次或1次以上(至少1次)
\? #<===匹配前一个字符0次或1次
| #<===同时过滤多个字符串,使用到的分隔符(在通配符中表示管道)
\(\) #<===括号中的内容被当做一个整体,可以被后面的 \n 引用(n为数字)
\n #<===引用 () 中的内容(n为数字)
a\{m,n\} #<===匹配前一个子符a至少m次,至多n次
a\{n,\} #<===匹配前一个字符a至少n次,多则不限
a\{n\} #<===匹配前一个字符n次
a\{,m\} #<===匹配前一个字符至多m次,可以没有
linux中的正则表达式知识梳理的更多相关文章
- Linux运维基础入门(四):Linux中的网络知识04
一,虚拟机的安装 略 二,Linux系统下的网络配置(Linux虚拟机的网络设定为桥接模式) 桥接模式:虚拟机同主机一样,在网络中相当于一个真实存在的装有Linux系统的电脑.(我们先用这个模式) N ...
- linux中的调试知识---基础gdb和strace查看系统调用信息,top性能分析,ps进程查看,内存分析工具
1 调试一般分为两种,可以通过在程序中插入打印语句.有点能够显示程序的动态过程,比较容易的检查出源程序中的有关信息.缺点就是效率比较低了,而且需要输入大量无关的数据. 2 借助相关的调试工具. 3 有 ...
- Linux中的正则表达式
* 前一个字符匹配0次或任意次. 匹配除了换行符外任意一个字符^ 匹配行首$ 匹配行尾[] ...
- linux中inode、软链接、硬链接
1 软链接 linux中软链接理解成window中的快捷方式.创建软链接的命令 ln -s 源文文件或目录 目标文件或目录 2 硬链接 创建硬链接的命令如下 ln 源文文件或目录 目标文件或目录 3 ...
- linux系统下的权限知识梳理
下面对linux系统下的有关权限操作命令进行了梳理总结,并配合简单实例进行说明.linux中除了常见的读(r).写(w).执行(x)权限以外,还有其他的一些特殊或隐藏权限,熟练掌握这些权限知识的使用, ...
- Linux基础知识梳理
Linux基础知识梳理 Linux内核最初只是由芬兰人林纳斯?托瓦兹(Linus Torvalds)在赫尔辛基大学上学时出于个人爱好而编写的.Linux是一套免费使用和自由传播的类Unix操作系统,是 ...
- Linux实战教学笔记19:Linux相关网络知识梳理
第十九节 Linux相关网络知识梳理 标签(空格分隔): Linux实战教学笔记-陈思齐 一,前言 一个运维有时也要和网络打交道,所以具备最基本的网络知识,对一个运维人员来说是必要的.但,对于我们的工 ...
- linux中的通配符与正则表达式
在linux中,有通配符及正则表达式,那么什么是通配符和正则表达式,什么时候用? 通配符 它是由shell解析,并且一般用于匹配文件名,实际上就是shell解释器去解析的特殊符号,linux系统通 ...
- My way on Linux - 知识梳理计划
知识梳理计划图 近期计划把自己学习的工作中用到的Linux知识梳理下,敬请期待.
随机推荐
- dp - 递推
C. Multiplicity time limit per test 3 seconds memory limit per test 256 megabytes input standard inp ...
- dfs 序 欧拉序
推荐博客 :https://www.cnblogs.com/stxy-ferryman/p/7741970.html DFS序其实就是一棵树顺次访问的结点的顺序,例如下面这棵树 它的 dfs 序就是 ...
- BFT-SMaRt:用Netty做客户端的可靠信道
目录 一.Netty服务端的构建 1. 父类构造函数 ① 查找缓存 ② 相关日志 2. 服务端构造 ① 配置读取 ② 服务端配置 3. 服务端功能 ① 通用接口功能 ② Channel处理器 4. 节 ...
- 20190925Java课堂记录(二)
1. testrandom public class test2{ public static void main(String[] args) { int[] n=new int [1001]; n ...
- path_info和get_full_path()的区别
1.get_full_path() 获取的url路径包含参数 2.path_info 获取的路径不包含参数 注意:获取的路径都不包含协议 IP 和端口 3.补充 sesssion http://127 ...
- [apue] 使用 Ctrl+S停止输出而不用挂起前台进程
之前一直知道使用 Ctrl+Z 挂起前台进程来阻止进程运行,之后可以再通过 shell 的作业控制 (jobs / fg N) 来将后台进程切换为前台,从而继续运行. 最近学到一种新的方法,对于不停有 ...
- python接口自动化测试 - openpyxl基本使用
前言 当你做接口自动化测试时,测试用例逐渐变多情况下,如果所有测试用例都通过代码管理将会使得代码十分臃肿,而且维护成本会很高: 所以我们一般会通过Excel去管理所有的测试用例,而openpyxl库提 ...
- 基于 Lind.DDD 的 权限管理系统
先起个头,在跟吧 表结构 12个表 ps: sxiaomais.blog.163.com/blog/static/31741203200811102630406/ 需要数据库 文件的 附件 权限 ...
- Java中的Swap,如何实现?
程序员都知道,在C/C++里面交换值的方法: void swap(int &a,int &b) { int temp; temp=a; a=b; b=temp; } 但是在Java中这 ...
- Thumb.db看不到的问题
今天读取数据集的时候总是会读到一个Thumb.db的缩略图文件,点开查看选项里面的显示隐藏文件.文件夹处于勾选状态,此时文件夹中并不存在此文件. 解决方案: 勾选掉隐藏受保护的操作系统文件即可.