目录:

   Ⅰ:正则表达式

   Ⅱ:作业

Ⅰ:正则表达式

正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。

在linux中,通配符是由shell解释的,而正则表达式则是由命令解释的,三种文本处理工具/命令:grep、sed、awk

正则介绍:^ 以什么开头(同一行)
         $
以什么结尾(同一行)

         . 除了换行符以外的任意单个字符

         * 紧挨的左边的第一个字符出现零个到无穷个

         + 紧挨的左边的第一个字符出现1个到无穷个

? 紧挨的左边的第一个字符出现0次到1次

        .* 所有字符

{n}左边的左边的那一个字符出现n次的

{2,4}左边的那一个字符出现2到4个的(表示范围的),例如:2 3 4

{2,}左边的那一个字符出现2到无穷个的(表示范围的),例如:2 3 4 5..........到无穷

        [] 字符组内的任一字符

        [^] 对字符组内的每个字符取反(不匹配字符组内的每个字符)

       ^[^] 非字符组内的字符开头的行

       [a-z] a到z的所有小写字母   例如:a  b  c.....z

       [A-Z] A到Z的所有大写字母  例如:A  B  C .....  Z

       [a-Z] a到Z的所有小写和大写字母  例如:a A  b  B   ........z  Z

       [0-9] 数字0到9    例如:0 1 2 ....9

       \< 单词头 单词一般以空格或特殊字符做分隔,连续的字符串被当做单词

       \> 单词尾

grep种类:grep      fgrep      pgrep     egrep  

-n  :显示行号

-o  :只显示匹配的内容

-q  :静默模式,没有任何输出,得用$?来判断执行成功没有,即有没有过滤到想要的内容

-l  :如果匹配成功,则只将文件名打印出来,失败则不打印,通常-rl一起用,grep -rl 'root' /etc

-A  :如果匹配成功,则将匹配行及其后n行一起打印出来

-B  :如果匹配成功,则将匹配行及其前n行一起打印出来

-C  :如果匹配成功,则将匹配行及其前后n行一起打印出来

--color

-c  :如果匹配成功,则将匹配到的行数打印出来

-E  :等于egrep,扩展

-i  :忽略大小写

-v  :取反,不匹配

-w:匹配单词

-rl :递归寻找并显示文件名

sed:流编辑器 stream editer,是以行为单位的处理程序
         a 后插

c 替换

i 前插

d 删除

p 打印匹配的行 一般和 -n 参数连用,以屏蔽默认输出

r 从文件中读入

w 写入到文件中作业二:grep作业(正则表达式及字符处理)

! 命令取反

{} 命令组合 命令用分号分隔 {1h;G} 可以理解为 -e 参数的另一种写法

= 打印行号(输入行的号码,而非处理的次数行号)

n 读入下一行到模式空间

N 而是追加下一行到模式空间,再把当前行和下一行同时应用后面的命令

s 字符串替换

awk

      -F 可以定义指定分隔符:(冒号)

-v 定义变量并赋值 也可以借用次方式从shell变量中引入

NF表示当前以分隔符(:)为分隔单位的行有几段内容

NR 表示行号

FNR表示读入行所在文件中的行数

-v 定义变量并赋值

== 判断;>=大于等于;<=小于等于;!=  非;>大于;<小于; ~ 使用正则定位 ; !~正则取反

&&且

||或

      |sort  |uniq        配续去重(排列顺序再去除重读的)

du -sh     统计文件大小

find / -size +30M 找出大于30M的文件
       find / -size +10M -size -30M 找出大于10M小于30M的文件

Ⅱ:作业

作业一:grep作业(正则表达式及字符处理)

目标文件/etc/passwd,使用grep命令或egrep
1.显示出所有含有root的行:

grep 'root' /etc/passwd

2.输出任何包含bash的所有行,还要输出紧接着这行的上下各两行的内容:

grep `bash` -C 2 /etc/passwd

3. 显示出有多少行含有nologin。

grep -c 'nologin' /etc/passwd

4.显示出那些行含有root,并将行号一块输出。

grep -n 'nologin' /etc/passwd

5.显示出文件中

grep -l 'root' /etc/passwd

6.新建用户
abominable
abominate
anomie
atomize
编写正则表达式,将他们匹配出来

egrep 'a.omi(nabl|nat|z|)e' /etc/passwd

7.建四个用户
Alex213sb
Wpq2222b
yH438PIG
egon666
egon

过滤出用户名组成是字母+数字+字母的行

egrep '^[a-Z]+[0-9]+[a-Z]+' /etc/passwd

8.显示出/etc目录下所有包含root的文件名

grep -w 'root' /etc

9. 过滤掉/etc/ssh/sshd_config内所有注释和所有空行

grep -v '^#' /etc/ssh/sshd_config |grep -v '^ *$'

作业二:Sed作业:以/etc/passwd文件为模板

1,删除文件每行的第一个字符。

 sed -r 's/^(.)(.*)/\2/' /etc/passwd

2,删除文件每行的第二个字符。

 sed -r 's/^(.)(.)(.*)/\1\3/' /etc/passwd

3,删除文件每行的最后一个字符。

 sed -r 's/(.*)(.)$/\1/' /etc/passwd

4,删除文件每行的倒数第二个字符。

 sed -r 's/(.*)(.)(.)$/\1\3/' /etc/passwd

5,删除文件每行的第二个单词。

 sed -r 's/^([a-Z]+)([^a-Z]+)([a-Z]+)([^a-Z]+)/\1\2\4/' /etc/passwd

6,删除文件每行的倒数第二个单词。

 sed -r 's/([^a-Z]+)([a-Z]+)([^a-Z]+)([a-Z]+)$/\1\3\4/' /etc/passwd

7,删除文件每行的最后一个单词。

 sed -r 's/([^a-Z]+)([a-Z]+)([^a-Z]+)([a-Z]+)$/\1\2\3/' /etc/passwd

8,交换每行的第一个字符和第二个字符。

 sed -r 's/^(.)(.*)(.)$/\3\2\1/' /etc/passwd

9,交换每行的第一个字符和第二个单词。

 sed -r 's/^(.)([a-Z]+)([^a-Z]+)([a-Z]+)([^a-Z]+)/\4\2\3\1\5/' /etc/passwd

10,交换每行的第一个单词和最后一个单词。

  sed -r 's/^([a-Z]+)([^a-Z]+)(.*)([^a-Z]+)([a-Z]+)$/\5\2\3\4\1/' /etc/passwd

11,删除一个文件中所有的数字。

  sed -r 's/[0-9]//g' /etc/passwd

12,删除每行开头的所有空格。

  sed -r 's/^ *//g' /etc/passwd

13,用制表符替换文件中出现的所有空格。

  sed -r 's/ /\t/g' /etc/passwd

14,把所有大写字母用括号()括起来。

  sed -r 's/[A-Z]/(&)/g' /etc/passwd

15,打印每行3次。

  sed 'p;p' /etc/passwd

16,只显示每行的第一个单词。

  sed -r 's/^([a-Z]+)([^a-Z]+)(.*)/\1/' /etc/passwd

17,打印每行的第一个单词和第三个单词。

  sed -r 's/^([a-Z]+)([^a-Z]+)([a-Z]+)([^a-Z]+)([a-Z]+)([^a-Z]+)/\5\2\3\4\1\6/' /etc/passwd

18,用命令获取格式为 mm/yy/dd 的日期格式,结合管道,将其换成 mm;yy;dd格式

date | sed -r ' s/ /; /g'

作业三:awk文本处理

1)打印uid在0~40范围内的用户名

awk -F: '$3>0 && $3<40{print $1,$3}' passwd

2)打印第5-10行的行号和用户名

awk -F: 'NR>=5 && NR<=10{print NR $1}' passwd

3)打印奇数行

awk '(NR%2){print $0}' passwd

4)打印偶数行

awk '!(NR%2){print $0}' passwd

5)打印字段数大于5的行

awk -F: '(NF>3){print $0}' passwd

6)打印UID不等于GID的用户名

awk -F: '($3 != $4){print $0}' passwd

7)打印没有指定shell的用户

awk -F: '($NF != "/bin/bash"){print $0}' passwd

Linux基础-正则表达式整理---------------grep、sed、awk的更多相关文章

  1. Linux 正则表达式 vi, grep, sed, awk

          1. vi 表示内容的元字符 模式 含义 . 匹配任意字符 [abc] 匹配方括号中的任意一个字符.可以使用-表示字符范围,如[a-z0-9]匹配小写字母和阿拉伯数字. [^abc] 在方 ...

  2. Linux三剑客grep/sed/awk

    grep/sed/awk被称为linux的“三剑客” grep更适合单纯的查找或匹配文本: sed更适合编辑匹配到的文本: awk更适合格式化文本,对文本进行较复杂各式处理: Grep --color ...

  3. linux三剑客grep|sed|awk实践

    最好先学习正则表达式的基本用法,以及正则表达式BREs,EREs,PREs的区别 此坑待填 grep sed awk

  4. Linux基础命令-Nginx-正则表达式( grep sed awk )-Shell Script--etc

    Linux基础使用 学习内容博客 内存 查看swap分区信息 > swapon -s 添加swap分区 > mkswap /dev/sdb2 > 激活 swapon -a /dev/ ...

  5. Linux基础正则表达式:grep,sed

    先说明语系对正则表达式的影响    LANG=C:0,1,2,3,4...A,B,C,D...Z a b c d ... z    LANG=zh_CN:0,1,2,3,4...a A b B c C ...

  6. linux 三大利器 grep sed awk 正则表达式

    正则表达式目标 正则表达式单字符: 特定字符 范围字符:单个字符[ ] :代表查找单个字符,括号内为字符范围 数字字符:[0-9],[259] 查找 0~9 和 2.5 .9 中的任意一个字符 小写字 ...

  7. 【Linux】 字符串和文本处理工具 grep & sed & awk

    Linux字符串&文本处理工具 因为用linux的时候主要用到的还是字符交互界面,所以对字符串的处理变得十分重要.这篇介绍三个常用的字符串处理工具,包括grep,sed和awk ■ grep ...

  8. [svc]linux正则实战(grep/sed/awk)

    企业实战: 过滤ip 过滤出第二行的 192.168.2.11. eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 ine ...

  9. 5_find grep sed awk 详解

    find :查找文件系统中指定的文件.可以按文件名(-name)  权限(-perm) 归属人 查找. find   要查找文件的路径   表达式 *通配符  可以添加在文件名的任意位置 常用的例子( ...

随机推荐

  1. idea scala 报 with UTF-8 Please try specifying another one using the -encoding option

    现象如下图, 代码里有汉字,执行代码报错,说编码格式不对, 修改方式如上面,将右下角的编码格式修改成 u8即可.

  2. mongo复杂操作

    相比关系型数据库, Array [1,2,3,4,5] 和 Object { 'name':'DragonFire' } 是MongoDB 比较特殊的类型了 特殊在哪里呢?在他们的操作上又有什么需要注 ...

  3. Centos安装Python3(自带pip和setuptools)

    安装zlib相关依赖 解决zipimport.ZipImportError: can't decompress data和pip3 ssl证书问题 sudo yum -y install zlib* ...

  4. cinder的组件

    跟nova相似,cinder也有很多组件,每个组件负责各自的业务,然后共同协作完成volume的管理.组件之间的通信方式与nova个组件之间的通信方式相同,都是通过消息队列进行通信. cinder-a ...

  5. leetcode个人题解——#36 valid Sudoku

    思路题目里已经给出来了,判断是否是一个有效数独,只需满足以下三个条件: 1.同行元素不重复且1-9都有: 2.同列元素不重复且1-9都有: 3.每个粗线分隔的3*3的小九宫格元素不重复且1-9都有. ...

  6. JDBC及DBUtils

    1.JDBC2.DBUtils ###01JDBC概念和数据库驱动程序 * A: JDBC概念和数据库驱动程序 * a: JDBC概述 * JDBC(Java Data Base Connectivi ...

  7. Python基础知识-06-集合内存布尔False

    python其他知识目录 1.判断一个字符串中是否有敏感字符? #str: m_str="我叫魔降风云变" if "魔" in m_str: #判断指定字符是否 ...

  8. Mininet介绍及安装

    什么是Mininet Mininet是由一些虚拟的终端节点(end-hosts).交换机.路由器连接而成的一个网络仿真器,它采用轻量级的虚拟化技术使得系统可以和真实网络相媲美. Mininet可以很方 ...

  9. 模拟登入教务处(header)

    import HTMLParser import urlparse import urllib import urllib2 import cookielib import string import ...

  10. lintcode-439-线段树的构造 II

    439-线段树的构造 II 线段树是一棵二叉树,他的每个节点包含了两个额外的属性start和end用于表示该节点所代表的区间.start和end都是整数,并按照如下的方式赋值: 根节点的 start ...