Linux基础篇,正则表达式
一、正则表达式特殊符号:
二、grep的用法
grep [-A|B|a|c|i|n|v] [--color=auto] '搜索字串' filename
-A ===> after缩写,后面接数字,除了列出该列外,还列出后续的n列
-B ===> before缩写,后面接数字,除了列出该列外,还列出前面的n列
-a ===> 将二进制binary文件以text文件的方式查找数据
-c ===> 记录找到字符串的次数
-i ===> 忽略大小写
-n ===> 输出行号
-v ===> 反向选择
--color-auto ===> 将找到的关键字用特殊颜色标注
1.普通用法
eg:
2.grep配合正则表达式用法
(1)将nginx文件中所有包含大写字符的行列出来,并标明行号
3.常见符号的用法
[] ===> 集合字符
- ===> 大小写字母和数字范围
^ ===> 指定字符出现在行首 | 取反
=======================================注释========================================
注意:这里的 ^ 可能代表行首也可能代表取反,[]代表集合符号
若为 ^[*] 则代表行首,即在括号 [] 之外代表行首。
若为 [^*] 则代表取反,即在括号 [] 之内代表取反。
==================================================================================
$ ===> 指定字符出现在行尾
. ===> 任意字符
* ===> 重复字符
=======================================注释========================================
注意:*?代表还有任意多个?字符的意思,即包含0个的可能,因此若至少要求含有两个a,则必须写成这样 : aaa*
===================================================================================
{} ===> 限定重复字符
=======================================注释========================================
?{x} 代表还有连续5个或5个以上?字符
?{x,y} 代表含有x到y个?字符
在shell里{和}是有特殊含义的,因此需要加转义字符 \
===================================================================================
(1)查找成绩单中是5的倍数的成绩
(2)将0-60的成绩输出(假设没有满分的)
(3)将成绩中不含3的成绩输出
(4)将mark文件中的空白行显示出来
grep -n '^$' mark.txt
注意 ^为行首 $为行尾,仅有行首和行尾的行即为空白行
(5)将profile文件除了注释行都显示出来
grep '^[^#]' /etc/profile
注意:
第一个^是行首,第二个^是取反。
综合意思就是行首不是#的数据,即非注释数据
(6)查找含有 b..h 的行,.其中 . 代表任意字符,但是一个 . 仅占用一个字符)
(7)将成绩中含有1的成绩都输出来
(8)将mark文件中还有2-5个重复字符'5'的行输出来
grep '[^5]5\{2,5\}[^5]' mark.txt
注意:
最前和最后的[^5]代表要查找的含有2-5个'5'的字符串前后不再是'5'
三、sed用法
sed [-nefr] 动作
-n ===> 安静模式,仅将经过sed特殊处理的那一行或者动作才列出来
-e ===> 直接在命令行进行sed的动作编辑
-f ===> 接文件,直接将sed的动作写在文件内
-r ===> sed的动作支持的是延伸型正则表达式(默认支持普通型正则表达式)
-i ===> 直接修改读取的文件内容,而不是由屏幕输出
动作:
[n1] | [n1,n2]function
a ===> 新增,后接的字符串会在当前行的下一行出现
c ===> 取代,后接的字符串会取代n1或n1-n2的内容
s ===> 取代,直接进行取代,通常搭配正则表达式
d ===> 删除
i ===> 插入,后接的字符串会在当前行的上一行出现
p ===> 打印输出,经常配合 -n
实战演练:
1.查看mark文件当前内容
2.在第10行后新增'lanyue'字符串并输出
'
3.删除第十一行的内容并输出
4.将mark第6行替换为666666输出,但是不改变源文件
5.将本机的IP地址输出(注意:这里是重点,代表着sed可以以行为单位进行处理)
(1)先来查看一下数据原始格式
(2)我们需要的仅仅是IP,所以首先要先将行过滤出来,然后再去头去尾
ifconfig | grep 'broadcast' | sed 's/.*inet//g' | sed 's/netmask.*//g'
注意:
grep 'broadcast' 为过滤出包含IP地址的行来
sed 's/.*inet//g' 为去头
sed 's/netmask.*//g' 为去尾
四、扩展正则表达式
基础的正则表达式已经足够使用了,这里可以先稍作了解就行
五、awk
相比较于sed处理整行的用法,awk更倾向于处理某行字段。
awk '条件类型1{动作1} 条件类型2{动作2} ...... 条件类型n{动作n}' filename
注意:
awk会将一行的数据分成指定段,每段都是一个变量从$1开始到$n。整行数据的变量用$0表示
内置变量:
逻辑运算符:
注意:
所有的awk动作,即在{}里面内的动作,如果需要多条命令辅助时,可以通过 ; (封号)或者 Enter(回车)来隔开每个指令
实例:列出当前系统所有的账号名称,并且将UID和GID输出
cat /etc/passwd | awk 'FS=":"{print $1 "\t" $3"\t" $4}'
注意:
passwd中,每个字段以:隔开,所以为了分出每个变量需要使用FS=":"条件表达式
Linux基础篇,正则表达式的更多相关文章
- Linux随笔-鸟哥Linux基础篇学习总结(全)
Linux随笔-鸟哥Linux基础篇学习总结(全) 修改Linux系统语系:LANG-en_US,如果我们想让系统默认的语系变成英文的话我们可以修改系统配置文件:/etc/sysconfig/i18n ...
- 第一天 Linux基础篇
课程介绍 1.认识Linux的不同版本 2.以及应用领域 3.文件和目录 4.Linux命令概述 5.Linux命令-文件 6.Linux命令-系统管理-磁盘管理 认识Linux 什么是操作系统 生 ...
- (大数据工程师学习路径)第一步 Linux 基础入门----正则表达式基础
介绍 虽然我们这一节的标题是正则表达式,但实际这一节只是介绍grep,sed,awk这三个命令,而正则表达式作为这三个命令的一种使用方式(命令输出中可以包含正则表达式).正则表达式本身的内容很多,要把 ...
- java基础篇---正则表达式
正则表达式在许多语言,例如Perl.PHP.Python.JavaScript和JScript,都支持用正则表达式处理文本,一些文本编辑器用正则表达式实现高级“搜索-替换”功能. 正则表达式是一种可以 ...
- Linux基础篇–shell脚本编程基础
本章内容概要 编程基础 脚本基本格式 变量 运算 条件测试 配置用户环境 7.1 编程基础程序:指令+数据程序编程风格: 过程式:以指令为中心,数据服务于指令 对象式:以数据为中心 ...
- Linux基础之-正则表达式(grep,sed,awk)
一. 正则表达式 正则表达式,又称规则表达式.(英语:Regular Expression,在代码中常简写为regex.regexp或RE),计算机科学的一个概念.正则表达式是对字符串操作的一种逻辑公 ...
- C#基础篇 - 正则表达式入门
1.基本概念 正则表达式(Regular Expression)就是用事先定义好的一些特定字符(元字符)或普通字符.及这些字符的组合,组成一个“规则字符串”,这个“规则字符串”用来判断我们给定的字符串 ...
- Linux基础篇
Linux入门 2.1 Linux介绍 1)Linux是一款操作系统,特点:免费.开源.安全.高效.稳定.处理高并发非常强悍,半年至一年重启一次机即可,比Windows强悍,现在很多企业级项目都部署到 ...
- linux基础之正则表达式
一.基本正则表达式 字符匹配 . : 匹配任意单个字符 [] : 匹配中括号中的任意单个字符 [^] : 匹配指定范围外的任意单个字符 空白字符:[:space:].数字:[:digit:].小写字母 ...
随机推荐
- 一键配置openstack-cata版的在线yum源
下面脚本可以直接复制来配置openstack-ocata版的yum源: echo "nameserver 8.8.8.8 nameserver 119.29.29.29 nameserver ...
- Java设计模式学习笔记三
工厂模式 简单工厂模式(不属于23种设计模式之一) 属于创建型模式,是工厂模式的一种.简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例.简单工厂模式是工厂模式家族中最简单实用的模式: 简单工厂 ...
- (转)协议森林10 魔鬼细节 (TCP滑窗管理)
协议森林10 魔鬼细节 (TCP滑窗管理) 作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! 在TCP协议与"流" ...
- 【Linux】linux系统管理---好用的一些开源工具
目录 linux系统管理---好用的一些开源工具 htop dstat Glances iftop nethogs iotop linux系统管理---好用的一些开源工具 htop htop是一款运行 ...
- Mybatis---在控制台打印sql语句
在mybatis主配置文件中mybatis.xml的<configuration>标签中加入 <settings> <setting name="logImpl ...
- 后端开发使用pycharm的技巧
后端开发使用pycharm的技巧 目录 后端开发使用pycharm的技巧 1.使用说明 2.database 3.HTTP Client 1.使用说明 首先说明,本文所使用的功能为pycharm专业版 ...
- 《吐血整理》Redis 性能优化的 13 条军规!史上最全
Redis 是基于单线程模型实现的,也就是 Redis 是使用一个线程来处理所有的客户端请求的,尽管 Redis 使用了非阻塞式 IO,并且对各种命令都做了优化(大部分命令操作时间复杂度都是 O(1) ...
- java后台调用文件上传接口
借鉴:https://blog.csdn.net/yjclsx/article/details/70675057 /** * 调用流程上传文件接口上传文件 * @param url * @param ...
- 知识图谱里的知识存储:neo4j的介绍和使用
一般情况下,我们使用数据库查找事物间的联系的时候,只需要短程关系的查询(两层以内的关联).当需要进行更长程的,更广范围的关系查询时,就需要图数据库的功能. 而随着社交.电商.金融.零售.物联网等行 ...
- PHP一致性hash
PHP提供了两种比较两个变量的方法: 松散比较使用 == or != : 两个变量都具有“相同的值”. 严格比较 === or !== : 两个变量都具有“相同的类型和相同的值”. 类型杂耍 真实陈述 ...