《linux 文本处理》- sed/awk
一:sed 行文本处理
- 基本概念
- sed 用于处理单行文本
- sed 命令本身不会修改源文件,只是处理文件"流"的内容。
- 如果需要修改源文件,请使用 -i 或者 重定向 文件。
- 使用场景
- 文件过大,编辑困难
- 有规律的修改大部分内容
- 修改
基本语法 sed [operation] file
- s 查找替换
sed -e ’s/待修改内容/修改内容/g' demo.txt g 代表全局替换,如果不使用 g ,则只会修改第一个发现的e 代表简单输出文件,如果需要修改源文件,请使用 -i
- s 查找替换
- y 字符转换
sed -e 'y/待修改字符/修改字符/' demo.txt e 代表简单输出文件,如果需要修改源文件,请使用 -i 注意: 转换字符长度要和被转换长度相同 例如: sed -i 'y/56/xf/' demo.txt 5 转换 x, 6 转换 f
- y 字符转换
- 删除
基本语法 sed -i '行' 文件
示例 删除 第一行 sed -i '1d' demo.txt 删除 第一行至第三行 sed -i ‘,3d’ demo.txt
- 插入
基本语法 sed -I ‘行 位置 内容' 文件
示例: demo.txt 文件的 第二行之前插入一行,内容为 insert sed -i '2 i insert' demo.txt i 表示匹配行之前插入,a 匹配行之后插入
二:awk 列文本处理
- 简介
- awk 列文本处理
- 原理是将文本读出,进行域的切分,所以在 awk 中,文本是有域的概念的
- 输出指定 域 的内容
- 先看一条 nginx 日志
/Oct/::: +] 123.124.16.83 192.168.240.255
- 在 awk 中,默认是以 空格 来进行 域 的切分的,
- 先看一条 nginx 日志
按照切分逻辑 $ 123.124.16.83 $ - $ - $ [/Oct/::: .... SO $ 状态码
- 所以,按照域的切分规则,输出对应的内容
打印对应的 $awk {print $}' access_log 123.124.16.83
- 所以,按照域的切分规则,输出对应的内容
- 指定域的分隔符
- 当然,我们也可以使用 -F 来指定域的分割符,来进行域的切分
awk -F 'HTTP' '{print $1}' access_log
123.124.16.83 - - [10/Oct/2018:10:24:56 +0800] "GET /static/favicon.ico
- 确定域个数
- 在上面的文本中,可能有多个域,可用通过 NF 变量来确定域的个数
awk '{print NF}' access_log
- 打印固定域
- 通过打印 NF 的值,来确定对应域的值
打印最后一个域的值 awk '{print $NF}' access_log 打印倒数第二个域的值 awk '{print $(NF - 1)}' access_log
《linux 文本处理》- sed/awk的更多相关文章
- Sed&awk笔记之sed篇
http://blog.csdn.net/a81895898/article/details/8482387 Sed是什么 <sed and awk>一书中(1.2 A Stream Ed ...
- linux sed awk seq 正则使用 截取字符 之技巧
[root@room9pc01 ~]# seq 5 1 2 3 4 5 [root@room9pc01 ~]# seq 2 5 2 3 4 5 seq 1 2 10 1 3 5 7 9 [root@d ...
- 1.Sed | Awk | Grep | Find
1.Sed | Awk | Grep | Find 可以参考的文档链接 CentOS7 查看 当前机器 已经启动的端口的Shell命令: netstat -lntup | awk -F' ' {'pr ...
- Sed&awk笔记之sed篇(转)
Sed是什么 <sed and awk>一书中(1.2 A Stream Editor)是这样解释的: Sed is a "non-interactive" strea ...
- [svc]linux正则实战(grep/sed/awk)
企业实战: 过滤ip 过滤出第二行的 192.168.2.11. eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 ine ...
- linux三剑客grep|sed|awk实践
最好先学习正则表达式的基本用法,以及正则表达式BREs,EREs,PREs的区别 此坑待填 grep sed awk
- Linux三剑客grep/sed/awk
grep/sed/awk被称为linux的“三剑客” grep更适合单纯的查找或匹配文本: sed更适合编辑匹配到的文本: awk更适合格式化文本,对文本进行较复杂各式处理: Grep --color ...
- 【转帖】vim/sed/awk/grep等文件批处理总结
vim/sed/awk/grep等文件批处理总结 https://www.cnblogs.com/cangqiongbingchen/p/9760544.html Vim相关操作 1.基础 * 和 # ...
- sed & awk 概述
概述 一般情况下,从grep到sed和awk的学习过程是很自然的.sed和awk是一般用户.程序员和系统管理员们处理文本文件的有力工具. sed的名字来源于其功能,它是个字符流编辑器(stream e ...
- sed awk grep三剑客常用
sed的常用用法: awk的常用用法: grep的常用用法: 除了列出符合行之外,并且列出后10行. grep -A 10 Exception kzfinance-front.log 除了列出符合行之 ...
随机推荐
- java框架篇---hibernate之缓存机制
一.why(为什么要用Hibernate缓存?) Hibernate是一个持久层框架,经常访问物理数据库. 为了降低应用程序对物理数据源访问的频次,从而提高应用程序的运行性能. 缓存内的数据是对物理数 ...
- 【GMT43液晶显示模块】发布原理图、出厂代码
GMT43是一款内置4.3寸真彩液晶显示模块,其内置高速ARM Cortex-M4处 理器,主频高达180MHz,并包含丰富的外设接口. GMT43拥有丰富的资源,包含RS-232,RS-485,RS ...
- centos 7 配置tomcat开机启动
1. tomcat 需要增加一个pid文件 在tomca/bin 目录下面,增加 setenv.sh 配置,catalina.sh启动的时候会调用,同时配置java内存参数. #add tomcat ...
- InstallShield:卸载时文字叠加,文字乱码
问题: InstallShield2010打包的程序.如果程序正在运行,卸载程序,提示关闭程序,然后消息界面出现文字叠加. 定位问题: 新建Installshield项目,依次修改SetupType, ...
- Android——RecycleView
RecycleView设置点击事件 http://blog.csdn.net/guxiao1201/article/details/40423361
- composer 再centos 下的安装
$ curl -sS https://getcomposer.org/installer | php $ sudo mv composer.phar /usr/local/bin/composer
- 解决java.sql.SQLException: The server time zone value 'Öйú±ê׼ʱ¼ä' is unrecognized or represents more than one time zone
使用spring boot整合MySQL时一直报 java.sql.SQLException: The server time zone value 'Öйú±ê׼ʱ¼ä' is unrecog ...
- [Laravel] 14 - REST API: Laravel from scratch
前言 一.基础 Ref: Build a REST API with Laravel API resources Goto: [Node.js] 08 - Web Server and REST AP ...
- PHP_CodeSniffer HG 服务端部署篇
环境:CentOs 6.7 语言:PHP5.4 PHP_CodeSniffer: https://github.com/phpdragon/PHP_CodeSniffer 本地代码检测请查看该文章:h ...
- 4G 通信模块在ARM 平台下的应用
收藏 评论(0) 分享到 微博 QQ 微信 LinkedIn 4G模块是连接物与物的重要载体,是终端设备接入物联网的核心部件之一,随着4G的普及,许多新兴市场对4G通信模块的需求都在日益扩大,那么在A ...