几个常用的文本处理shell 命令:find、grep、sort、uniq、sed、awk
find 文件查找
查找txt和pdf文件
- find . \( -name "*.txt" -o -name "*.pdf" \) -print
查找所有字母开头的文件
- find . -name "[a-a]*"
否定参数->查找所有非txt文本
- find . ! -name "*.txt" -print
指定搜索深度->打印出当前目录的文件(深度为1)
- find . -maxdepth 1 -type f
正则方式查找.txt和pdf
- find . -regex ".*\(\.txt|\.pdf\)$"
- -iregex: 忽略大小写的正则
查找目录下属性为755的文件
- find . -prem 755
查找所属主为root的文件
- find -user root
寻找大于2k的文件
- find . -type f -size +2k
找到文件后续动作
删除当前目录下所有的avi文件
- find . -type f -name "*.avi" -delete
执行动作(强大的exec)
- find . -type f -user root -exec chown root {} \; //将当前目录下的所有权变更为root
grep 文本搜索
在file文件中过滤掉字符串'str'所在的行
- grep -v "str" file
在file文件中查找时间在2017:22:50~2017:22:59所在的行
- grep -E "2017:22:5[0-9]" file
在file文件中查找不包括360的行
- grep -E "^[^360]" file
在file文件中查找包括w和t的行
- grep -E "w*t" file
在file文件中查找大于560小于893的行
- grep -E "[5-8][6-9][0-3]"
在file文件中查找包含两个9的行
- grep -E "9{2}" file
查找大于两个9的行
- grep -E "9{2,}" file
查找file文件中的空行
- grep -E "^$" file
查找包括?的行
- grep "?" file
查找文件中以w开头的行
- grep -E "^w" file
查找文件中不是以w开头的行
- grep -E "^[^w]" file
awk 数据流处理工具
查找出日志文件中的每一列
- awk '{print $0}' log.log
查找出文件中的第一列和第七列
- awk '{print %$1 "\t"$7}' log.log
~匹配192.168.10.2的ip地址统计。!~为不匹配
- cat file | awk '$0 !~ /192.168.10.2/' | grep 'php' |wc -|
sed 行定位
只打印第二行,不打印其它行的数据
- sed -n '2'p file
从第一行到第九行的记录
- sed -n '1,9'p file
打印匹配php的行
- sed -n '/php/p file
打印从第九行到匹配php的之间所有行
- sed -n '9,/php/'p file
把第一行和第二行全部删除(非文件删除)
- sed '1,2'd file
Uniq行定位的使用
打印紧挨的重复行出现的次数
- uniq -c file
只打印重复的行
- uniq -d file
把apache网站的所有访问ip统计出来,并打印统计次数
- awk '{print $1}' /var/log/httpd/access_log | sort | uniq -c
sort排序的使用
把文件喊字母的圣墟进行排序
- sort file
把文件按照字母的降序进行排序
- sort -r file
为进行分割后的第一列来排序
- cat file | sort -t: -k1 -r
几个常用的文本处理shell 命令:find、grep、sort、uniq、sed、awk的更多相关文章
- Linux管线命令 - cut,grep,sort,uniq,wc,tee,tr,col,join,paste,expand,split,xargs
在每个管线后面接的第一个数据必定是『命令』喔!而且这个命令必须要能够接受 standard input 的数据才行,这样的命令才可以是为『管线命令』,例如 less, more, head, tail ...
- Linux Bash命令杂记(cut sort uniq wc tee)
Linux Bash命令杂记(cut sort uniq wc tee) 数据流重定向 标准输入(stdin):代码为0,使用<或<<: 标准输出(stdout):代码为1,使用&g ...
- 【android】android 常用adb 和 adb shell 命令
db是SDK自带的工具,可实现桥接功能:adb shell 可以与手机系统建立交互,是基于andoid Linux系统下的操作 ADB常用命令: 1. 查看设备 adb device ...
- linux命令使用 cut/sort/uniq
我记得之前去XX网面试的那个面试题是这样的:有个apache.log 文件文本内容如下:======================[niewj@centSvr ~]$ cat apache.log ...
- 将常用的Android adb shell 命令行封装为C#静态函数
更多原创测试技术文章同步更新到微信公众号 :三国测,敬请扫码关注个人的微信号,感谢! 简介:adb命令是常用的Android命令行,自动化.代码调试.手工排查问题都会用的到,这里将常用的一些命令行封装 ...
- 自动化测试系列:将常用的Android adb shell 命令行封装为C#静态函数
更多原创测试技术文章同步更新到微信公众号 :三国测,敬请扫码关注个人的微信号,感谢! 简介:adb命令是常用的Android命令行,自动化.代码调试.手工排查问题都会用的到,这里将常用的一些命令行封装 ...
- 009--test命令和grep作业及Sed作业awk作业和循环结构
一.test命令 -d :目录 test -d /boot -s :文件长度 > 0.非空 test - ...
- 收集的55个Linux系统管理中常用的一些shell命令
.显示消耗内存/CPU最多的10个进程 代码如下: | tail | tail .查看进程 按内存从大到小排列 代码如下: ps -e -o "%C : %p : %z : %a" ...
- 精选37条强大的常用linux shell命令组合
任务 命令组合 1 删除0字节文件 find . -type f -size 0 -exec rm -rf {} \;find . type f ...
随机推荐
- 使用logrotate分割tomcat日志
转:https://www.52os.net/articles/using-logrotate-manage-tomcat-logs.html July 28, 2014 日志是Linux系统中最重要 ...
- discuz数据库相关表
discuz 数据表对照cdb_access 用户权限表 cdb_adminactions 管理动作表cdb_admingroups ...
- Tomcat对Struts中的Action进行授权利
.应用的意义 在某些应用下,如果Action类执行的功能比较重要,可以对该Action类进行授权利以实现只有特定角色的用户能够访问,此时可以在struts-config.xml文件中进行配置 2. ...
- 【转】 C++易混知识点4: 自己编写一个智能指针(Reference Counting)学习auto_ptr和reference counting
这篇文章建大的介绍了如何编写一个智能指针. 介绍: 什么是智能指针?答案想必大家都知道,智能指针的目的就是更好的管理好内存和动态分配的资源,智能指针是一个智能的指针,顾名思义,他可以帮助我们管理内存. ...
- 【转】高精度GPS测量中框架基准的统一
一.地面基准点的坐标基准转换 一般情况下,我们可以从IERS或IGS等机构获取最新的站坐标和速度场,这些站坐标和速度场是在某一特定基准框架和历元下的坐标值,若要提供高精度GPS网的分析使用,还需要作框 ...
- JavaSE基础篇—流程控制语句
本章知识点分析: 流程控制语句 1.定义:流程控制语句是用来控制程序中各语句执行顺序的语句,可以把语句组合成能完成一定功能的小逻辑模块.流程控 制方式采用结构化程序设计中规定的三种基本流程机构:顺序结 ...
- NOI2001 食物链
食物链 题目描述 动物王国中有三类动物 A,B,C,这三类动物的食物链构成了有趣的环形.A 吃 B,B 吃 C,C 吃 A. 现有 N 个动物,以 1 - N 编号.每个动物都是 A,B,C 中的一种 ...
- Java并发系列[4]----AbstractQueuedSynchronizer源码分析之条件队列
通过前面三篇的分析,我们深入了解了AbstractQueuedSynchronizer的内部结构和一些设计理念,知道了AbstractQueuedSynchronizer内部维护了一个同步状态和两个排 ...
- Win7系统下彻底删除无用服务的方法
win7系统下中有非常多的服务项,用户来满足不同行业用户间的所有需求,系统服务也是执行指定系统功能的程序,许多情况下我们想要运行软件或执行外接设备都无法离开系统服务,但并非所有系统服务都是我们用到的, ...
- 记录下直接在git里读取出差异并打包的代码
一行命令: git diff --name-only HEAD commit_id | xargs tar -zcvf diff_head.tar.gz 这里的HEAD可以理解为最新的版本 HEAD本 ...