Linux 下文本查找技巧你掌握了吗?
前言
之前介绍过很多linux下查找相关的命令,例如《Linux中的文件查找技巧》,《find命令高级用法》,《如何查看linux中文件打开情况-lsof命令》等等,而对文件内容搜索的命令似乎还没有涉及,因此本文介绍文本搜索命令--grep。
本文最新地址Linux grep命令实例详解
常见用法
我们会经常结合管道符(|)来使用它,即在前面命令执行的结果中查找包含相关字符串的内容。例如:
$ ps -ef|grep redis
ps -ef用于查看系统进程情况,但是它列出的结果很多,如果我们只想看到自己需要的,则通过管道符,用grep进行过滤搜索,例如搜索redis相关的进程,最后它只会列出和redis相关的进程了:
$ ps -ef|grep redis
root 10748 10733 0 21:14 pts/21 00:00:00 redis-server *:6379
root 10754 10733 0 21:14 pts/21 00:00:00 grep --color=auto redis
那么如果要排除某些不相关信息呢?我们可以使用-v参数
$ ps -ef|grep redis |grep -v auto
root 10748 10733 0 21:14 pts/21 00:00:00 redis-server *:6379
这样一来,包含auto相关的结果就不会出现在最终结果里了。
如果只想统计结果数量呢?我们可以结合-c(count)参数:
$ ps -ef|grep redis -c
2
文件内容搜索
好了,说完了最常见的用法,我们来看看如何搜索文件内容。实际上awk和sed在这方面也颇有经验,不过本文的主角是grep,所以另外两个命令暂时不涉及。我们来看几个实例。
在指定文件中查找指定关键字
例如,要在linux_command_debug.md文件中,查找test字符串:
$ grep "test" aaa/bbb/linux_command_debug.md
int test(int a,int b)
test(a,b);
如果想要显示指定关键字的行号,可以使用-n参数,例如:
$ grep -n "test" aaa/bbb/linux_command_debug.md
18:int test(int a,int b)
27: test(a,b);
搜索时指定或排除多个文件
前面提到了对一个文件内容进行搜索,如果是多个呢?或者不想从某些文件里搜索呢?
如果想对文件进行指定也是可以的,例如搜索所有的md结尾的文件:
$ grep -n "test" *.md
或者可以使用--exclude参数来排除某些文件,例如,查找包含test,但是排除txt文件:
$ grep -rn "test" --exclude=*.txt
搜索时就会忽略.txt结尾的文件了。
如果要排序的条件比较多,可以将要排除的条件存储在另外一个文件里:
$ grep -rn "test" --exclude-from=skip.txt
skip.txt的内容可以是模式匹配的文件名或者具体文件名:
*.txt
test.md
这样,以.txt结尾,以及test.md文件都不会搜索了。
除此之外,还可以排除或指定目录,它需要用到--exclude-dir参数:
$ grep -rn "test" --exclude-dir=aaa
它在搜索时将会跳过aaa目录下的文件。
查找包含指定关键字的文件
如果要在当前目录下所有文件查找包含“int main(void)”字符串的文件:
$ grep -rn "int main(void)"
aaa/bbb/c_main_func.md:49:int main(void)
aaa/bbb/c_main_func.md:71:int main(void) { /* ... */ }
aaa/bbb/c_array.md:104:int main(void)
aaa/bbb/c_array.md:129:int main(void)
aaa/bbb/pc-lint.md:42:int main(void)
aaa/bbb/pc-lint.md:128:int main(void)
这可能是最实用的使用方法之一了。这里-r参数表示递归查找当前目录的文件,-n会显示查找位置的行号,如果只想显示包含该指定关键字的文件名,可使用-l(--file-with-matches)参数:
$ grep -rln "int main(void)"
aaa/bbb/c_main_func.md
aaa/bbb/c_array.md
aaa/bbb/pc-lint.md
如果你尝试一下就会发现,如果不带-r参数,它会暂停,等待你从控制台输入,例如:
$ grep -n "test"
test
1:test
所以使用时记得带上相关参数奥!
查找不包含指定关键字的文件
前面提到了如何查找包含某个字符的文件,如果要找的是不包含该字符的文件呢?
实际上只要使用-L参数即可:
$ grep -rLn "int main(void)"
(这里会显示不包含指定关键字内容的文件名)
搜索时忽略大小写
使用-i(--ignore-case)参数即可:
$ grep -rni "int MAIN(void)"
aaa/bbb/c_main_func.md:49:int main(void)
aaa/bbb/c_main_func.md:71:int main(void) { /* ... */ }
aaa/bbb/c_array.md:104:int main(void)
aaa/bbb/c_array.md:129:int main(void)
aaa/bbb/pc-lint.md:42:int main(void)
aaa/bbb/pc-lint.md:128:int main(void)
搜索显示不包含指定关键字的行
前面的大部分例子都是显示符合条件的行,如果要显示不符合条件的行呢?可以用我们前面提到的-v参数:
$ grep -rnv "int main(void)"
(内容较多,未显示)
从结果中就会发现,它会展示出包含指定关键字的文件,但是展示的是不包含该字符串的行。
显示指定关键字前后内容
假如你需要查看包含指定关键字行附近的行,前面的方式是没有办法看到的,不过我们可以用-A(--after-context=)和-B(--before-context=)参数来显示前后的行:
$ grep -rn "int main(void)" -A 1 -B 1
aaa/bbb/c_array.md-103-}
aaa/bbb/c_array.md:104:int main(void)
aaa/bbb/c_array.md-105-{
(其他内容省略)
通过最后加上-A和-B参数,显示了指定关键字前面的行,这在日志搜索分析时非常有用。
指定规则文件进行搜索
如果有多个搜索关键字怎么处理呢?我们可以把关键字写在一个文件,搜索时指定文件即可,例如规则文件为key.txt:
int main(void)
test
从指定文件中搜索上面的关键字:
$ cat filename |grep -f key.txt
这样结果就会显示匹配key.txt文件中所有关键字的行,非常适合用于多个条件的搜索。
正则表达式搜索
看完前面的内容,是不是还没有感受到grep的强大,grep的另一个强大之处是,它的搜索支持正则表达式,例如查找文本行以t开头,以t结尾的文件:
$ grep -rn ^t.*t$
key.txt:2:test
aaa/bbb/c_operate_redis_start.md:68:typedef struct Stu_Info_Struct
aaa/bbb/c_operate_redis_start.md:101:typedef struct Stu_Info_Struct
其中^t,表明以t开头,t$表明以t结尾,如果需要使用扩展的正则表达式进行搜索,可使用egrep命令。关于正则表达式的写法,本文不做详细介绍。
总结
在内容搜索方面,grep常常能够助我们一臂之力,因此掌握grep的使用也是linux学习不可缺少的一部分,当然我们不需要完全记住每个参数的作用,但我们至少知道有这样的参数,并且在需要时能够快速查询到。本文常用参数如下:
- -v #显示不包含匹配关键字的所有行。
- -l #显示包含匹配关键字的文件
- -L #显示不包含匹配关键字的文件
- -r #递归搜索
- -i #忽略大小写
- -n #显示关键字所在行号
- -A n #显示关键字后n行
- -B n #显示关键字前n行
- --exclude #搜索时排除某些文件
- --exclude-dir #搜索时排除某些目录
- -f #指定规则文件进行搜索
本文最新地址Linux grep命令实例详解
微信公众号【编程珠玑】:专注但不限于分享计算机编程基础,Linux,C语言,C++,数据结构与算法,工具,资源等编程相关[原创]技术文章,号内包含大量经典电子书和视频学习资源。欢迎一起交流学习,一起修炼计算机“内功”,知其然,更知其所以然。
公众号编程珠玑
Linux 下文本查找技巧你掌握了吗?的更多相关文章
- Linux下的查找技巧
Find知识点: -mtime ——修改时间 -ctime ——创建时间 -atime ——访问时间 mtime 举例说明: -mtime n : n为数字,意思为在n天之前的“一天之内”被更改过内容 ...
- Linux下如何查找可执行文件
Linux下的可执行文件 Linux下如何查找可执行文件,作为一个Linux小菜刚刚有了这个问题, 在windows中,可以通过后缀名判断是否是可执行文件,比如.exe,.bat等是可执行文件,但是在 ...
- Linux下快速查找文件
1 locate 查找内容.查找数据库,updatedb命令更新数据库 2 which 命令 3 find 路径 -name 查找内容.find命令会磁盘查找,比较耗时. 4 grep 查找内容一般为 ...
- linux下如何查找nginx配置文件的位置
nginx的配置放在nginx.conf文件中,一般我们可以使用以下命令查看服务器中存在的nginx.conf文件. locate nginx.conf /usr/local/etc/nginx/ng ...
- [转帖]linux 下yum使用技巧
linux 下yum使用技巧 https://www.cnblogs.com/galengao/p/5750389.html 本文来自我的github pages博客http://galengao.g ...
- linux下find查找命令用法
Linux下find命令在目录结构中搜索文件,并执行指定的操作.Linux下find命令提供了相当多的查找条件,功能很强大.由于find具有强大的功能,所以它的选项也很多,其中大部分选项都值得我们花时 ...
- Linux下相关查找文件命令(find locate which whereis type)
以下内容摘自:http://blog.csdn.net/jessica1201/article/details/8139249 标注的内容为自己的补充: 我们经常需要在系统中查找一个文件,那么在lin ...
- linux下怎么查找文件
linux下通常用whereis或者是locate来检查文件,如果实在找不到,才使用find.为什么find不能作为优先考虑的命令? 因为whereis与locate是利用数据库来查找数据,所以相当快 ...
- Linux下的查找命令which、whereis、locate、find(6/20)
Linux下查找相关命令主要有以下4个:which.whereis.locate.find. (1)which [-a] cmdname1 cmdname2 ...... 命令参数: -n ...
随机推荐
- linux下Mongodb集群搭建:分片+副本集
三台服务器 192.168.1.40/41/42 安装包 mongodb-linux-x86_64-amazon2-4.0.1.tgz 服务规划 服务器40 服务器41 服务器42 mongo ...
- 54.string field聚合以及fielddata原理初探
主要知识点: 直接对分词的term进行聚合后果 设置fielddata=true 直接用.keyword进行聚合 doc value 的性能问题 一.直接对分词的term进行聚合后果 ...
- Leetcode 135.分糖果
分发糖果 老师想给孩子们分发糖果,有 N 个孩子站成了一条直线,老师会根据每个孩子的表现,预先给他们评分. 你需要按照以下要求,帮助老师给这些孩子分发糖果: 每个孩子至少分配到 1 个糖果. 相邻的孩 ...
- Android NumberProgressBar:动态移动显示百分比进度的进度条
Android NumberProgressBar:动态移动显示百分比进度的进度条 NumberProgressBar是github上一个开源项目,其项目主页是:https://github.c ...
- mybatis源码阅读-执行一个sql的流程(九)
图解 图片来源:https://my.oschina.net/zudajun/blog/670373 Mapper接口调用原理 我们整合成Spring 直接使用Mapper就能执行对应的sql 表现 ...
- HDU 2242 连通分量缩点+树形dp
题目大意是: 所有点在一个连通图上,希望去掉一条边得到两个连通图,且两个图上所有点的权值的差最小,如果没有割边,则输出impossible 这道题需要先利用tarjan算法将在同一连通分量中的点缩成一 ...
- ZMQ源代码分析(一)-- 基础数据结构的实现
yqueue 和 ypipe zmq号称是"史上最快的消息队列",由此可见zmq中最重要的数据结构就是队列. zmq的队列主要由yqueue和ypipe实现.yqueue是队列的基 ...
- OC-内存管理的一些要点
创建一个BOOK对象,对其属性进行声明 定义. @property 属性声明 定义了对属性的赋值 -(void) dealloc 方法在对象销毁的时候进行调用. #import <Foundat ...
- 深入学习理解java-ThreadLocal
导读 首先,ThreadLocal 不是用来解决共享对象的多线程訪问问题的,普通情况下,通过ThreadLocal.set() 到线程中的对象是该线程自己使用的对象,其它线程是不须要訪问的,也訪问不到 ...
- Python FAQ1:传值,还是传引用?
在C/C++中,传值和传引用是函数参数传递的两种方式.由于思维定式,从C/C++转过来的Python初学者也经常会感到疑惑:在Python中,函数参数传递是传值,还是传引用呢? 看下面两段代码: de ...