find文本处理(locate)实例学习记录

(一)按文件名称查找

按照文件名称查找是 find 最常见的用法,需要注意的是,搜索的文件名必须完全匹配,才能找到对应的文件。

1. 查找当前目录下所有 go 文件

  find . -name "*.go"

2. 在 etc 目录下,查找大写字母开头的 txt 文件

 find /etc -name "[A-Z]*.txt" -print

3. 在当前目录下查找不是 out 开头的 txt 文件

 find . -name "out*" -prune -o -name "*.txt" -print

4. 在当前目录除 git 子目录外查找 txt 文件

 find . -path "./git" -prune -o -name "*.txt" -print

5. 找出某个文件的所有硬链接,ls 命令 -i 选项可以查看文件的 inode 号

ls -i 1.txt
138956 1.txt
$ find . -num 138956

这里补充一个小技巧,搜索文件时使用 -iname 参数可以忽略文件名称大小写

(二)按文件类型查找

1. 在当前目录下,查找软连接文件

 find . -type l -print

2. 在当前目录下,查找 log 结尾的普通文件,f 表示普通文件类型

 find . -type f -name "*.log"

(三)按文件大小查找

1. 查找小于 64k 的文件

 find . -size -64k -print

2. 查找大小超过 200M 的文件

 find . -size +200M -type f -print

(四)按时间查找

1. 查找 2 天内被修改过的文件

 find . -mtime -2 -type f -print

2. 查找 2 天前被更改过的文件,-mtime 表示内容修改时间

 find . -mtime +2 -type f -print

3. 查找一天内被访问的文件,-atime 表示访问时间

 find . -atime -1 -type f -print

4. 查找一天内状态被改变的文件,-ctime 表示元数据被变化时间

 find . -ctime -1 -type f -print

5. 查找比 chopin.txt 新的文件

$ find . -newer "chopin.txt" -type f -print
$ find . ! -newer "chopin.txt" -type f -print # 旧

(五)根据权限查找

1. 查找当前目录权限为 644 的文件

 find . -type f -perm 644

2. 查找 etc 目录下至少有一个用户有写权限的文件

 find /etc -type f -perm /222

3. 查找 etc 目录下所有用户都有执行权限的文件

find /etc -perm -111 -ls 

(六)组合条件

1. 查找当前目录下属于 chopin 用户的普通文件,-a 可以省略

 find . -type f -a -user chopin -print

2. 查找当前目录下大于 2M 或 2 天前被修过的文件

 find . -size +2M -o -mtime +2 -print

3. 查找当前目录下不是普通文件

$ find . -not -type f
$ find . ! -type f

4. 查找非空文件

 find . ! -empty

(七)处理动作

find 根据上述各种条件查找后,支持执行相关的处理动作,可以让我们的更方便和灵活,而不只是打印出来

1. -print 默认为打印,可省略


find . -name "*.log" -print
find . -name "*.log" # 等价

2. -ls 以 ls 长文件的格式形式输出

$ find . -name "*.txt" -ls
138957      4 -rw-r--r--   1 root     root           16 Jan 24 23:20 ./a.txt
138959      4 -rw-r--r--   1 root     root          172 Jan 24 13:06 ./T.txt
138956      4 -rw-r--r--   1 root     root           27 Jan 24 23:28 ./1.txt

3. -delete 删除查找到的文件

find . -size +100M -delete 

4. -exec 将查找到的文件传递给 command 命令。下边例子是将查找到的文件传递给了 ls 命令,同理我们可以传递给任何一个 Linux 命令,功能十分强大,也很灵活。

$ find . -name "*.txt" -exec ls -lh {} \;
-rw-r--r-- 1 root root 16 Jan 24 23:20 ./a.txt
-rw-r--r-- 1 root root 172 Jan 24 13:06 ./T.txt
-rw-r--r-- 1 root root 27 Jan 24 23:28 ./1.txt

5. -ok 与 -exec 功能一样,只是操作时会提示用户确认,仅此而已。当然,在生产环境上,我们还是推荐使用 ok

(八)经典案例

如果存在一个名称乱码的文件,想要删除它,该怎么办?即使我们复制乱码名称到命令行,很有可能终端不能正确识别。不用担心,下边来展示下 find 是如何优雅的解决问题的。

$ ls  -i
138957 a.txt  138959 T.txt  132395 ڹ��.txt

$ find . -inum 132395 -exec rm {} \;

命令中,-inum 指定的是文件的 inode 号,它是系统中每个文件对应的唯一编号,find 通过编号找到后,执行删除操作。

################################################################################

find总结:

find命令格式:

find path -option [-exec ...]

################################################################################

####按文件名查找

  • -name:按照文件名称查找,准确匹配;
  • -iname:不区分文件名的大小写;
  • -inode:按照文件 inode 号查找;

####按照文件类型查找

按照文件类型查找,可以使用 -type 选项,具体支持的文件类型如下:

  • f:普通文件
  • d:目录文件
  • l:链接文件
  • s:套接字文件
  • p:管道文件
  • b:块设备文件,比如:磁盘
  • c:字符设备文件,比如:键盘、鼠标、网卡

####按照文件从属关系查找

  • -user:以用户名查找
  • -group:以组名查找
  • -uid:以用户 ID 查找
  • -gid:以组 ID 查找
  • -nouser:查找没有属主的文件
  • -nogroup:查找没有属组的文件

####按照文件大小查找

按照文件大小查找功能十分常用,用 -size 选项,选项后边指定大小 1024M,表示大小的格式有如下几种:

  • -5M:查找小于 5M 的文件
  • +5M:查找大于 5M 的文件
  • 5M:查找大小为 5M 的文件

单位支持的有 c(字节)kMG 等,需要注意的是默认单位并不是字节,而是 b,大小为 512 字节。

####按照时间查找

按照时间查找的功能对系统管理员来说,十分常用,find 支持如下几种时间类型:

  • atime:以访问时间查找
  • mtime:以数据修改时间查找
  • ctime:以元数据修改时间查找
  • newer:以文件为条件,判断比它新的文件

按时间查找时,使用格式如下:

  • -atime -5:表示 5 天内访问过的文件;
  • -atime +5:表示 6 天前访问过的文件;
  • -atime 5:表示前 5-6 那一天访问的文件;

find 不仅可以按  为单位来查找文件,可以按照 aminmmincmin 来查找,区别只是 min 选项单位为分钟。

#######按照权限查找

按权限查找是通过 -perm 选项,可以按照如下方式使用:

  • -perm 644:精确权限查找
  • -perm /666:任何一类用户中的任何一位符合条件即满足
  • -perm -222:每一类用户的每一位同时符合条件即满足

组合条件

find 可以使用多个条件的组合,支持 -a-o-not 或 !,比较简单,不再详细描述其含义。

处理动作

find 根据各种条件查找后,支持执行相关的处理动作,可以让我们的更方便和灵活,而不只是打印出来。

  • -print:打印,默认动作,可省略
  • -ls:以 ls 长文件格式输出
  • -delete:删除查找到的文件
  • -exec:查找到的文件传递给任何 Linux 命令
  • -ok:与 exec 功能相同,区别是需要用户确认每次的操作

虽然 find 功能非常强大,但要知道的是,find 执行过程是通过扫描磁盘文件来进行查找的,如果大范围的查找文件,需要花费的时间很长,且消耗服务器 cpu 资源。

这里推荐另一个 Linux 文件查找神器 locate,类似于 win 平台下的 everything。它基于索引表进行查询,查询速度非常快,基本不占用 cpu 资源。

yum install -y mlocate            ######yum安装

updatedb          #####刷新数据库

locate  xxx.txt        #####

find文本处理(locate)实例学习记录的更多相关文章

  1. [c#]asp.net开发微信公众平台(4)关注事件、用户记录、回复文本消息

    上一篇已经把所有消息封装且都各自有方法处理了,这篇从使用第一步——关注开始,  关注之后进行消息记录,同时回复文本消息给用户,关注方法:DoSub,另外新用户扫描带参数的二维码关注方法:DoCodeN ...

  2. 关于如何获取/清除 MAXScript 侦听器内的文本

    关于如何获取/清除 MAXScript 侦听器内的文本 用来保存记录?还没想到实际用处,先记上. macroRecorder as string listener as stringclearList ...

  3. DoctorNote医生处方笔记开发记录

    1.开发背景 一个开诊所的中医朋友,希望我能给他开发一个记录病人姓名和处方的Android手机app,以便查询病人每次就诊信息,比如上一次的处方,以前他要找个病人上一次的就诊处方,几乎要翻遍一叠厚厚的 ...

  4. Mahout文本向量化

    在文本聚类之前,首先要做的是文本的向量化.该过程涉及到分词,特征抽取,权重计算等等.Mahout 提供了文本向量化工具.由于Mahout 向量化算法要处理的文件是Hadoop SequenceFile ...

  5. C#中富文本编辑器Simditor带图片上传的全部过程(MVC架构的项目)

    描述:最近c#项目中使用富文本编辑器Simditor,记录一下以便以后查看. 注:此项目是MVC架构的. 1.引用文件 项目中引用相应的css和js文件,注意顺序不能打乱,否则富文本编辑器不会正常显示 ...

  6. c#中富文本编辑器Simditor带图片上传的全部过程(项目不是mvc架构)

    描述:最近c#项目中使用富文本编辑器Simditor,记录一下以便以后查看. 注:此项目不是MVC架构的. 1.引用文件 项目中引用相应的css和js文件,注意顺序不能打乱,否则富文本编辑器不会正常显 ...

  7. Linux终端回话记录和回放工具 - asciinema使用总结

    目前linux终端回放工具常见的就是asciinema和script了, 这两种工具都有那种类似于视频回放的效果.虽然这样做的代价是录制过程中需要占用一定的cpu资源以及录制后可能会因为视频文件太大而 ...

  8. JDBC处理文本和二进制文件

    JDBC支持文本(CLOB)和二进制(BLOB)文件的处理,比如要往数据库里存取文章或者图片.这都是用流的思想来解决的. 来两个Demo看看JDBC是怎么操作文本和二进制文件的. CLOB: pack ...

  9. 使用Arduino和SD卡模块记录数据并导出到Excel

    在本篇文章中,我们将学习如何基于Arduino开发板使用一个SD卡模块.同时结合DS3231实时时钟模块,我们将制作一个数据记录仪的示例,在示例中,我们将温度传感器的数据存储到SD卡中,并将这些数据导 ...

随机推荐

  1. 基金术语 All In One

    基金术语 All In One GP.LP.PE.VC.FOF LP 有限合伙人(Limited Partner, LP):我们可以简单的理解为出资人. 很多时候,一个项目需要投资上千万乃至数个亿的资 ...

  2. Apple & 人体工程学

    Apple & 人体工程学 https://support.apple.com/zh-cn/HT205655 MBP 2018 https://help.apple.com/macbookpr ...

  3. Python Web Frameworks

    Python Web Frameworks top 10 Python web frameworks Django (Full-stack framework) Flask (Micro framew ...

  4. how to install zoom meeting app in macOS

    how to install zoom meeting app in macOS https://support.zoom.us/hc/zh-cn/articles/203020795-如何在Mac上 ...

  5. 找出 int 数组的平衡点 & 二叉树 / 平衡二叉树 / 满二叉树 / 完全二叉树 / 二叉查找树

    找出 int 数组的平衡点 左右两边和相等, 若存在返回平衡点的值(可能由多个); 若不存在返回 -1; ``java int [] arr = {2,3,4,2,4}; ```js const ar ...

  6. HANNAH WHITE:从Facebook谈坚持

    HANNAH WHITE于1993年毕业于加州斯坦福大学,被美国多家知名杂志评为最值得关注经济管理学杰出人才,2006年-2009年担任Doll资本管理公司部门主管,2009年-2013年担任Doll ...

  7. python中yaml模块的使用

    1.yaml库的导入 经过尝试,发现在python2 和python3语言环境下,安装yaml库的命令行语句不一样. python2: pip install yaml python3:pip ins ...

  8. 教你吃透CSS的盒子模型(Box Model)

    CSS 盒子模型(Box Model) 所有HTML元素可以看作盒子,在CSS中,"box model"这一术语是用来设计和布局时使用. CSS盒模型本质上是一个盒子,封装周围的H ...

  9. 利用 Java 操作 Jenkins API 实现对 Jenkins 的控制详解

    本文转载自利用 Java 操作 Jenkins API 实现对 Jenkins 的控制详解 导语 由于最近工作需要利用 Jenkins 远程 API 操作 Jenkins 来完成一些列操作,就抽空研究 ...

  10. python类的内部方法

    目录 一.绑定方法与非绑定方法 1.绑定方法 2.非绑定方法 二.property 1.什么是property? 2.为什么要用property? 3.如何使用property? 三.isinstan ...