sort:

  1. 选项:
  2. -b 忽略每行前面开始出的空格字符
  3. -c 检查文件是否已经按照顺序排序
  4. -d 排序时,处理英文字母、数字及空格字符外,忽略其他的字符
  5. -f 排序时,将小写字母视为大写字母
  6. -i 排序时,除了040176之间的ASCII字符外,忽略其他的字符
  7. -m 将几个排序好的文件进行合并
  8. -M 将前面3个字母依照月份的缩写进行排序
  9. -n 依照数值的大小排序
  10. -o 将排序后的结果存入指定的文件
  11. -r 倒序
  12. -t 指定排序时所用的分隔符, 默认为[tab](通常和 -k 参数一起使用)
  13. -k 指定以第几个字段进行排序
  14. -u uniq, 相同的数据, 仅出现一行
  15. +<起始栏位>-<结束栏位> 以指定的字段来排序,范围由起字段到结束字段的前一个字段
  16. --help 显示帮助信息
  17.  
  18. 示例:
  19. sort /etc/passwd
  20. sort -t ':' -k 3 /etc/passwd -n
  21. sort -t ':' -k 3 /etc/passwd -n -r

  

uniq:

  1. 选项: 不指定选项, 默认重复的行只出现一次
  2. -c 在每列旁边显示该行重复出现的次数
  3. -d 仅显示重复出现的行
  4. -u 仅显示出现过一次的行(唯一的行)
  5. -w 指定要比较的字段
  6.  
  7. 示例:
  8. last | sort -k '3' | uniq -w 3 -c

  

sort 和 uniq 使用示例:

  1. 示例文件:
  2. cat test1.txt
  3. 1
  4. 2
  5. 3
  6. 4
  7. 5
  8.  
  9. cat test2.txt
  10. 1
  11. 3
  12. 5
  13. 6
  14. 7
  15. 9
  16.  
  17. 示例1: 求两个文件的交集
  18. # 实现思路: 交集, 即两个文件都存在的列, 使用 sort 排序之后再使用 uniq -d 命令即可实现
  19. sort test1.txt test2.txt | uniq -d
  20. 1
  21. 3
  22. 5
  23.  
  24. 示例2: 求两个文件的并集
  25. # 实现思路: 并集, 即两个文件合并在一起, 去除重复的行, 使用 sort 排序之后再使用 uniq 或者 sort -u
  26. sort test1.txt test2.txt | sort -u 或者 sort test1.txt test2.txt | uniq
  27. 1
  28. 2
  29. 3
  30. 4
  31. 5
  32. 6
  33. 7
  34. 9
  35.  
  36. 示例3: 求两个文件的差集
  37. # 实现思路: 差集(test1-test2), 把 test2 的行重复2次和 test1 的元素放到一起排序, 只输出出现一次的项
  38. # test1 相对 test2 的差集
  39. sort test1.txt test2.txt test2.txt | uniq -u
  40. 2
  41. 4
  42.  
  43. # test2 相对 test1 的差集
  44. sort test1.txt test1.txt test2.txt | uniq -u
  45. 6
  46. 7
  47. 9
  48.  
  49. 示例4: 求两个文件的对称差
  50. # 实现思路: 对称差, 即两个文件加起来只出现过一次的行, 使用 sort 排序之后再使用 uniq -u
  51. sort test1.txt test2.txt | uniq -u
  52. 2
  53. 4
  54. 6
  55. 7
  56. 9

  

Linux sort和uniq命令的应用的更多相关文章

  1. linux sort 、uniq 命令

    以文件的每行为单位,从左往右依次按ascii码进行比较 sort sort.txt #默认为升序 -u:去除重复行 sort -u sort.txt -r:降序排列 sort -r sort.txt ...

  2. xargs、sort、uniq命令

    xargs.sort.uniq命令,我们由LeetCode的一道题来引入,并使用加以理解: 题目是这样的:写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率. word ...

  3. linux shell 脚本攻略学习8---md5校验,sort排序,uniq命令详解

    一.校验与核实 目前最为出名的校验技术是md5sum和sha1sum,它们对文件内容使用相应的算法来生成校验和. 举例: amosli@amosli-pc:~/learn$ md5sum text.t ...

  4. sort与uniq命令详解

    1.sort的作用 (排序) sort 命令对 File 参数指定的文件中的行排序,并将结果写到标准输出. 如果 File 参数指定多个文件,那么 sort 命令将这些文件连接起来,并当作一个文件进行 ...

  5. Linux基础:uniq命令总结

    本文只总结一些常用的用法,更详细的说明见man uniq和 uniq --help. uniq命令 uniq命令主要用于去重. 需要注意的是,不相邻的行不算重复值. 语法格式 Usage: uniq ...

  6. Linux中的uniq命令(去掉重复项,输出重复项)

    ls /bin /usr/bin | sort | uniq | less 上面这条命令的实际效果是: 获得 ls /bin /usr/bin 的 output 将上述 output 进行 sort ...

  7. Linux uniq 命令

    Linux uniq 命令  Linux 命令大全 Linux uniq 命令用于检查及删除文本文件中重复出现的行列,一般与 sort 命令结合使用. uniq 可检查文本文件中重复出现的行列. 语法 ...

  8. Linux中sort和uniq关于排序去重的那些用法

    相信在Linux下对文件操作经常会用到sort和uniq命令,下面系统的介绍一下这两个命令的用法. sort命令是在Linux里非常有用,它将文件进行排序,并将排序结果标准输出.sort命令既可以从特 ...

  9. Linux -- 文件统计常用命令

    标签(空格分隔): Linux sort -- 文件内排序命令 sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次比较其ASCII码. 按每行升序排序: sort seq.tx ...

随机推荐

  1. Sql Server 2008R2 数据库发布与订阅

    背景描述: 发布服务器A: (远程端) , 数据库服务名: GUANWANG1 订阅服务器B: (本机)   ,  数据库服务名: PC-LLRDBA 需要从服务器A中数据库发布,然后在B中订阅A发布 ...

  2. 微信小程序(一)基本知识初识别

    最近微信圈里小程序很火的样子,以前小程序刚开始的时候研究了一下,多日没关注发现一些东西都淡忘了,最后决定还是记录下来的好.    毕竟好记星比不上烂笔头嘛~

  3. 621. Task Scheduler CPU任务间隔分配器

    [抄题]: Given a char array representing tasks CPU need to do. It contains capital letters A to Z where ...

  4. Nginx概述、安装及配置详解

    nginx概述 nginx是一款自由的.开源的.高性能的HTTP服务器和反向代理服务器:同时也是一个IMAP.POP3.SMTP代理服务器:nginx可以作为一个HTTP服务器进行网站的发布处理,另外 ...

  5. Jedis连接Redis三种模式

    这里说的三种工作模式是指: 1.单机模式 2.分片模式 3.集群模式(since 3.0) 说明图详见以下: 使用单机模式连接: private String addr="192.168.1 ...

  6. python中fork()函数生成子进程分析-乾颐堂

    python的os module中有fork()函数用于生成子进程,生成的子进程是父进程的镜像,但是它们有各自的地址空间,子进程复制一份父进程内存给自己,两个进程之 间的执行是相互独立的,其执行顺序可 ...

  7. Python守护进程(多线程开发)-乾颐堂

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 3 ...

  8. eclipse 按装lombok与注解说明

    原文:http://www.cnblogs.com/ywqbj/p/5711691.html 一.安装lombok 1.下载   lombok-1.16.16.jar 包 我的下载完后放到:/root ...

  9. PrintWriter类

    PrintWriter是一种过滤流,也是一种处理流,即能对字节流和字符流进行处理. 1.查询API后,我们发现,会有八种构造方法.即: PrintWriter(File file) Creates a ...

  10. 使用火蜘蛛采集器Firespider采集天猫商品数据并上传到微店

    有很多朋友都需要把天猫的商品迁移到微店上去.可在天猫上的商品数据非常复杂,淘宝开放接口禁止向外提供数据,一般的采集器对ajax数据采集的支持又不太好. 还有现在有了火蜘蛛采集器,经过一定的配置,终于把 ...