Linux sort和uniq命令的应用
sort:
- 选项:
- -b 忽略每行前面开始出的空格字符
- -c 检查文件是否已经按照顺序排序
- -d 排序时,处理英文字母、数字及空格字符外,忽略其他的字符
- -f 排序时,将小写字母视为大写字母
- -i 排序时,除了040至176之间的ASCII字符外,忽略其他的字符
- -m 将几个排序好的文件进行合并
- -M 将前面3个字母依照月份的缩写进行排序
- -n 依照数值的大小排序
- -o 将排序后的结果存入指定的文件
- -r 倒序
- -t 指定排序时所用的分隔符, 默认为[tab](通常和 -k 参数一起使用)
- -k 指定以第几个字段进行排序
- -u uniq, 相同的数据, 仅出现一行
- +<起始栏位>-<结束栏位> 以指定的字段来排序,范围由起字段到结束字段的前一个字段
- --help 显示帮助信息
- 示例:
- sort /etc/passwd
- sort -t ':' -k 3 /etc/passwd -n
- sort -t ':' -k 3 /etc/passwd -n -r
uniq:
- 选项: 不指定选项, 默认重复的行只出现一次
- -c 在每列旁边显示该行重复出现的次数
- -d 仅显示重复出现的行
- -u 仅显示出现过一次的行(唯一的行)
- -w 指定要比较的字段
- 示例:
- last | sort -k '3' | uniq -w 3 -c
sort 和 uniq 使用示例:
- 示例文件:
- cat test1.txt
- 1
- 2
- 3
- 4
- 5
- cat test2.txt
- 1
- 3
- 5
- 6
- 7
- 9
- 示例1: 求两个文件的交集
- # 实现思路: 交集, 即两个文件都存在的列, 使用 sort 排序之后再使用 uniq -d 命令即可实现
- sort test1.txt test2.txt | uniq -d
- 1
- 3
- 5
- 示例2: 求两个文件的并集
- # 实现思路: 并集, 即两个文件合并在一起, 去除重复的行, 使用 sort 排序之后再使用 uniq 或者 sort -u
- sort test1.txt test2.txt | sort -u 或者 sort test1.txt test2.txt | uniq
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 9
- 示例3: 求两个文件的差集
- # 实现思路: 差集(test1-test2), 把 test2 的行重复2次和 test1 的元素放到一起排序, 只输出出现一次的项
- # test1 相对 test2 的差集
- sort test1.txt test2.txt test2.txt | uniq -u
- 2
- 4
- # test2 相对 test1 的差集
- sort test1.txt test1.txt test2.txt | uniq -u
- 6
- 7
- 9
- 示例4: 求两个文件的对称差
- # 实现思路: 对称差, 即两个文件加起来只出现过一次的行, 使用 sort 排序之后再使用 uniq -u
- sort test1.txt test2.txt | uniq -u
- 2
- 4
- 6
- 7
- 9
Linux sort和uniq命令的应用的更多相关文章
- linux sort 、uniq 命令
以文件的每行为单位,从左往右依次按ascii码进行比较 sort sort.txt #默认为升序 -u:去除重复行 sort -u sort.txt -r:降序排列 sort -r sort.txt ...
- xargs、sort、uniq命令
xargs.sort.uniq命令,我们由LeetCode的一道题来引入,并使用加以理解: 题目是这样的:写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率. word ...
- linux shell 脚本攻略学习8---md5校验,sort排序,uniq命令详解
一.校验与核实 目前最为出名的校验技术是md5sum和sha1sum,它们对文件内容使用相应的算法来生成校验和. 举例: amosli@amosli-pc:~/learn$ md5sum text.t ...
- sort与uniq命令详解
1.sort的作用 (排序) sort 命令对 File 参数指定的文件中的行排序,并将结果写到标准输出. 如果 File 参数指定多个文件,那么 sort 命令将这些文件连接起来,并当作一个文件进行 ...
- Linux基础:uniq命令总结
本文只总结一些常用的用法,更详细的说明见man uniq和 uniq --help. uniq命令 uniq命令主要用于去重. 需要注意的是,不相邻的行不算重复值. 语法格式 Usage: uniq ...
- Linux中的uniq命令(去掉重复项,输出重复项)
ls /bin /usr/bin | sort | uniq | less 上面这条命令的实际效果是: 获得 ls /bin /usr/bin 的 output 将上述 output 进行 sort ...
- Linux uniq 命令
Linux uniq 命令 Linux 命令大全 Linux uniq 命令用于检查及删除文本文件中重复出现的行列,一般与 sort 命令结合使用. uniq 可检查文本文件中重复出现的行列. 语法 ...
- Linux中sort和uniq关于排序去重的那些用法
相信在Linux下对文件操作经常会用到sort和uniq命令,下面系统的介绍一下这两个命令的用法. sort命令是在Linux里非常有用,它将文件进行排序,并将排序结果标准输出.sort命令既可以从特 ...
- Linux -- 文件统计常用命令
标签(空格分隔): Linux sort -- 文件内排序命令 sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次比较其ASCII码. 按每行升序排序: sort seq.tx ...
随机推荐
- Sql Server 2008R2 数据库发布与订阅
背景描述: 发布服务器A: (远程端) , 数据库服务名: GUANWANG1 订阅服务器B: (本机) , 数据库服务名: PC-LLRDBA 需要从服务器A中数据库发布,然后在B中订阅A发布 ...
- 微信小程序(一)基本知识初识别
最近微信圈里小程序很火的样子,以前小程序刚开始的时候研究了一下,多日没关注发现一些东西都淡忘了,最后决定还是记录下来的好. 毕竟好记星比不上烂笔头嘛~
- 621. Task Scheduler CPU任务间隔分配器
[抄题]: Given a char array representing tasks CPU need to do. It contains capital letters A to Z where ...
- Nginx概述、安装及配置详解
nginx概述 nginx是一款自由的.开源的.高性能的HTTP服务器和反向代理服务器:同时也是一个IMAP.POP3.SMTP代理服务器:nginx可以作为一个HTTP服务器进行网站的发布处理,另外 ...
- Jedis连接Redis三种模式
这里说的三种工作模式是指: 1.单机模式 2.分片模式 3.集群模式(since 3.0) 说明图详见以下: 使用单机模式连接: private String addr="192.168.1 ...
- python中fork()函数生成子进程分析-乾颐堂
python的os module中有fork()函数用于生成子进程,生成的子进程是父进程的镜像,但是它们有各自的地址空间,子进程复制一份父进程内存给自己,两个进程之 间的执行是相互独立的,其执行顺序可 ...
- Python守护进程(多线程开发)-乾颐堂
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 3 ...
- eclipse 按装lombok与注解说明
原文:http://www.cnblogs.com/ywqbj/p/5711691.html 一.安装lombok 1.下载 lombok-1.16.16.jar 包 我的下载完后放到:/root ...
- PrintWriter类
PrintWriter是一种过滤流,也是一种处理流,即能对字节流和字符流进行处理. 1.查询API后,我们发现,会有八种构造方法.即: PrintWriter(File file) Creates a ...
- 使用火蜘蛛采集器Firespider采集天猫商品数据并上传到微店
有很多朋友都需要把天猫的商品迁移到微店上去.可在天猫上的商品数据非常复杂,淘宝开放接口禁止向外提供数据,一般的采集器对ajax数据采集的支持又不太好. 还有现在有了火蜘蛛采集器,经过一定的配置,终于把 ...