使用Cygwin在WIN系统下处理文本常用命令
1.打开Cygwin,把需要处理的文本复制你的安装目录例如:D:\cygwin\home\Administrator
使用 ls命令查看根目录文件
2.现在我们就可以对1.txt文本进行操作,
3.我常用到命令
【Sort排序功能】
1.指定列正向排序
对文本第一列排序 默认TAB分割
Sort -k 1 1.txt -o 输出.txt
对文本第二列排序 :分割
Sort -t: -k 2 1.txt -o 输出.txt
2.指定列逆向排序
对文本第一列排序 默认TAB分割
Sort -r -k 1 1.txt -o 输出.txt
对文本第二列排序 自定义分割符号“:”
Sort -r -t: -k 2 1.txt -o 输出.txt
3.指定列排序并去重
对文本第一列排序 默认TAB分割
Sort -u -r -k 1 1.txt -o 输出.txt
对文本第二列排序 自定义分割符号“:”
Sort -u -r -t: -k 2 1.txt -o 输出.txt
1.通用正向排序
sort 1.txt -o 输出.txt
2.通用逆向排序
sort -r 1.txt -o 输出.txt
3.数字正向排序
sort -n 1.txt -o 输出.txt
4.排序并去重
sort -u 1.txt -o 输出.txt
【Uniq统计】
1.统计文本出现次数
详解:排序之后删除了重复行,同时在行首位置输出该行重复的次数
#sort testfile | uniq -c
1 friend
3 hello
2 world
2.只输出重复的行,并输出重复次数
#sort testfile | uniq -d -c
3 hello
2 world
3.仅显示不重复的行
sort testfile | uniq -u
【split分割】
1.按行分割
分割成10行 文件名5位数字开头
split -l 10 -d -a 5 file
2.按MB分割
分割成10MB大小 文件名5位数字开头
split -b 10m -d -a 5 file
【Cat 合并文件】
Cat命令详解:http://www.cnblogs.com/perfy/archive/2012/07/23/2605550.html
1.合并多个文件
Cat 1.txt 2.txt 3.txt > hb.txt
2.合并整个文件夹
Cat *.txt > newfile
【Sed 】
以行为单位行头行尾添加字符
1.行首添加字符
在每行的头添加字符,比如"TOU_",命令如下:
sed 's/^/TOU_&/g' 1.txt
2.行尾添加字符
2.在每行的尾添加字符,比如"Wei_",命令如下:
sed 's/$/Wei_&/g' 1.txt
3.每一行的行头和行尾分别添加字符
sed '/./{s/^/Tou_/;s/$/Wei/}' 1.txt
"^"代表行首,"$"代表行尾
's/$/&TAIL/g'中的字符g代表每行出现的字符全部替换,如果想在特定字符处添加,g就有用了,否则只会替换每行第一个,而不继续往后找了
以行为单位的新增/删除
将第 2~5 行删除
sed '2,5d
只要删除第 2 行
sed '2d'
要删除第 3 到最后一行
sed '3,$d'
在第二行后(亦即是加在第三行)加上『drink tea?』字样!
sed '2a drink tea'
那如果是要在第二行前
sed '2i drink tea'
以行为单位的替换与显示
将第2-5行的内容取代成为『No 2-5 number』呢?
sed '2,5c No 2-5 number'
仅列出文件内的第 5-7 行
Sed -n '5,7p'
数据的搜寻并显示
搜索有root关键字的行 模糊搜索哦
sed -n '/root/p
数据的搜寻并删除
删除/etc/passwd所有包含root的行,其他行输出
nl /etc/passwd | sed '/root/d'
数据的搜寻并替换
sed 's/要被取代的字串/新的字串/g' 1.txt
替换@开 到TAB尾
sed 's/@[^\t]*\t/\t/g' 1.txt
只保留有某个字符的行 用于保留某行,或者删除没有分隔符的行
sed -n '/\t/p'> out.txt 只输出包含TAB的行
【WC 】
统计行数,在对记录数时,很常用
Wc -l 1.txt
使用Cygwin在WIN系统下处理文本常用命令的更多相关文章
- 解决在win系统下使用DOS命令开启TensorBoard的问题及方法步骤
解决在win系统下使用DOS命令开启TensorBoard的问题及方法步骤: TensorBoard是TensorFlow下的一个可视化的工具,能够帮助研究者们可视化训练大规模神经网络过程中出现的复杂 ...
- win系统下启动linux上的kafka集群及使用
一.首先在win系统下C:\Windows\System32\drivers\etc文件夹中hosts文件加入例如以下内容: 10.61.6.167 slaves1 10.61.6.168 slave ...
- Linux 系统下安装 rz/sz 命令及使用说明
Linux 系统下安装 rz/sz 命令及使用说明 rz/sz命令,实现将本地的文件上传到服务器或者从服务器上下载文件到本地,但是很多Linux系统初始并没有这两个命令,以下为安装和使用的具体步骤: ...
- 【linux配置】Linux系统下安装rz/sz命令以及使用说明
Linux系统下安装rz/sz命令以及使用说明 对于经常使用Linux系统的人员来说,少不了将本地的文件上传到服务器或者从服务器上下载文件到本地,rz / sz命令很方便的帮我们实现了这个功能,但是很 ...
- Linux 系统基础优化和常用命令
目录 Linux 系统基础优化和常用命令 软连接 tar解压命令 gzip命令 netstart命令 ps命令 kill命令 killall命令 SELinux功能 iptables防火墙 Linux ...
- 运维 07 Linux系统基础优化及常用命令
Linux系统基础优化及常用命令 Linux基础系统优化 引言没有,只有一张图. Linux的网络功能相当强悍,一时之间我们无法了解所有的网络命令,在配置服务器基础环境时,先了解下网络参数设定命令 ...
- 实验 1 Linux 系统的安装和常用命令
实验 1 Linux 系统的安装和常用命令 (题目) 一.实验目的 (1)掌握 Linux 虚拟机的安装方法.Spark 和 Hadoop 等大数据软件在 Linux 操作系统 上运行可以发挥最佳性能 ...
- win 系统下制作U盘安装 linux系统
win 系统制作U盘安装硬盘镜像用ultraiso_v9.5.3.2901将Centos.iso写进U盘.安装过程全程区分大小写.过低的ultraiso不能正确读取文件.本文所有资料均能在网上免费下载 ...
- win系统下的eclipse连接和使用linux上的hadoop集群
准备工作 先在win系统的hosts文件中加入下面内容 10.61.6.164master //hadoop集群的master节点 一.首先在eclipse上安装hadoop插件 下载hado ...
随机推荐
- JS多级树结构写法
效果: 一.布局: <div class="three_tree"> <div class="tree_title_cut"> < ...
- ECMAscript 变量作用域
使用var操作符声明的变量与未使用var操作符声明的变量区别 未使用var操作符声明 function test() { message='hi'; console.log(message); } c ...
- Android SharedPreferences存储数据
SharedPreferences是Android中最容易理解的数据存储技术,实际上SharedPreferences处理的就是一个key-value(键值对)SharedPreferences常用来 ...
- linux c 监控目录
static void* thread_monitor(void* args) { pthread_detach(pthread_self()); int fd; int wd; int len; i ...
- 本机浏览器访问不到Linux虚拟机中的nginx开启页面
1.使用该执行打开端口文件vi /etc/sysconfig/iptables 2.随便复制一行现有内容,将你要打开的端口设置上就行了,这里是打开80端口-A INPUT -m state --sta ...
- C#实现Stream与byte[]之间的转换实例教程
一.二进制转换成图片 MemoryStream ms = new MemoryStream(bytes); ms.Position = ; Image img = Image.FromStream(m ...
- June 10th 2017 Week 23rd Saturday
A lot of things, we can be touched, but we can not shed tears. 很多事情,我们可以感动,却不能流泪. Sometimes I was to ...
- SQA计划与测试规程
长大一条龙之SQA计划与测试规程 一.SQA计划 1.软件工程 我们之进行开发之前,在弄完需求分析的前提下,进行了软件一些列的建模和评估,我们建立了基于类的模型图类图,基于场景的模型图流程图,再对这些 ...
- Jmeter入门9 __digest函数 jmeter字符串连接与登录串加密应用
登录请求中加密串是由多个子串连接,再加密之后传输. 参数连接:${var1}${var2}${var3} 加密函数:__digest (函数助手里如果没有该函数,请下载最新版本的jmeter5 ...
- Arcgis Javascript中geometryEngine报错’hq‘of undefined的解决方法
这个问题困扰了我一个星期,原因是使用geomagicbuffer时候,有的线可正常使用,有的就直接报错,一直没有解决,后来发现是api自己的bug导致的 干脆直接读代码,在geometryEngine ...