awk排序作业

输入：给定一个hotelinfo文件，文件格式如下：

shanghai_city_7208      上海全季酒店淮海路店

shanghai_city_14744     锦江之星上海金山城市沙滩店

jinan_2794      章丘市大众旅馆

carmel_ca_5     Carmel River Inn

格式说明：

1. 一共两列，之间使用tab分隔

2. 第一列是酒店代号，第二列是酒店名称

3. 以shanghai_city_7208为例，前面的shanghai_city代表城市

要求如下：

1. 输出一个文件，和hotelinfo格式一样，但是按照酒店代号进行降序排序

2. 输出一个文件，两列，第一列是城市代号，第二列是这个城市下的酒店数，但是按照酒店数进行降序排序

文件如下：

hotelinfo.txt

1.先表示我看错题目了，我以为是按照第一列的最后的数字排序，瞬间复杂度增加，于是我写了一段蛋疼的awk程序。

首先对文本进行排序处理,awk程序为hotelsort.awk

BEGIN{FS="_";ORS="";content=""}
#将原来的文件按照“_”切分，确保酒店的数字代码在空格的第二列

{for(i=;i<(NF-);i++) content=content""$i"_";content=content""$(NF-)" "$NF"\n"}
#用sort命令对酒店代码排序

END{printf("%s", content) | "sort -rn -k 2 > hotelsorted.txt"}

执行

awk -f hotelsort.awk hotelinfo.txt

此时hotelsorted.txt如下

falling_waters_wv  Holiday Inn Express MARTINSBURG-NORTH

fairlee_vt     Silver Maple Lodge & Cottages

etroubles_ita  Hotel Beau Sejour

escanaba_mi    Comfort Suites Escanaba

elk_river_mn   Country Inn & Suites By Carlson Elk River

eckelsheim_ger     Hotel Klosterhof Eckelsheim

dundalk_il     邓多克皇冠假日酒店

delwara_ind    Devi Garh

deidesheim_ger     Steigenberger Hotel Deidesheim

colton_ca  Holiday Inn Express Colton

chita  Arkadia

burbank_ca     Burbank-Media Center

最后格式化一下这个文件

awk '{print $1"_"$2" "$3}' hotelsorted.txt > hotelsortedformat.txt

得到最后结果

fancy_gap_va_1 Days

falling_waters_wv_1 Holiday

fairlee_vt_1 Silver

etroubles_ita_1 Hotel

escanaba_mi_1 Comfort

elk_river_mn_1 Country

eckelsheim_ger_1 Hotel

dundalk_il_1 邓多克皇冠假日酒店

delwara_ind_1 Devi

deidesheim_ger_1 Steigenberger

colton_ca_1 Holiday

chita_1 Arkadia

burbank_ca_1 Burbank-Media

收工

2. 跟第一题差不多，写个awk hotelsum.awk

BEGIN{FS="_"}

#跟第一题类似，用数组统计个数

{citycode="";for(i=;i<(NF-);i++) citycode=citycode""$i"_";if(NF>)citycode=citycode""$(NF-);sum[citycode]++}

END{for(city in sum) printf("%s\t%4d\n", city, sum[city])}

然后调用一下并排序

awk -f hotelsum.awk hotelinfo.txt | sort -t " " -k  -nr

结果：

torquay_vic

tel_aviv

rovinj_cro

torremolinos_esp

the_hague

torquay_uk

paris_city

telford_uk

london_england

los_angeles_usa

fairview_pa

tarragona_esp

beijing_city

tampere_fi

shanghai_city

san_antonio_usa

suzhou_jiangsu

manchester_usa

tossa_de_mar_spa

timmendorfer_strand

terracina_ita

riccione_ita

chongqing_city

yichun_jiangxi

west_memphis_ar

sydney_australia

rovaniemi_fi

dover_de

anderson_sc

ubud_id

taunton_ma

taizhou_zhejiang

robinson_il

okehampton_uk

melbourne_australia

las_vegas

koh_phuket_tha

harrisburg_pa

hamilton_on

gardner_ks

faulkton_sd

beppu_jp

west_columbia_tx

volos_gre

thunder_bay_on

the_entrance_nsw

teignmouth_uk

pittsfield_il

newcastle_united_kingdom

motta_camastra

montvale_nj

montauk_ny

lindos_gre

liberal_ks

lakeside_ca

fort_washington_pa

fillmore_ut

escanaba_mi

birmingham_usa

big_island

zanzibar_tza

yulin_shanxi_02

yulin_guangxi

ypsilanti_mi

yelverton_uk

wigston_uk

wangerooge_ger

vysoke_tatry_sk

trento_ita

the_rocks_nsw

tamworth_uk

stadtoldendorf_ger

somerset_uk

singapore_city

shipley_uk

shenandoah_tx

schmallenberg_ger

santa_elena_gt

san_diego

salado_tx

saint_petersburg

rock_port_mo

riverside_il

richmond_vt

ravenna_italy

prestwick_uk

piste_mex

peoria_az

pensacola_fl

painesville_oh

osnabruck_ger

new_york_city

new_delhi

nelson_bay

montclair_nj

montclair_ca

mexico_city

menlo_park_ca

mattoon_il

mason_wv

madonna_di_campiglio

lone_tree_co

london_England

livingston_nj

lincoln_uk

lakeside_az

krumbach_ger

kota_kinabalu

koh_samui

kernersville_nc

kansas_city

jackson_ms

huizhou_guangdong

huelva_esp

hongkong_city

himeji_jp

hillsborough_nc

hille_ger

hershey_pa

havelock_north_nz

hakodate_jp

grand_rapids

glendale_ca

glen_allen_va

galena_park_tx

fuzhou_fujian

ft_lauderdale

french_lick_in

frazer_pa

fondi_ita

fancy_gap_va

falling_waters_wv

fairport_ny

fairlee_vt

etroubles_ita

elk_river_mn

eckelsheim_ger

dundalk_il

denpasar_bali

delwara_ind

deidesheim_ger

davie_fl

covington_kt

corpus_christi_tx

colton_ca

cefalu_ita

cavriglia_ita

carmel_ca

campinas_bra

burbank_ca

budapest_city

brooklyn_center_mn

bratislava_city

aberdeen_united_kingdom

awk排序作业的更多相关文章

MapReduce --全排序
MapReduce全排序的方法1: 每个map任务对自己的输入数据进行排序,但是无法做到全局排序,需要将数据传递到reduce,然后通过reduce进行一次总的排序,但是这样做的要求是只能有一个red ...
03-Foundation中NSMutableArray遍历、复制和排序
目录: 一.NSString补充二.NSMutableArray可变数组三.遍历四.NSArray支持的新语法五.数组复制六.数组的排序 SDK.API.Foundation.Cocoa是什 ...
Hadoop 数据排序（一）
1.概述 1TB排序通常用于衡量分布式数据处理框架的数据处理能力.Terasort是Hadoop中的的一个排序作业.那么Terasort在Hadoop中是怎样实现的呢?本文主要从算法设计角度分析Ter ...
实验楼实验——LINUX基础入门
第一节 Linux简介一.Linux的历史: 1965 年,Bell 实验室.MIT.GE(通用电气公司)准备开发 Multics 系统,为了同时支持 300 个终端访问主机,但是 1969 年失败 ...
hadoop MapReduce 笔记
1. MapReduce程序开发步骤编写map 和 reduce 程序–> 单元测试 -> 编写驱动程序进行验证-> 本地数据集调试 -> 部署到集群运行用 ...
使用DBMS_STATS来收集统计信息【转】
overview Oracle's cost-based optimizer (COB) uses statistics to calculate the selectivity (the fract ...
Hadoop 中疑问解析
Hadoop 中疑问解析 FAQ问题剖析一.HDFS 文件备份与数据安全性分析1 HDFS 原理分析1.1 Hdfs master/slave模型 hdfs采用的是master/slave模型,一个 ...
[hadoop转载]tearsort
1TB排序通常用于衡量分布式数据处理框架的数据处理能力.Terasort是Hadoop中的的一个排序作业,在2008年,Hadoop在1TB排序基准评估中赢得第一名,耗时209秒.那么Tera ...
ISPF常用命令
[ISPF功能键] PF1: HELP帮助键 PF2: SPLIT键,改变分屏位置 PF3: END键,结束并退回上级菜单 PF4: RETURN键,结束并退回主菜单 PF5: REFIND键,重复最 ...

随机推荐

微信小程序之wepy自动化架构搭建（fly+wepy-plugin-replace）
前言本文章秉着自动化工程项目的思想搭建的,基础架子完全按照wepy官网搭建,在基础上增加配置达到自动化项目.新增动flxio拦截器自动处理接口,新增根据环境变量来改变运行时的参数. Fly.js 小 ...
PyQt5点击按钮产生新窗体
import sys from PyQt5.QtWidgets import QApplication,QWidget from form1 import Ui_Form1 from form2 im ...
poj1475 Pushing Boxes（BFS）
题目链接 http://poj.org/problem?id=1475 题意推箱子游戏.输入迷宫.箱子的位置.人的位置.目标位置,求人是否能把箱子推到目标位置,若能则输出推的最少的路径,如果有多条步 ...
洛谷P2151 [SDOI2009] HH去散步 [矩阵加速]
题目传送门 HH去散步题目描述 HH有个一成不变的习惯,喜欢饭后百步走.所谓百步走,就是散步,就是在一定的时间内,走过一定的距离. 但是同时HH又是个喜欢变化的人,所以他不会立刻沿着刚刚走来的路走 ...
MNIST神经网络的训练
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data 1.设置输入和输出节点的个数,配置 ...
NEO4j简单入门
Neo4j是: 一个开源无Schema 没有SQL 图形数据库图形数据库也称为图形数据库管理系统或GDBMS. Neo4j的官方网站:http://www.neo4j.org Neo4j的优点它 ...
比较IBM MQSeries和BEA WebLogic JMS Server(转载)
在面向消息的中间件(MOM)这个领域,IBM MQSeries (又称WebSphere MQ)一直是当仁不让的超级大哥,其它还有一些小兄弟,比如SwiftMQ.SonicMQ之类.但近年来随着J2E ...
Codeforces 835 F. Roads in the Kingdom
\(>Codeforces\space835 F. Roads in the Kingdom<\) 题目大意 : 给你一棵 \(n\) 个点构成的树基环树,你需要删掉一条环边,使其变成一颗 ...
hdu 4240 最大流量路径
题意弄了半天: 给出一个有向图,带边权,src,dst. 求出src到dst的最大流,再求出从src到dst流量最大的路径的流量,求它们的比值. #include <cstdio> #in ...
中国剩余定理 hdu 1573 X问题
HDU 1573 X问题 Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Tota ...

awk排序作业

awk排序作业的更多相关文章

随机推荐

热门专题