Hive之数据查询 发布于:2013 年 10 月 11 日 由 Aaron发布于: Hive 一,排序和聚合 对于排序有两种方式,一种是order by 一种是sort by order by 会对所有的数据进行排序,所以最后会只有一个reducer来处理,如果数据量非常大,效率会非常差劲 sort by是部分排序,只是对一个reducer的数据进行排序 FROM records2 SELECT year, temperature DISTRIBUTE BY year SORT BY year…