(一)简单入门 1.创建一个表 create table if not exists ljh_emp( name string, salary float, gender string) comment 'basic information of a employee' row format delimited fields terminated by ','; 2.准备数据文件 创建test目录且目录只有一个文件,文件内容如下: ljh,25000,male jediael,25000,mal…
(一)简单入门 1.创建一个表 create table if not exists ljh_emp( name string, salary float, gender string) comment 'basic information of a employee' row format delimited fields terminated by ','; 2.准备数据文件 创建test目录且目录只有一个文件,文件内容如下: ljh,25000,male jediael,25000,mal…
上次已经讲了<Hive数据仓库之快速入门一>不记得的小伙伴可以点击回顾一下,接下来我们再讲Hive数据仓库之快速入门二 DQL hive中的order by.distribute by.sort by和cluster by order by 全局排序,只有一个Reduce任务 sort by 只做jubu排序 distribute by 用distribute by 会对指定的字段按照hashCode值对reduce的个数取模,然后将任务分配到对应的reduce中去执行 cluster by…