Pig Pig是一种数据流语言,用来快速轻松的处理巨大的数据.Pig包含两个部分:Pig Interface,Pig Latin.Pig可以非常方便的处理HDFS和HBase的数据,和Hive一样,Pig可以非常高效的处理其需要做的,通过直接操作Pig查询可以节 省大量的劳动和时间. 当你想在你的数据上做一些转换,并且不想编写MapReduce jobs就可以用Pig. Hive 起源于FaceBook,Hive在Hadoop中扮演数据仓库的角色.建立在Hadoop集群的最顶层,对存储在Hado…