pig是hadoop客户端,使用类似于SQL的面向数据流的语言pig latin,这个语言可以完成排序,过滤,求和,关联等操作,可以支持自定义函数.Pig自动把pig latin 映射为Map-Reduce作业上传到集群运行,减少用户编写java程序的苦恼. Pig是专门用于处理来自于HDFS的数据的. Pig提供了一套流式的数据处理语言,转换为MapReduce,来处理HDFS中的数据. *HBase是用来存储和查询数据 1.如何使用? 直接解压缩,执行bin/pig,就进入到grunt命令行…