pig概述pig是一个用于并行计算的高级数据流语言和执行框架:类sql.文件处理框架:有一套和sql类似的执行语句,处理的对象是HDFS上文件.Pig的数据处理语言是数据流方式的,一步一步的进行处理: Pig基本数据类型:int.long.float.double.chararry.bytearray复合数据类型:Map([open#apache]).Tuple(类似于数组,(19,2)).Bag(Tuple的集合,{(19,2), (18,1)}) pig运行模式pig运行模式有两种:本地式和…