Spark python集成 1.介绍 Spark支持python语言,对于大量的SQL类型的操作,不需要编译,可以直接提交python文件给spark来运行,因此非常简单方便,但是性能要比scala或java慢.对于常规任务,可以使用python来编写,特殊任务还是建议scala编写. 2.使用pyspark启动spark shell(centos) 2.1 启动pyspark $>spark/bin/pyspark --master spark://s101:7077 使用python实现w