在sparkR在配置完成的基础上,本例采用Spark on yarn模式,介绍sparkR运行的一个例子. 在spark的安装目录下,/examples/src/main/r,有一个dataframe.R文件.该文件默认是在本地的模式下运行的,不与hdfs交互.可以将脚本进行相应修改,提交到yarn模式下. 在提交之前,要先将${SPARK_HOME}/examples/src/main/resources/people.json 文件上传到hdfs上,我上传到了hdfs://data-mini…