spark在yarn-cluster上面执行报错
在单机模式下执行成功的spark程序,在yarn上面就报错。异常信息如下:
// :: INFO DAGScheduler: Completed ResultTask(, )
// :: INFO DAGScheduler: Stage (saveAsTextFile at FileUtil.scala:) finished in 0.179 s
// :: INFO SparkContext: Job finished: saveAsTextFile at FileUtil.scala:, took 0.331739293 s
// :: INFO TaskSetManager: Finished TID in ms on localhost (progress: /)
// :: INFO TaskSchedulerImpl: Removed TaskSet 2.0, whose tasks have all completed, from pool
// :: INFO ApplicationMaster: finishApplicationMaster with SUCCEEDED
Exception in thread "main" java.lang.AssertionError: assertion failed
at scala.Predef$.assert(Predef.scala:)
at org.apache.spark.deploy.yarn.ApplicationMaster.waitForSparkContextInitialized(ApplicationMaster.scala:)
at org.apache.spark.deploy.yarn.ApplicationMaster.run(ApplicationMaster.scala:)
at org.apache.spark.deploy.yarn.ApplicationMaster$$anonfun$main$.apply$mcV$sp(ApplicationMaster.scala:)
at org.apache.spark.deploy.SparkHadoopUtil$$anon$.run(SparkHadoopUtil.scala:)
at org.apache.spark.deploy.SparkHadoopUtil$$anon$.run(SparkHadoopUtil.scala:)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:)
at org.apache.spark.deploy.SparkHadoopUtil.runAsSparkUser(SparkHadoopUtil.scala:)
at org.apache.spark.deploy.yarn.ApplicationMaster$.main(ApplicationMaster.scala:)
at org.apache.spark.deploy.yarn.ApplicationMaster.main(ApplicationMaster.scala)
// :: INFO ApplicationMaster: AppMaster received a signal.
// :: INFO ApplicationMaster: Deleting staging directory .sparkStaging/application_1408004797389_0007
从日志上面分析,job执行成功了。但貌似是没有获取到yarn返回的结果信息。
debug后发现是下面的问题:
spark-submit --class org.andy.hadoop.ETL --master yarn-cluster ../lib/rdbms-0.0.-SNAPSHOT-jar-with-dependencies.jar /dest/ETL2
job以yarn-cluster形式执行,但代码中初始化的为:
var conf = new SparkConf().setAppName("testFilter").setMaster("local")
var sc = new SparkContext(conf)
以local的形式初始化的。所以接收不到yarn的返回结果。修改后:
var conf = new SparkConf().setAppName("testFilter").setMaster("yarn-cluster")
var sc = new SparkContext(conf)
执行成功!
spark在yarn-cluster上面执行报错的更多相关文章
- 执行Spark运行在yarn上的命令报错 spark-shell --master yarn-client
1.执行Spark运行在yarn上的命令报错 spark-shell --master yarn-client,错误如下所示: // :: ERROR SparkContext: Error init ...
- Spark On Yarn Cluster生产环境下JVM的OOM和Stack Overflow问题
1.Spark on Yarn下JVM的OOM问题及解决方式 2.Spark中Driver的Stack Overflow的问题及解决方式 Spark on Yarn cluster mode: 此时有 ...
- oracle创建包后执行报错:object omgmig.test_package is invalid.
今天学习了一下oracle的包的写法,然后碰到这么个问题.包声明和包主体都正确,但是就是执行报错:object omgmig.test_package is invalid. 这是会报错的sql,看起 ...
- salt执行报错一例
执行报错: 查看服务端日志: 认证有问题 重新认证吧!!! minion端: [root@super66 ~]# cd /etc/salt/[root@super66 salt]# lsminion ...
- Ubuntu下sh *.sh使用==操作符执行报错
----<鸟哥的Linux私房菜--基础篇>学习笔记 ubuntu默认的sh是连接到dash,而我们写shell脚本时使用的时bash.bash和dash在一些方面是不兼容的.因此执行同一 ...
- windows中修改catalina.sh上传到linux执行报错This file is needed to run this program解决
windows中修改catalina.sh上传到linux执行报错This file is needed to run this program解决 一.发现问题 由于tomcat内存溢出,在wind ...
- apscheduler 执行报错No handlers could be found for logger "apscheduler.executors.default
执行报错如下: No handlers could be found for logger "apscheduler.executors.default 解决: 加入日志,查看具体报错,载根 ...
- SQL server 维护计划中 “清除维护任务” 执行报错
SQL server 维护计划中 “清除维护任务” 执行报错,错误如下: 执行查询“EXECUTE master.dbo.xp_delete_file 0,N'',N'',N'2019...”失败,错 ...
- scala的trait执行报错: 错误: 找不到或无法加载主类 cn.itcast.scala.`trait`
scala的trait执行报错: 错误: 找不到或无法加载主类 cn.itcast.scala.`trait`.Children 原因:包名写成了trait,与trait关键字重名了: package ...
随机推荐
- JAVA Eclipse如何设置点击按钮切换图片
右击图片文件夹,新建一个Android XML文件 设置文件的名称,注意这个新建的xml文件就是会被用作按钮的background属性的,所以名字不要太奇怪,设置Root Element为sele ...
- ssh的一些小操作
不让对方执行w的时候看到我 ssh -T root@8.8.8.8 bin/sh -i 还有一个技巧:远程登录时防止被记录到knowhosts文件(默认为~/.ssh/knowhosts) ssh - ...
- 【BIEE】08_修改浏览器标题栏显示内容
打开分析,我们可以看到标题栏中显示的BIEE默认的,现在想要把这个修改为自定义的 打开文件路径: D:\obiee\Oracle_BI1\bifoundation\web\msgdb\l_zh-CN\ ...
- MySql 删除相同前缀的表名
SELECT CONCAT('drop table ', table_name, ';') FROM information_schema.tables WHERE table_name LIKE ' ...
- Vue-cli + Express 构建的SPA Blog(前后分离)
代码地址如下:http://www.demodashi.com/demo/12526.html 为什么学习并使用Vue 1.发展趋势 最近这几年的前端圈子,由于戏台一般精彩纷呈,从 MVC 到 MVV ...
- java如何实现多个线程并发运行
随着计算机技术的发展,编程模型也越来越复杂多样化.但多线程编程模型是目前计算机系统架构的最终模型.随着CPU主频的不断攀升,X86架构的硬件已经成为瓶,在这种架构的CPU主频最高为4G.事实上目前3. ...
- Dephi泛型generic的应用
Dephi泛型generic的应用 泛型在C++, C#中已有广泛应用,Delphi自2009版本也引入泛型,典型的应用如TList,TDictionary.如果你熟悉C#,其用法十分类似. 比如 ...
- mysql中的for update
Select…For Update语句的语法与select语句相同,只是在select语句的后面加FOR UPDATE [NOWAIT]子句. 该语句用来锁定特定的行(如果有where子句,就是满足w ...
- angularjs中的$q
先说说什么是Promise,什么是$q吧.Promise是一种异步处理模式,有很多的实现方式,比如著名的Kris Kwal's Q还有JQuery的Deffered. 什么是Promise 以前了解过 ...
- tornado 初学
tornado第一个例子 import tornado.ioloopimport tornado.web class MainHandler(tornado.web.RequestHandler): ...