Spark资源配置(核数与内存)
转载自:http://blog.csdn.net/zrc199021/article/details/54020692
关于所在节点核数怎么看?
======================================================================
# 总核数 = 物理CPU个数 X 每颗物理CPU的核数
# 总逻辑CPU数 = 物理CPU个数 X 每颗物理CPU的核数 X 超线程数
# 查看物理CPU个数
cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l
# 查看每个物理CPU中core的个数(即核数)
cat /proc/cpuinfo| grep "cpu cores"| uniq
# 查看逻辑CPU的个数
cat /proc/cpuinfo| grep "processor"| wc -l
======================================================================
spark资源主要就是core和memery。
spark主题功能分三部分:spark RDD,sparkSQL,spark shell,如果每个部分的功能都要用,那么每块都要占用资源。
其中,spark RDD和spark shell 是动态分配占用资源的,sparkSQL是静态分配资源的(启动后即一直占着分配的资源)
spark分配的总体资源在哪里看?
- cat /home/mr/spark/conf/spark-env.sh
- JAVA_HOME=/usr/java/jdk
- SPARK_HOME=/home/mr/spark
- SPARK_PID_DIR=/home/mr/spark/pids
- SPARK_LOCAL_DIRS=/data2/zdh/spark/tmp,/data3/zdh/spark/tmp,/data4/zdh/spark/tmp
- SPARK_WORKER_DIR=/data2/zdh/spark/work
- SPARK_LOG_DIR=/data1/zdh/spark/logs
- SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18088-Dspark.history.retainedApplications=500"
- SPARK_MASTER_WEBUI_PORT=18080
- SPARK_WORKER_WEBUI_PORT=18081
- SPARK_WORKER_CORES=25
- SPARK_WORKER_MEMORY=150g
- SPARK_DAEMON_MEMORY=2g
- SPARK_LOCAL_HOSTNAME=`hostname`
- YARN_CONF_DIR=/home/mr/yarn/etc/hadoop
SparkSQL的总体资源在哪看?
- [root@vmax47 conf]# cat sparksql-defaults.conf
- spark.serializer=org.apache.spark.serializer.KryoSerializer
- spark.driver.extraJavaOptions=-Xss32m-XX:PermSize=128M-XX:MaxPermSize=512m
- spark.driver.extraClassPath=/home/mr/spark/libext/*
- spark.executor.extraClassPath=/home/mr/spark/libext/*
- spark.executor.memory=10g
- spark.eventLog.enabled=true
- spark.eventLog.dir=/data1/zdh/spark/logs/eventLog
- spark.history.fs.logDirectory=/data1/zdh/spark/logs/eventLog
- spark.worker.cleanup.enabled=true
- spark.shuffle.consolidateFiles=true
- spark.ui.retainedJobs=200
- spark.ui.retainedStages=200
- spark.deploy.retainedApplications=100
- spark.deploy.retainedDrivers=100
- spark.speculation=true
- spark.speculation.interval=1000
- spark.speculation.multiplier=4
- spark.speculation.quantile=0.85
- spark.shuffle.service.enabled=false
- spark.dynamicAllocation.enabled=false
- spark.dynamicAllocation.minExecutors=0
- spark.dynamicAllocation.maxExecutors=2147483647
- spark.sql.broadcastTimeout=600
- spark.yarn.queue=mr
- spark.master=spark://vmax47:7077,SPARK49:7077
- spark.deploy.recoveryMode=ZOOKEEPER
- spark.deploy.zookeeper.url=SPARK49:2181,HADOOP50:2181,vmax47:2181
- spark.ui.port=4100
- spark.driver.memory=40G
- spark.cores.max=30
查看Spark资源可从18080端口查看:
Spark资源配置(核数与内存)的更多相关文章
- Spark内核| 调度策略| SparkShuffle| 内存管理| 内存空间分配| 核心组件
1. 调度策略 TaskScheduler会先把DAGScheduler给过来的TaskSet封装成TaskSetManager扔到任务队列里,然后再从任务队列里按照一定的规则把它们取出来在Sched ...
- Spark Tungsten揭秘 Day4 内存和CPU优化使用
Spark Tungsten揭秘 Day4 内存和CPU优化使用 今天聚焦于内存和CPU的优化使用,这是Spark2.0提供的关于执行时的非常大的优化部分. 对过去的代码研究,我们会发现,抽象的提高, ...
- Spark Tungsten揭秘 Day3 内存分配和管理内幕
Spark Tungsten揭秘 Day3 内存分配和管理内幕 恭喜Spark2.0发布,今天会看一下2.0的源码. 今天会讲下Tungsten内存分配和管理的内幕.Tungsten想要工作,要有数据 ...
- [Spark性能调优] 第四章 : Spark Shuffle 中 JVM 内存使用及配置内幕详情
本课主题 JVM 內存使用架构剖析 Spark 1.6.x 和 Spark 2.x 的 JVM 剖析 Spark 1.6.x 以前 on Yarn 计算内存使用案例 Spark Unified Mem ...
- 【Spark调优】内存模型与参数调优
[Spark内存模型] Spark在一个executor中的内存分为3块:storage内存.execution内存.other内存. 1. storage内存:存储broadcast,cache,p ...
- Spark 1.x 爆内存相关问题汇总及解
Spark 1.x 爆内存相关问题汇总及解决 OOM # 包括GC Overhead limitjava.lang.OutOfMemoryError # on yarn org.apache.hado ...
- spark性能调优(四) spark shuffle中JVM内存使用及配置内幕详情
转载:http://www.cnblogs.com/jcchoiling/p/6494652.html 引言 Spark 从1.6.x 开始对 JVM 的内存使用作出了一种全新的改变,Spark 1. ...
- Spark Shuffle 中 JVM 内存使用及配置内幕详情
本课主题 JVM 內存使用架构剖析 Spark 1.6.x 和 Spark 2.x 的 JVM 剖析 Spark 1.6.x 以前 on Yarn 计算内存使用案例 Spark Unified M ...
- Spark 介绍(基于内存计算的大数据并行计算框架)
Spark 介绍(基于内存计算的大数据并行计算框架) Hadoop与Spark 行业广泛使用Hadoop来分析他们的数据集.原因是Hadoop框架基于一个简单的编程模型(MapReduce),它支持 ...
- 获取指定订阅下所有Azure ARM虚拟机配置(CPU核数,内存大小,磁盘信息)的使用情况
脚本内容: <# .SYNOPSIS This script grab all ARM VM VHD file in the subscription and caculate VHD size ...
随机推荐
- C# wnform 请求http ( get , post 两种方式 )
1.Get请求 string strURL = "http://localhost/WinformSubmit.php?tel=11111&name=张三";System. ...
- 20190318wdVBA_替换下划线
Sub 替换下划线() Selection.HomeKey wdStory Selection.Find.ClearFormatting Selection.Find.Font.Underline = ...
- 关于AndroidStudio 经常弹出TortoiseSVN 同步的解决办法
我的AndroidStudio在使用时是从TortoiseSVN的文件夹下直接打开的 但是由于svn自己的特点每改一个文件就要跳出来一个svn的对话框 体验极其难受!砍人的心都有了 网上的解决办法都是 ...
- python学习(三)
- day037 mysql之单表查询
一.单表查询语法 select distinct 字段1,字段2,... from 库名.表名 where 条件 group by 字段 having 筛选条件 order by 字段 limit 限 ...
- CI集成 mesos 资源分配的思考, 待续
读了mesos的论文(https://people.eecs.berkeley.edu/~alig/papers/mesos.pdf ),感觉应用在 CI 上的资源管理很赞,能够解决 jenkins在 ...
- 一个简单CI/CD流程的思考
因为公司有两地研发团队,在统一CI/CD上难度不亚于两家公司合并后的新流程建立,并非不可攻克,简单描述下心得. 首先,代码管理使用gerrit -> 因其强大的 codereview 功能被选中 ...
- js 浏览器 宽高 各种
常用: JS 获取浏览器窗口大小 // 获取窗口宽度 if (window.innerWidth) winWidth = window.innerWidth; else if ((do ...
- css3的transform-origin配合scale,控制动画,实现各种hover效果
1.底部画线,从左边开始,右边结束 html: <div class="silde-txt">底部划线</div> css: <style>.s ...
- Win10系列:C#应用控件基础12
TextBlock控件 TextBlock控件是应用程序开发过程中经常使用的控件之一,它的主要功能是显示一段只读的文本内容.开发者可以使用TextBlock控件来显示提示信息,还可以根据需求将显示的提 ...