根据。方案最右侧一栏是一个8G VM的分配方案，方案预留1-2G的内存给操作系统，分配4G给Yarn/MapReduce，当然也包括了HIVE，剩余的2-3G是在需要使用HBase时预留给HBase的。

内存调优

一、AM、Container大小设置
1、tez.am.resource.memory.mb　　#设置 tez AM容器内存

　　默认值：　　

　　配置文件：tez-site.xml
　　建议：不小于或者等于yarn.scheduler.minimum-allocation-mb值。

　　

、hive.tez.container.size　　#设置 tez container内存

　　默认值：-

　　默认情况下，Tez将生成一个mapper大小的容器。这可以用来覆盖默认值。

　　配置文件：hive-site-xml
　　建议：不小于或者是yarn.scheduler.minimum-allocation-mb的倍数

　　
二、AM、Container JVM参数设置
1、tez.am.launch.cmd-opts　　#设置 AM jvm，启动TEZ任务进程期间提供的命令行选项。

　　默认值：-XX:+PrintGCDetails -verbose:gc -XX:+PrintGCTimeStamps -XX:+UseNUMA -XX:+UseParallelGC(用于GC)，默认的大小：80%*tez.am.resource.memory.mb
　　配置文件：tez-site.xml
　　建议：不要在这些启动选项中设置任何xmx或xms，以便tez可以自动确定它们。
　　

2、hive.tez.java.ops　　#设置 container jvm

　　默认值：Hortonworks建议“–server –Djava.net.preferIPv4Stack=true–XX:NewRatio=8 –XX:+UseNUMA –XX:UseG1G”，默认大小：80%*hive.tez.container.size
　　说明：在hive 2.x的官方文档中没有找到这个参数。看有些博客里面有这个值。
　　配置文件：hive-site.xml

3、tez.container.max.java.heap.fraction　　#设置task/AM占用jvm内存大小的比例。
　　默认值：0.8
　　配置文件：tez-site.xml
　　说明：这个值按具体需要调整，当内存不足时，一般都要调小。

三、Hive内存Map Join参数设置
1、tez.runtime.io.sort.mb　　#设置输出排序内存大小
　　默认值：100
　　配置文件：tez-site.xml
　　建议：40%*hive.tez.container.size，一般不超过2G
2、hive.auto.convert.join.noconditionaltask　　#是否将多个mapjoin合并为一个
　　默认值：true
　　建议使用默认值。
　　配置文件：hive-site.xml
3、hive.auto.convert.join.noconditionaltask.size  
　　默认值：10000000　　(10M)
　　说明：这个参数使用的前提是hive.auto.convert.join.noconditionaltask值为true，多个mapjoin转换为1个时，所有小表的文件大小总和小于这个值，这个值只是限制输入的表文件的大小，并不代表实际mapjoin时hashtable的大小。 建议值：1/3* hive.tez.container.size
　　配置文件：hive-site.xml

4、tez.runtime.unordered.output.buffer.size-mb　　#如果不直接写入磁盘，使用的缓冲区大小
　　默认值：100M
 　建议：10%* hive.tez.container.size
　　配置文件：tez-site.xml

5、tez.am.container.reuse.enabled　　#容器重用
　　默认值：true
　　配置文件：tez-ste.xml

hive tez调优（3）的更多相关文章

数据迁移过程中hive sql调优
本文记录的是,在数据处理过程中,遇到了一个sql执行很慢,对一些大型的hive表还会出现OOM,一步一步通过参数的设置和sql优化,将其调优的过程. 先上sql ) t where t.num =1) ...
Hive（十）Hive性能调优总结
一.Fetch抓取 1.理论分析 Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算.例如:SELECT * FROM employees;在这种情况下,Hive可以简单 ...
Hive参数调优
调优 Hive提供三种可以改变环境变量的方法,分别是: (1)修改${HIVE_HOME}/conf/hive-site.xml配置文件: 所有的默认配置都在${HIVE_HOME}/conf/hiv ...
Hive 企业调优
9.企业级调优 9.1 Fetch 抓取 Fetch 抓取:Hive 中对某些情况的查询可以不必使用 MapReduce 计算: hive.fetch.task.conversion:more 9.2 ...
hive的调优
调优 1 Fetch抓取(Hive可以避免进行MapReduce) Hive中对某些情况的查询可以不必使用MapReduce计算.例如:SELECT * FROM employees;在这种情况下,H ...
HDP Hive性能调优
(官方文档翻译整理及总结) 一.优化数据仓库 ① Hive LLAP 是一项接近实时结果查询的技术,可用于BI工具以及网络看板的应用,能够将数据仓库的查询时间缩短到15秒之内,这样的查询称之为Int ...
关于Hive的调优（本身，sql，mapreduce）
1.关于hive的优化 ->大表拆分小表 ->过滤字段 ->按字段分类存放 ->外部表与分区表 ->外部表:删除时只删除元数据信息,不删除数据文件多人使用多个外部表操作 ...
060 关于Hive的调优（本身，sql，mapreduce）
1.关于hive的优化 ->大表拆分小表 ->过滤字段 ->按字段分类存放 ->外部表与分区表 ->外部表:删除时只删除元数据信息,不删除数据文件多人使用多个外部表操作 ...
Hive 性能调优
避免执行MR select * or select field1,field2 limit 10 where语句中只有分区字段或该表的本地字段使用本地set hive.exec.mode.local ...

随机推荐

mysql建表常用命令
MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于 Oracle 旗下产品.MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RD ...
javascript原型原型链学习随笔
理解原型和原型链.需从构造函数.__proto__属性(IE11以下这个属性是undefined,请使用chrome调试).prototype属性入手. JS内置的好多函数,这些函数又被叫做构造函数. ...
iptables的nat规则骚操作
水一枪我对防火墙这块的认知是比较低的, 之前一直没怎么去用最多的要么就是 iptables -A INPUT -p tcp --dport 80 -j ACCEPT iptables -A OUT ...
aspx反射调用方法
string name = base.Request["action"]; ]); if (obj2 != null) { s = obj2.ToString(); } 传入方法名 ...
seo域名选择
1-1第一选域名: 1,简单好记,有意义. 2,后缀首选com 其次cn 1-2购买域名网站有 1,阿里云 2,godaddy 3 ,景安购买是可以在这三个域名平台都看看价格有些不一样.(可以省钱) ...
MySql 安装及实用笔记
安装更新 rpm 包 rpm -Uvh http://repo.mysql.com//mysql57-community-release-el7-7.noarch.rpm 安装MySql yum - ...
跨域访问支持（Spring Boot、Nginx、浏览器）
原文:http://www.itmuch.com/work/cors/ 最近家中事多,好久没有写点啥了.一时间竟然不知从何说起.先说下最近家里发生的事情吧: 老爸肺气肿住院: 老妈甲状腺囊肿儿子喘息 ...
MyBatis3_[tp_41-42-43]-_动态sql_trim_自定义字符串截取_choose分支选择_update的set与if-trim 结合的动态更新
笔记要点出错分析与总结 /** 笔记: * 查询的时候,如果某些条件,没带可能SQL拼装会有问题; * 1.-->给where 后面加上 1=1, 以后的条件都and XXX * 2. < ...
python学习之多线程多进程
python基础进程&线程进程是一组资源的集合,运行一个系统就是打开了一个进程,如果同时打开了两个记事本就是开启了两个进程,进程是一个笼统的概念,进程中由线程干活工作,由进程统一管理一个 ...
关于TCP/IP协议的记录
本博客是个人随笔,只是记录自己的学习过程.

hive tez调优（3）

内存调优

hive tez调优（3）的更多相关文章

随机推荐

热门专题