Impala 安装笔记3一impala安装

安装impala之前，确认满足Cloudera Impala Requirements中要求的所有条件：

Supported Operating Systems
Supported CDH Versions
Hive Metastore and Related Configuration
Java Dependencies
Packages and Repositories
Networking Configuration Requirements
Hardware Requirements
User Account Requirements

Impala官方安装wiki地址：

http://www.cloudera.com/content/cloudera-content/cloudera-docs/Impala/latest/Installing-and-Using-Impala/ciiu_install.html

确保你的包管理工具中加了impala需要的库（在该链接中描述http://www.cloudera.com/content/cloudera-content/cloudera-docs/Impala/latest/Installing-and-Using-Impala/ciiu_prereqs.html#prereqs）
安装impala各组件的命令：

$ sudo yum install impala             # Binaries for daemons

$ sudo yum install impala-server      # Service start/stop script

$ sudo yum install impala-state-store # Service start/stop script

$ sudo yum install impala-catalog     # Service start/stop script

　　3. 复制hive-site.xml, core-site.xml, and hdfs-site.xml到impala的配置文件夹中，默认目录在/etc/impala/conf如果没有此文件夹就创建。

　　4. 安装impala-shell

$ sudo yum install impala-shell

　　5. 完成impala要求的配 置。

Post-Installation Configuration for Impala

强制Mandatory配置(Short-Circuit Reads)

开启Block Location Tracking可以允许impala能够从文件系统中直接读取本地数据,而不需要像平常一样与datanode通信,从而可以提升查询的速度。

依据你所安装的CDH的版本不一样，配置也是不一样的，此处我仅整理我对应的CDH4.3正确的配置，实际安装中要采用对应版本的配置。

在所有的impala的节点上，修改hdfs-site.xml文件，添加下列属性：

 <property>

     <name>dfs.client.read.shortcircuit</name>

     <value>true</value>

 </property>

 <property>

 <name>dfs.domain.socket.path</name>

 <value>/var/run/hadoop-hdfs/dn._PORT</value>

 </property>

 <property>

   <name>dfs.client.file-block-storage-locations.timeout</name>

     <value>3000</value>

 </property>

　　2. if /var/run/hadoop-hdfs是组可写的，那么确保他的组是root。

　　3. 复制hive-site.xml, core-site.xml, and hdfs-site.xml到impala的配置文件夹中，默认目录在/etc/impala/conf。

　　4. 上述配置结束后，重启所有datanodes。

强制Mandatory配置(Block Location Tracking)

开启Block Location metadata允许impala知道数据块在哪块磁盘上，这样可以更好的利用下面的磁盘。（如果不开启这个设置，impala默认是不会启动）。

对于每一个Datanode，添加下列属性到hdfs-site.xml 文件：

 <property>

  <name>dfs.datanode.hdfs-blocks-metadata.enabled</name>

  <value>true</value>

</property>

　　2. 复制hive-site.xml, core-site.xml, and hdfs-site.xml到impala的配置文件夹中，默认目录在/etc/impala/conf。

　　3. 上述配置结束后，重启所有datanodes。

配置impala 启动的一些操作

Impala服务启动的时候会加载/etc/default/impala文件中的配置，这里包含了很多impala要用到的资源的信息。例如，典型的classpath变量，你还需要加入或者修改一些信息，比如statstore的地址信息。

IMPALA_STATE_STORE_HOST=127.0.0.1

IMPALA_STATE_STORE_PORT=24000

IMPALA_BACKEND_PORT=22000

IMPALA_LOG_DIR=/var/log/impala

IMPALA_CATALOG_ARGS=" -log_dir=${IMPALA_LOG_DIR} "

IMPALA_STATE_STORE_ARGS=" -log_dir=${IMPALA_LOG_DIR} -state_store_port=${IMPALA_STATE

_STORE_PORT}"

IMPALA_SERVER_ARGS=" \

    -log_dir=${IMPALA_LOG_DIR} \

    -state_store_port=${IMPALA_STATE_STORE_PORT} \

    -use_statestore \

    -state_store_host=${IMPALA_STATE_STORE_HOST} \

    -be_port=${IMPALA_BACKEND_PORT}"

ENABLE_CORE_DUMPS=false

LIBHDFS_OPTS=-Djava.library.path=/usr/lib/impala/lib

MYSQL_CONNECTOR_JAR=/usr/share/java/mysql-connector-java.jar

IMPALA_BIN=/usr/lib/impala/sbin

IMPALA_HOME=/usr/lib/impala

HIVE_HOME=/home/godp/hive-0.9.0-cdh4.1.0

# HBASE_HOME=/usr/lib/hbase

IMPALA_CONF_DIR=/etc/impala/conf

HADOOP_CONF_DIR=/etc/impala/conf

HIVE_CONF_DIR=/etc/impala/conf

# HBASE_CONF_DIR=/etc/impala/conf

修改完这些信息之后，重启所有impala相关的服务。

$ sudo service impala-server restart

$ sudo service impala-state-store restart

$ sudo service impala-catalog restart

至此，安装结束

Impala 安装笔记3一impala安装的更多相关文章

ubuntu 18.04下greenplum安装笔记（二）安装Greenplum的失败的尝试
之前对Linux环境进行了搭建,现在开始进行Greenplum的正式安装. 下载进Greenplum的官网:https://greenplum.org/download/ 可以发现,对于ubuntu ...
CollabNet Subversion Edge 安装笔记(1)：基本安装设定篇
转载于:http://blog.miniasp.com/post/2011/12/30/CollabNet-Subversion-Edge-Installation-Notes-Part-1-Basi ...
Impala 安装笔记1一Cloudera CDH4.3.0安装
Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库 ...
入门大数据---安装ClouderaManager,CDH和Impala,Hue，oozie等服务
1.要求和支持的版本 (PS:我使用的环境,都用加粗标识了.) 1.1 支持的操作系统版本操作系统版本 RHEL/CentOS/OL with RHCK kernel 7.6, 7.5, 7.4, ...
【原创】大数据基础之Impala（1）简介、安装、使用
impala2.12 官方:http://impala.apache.org/ 一简介 Apache Impala is the open source, native analytic datab ...
Impala的安装（含使用CM安装和手动安装）（图文详解）
Impala有两种安装方式: 1)使用CM安装Impala 2)手动安装Impala 注意:Impala不支持在Debian/Ubuntu, SuSE, RHEL/CentOS 6.5系统中安装. 基 ...
Impala入门笔记
From:http://tech.uc.cn/?p=817 问题背景: 初步了解Impala的应用重点测试Impala的查询速度是否真的如传说中的比Hive快3~30倍写作目的: 了解Impala ...
CDH6.1.0离线安装——笔记
一. 概述该文档主要记录大数据平台的搭建CDH版的部署过程,以供后续部署环境提供技术参考. 1.1 主流大数据部署方法目前主流的hadoop平台部署方法主要有以下三种: Apache hadoop ...
MonoDevelop 4.2.2/Mono 3.4.0 in CentOS 6.5 安装笔记
MonoDevelop 4.2.2/Mono 3.4.0 in CentOS 6.5 安装笔记说明以root账户登录Linux操作系统,注意:本文中的所有命令行前面的 #> 表示命令行提示符 ...

随机推荐

使用redis-stat来监控redis实例
https://blog.csdn.net/xiao_jun_0820/article/details/78189576 https://blog.csdn.net/u010022051/articl ...
[ONTAK2010]Peaks
题目大意: 一个图上有$n(n\leq100000)$个带权点,$m(m\leq500000)$条带权边.有$q(q\leq500000)$组询问,每次询问从点$v$出发,只经过权值小于等于$x$的边 ...
3.eclipse中 maven打包web工程几种方式
1.右键项目-export 选择war file导出即可 2.第二种:右键项目-RUN AS -maven build..goals填入:clean package 第三种方式:右键项目.选择Debu ...
debug : 调试主进程启动的子进程
http://blog.csdn.net/lostspeed/article/details/10109867
android权限大全转http://www.cnblogs.com/classic/archive/2011/06/20/2085055.html
android权限大全转http://www.cnblogs.com/classic/archive/2011/06/20/2085055.html 访问登记属性 android.permission ...
Excel导入的HDR=YES; IMEX=1详解
参数HDR的值:HDR=Yes,这代表第一行是标题,不做为数据使用 ,如果用HDR=NO,则表示第一行不是标题,做为数据来使用.系统默认的是YES 参数Excel 8.0对于Excel 97以上版本都 ...
转置卷积&&膨胀卷积
Convolution arithmetic tutorial theano Convolution arithmetric github 如何理解深度学习中的deconvolution networ ...
Maven plugin提示错误“Plugin execution not covered by lifecycle configuration”
myeclipse在其POM文件的一处提示出错如下: Plugin execution not covered by lifecycle configuration: org.apache.maven ...
设计模式之中介者模式(Mediator)摘录
23种GOF设计模式一般分为三大类:创建型模式.结构型模式.行为模式. 创建型模式抽象了实例化过程.它们帮助一个系统独立于怎样创建.组合和表示它的那些对象.一个类创建型模式使用继承改变被实例化的类,而 ...
POCO类
我认为POCO(简单传统CLR对象)重点应该是简单,不跟其他不相关的类进行关联关系或不相关的属性.<NHibernate 4 Beginner Guid>这本书有提到,应该是满足下面三个条 ...

Impala 安装笔记3一impala安装

Post-Installation Configuration for Impala

Impala 安装笔记3一impala安装的更多相关文章

随机推荐

热门专题