kudu的架构体系

下图显示了一个具有三个 master 和多个 tablet server 的 Kudu 集群,每个服务器都支持多个 tablet。它说明了如何使用 Raft 共识来允许 master 和 tablet server 的 leader 和 f ollow。此外,tablet server 可以成为某些 tablet 的 leader,也可以是其他 tablet 的 follower。leader 以金色显示,而 follower 则显示为蓝色。

下面是一些基本概念:

Table(表)
  一张 talbe 是数据存储在 Kudu 的位置。表具有 schema 和全局有序的 primary key(主键)。table 被分成称为 tablets 的 segments。
Tablet
  一个 tablet 是一张 table 连续的 segment,与其它数据存储引擎或关系型数据库中的 partition(分区)相似。给定的 tablet 冗余到多个 tablet 服务器上,并且在任何给定的时间点,其中一个副本被认为是 leader tablet。任何副本都可以对读取进行服务,并且写入时需要在为 tablet 服务的一组 tablet server之间达成一致性。
Tablet Server
  一个 tablet server 存储 tablet 和为 tablet 向 client 提供服务。对于给定的 tablet,一个 tablet server 充当 leader,其他 tablet server 充当该 tablet 的 follower 副本。只有 leader服务写请求,然而 leader 或 followers 为每个服务提供读请求。leader 使用 Raft Consunsus Algorithm来进行选举 。一个 tablet server 可以服务多个 tablets ,并且一个 tablet 可以被多个 tablet servers 服务着。

kudu的集群安装

节点规划

节点            Kudu-master        Kudu-tserver
Hadoop01 是 是
Hadoop02 是 是
Hadoop03 是 是

配置本地的CDH-yum源

所有cloudera软件下载地址:

http://archive.cloudera.com/cdh5/cdh/5/
或者http://archive.cloudera.com/cdh5/

1):上传压缩包并解压

5个G的压缩文件上传/yumData目录下,并进行解压

cd /yumData/
tar -zxvf cdh5.14.0-centos6.tar.gz

2):制作本地yum源

镜像源是centos当中下载相关软件的地址,我们可以通过制作我们自己的镜像源指定我们去哪里下载impala的rpm包,这里我们使用httpd这个软件来作为服务端,启动httpd的服务来作为我们镜像源的下载地址 这里我们选用第三台机器作为镜像源的服务端 node03机器上执行以下命令:

yum  -y install httpd
service httpd start
cd /etc/yum.repos.d

vim localimp.repo

[localimp]
name=localimp
baseurl=http://hadoop01/5.14.0
gpgcheck=
enabled=

创建apache httpd的读取连接

setenforce
ln -s /yumData/cdh/5.14. /var/www/html/ (删除软连接方式):rm -rf ./5.14.
(错误删除方式):rm -rf ./5.14./

页面访问本地yum源,出现这个界面表示本地yum源制作成功 访问http://hadoop01/5.14.0/

将制作好的localimp配置文件发放到所有需要安装impala的节点上去

cd /etc/yum.repos.d/
scp localimp.repo hadoop02:$PWD
scp localimp.repo hadoop03:$PWD

下载命令:

sudo yum install kudu                         # Base Kudu files
sudo yum install kudu-master # Kudu master init.d service script and default configuration
sudo yum install kudu-tserver # Kudu tablet server init.d service script and default configuration
sudo yum install kudu-client0 # Kudu C++ client shared library
sudo yum install kudu-client-devel # Kudu C++ client SDK

3):安装

在不同的节点上下载不同的kudu进程即可;

参照我的服务器:

服务器                    命令
hadoop01 yum install -y kudu kudu-master kudu-tserver kudu-client0 kudu-client-devel hadoop02 yum install -y kudu kudu-master kudu-tserver kudu-client0 kudu-client-devel hadoop03 yum install -y kudu kudu-master kudu-tserver kudu-client0 kudu-client-devel

配置master和tserver节点

安装完成之后。 需要在所有节点的/etc/kudu/conf目录下有两个文件:master.gflagfile和tserver.gflagfile 。

默认配置(不采用):

master.gflagfil

# cat /etc/kudu/conf/master.gflagfile
# Do not modify these two lines. If you wish to change these variables,
# modify them in /etc/default/kudu-master.
--fromenv=rpc_bind_addresses
--fromenv=log_dir
--fs_wal_dir=/opt/kudu/master
--fs_data_dirs=/opt/kudu/master

tserver.gflagfile::

# cat /etc/kudu/conf/tserver.gflagfile
# Do not modify these two lines. If you wish to change these variables,
# modify them in /etc/default/kudu-tserver.
--fromenv=rpc_bind_addresses
--fromenv=log_dir
--fs_wal_dir=/opt/kudu/tserver
--fs_data_dirs=/opt/kudu/tserver

自定义配置:(每一台节点) 在所有节点操作如下:

1):配置master

master.gflagfil:

[angel@angel1 kudu]$ vim /etc/default/kudu-master
export FLAGS_log_dir=/var/log/kudu
export FLAGS_rpc_bind_addresses=hadoop01: 【指定每台主机】

[angel@angel1 kudu]$ vim /etc/kudu/conf/master.gflagfile

# Do not modify these two lines. If you wish to change these variables,
# modify them in /etc/default/kudu-master. --fromenv=rpc_bind_addresses
--fromenv=log_dir
--fs_wal_dir=/opt/cdh/kudu/master
--fs_data_dirs=/opt/cdh/kudu/master
--master_addresses=hadoop01:,hadoop02:,hadoop03:

2):配置tserver

tserver.gflagfile: [angel@angel1 kudu]$ vim /etc/default/kudu-tserver

export FLAGS_log_dir=/var/log/kudu
export FLAGS_rpc_bind_addresses=hadoop01:【指定每台主机】

[angel@angel1 kudu]$ vim /etc/kudu/conf/tserver.gflagfile

# Do not modify these two lines. If you wish to change these variables,
# modify them in /etc/default/kudu-tserver. --fromenv=rpc_bind_addresses
--fromenv=log_dir
--fs_wal_dir=/opt/cdh/kudu/tserver
--fs_data_dirs=/opt/cdh/kudu/tserver
--tserver_master_addrs=hadoop01:,hadoop02:,hadoop03:

注意

kudu的默认权限是kudu , 所以如果使用root用户的话,需要将/opt/cdh/kudu的权限修改为kudu
drwxr-xr-x. kudu kudu Nov : kudu
配置完成后,将配置文件tserver.gflagfile、tserver.gflagfile 以及自定义目录:/opt/cdh/kudu的权限修改为当前使用用户的权限(chown -R angel:angel XXXXX)【如果是普通用户】
另外:如果使用普通用户,需要为普通用户配置sudo权限:
/etc/sudoers文件中添加

/etc/sudoers文件中添加:

注意:kudu的日志文件需要定期清理,否则占用磁盘空间非常大(/var/log/kudu目录)

启动和关闭kudu

方式1: 启动:

sudo service kudu-master start
sudo service kudu-tserver start

启动的时候注意服务器时钟是同步 :

/etc/init.d/ntpd restart

关闭:

sudo service kudu-master stop
sudo service kudu-tserver stop

方式2: 启动:

sudo /etc/init.d/kudu-master  start

sudo /etc/init.d/kudu-tserver  start

关闭:

sudo /etc/init.d/kudu-master  stop
sudo /etc/init.d/kudu-tserver stop

安装过成中可能出现的问题

1:给用户添加sudo权限的时候报错

sudo: /etc/sudoers is world writable
解决方式:pkexec chmod /etc/sudoers

2:启动kudu的时候报错

Failed to start Kudu Master Server. Return value:         [FAILED]
去日志文件中查看:
错误:F0810 ::08.354552 master_main.cc:] Check failed: _s.ok() Bad status: Service unavailable: Cannot initialize clock: Error reading clock. Clock considered unsynchronized
解决:
第一步:首先检查是否有安装ntp:如果没有安装则使用以下命令安装:
yum -y install ntp
第二步:设置随机启动:
service ntpd start
chkconfig ntpd on

3:启动过程中报错

F0810 ::12.620932  master_main.cc:] Check failed: _s.ok() Bad status: Invalid argument: Unable to initialize catalog manager: Failed to initialize sys tables async: on-disk master list
解决:
():停掉master和tserver
():删除掉之前所有的/opt/cdh/kudu/master/*和/opt/cdh/kudu/tserver/*

4:启动过程中报错:

F0913 ::00.628237  master_main.cc:] Check failed: _s.ok() Bad status: IO error: Could not create new FS layout: unable to create file system roots: unable to write instance metadata: Call to mkstemp() failed on name template /opt/cdh/kudu/master/instance.kudutmp.XXXXXX: Permission denied (error )
这是因为kudu默认使用kudu权限进行执行,可能遇到文件夹的权限不一致情况,更改文件夹权限即可

kudu的图形界面

Master的web地址:http://hadoop01:8051/masters

Tserver的web地址:http://hadoop01:8051/tablet-servers

Kudu的集群安装(1.6.0-cdh5.14.0)的更多相关文章

  1. K8s集群安装--最新版 Kubernetes 1.14.1

    K8s集群安装--最新版 Kubernetes 1.14.1 前言 网上有很多关于k8s安装的文章,但是我参照一些文章安装时碰到了不少坑.今天终于安装好了,故将一些关键点写下来与大家共享. 我安装是基 ...

  2. [转帖]K8s集群安装--最新版 Kubernetes 1.14.1

    K8s集群安装--最新版 Kubernetes 1.14.1 http://www.cnblogs.com/jieky/p/10679998.html 原作者写的比较简单 大略流程和跳转的多一些 改天 ...

  3. CentOS7+CDH5.14.0安装全流程记录,图文详解全程实测-总目录

    CentOS7+CDH5.14.0安装全流程记录,图文详解全程实测-总目录: 0.Windows 10本机下载Xshell,以方便往Linux主机上上传大文件 1.CentOS7+CDH5.14.0安 ...

  4. 菜鸟玩云计算之十八:Hadoop 2.5.0 HA 集群安装第1章

    菜鸟玩云计算之十八:Hadoop 2.5.0 HA 集群安装第1章 cheungmine, 2014-10-25 0 引言 在生产环境上安装Hadoop高可用集群一直是一个需要极度耐心和体力的细致工作 ...

  5. CentOS下Hadoop-2.2.0集群安装配置

    对于一个刚开始学习Spark的人来说,当然首先需要把环境搭建好,再跑几个例子,目前比较流行的部署是Spark On Yarn,作为新手,我觉得有必要走一遍Hadoop的集群安装配置,而不仅仅停留在本地 ...

  6. redis3.0.0 集群安装详细步骤

    Redis集群部署文档(centos6系统) Redis集群部署文档(centos6系统) (要让集群正常工作至少需要3个主节点,在这里我们要创建6个redis节点,其中三个为主节点,三个为从节点,对 ...

  7. hadoop2.20.0集群安装教程

    一.安装的需要软件及集群描述 1.软件: Vmware9.0:虚拟机 Hadoop2.2.0:Apache官网原版稳定版本 JDK1.7.0_07:Oracle官网版本 Ubuntu12.04LTS: ...

  8. Storm-1.0.1+ZooKeeper-3.4.8+Netty-4.1.3 HA集群安装

    Storm-1.0.1+ZooKeeper-3.4.8+Netty-4.1.3 HA集群安装 下载Storm-1.0.1 http://mirrors.tuna.tsinghua.edu.cn/apa ...

  9. hadoop 2.2.0集群安装

    相关阅读: hbase 0.98.1集群安装 本文将基于hadoop 2.2.0解说其在linux集群上的安装方法,并对一些重要的设置项进行解释,本文原文链接:http://blog.csdn.net ...

随机推荐

  1. 007grafana监控时间戳转换

    一. https://d.jyall.me/dashboard-solo/db/soloview?panelId=1&var-metrics=stats.gauges.zookeeper.mo ...

  2. top 分析

    Top命令监控某个进程的资源占有情况 下面是各种内存: VIRT:virtual memory usage 1.进程“需要的”虚拟内存大小,包括进程使用的库.代码.数据等     2.假如进程申请10 ...

  3. 使用mysql自带工具mysqldump进行全库备份以及source命令恢复数据库

    mysql数据库提供了一个很好用的工具mysqldump用以备份数据库,下面将使用mysqldump命令进行备份所有数据库以及指定数据库 一.mysqldump一次性备份所有数据库数据 /usr/lo ...

  4. svn:Item ‘XXXXXX’ is out of date

    问题描述:     工作副本没有更新到最新版本 svn: 提交失败(细节如下): svn: 目录 "D:\develop\workspace\gxcjx\src\main\resources ...

  5. <转载>关系规范化之求最小函数依赖集(最小覆盖)

    原文链接http://blog.csdn.net/icurious/article/details/51240114 最小函数依赖集 一.等价和覆盖 定义:关系模式R<U,F>上的两个依赖 ...

  6. 阿里云服务器ubuntu 配置

    由于阿里云的导入自定义 ubuntu 镜像需要开通 OSS 快照是收费的(看着感觉不贵,但是也很麻烦),而且自己已配置好的镜像想导入需要转换格式,还存在不能使用的情况,所以麻烦点直接在阿里云原来的ub ...

  7. 搭建 RabbitMQ Server 高可用集群【转】

    阅读目录: 准备工作 搭建 RabbitMQ Server 单机版 RabbitMQ Server 高可用集群相关概念 搭建 RabbitMQ Server 高可用集群 搭建 HAProxy 负载均衡 ...

  8. 【进阶3-2期】JavaScript深入之重新认识箭头函数的this(转)

    这是我在公众号(高级前端进阶)看到的文章,现在做笔记 https://github.com/yygmind/blog/issues/21 上篇文章详细的分析了各种this的情况,看过之后对this的概 ...

  9. easyui生成合并行,合计计算价格

    easyui生成合并行,合计计算价格 注:本文来源: 原创 一:图样你效果图 二:代码实现 1:datagrid 列展示: window.dataGrid = $("#dataGrid&qu ...

  10. Confluence 6 用户宏示例 - Color and Size

    这个示例定义了如何向你宏中传递参数.我们将会创建一个字体样式宏,在这个宏中有 2 个参数,允许用户在这 2 个参数中指定宏中包含的字体的颜色大小. Macro name stylish Visibil ...