centos7 ambari2.6.1.5+hdp2.6.4.0 大数据集群安装部署
前言
本文是讲如何在centos7(64位) 安装ambari+hdp,如果在装有原生hadoop等集群的机器上安装,需要先将集群服务停掉,然后将不需要的环境变量注释掉即可,如果不注释掉,后面虽然可以安装成功,但是在启动某些服务的时候可能会有异常,比如最后提到的hive启动异常。本文适合系统: RedHat7、CentOS7、Oracle Linux7(都是64位)
注意:centos7中文系统有bug(python脚本中文识别问题),需要使用英文系统。
本文仅作参考(基本每个配置博客都有局限性和坑~),推荐先参考官方文档:
https://docs.hortonworks.com/HDPDocuments/Ambari-2.6.1.5/bk_ambari-installation/content/ch_Getting_Ready.html
以下均在root用户下执行。
1、满足最低系统要求
1.1 浏览器
建议您将浏览器(自己使用的windows既可)更新至最新的稳定版本
1.2 软件要求(在每台主机上)
|
|
以上软件大部分系统自带,其余可参考:CentOS 初始环境配置
2、环境准备(在每台主机上)
2.1 ssh 免密
只需master 免密到其他节点(包含自身),不需要互通,参考:linux ssh 免密登录
2.2 启用NTP
|
|
2.3 编辑主机文件
|
|
本文只是在个人虚拟机上进行安装测试,所以只选择两个节点,在公司真实环境下多个节点安装是一样的,ambari对内存要求较高,如果个人电脑配置不高的话,建议学习一下即可。
|
|
其中后面的如ambari.master.com为完全限定域名(FQDN)(通过符号“.”),不能简单的设为master等,如果该文件里有其他映射,如上面的配置必须要在最前面(自带的localhost下面一行),否则后面安装会报错。
2.4 设置主机名
以ambari.master.com为例
2.4.1
|
|
2.4.2
|
|
|
|
两步缺一不可,通过命令验证
|
|
两个必须都为ambari.master.com才行
2.5 编辑网络配置文件
|
|
修改HOSTNAME属性为FQDN
|
|
2.6 禁用iptables
|
|
2.7 禁用SELinux
2.7.1 临时禁用
|
|
2.7.2 永久禁用(重启机器)
|
|
将SELINUX改为disabled
|
|
这样服务器或虚拟机重启也没有问题。
3、制作本地源(仅在master)
因为ambari 和 hdp 安装文件比较大,如果在线安装的话会很慢,所以最好选择本地源。
(可以在集群可以访问的任何机器上制作本地源)
3.1 安装制作本地源工具
|
|
3.2 创建一个HTTP服务器
|
|
3.3 为Web服务器创建目录
|
|
3.4 下载系统对应的最新版相关安装包
其中包括Ambari、HDP、HDP-UTILS,由于HDP-GPL较小只有几百k,所以没有配置为本地源。
3.4.1 下载
|
|
3.4.2 解压
|
|
3.4.3 解决在浏览器访问HTTP://AMBARI.MASTER.COM/HDP/HDP/CENTOS7/2.6.4.0-91 为空白
原因:该目录下index.xml使用了 https://ajax.googleapis.com/ajax/libs/jquery/3.1.1/jquery.min.js 国内访问不了谷歌,将index.xml注释掉即可
|
|
此时应该可以在浏览器访问下面的地址了,可以验证一下
|
|
3.5 配置ambari、HDP、HDP-UTILS的本地源
|
|
将每个repo里的baseurl和gpgkey的地址修改为本地的
|
|
|
|
|
|
|
|
|
|
3.6 (可选)如果您的环境中配置了多个存储库,请在集群中的所有节点上部署以下插件
|
|
|
|
4、安装ambari(仅在master)
4.1安装ambari-server
|
|
4.2 设置mysql连接器
|
|
(如果使用mysql作为hive的元数据库)
4.3 创建相关的mysql数据库
创建ambari数据库及用户,登录root用户执行下面语句:
|
|
|
|
如果要安装Hive,再创建Hive数据库和用户,再执行下面的语句:
|
|
hive用户可以不用指定全部库的权限。
4.4 配置ambari-server
4.4.1 SETUP
|
|
4.4.2 配置流程
以下为全部的配置过程,其中主要是自定义jdk,输入JAVA_HOME路径,自定义数据库选mysql,输入数据库用户名,密码等
|
|
4.4.3将AMBARI数据库脚本导入到数据库
|
|
4.4.4 启动AMBARI
|
|
4.4.5 启动成功,可以通过如下地址访问:
用户名,密码为admin admin
5、使用ambari浏览器界面安装hadoop,hive等组件
5.1 登录到ambari管理界面
5.2 安装hdp集群,点击Launch Install Wizard
5.3,设置集群名称
5.4 配置本地源
其中HDP-GPL较小,用默认的即可
5.5 设置host
其中下面的为master上ssh的私钥(~/.ssh/id_rsa)
5.6 Host确认
如果失败或者卡住不动可根据日志解决,如果warn根据提示信息解决,直到全部为Success才可以进行下一步。
注:我一般根据/var/log/ambari-server/ambari-server.log 查看ambari的日志,根据里面的异常解决问题,如果没有异常,再查看ambari的其他日志文件。
下面两个是我在使用ambari时碰到的异常,可以参考:HDFS DataNode启动异常:/opt/jdk1.8.0_151/bin/java:权限不够和ambari 异常总结及解决办法
5.7 选择要安装的服务
如果有依赖其他组件选择ok即可,如安装hive依赖tez,pig等
5.8 设置各个服务Master
5.9 设置Slaves 和 Clients
5.10 自定义配置
其中红色的必须要改,大致是设置路径,密码等,如hive要设置hive元数据的数据库信息,我用的master上的mysql
测试一下连接
没有了红色的即可进行下一步,如遇到warn,可根据提示信息进行修改配置,也可以忽略警告,等装完以后再改。
5.11 review前面的配置
5.12 安装、启动、测试
这里因为个人电脑配置较低,浏览器有点卡,进度条没有显示出来。
5.13 安装完成
若最后出现警告,可以装完重启所有服务,再检查看看有没有问题,如有警告或启动失败,可根据日志排查原因,一开始安装的的组件较多的话,出现警告的可能性会大一些,所以可以先装几个必要的组件,之后一个一个组件装。
5.14 概要
5.15 hive启动异常
这次安装重启之后发现hive等服务启动不成功,我就把hive等卸载然后重装,本来以为是开始是hive没安装成功,但是重装后hive还是启动不成功,看了一下日志,发现是之前手动安装的原生的hive的环境变量没有注释掉,注释掉,重启ambari之后,再启动所有服务,就成功了(再在hive shell 里建表、插入数据、查询验证一下),所以如果在已经安装好的大数据集群上安装ambari,最好先把之前配的环境变量注释掉。
5.16 启动成功
centos7 ambari2.6.1.5+hdp2.6.4.0 大数据集群安装部署的更多相关文章
- Ambari2.6.2 HDP2.6.5 大数据集群搭建
Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SPARK-2.3.0 注:本文基于root用户 ...
- 最新版大数据平台安装部署指南,HDP-2.6.5.0,ambari-2.6.2.0
一.服务器环境配置 1 系统要求 名称 地址 操作系统 root密码 Master1 10.1.0.30 Centos 7.7 Root@bidsum1 Master2 10.1.0.105 Cent ...
- centos7下kafka集群安装部署
应用摘要: Apache kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写.Kafka是一种高吞吐量的 分布式发布订阅消息系统,是消息中间件的一种,用于构建实时 ...
- centos7下zookeeper集群安装部署
应用场景:ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件. 它是一个为分布式应用提供一致性服务的软 ...
- CentOS7.4 + Ambari 2.6.1.5 + HDP 2.6.4.0 安装部署
1. 参考说明 参考文档: https://docs.hortonworks.com/HDPDocuments/Ambari-2.6.1.5/bk_ambari-installation/conten ...
- Spring boot centos7 后台服务安装部署
Spring boot 应用服务安装部署(maven工程) 1.首先在maven工程的pom文件中引入以下标签并保存 <build> <plugins> <plugin& ...
- 在ConoHa上Centos7环境下源码安装部署LNMP
本文记录了从源码,在Centos 7上手动部署LNMP环境的过程,为了方便以后对nginx和mariadb进行升级,这里采用yum的方式进行安装. 1.建立运行网站和数据库的用户和组 groupadd ...
- centos7使用kubeadm安装部署kubernetes 1.14
应用背景: 截止目前为止,高热度的kubernetes版本已经发布至1.14,在此记录一下安装部署步骤和过程中的问题排查. 部署k8s一般两种方式:kubeadm(官方称目前已经GA,可以在生产环境使 ...
- Linux Centos7.x下安装部署Jira和confluence以及破解方法详述
简述 JIRA是Atlassian公司出品的项目与事务跟踪工具,被广泛应用于缺陷跟踪.客户服务.需求收集.流程审批.任务跟踪.项目跟踪和敏捷管理等工作领域. Confluence是一个专业的企业知识管 ...
随机推荐
- ES7 Async/Await 陷阱
什么是Async/Await ES6新增了Promise函数用于简化项目代码流程.然而在使用promise时,我们仍然要使用callback,并且并不知道程序要干什么,例如: function doS ...
- struts2(三)---struts2中的服务端数据验证框架validate
struts2为我们提供了一个很好的数据验证框架–validate,该框架可以很方便的实现服务端的数据验证. ActionSupport类提供了一个validate()方法,当我们需要在某一个acti ...
- diskqueue.go
}
- Ubuntu 16.04 为 root 帐号开启 SSH 登录
1.先用普通账号登录 2.安装 open ssh: sudo apt-get install openssh-server 3.修改密码: sudo passwd root 4.切换到root账户 s ...
- 从零开始学 Web 之 CSS(三)链接伪类、背景、行高、盒子模型、浮动
大家好,这里是「 Daotin的梦呓 」从零开始学 Web 系列教程.此文首发于「 Daotin的梦呓 」公众号,欢迎大家订阅关注.在这里我会从 Web 前端零基础开始,一步步学习 Web 相关的知识 ...
- 谈谈 ANR 之 Service 超时
1. 核心源码 关键类 路径(/frameworks/base/) ActiveServices.java services/core/java/com/android/server/am/Activ ...
- 车牌定位与畸变校正(python3.7,opencv4.0)
一.前言及思路简析 目前车牌识别系统在各小区门口随处可见,识别效果貌似都还可以.查阅资料后,发现整个过程又可以细化为车牌定位.畸变校正.车牌分割和内容识别四部分.本篇随笔主要介绍车牌定位及畸变校正两部 ...
- 教你如何使用Java手写一个基于链表的队列
在上一篇博客[教你如何使用Java手写一个基于数组的队列]中已经介绍了队列,以及Java语言中对队列的实现,对队列不是很了解的可以我上一篇文章.那么,现在就直接进入主题吧. 这篇博客主要讲解的是如何使 ...
- 强化学习(十七) 基于模型的强化学习与Dyna算法框架
在前面我们讨论了基于价值的强化学习(Value Based RL)和基于策略的强化学习模型(Policy Based RL),本篇我们讨论最后一种强化学习流派,基于模型的强化学习(Model Base ...
- Kubernetes集群部署关键知识总结
Kubernetes集群部署需要安装的组件东西很多,过程复杂,对服务器环境要求很苛刻,最好是能连外网的环境下安装,有些组件还需要连google服务器下载,这一点一般很难满足,因此最好是能提前下载好准备 ...