前言

这是小的第一次搭建hadoop平台,写下这篇博客有以下几个目的(ps:本博只记录在linux系统下搭建hadoop的步骤,如果需要了解在其他平台上搭建hadoop的步骤,还请移步):

  • 1.希望大牛可以指出小的在搭建hadoop平台中的错误的打开方式
  • 2.希望可以帮助到那些需要在linux平台上搭建hadoop的人们
  • 3.记录下搭建过程,以便以后很好的回顾

准备工作

  • 1.linux中java环境的搭建(ps:java环境的搭建不是本博的重点,如果不知道搭建方法,请自行百度)
  • 2.硬件需求至少4g内存

搭建环境

  • 1.ubuntu 14(ps:一定要是64位的操作系统,不然安装cloudera-manager-agant会报错)
  • 2.jdk 7

安装Hadoop

安装SSH

SSH的作用:

  • 1.cloudera manager需要通过SSH跳转到所有的节点上执行任务
  • 2.为将来远程服务提供方便

安装步骤:

  • 1.更新最新的软件列表(ps:下载最新的软件列表):
sudo apt-get update
  • 2.安装ssh:
sudo apt-get -y --force-yes install ssh
  • 3.查看ssh是否安装成功:
sudo service ssh status

4.安装ntp

安装步骤:

  • 1.安装ntp:
sudo apt-get -y --force-yes install ntp

配置无密码sudo

原因:在安装CDH的过程中,让Cloudera Manager可以不使用密码直接获取root权限

操作步骤:

  • 1.创建一个新的用户cdh:
sudo useradd -b /home -d /home/cdh -m -s /bin/bash cdh
  • 2.查看用户是否创建成功:
sudo cat /etc/passwd
  • 3.设置cdh用户的密码(ps:之后集群页面安装,提供ssh凭证时需要用到)
sudo passwd cdh
  • 4.生成文件nopasswd
echo "cdh ALL=(ALL:ALL) NOPASSWD: ALL" > nopasswd
  • 5.修改nopasswd文件的用户
sudo chown root.root nopasswd
  • 6.将文件放入权限配置文件夹下
sudo mv nopasswd /etc/sudoers.d/nopasswd

配置网络

介绍:Ubuntu默认将网络配置成以DHCP的方式获取IP地址。集群中每一台都已经有固定IP地址,所以我们需要固定一个IP地址,因此需要将IP获取方式改为静态获取。

操作步骤:

  • 1.修改/etc/network/interfaces文件(ps:以下指令使用到了vim,若各位看官没有该指令,请百度自行安装)
sudo vim /etc/network/interface

在打开的文件末尾添加以下代码:

auto eth0
iface eth0 inet static
address x.x.x.x
netmask x.x.x.x
gateway x.x.x.x
broadcast x.x.x.x
dns-nameservers x.x.x.x 8.8.8.8
  • 2.保存文件,并且重启电脑
reboot

问题记录:

  • 1.修改为静态获取ip后,重启系统,发现该主机ping局域网的其他主机显示dstination host unreachable,但是可以上网。

    原因:通过百度,发现小弟安装的是桌面版的ubuntu,然而桌面版的ubuntu修改interface文件后,重启系统也是不会生效的。

    解决:修改 /etc/NetworkManager/NetworkManager.conf 文档中的managed参数,使之为true。重启系统,问题解决。

配置host文件

操作步骤:

  • 1.打开hosts文件
sudo vim /etc/hosts
  • 2.在文件最后面加入如下代码
127.0.0.1 server.bigdata.net localhost

配置hostsname文件

操作步骤:

  • 1.打开hostsname文件
sudo vim /etc/hostname
  • 2.在文件末尾加入以下代码
server.bigdata.net

配置sysctl.conf文件

操作步骤:

  • 1.打开sysctl.conf文件
sudo vim /etc/sysctl.conf
  • 2.在文件末尾加入以下代码
vm.swappiness=0

安装CDH

注意:在安装CDH的过程中,请保持电脑可以访问外网,因为在安装的过程中需要下载安装包。

安装步骤:

  • 1.进入到sources.list.d文件夹下(ps:该文件夹是使用 add-apt-repository命令安装的第三方源库)
cd /etc/apt/sources.list.d/
  • 2.下载couldera的第三方源
sudo wget http://archive.cloudera.com/cm5/ubuntu/trusty/amd64/cm/cloudera.list
  • 3.向apt添加cloudera源公钥(不执行这一步,更新源可能会出现NO_PUBKEY的错误提示)
sudo curl -s http://archive.cloudera.com/cm5/ubuntu/trusty/amd64/cm/archive.key | sudo apt-key add -
  • 4.更新源
sudo apt-get update
  • 5.在Cloudera Manager节点上安装cloudera server
sudo apt-get -y --force-yes install cloudera-manager-daemons cloudera-manager-server
  • 6.在Cloudera Manager节点上安装DB
sudo apt-get -y --force-yes install cloudera-manager-server-db-2
  • 7.启动Cloudera Manager节点
sudo service cloudera-scm-server-db start
sudo service cloudera-scm-server start

通过网页安装cdh

  • 1.使用浏览器访问Cloudera Manager节点的7180端口,比如http://server.bigdata.net:7180



输入用户名和密码(ps:默认都是admin),点击登录

  • 2.选择版本

这里我选择的是免费版本,点击继续,看到下面的界面,点击继续

  • 3.指定集群的主机

在这里,由于就一个节点,所以我们在框内填写server.bigdata.net,并且点击搜索按钮,出现下图的节点信息,勾选,然后点击继续

  • 4.集群CDH包的选择

    这里保持默认的就好了,除非你确定还要选择其他的包。然后点继续按钮

  • 5.JDK选项

    先选中安装Oracle JDK,然后再选中安装Java无限制强度加密,然后点继续按钮

  • 6.启用单用户模式

    这一页保持默认就好了,点继续按钮

  • 7.提供SSH登陆凭据

这里我们选择其他用户,密码就是之前设置的密码,其他的配置保持不变,点击继续,安装完成后,点击继续

  • 8.安装选定的Parcel

    在这个界面耐心等待继续按钮变亮,注意,如果你现在做的是为了备份安装包而进行的单节点临时安装过程,那么到这里就可以停止了,然后进行安装包的备份操作。如果你是在安装一个实际会使用的集群,那么请点击继续按钮

  • 9.检查主机正确性

    在这个界面耐心等待主机检查完成,要保证没有一个错误。如果有任何错误,参考前面的配置修改,然后点“重新运行”按钮,如果没有任何问题了,就点完成按钮

hadoop平台搭建的更多相关文章

  1. Hadoop 平台搭建

    一.在Linux中安装JDK并配置环境变量 输入javac 查看是否已安装java环境如果没有安装 sudo apt-get install openjdk-7-jdk再次检测 javac修改配置参数 ...

  2. hadoop伪分布式平台搭建(centos 6.3)

    最近要写一个数据量较大的程序,所以想搭建一个hbase平台试试.搭建hbase伪分布式平台,需要先搭建hadoop平台.本文主要介绍伪分布式平台搭建过程. 目录: 一.前言 二.环境搭建 三.命令测试 ...

  3. Hadoop 全分布模式 平台搭建

    现将博客搬家至CSDN,博主改去CSDN玩玩~ 传送门:http://blog.csdn.net/sinat_28177969/article/details/54138163 Ps:主要答疑区在本帖 ...

  4. 大数据平台搭建(hadoop+spark)

    大数据平台搭建(hadoop+spark) 一.基本信息 1. 服务器基本信息 主机名 ip地址 安装服务 spark-master 172.16.200.81 jdk.hadoop.spark.sc ...

  5. Hadoop高可用平台搭建

    文章概览: 1.机器规划和预配置 2.软件安装 3.集群文件配置 4.启动集群 5.HA验证 6.注意事项 7.小结   机器规划和预配置 主机/进程 NN DN RM NM ZK(QP) ZKFC ...

  6. 大数据Hadoop学习之搭建hadoop平台(2.2)

    关于大数据,一看就懂,一懂就懵. 一.概述 本文介绍如何搭建hadoop分布式集群环境,前面文章已经介绍了如何搭建hadoop单机环境和伪分布式环境,如需要,请参看:大数据Hadoop学习之搭建had ...

  7. 大数据Hadoop学习之搭建Hadoop平台(2.1)

     关于大数据,一看就懂,一懂就懵. 一.简介 Hadoop的平台搭建,设置为三种搭建方式,第一种是"单节点安装",这种安装方式最为简单,但是并没有展示出Hadoop的技术优势,适合 ...

  8. 高可用Hadoop平台-HBase集群搭建

    1.概述 今天补充一篇HBase集群的搭建,这个是高可用系列遗漏的一篇博客,今天抽时间补上,今天给大家介绍的主要内容目录如下所示: 基础软件的准备 HBase介绍 HBase集群搭建 单点问题验证 截 ...

  9. 大数据平台搭建:Hadoop

    To construct big data distributed platform based on Hadoop is a common method. Hadoop comes fron Goo ...

随机推荐

  1. Nacos1.1.3小试牛刀

    什么是 Nacos(摘自https://nacos.io/zh-cn/docs/quick-start.html) Nacos 致力于帮助您发现.配置和管理微服务.Nacos 提供了一组简单易用的特性 ...

  2. Java学习day7面向对象编程1-对象和类

    一.Java编程中对象和类的概念 1,什么是类? 答:类是客观存在的,抽象的,概念的东西. 2,什么是对象? 答:对象是具体的,实际的,代表一个事物.例如:车是一个类,汽车,自行车就是他的对象. 关于 ...

  3. Python 的 time 模块导入及其方法

    时间模块很重要,Python 程序能用很多方式处理日期和时间,转换日期格式是一个常见的功能,讲解一下Python 的 time 模块导入及其方法. 1,time 模块导入 import time; # ...

  4. echarts柱状图个数多,横坐标名称过长显示不全解决方法

    当echarts柱状图个数多,横坐标名称过长时横坐标名称显示不全,网上并没有搜到太好的方法,于是自己加工了下,将横坐标名称显示前六位,当鼠标放到上面的时候显示全名,下面是示例代码,可以直接拷贝测试 代 ...

  5. Linux环境下安装Django和Python

        1  下载前准备操作:安装相关的依赖库(工具包) yum install gcc patch libffi-devel python-devel  zlib-devel bzip2-devel ...

  6. 安装python3并安装pip3

    python是一门高级编译语言,这么语言可以让你做一些运维平台,是因为他可以执行linux中的命令,让你实现自动化和半自动话,s 在运维开发这方面的话,就相当于把shell和java给结合了一下,ja ...

  7. vue css中scoped

    1.什么是scoped vue组件中,在style标签中有一个属性,叫做scoped.当此标签拥有scoped属性的时候,该组件下的css样式只适用于本组件,而不会影响全局组件.这其实也相当于样式的模 ...

  8. python学习笔记(13):python并发编程以及系统常用模块

    一.进程与线程 1.进程:程序的一次执行(程序装载入内存,系统分配资源运行).n 每个进程有自己的内存空间.数据栈等,只能使用进程间通讯,而不能直接共享信息 2.线程:所有线程运行在同一个进程中,共享 ...

  9. python学习笔记(6)关键字与循环控制

    一.变量和类型 1.基本变量类型 (1)整数 (2)浮点数 (3)字符串 (4)布尔值 (5)空值 (6)函数 (7)模块 (8)类型 (9)自定义类型 print(type()) print(typ ...

  10. 用Node.js原生代码实现静态服务器

    ---恢复内容开始--- 后端中服务器类型有两种 1. web服务器[ 静态服务器 ] - 举例: wamp里面www目录 - 目的是为了展示页面内容 - 前端: nginx 2. 应用级服务器[ a ...