測试集群简单介绍:一共同拥有4台机器:10.10.244.136、10.10.244.137、10.10.244.138、10.10.244.139。

10.10.244.136是管理节点。另外3台是存储节点。准备工作详情例如以下:

1 在四台机器上安装CentOS release 6.5 (Final)  64位(管理节点须要安装Mysql\Postgresql\redhat_lsb)

2 CDH5.2(包括了Spark1.1) YUM源搭建、CM5.2 YUM源搭建、impala2 YUM 源搭建

CDH5.2仓库地址:http://archive-primary.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/

CM5.2仓库地址:http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5/

impala2仓库地址:http://archive-primary.cloudera.com/impala/redhat/6/x86_64/impala/2/

3 关闭4台机器的selinux

cd /etc/selinux; vi config;SELINUX=disabled(找到它,改动成这样)

4 关闭4台机器的iptables(防火墙。CentoOS7.0 中就不是它了,好像是firewalk)

chkconfig --level 35 iptables off;

5 改动四台机器的hostname分别为master01.pmsc.gov.cn、datanode01.pmsc.gov.cn、datanode02.pmsc.gov.cn、 datanode03.pmsc.gov.cn

cd /etc/sysconfig; vi network;HOSTNAME=master01.pmsc.gov.cn(类似于这样改动)

6 在4台机器分别创建cloudera用户

groupadd cloudera;useradd -g cloudera cloudera;passwd cloudera;

7 让4台机器上的cloudera用户能够无password获得sudo权限

cd /etc;chmod u+w sudoers;vi sudoers;cloudera    ALL=(ALL)   ALL;%cloudera    ALL=(ALL)NOPASSWD : ALL(这两句话加入在root    ALL=(ALL)       ALL下方);chmod u-w sudoers

8 在4台机器间配置cloudera用户的SSH无password通信

cd /etc;vi hosts;加入例如以下内容

10.10.244.136 master01.pmsc.gov.cn

   10.10.244.137 datanode01.pmsc.gov.cn

   10.10.244.138 datanode02.pmsc.gov.cn

   10.10.244.139 datanode03.pmsc.gov.cn

   10.10.244.129 archive.cloudera.com  (YUM源本地机器)

cd /home/cloudera/.ssh;rm -rf *;ssh-keygen -t rsa -P '';cat id_rsa.pub>>authorized_keys(在4台机器上运行同样的操作,合并authorized_keys文件内容,并覆盖每一个机器上的authorized_keys文件);chmod 600 authorized_keys;

9 在4台机器之间做时钟同步。保证时间的一致性(136 自己同步自己。其他机器同步136的时间。

136上的配置(/etc/ntp.conf)

#server 0.centos.pool.ntp.org iburst

            #server 1.centos.pool.ntp.org iburst

            #server 2.centos.pool.ntp.org iburst

            #server 3.centos.pool.ntp.org iburst

            server 127.127.1.0

            fudge 127.127.1.0 stratum 8

137\138\139上的配置(/etc/ntp.conf)

#server 0.centos.pool.ntp.org iburst

            #server 1.centos.pool.ntp.org iburst

            #server 2.centos.pool.ntp.org iburst

            #server 3.centos.pool.ntp.org iburst

            server 10.10.244.136

            fudge 10.10.244.136 stratum 8

136\137\138\139设置ntpd服务开机自启动

sudo chkconfig ntpd on

137\138\139上在cloudera用户下每天同步一次时间(使用crontab)

30 21 * * * sudo ntpdate 10.10.244.131

10 在4台机器上安装JDK(最小版本号1.7.0_67)

sudo vi /etc/profile;加入例如以下配置

export JAVA_HOME=/usr/local/jdk1.7.0_71

      export PATH=$JAVA_HOME/bin:$PATH

      export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

11 Mysql数据的安装配置

默认字符编码设置为utf-8:

[mysqld]

            character-set-server=utf8

             # Disabling symbolic-links is recommended to prevent assorted security risks

             symbolic-links=0

            [client]

            port = 3306

            socket = /var/lib/mysql/mysql.sock

            default-character-set=utf8

            [mysql]

            no-auto-rehash

            default-character-set=utf8

改动root账户password:update user set Password = Password('test') where Host = '%' and User = 'root';flush privileges;

开启远程登录:update user set host = ‘%’ where user = ‘root’;flush privileges;

改动数据文件存储位置:

[mysqld]

             datadir=/home/mysql

socket=/home/mysql/mysql.sock

设置开机自启动:sudo chkconfig mysqld on

CDH5.2+CM5.2+impala2+Spark1.1 集群搭建基础环境准备的更多相关文章

  1. hadoop 1.2 集群搭建与环境配置

    一.虚拟机环境 见我的另一篇博客http://www.cnblogs.com/xckk/p/6000881.html, 需要安装JDK环境,centos下安装JDK可参考: http://www.ce ...

  2. Spark1.3.1 On Yarn的集群搭建

    下面给出的是spark集群搭建的环境: 操作系统:最小安装的CentOS 7(下载地址) Yarn对应的hadoop版本号:Hadoop的Cloudera公司发行版Hadoop2.6.0-CDH5.4 ...

  3. Hadoop分布式集群搭建

    layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...

  4. Hadoop+HBase 集群搭建

    Hadoop+HBase 集群搭建 1. 环境准备 说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1. 1.1 配置说明 本次集群搭建共三台机器,具体说明下: 主机名 IP ...

  5. 基于centos6.5 hbase 集群搭建

    注意本章内容是在上一篇文章“基于centos6.5 hadoop 集群搭建”基础上创建的 1.上传hbase安装包 hbase-0.96.2-hadoop2 我的目录存放在/usr/hadoop/hb ...

  6. Elasticsearch集群搭建及使用Java客户端对数据存储和查询

    本次博文发两块,前部分是怎样搭建一个Elastic集群,后半部分是基于Java对数据进行写入和聚合统计. 一.Elastic集群搭建 1. 环境准备. 该集群环境基于VMware虚拟机.CentOS ...

  7. zookeeper与卡夫卡集群搭建

    首先这片博客没有任何理论性的东西,只是详细说明kafka与zookeeper集群的搭建过程,需要三台linux服务器. java环境变量设置 zookeeper集群搭建 kafka集群搭建 java环 ...

  8. 大数据中Hadoop集群搭建与配置

    前提环境是之前搭建的4台Linux虚拟机,详情参见 Linux集群搭建 该环境对应4台服务器,192.168.1.60.61.62.63,其中60为主机,其余为从机 软件版本选择: Java:JDK1 ...

  9. zookeeper相关知识与集群搭建

    Zookeeper Zookeeper相关概念 Zookeeper概述 Zookeeper是一个分布式协调服务的开源框架,主要用来解决分布式集群中应用系统的一致性问题. Zookeeper本质上是一个 ...

随机推荐

  1. Jmeter测试报告可视化(Excel, html以及jenkins集成)

    做性能测试通常在none GUI的命令行模式下运行Jmeter. 例如: jmeter -n -t /opt/las/JMeter/TestPlan/test.jmx -l /opt/las/JMet ...

  2. 在Ubuntu 桌面版 12.04 LTS配置sftp

    第一步:检查vsftpd是否安装了 root@hy-Aspire-SA10:~# rpm -qa|grep vsftpd 没有输出,说明没安装. 第二步:安装vsftpd root@hy-Aspire ...

  3. (算法)判断字符串中是否包含HelloWorld

    题目: 给定某字符串,判断该字符串中是否包含HelloWorld,出现HelloWorld不一定要连续,但顺序不变,如“HeByello,ByeWorByeld”就包含“HelloWorld”. 思路 ...

  4. SQL 2008 R2数据库变为REPLICATION,日志不断增长并且不能截断和收缩的解决方式

     执行环境:windows server2003,sql server2008 R2,数据库上布置CDC   用户反应系统报错是日志已满,系统不能执行. 查看日志文件时.发现日志文件已经达到15G ...

  5. MHDD修复硬盘坏道

    2种修复的方法,本人已经尝试过,非常管用! 1.先按SHIFT+F3扫描硬盘连接并选择,按F4键,先用一般模式扫一遍,再用高级模式扫一变,具体方法是选择LBA模式,remap项OFF,Loop the ...

  6. [Python]网络爬虫(九):百度贴吧的网络爬虫(v0.4)源码及解析

    转自:http://blog.csdn.net/pleasecallmewhy/article/details/8934726 百度贴吧的爬虫制作和糗百的爬虫制作原理基本相同,都是通过查看源码扣出关键 ...

  7. curl命令(测试连接命令)

    curl命令是一个利用URL规则在命令行下工作的文件传输工具.它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称curl为下载工具.作为一款强力工具,curl支持包括HTTP.HTTPS.f ...

  8. 恭喜您成为2014年度Microsoft MVP!

  9. js-form表单元素的自定义属性

      form表单元素的自定义属性 CreateTime--2016年9月22日09:03:40 Author:Marydon 场景: <script type="text/javasc ...

  10. oracle tnsnames.ora文件用法说明

      oracle tnsnames.ora文件用法说明 CreationTime--2018年8月10日08点32分 Author:Marydon 1.用途 oracle客户端所需要的一个文件,通过该 ...