Hadoop2.2集群安装配置-Spark集群安装部署

配置安装Hadoop2.2.0 部署spark 1.0的流程

一、环境描写叙述

本实验在一台Windows7-64下安装Vmware。在Vmware里安装两虚拟机分别例如以下

主机名spark1（192.168.232.147），RHEL6.2-64 操作系统，usernameRoot

从机名spark2（192.168.232.152）。RHEL6.2-64 操作系统，usernameRoot

二、环境准备

1、防火墙禁用。SSH服务设置为开机启动。并关闭SELINUX

2、改动hosts文件

3、配置SSH无password登录

4、准备安装软件包

5、JDK1.7安装及配置

以上操作比較简单。在此就无需赘述。

三. Hadoop2.2集群安装配置

1、创建安装文件夹（在spark2上同做）

mkdir -p /root/install/hadoop

mkdir -p /root/install/hadoop/hdfs

mkdir -p /root/install/hadoop/tmp

mkdir -p /root/install/hadoop/mapred

mkdir -p /root/install/hadoop/hdfs/name

mkdir -p /root/install/hadoop/hdfs/data

mkdir -p /root/install/hadoop/mapred/local

mkdir -p /root/install/hadoop/mapred/system

2、把文件hadoop-2.2.0.x86_64.tar.gz上传到/root/install文件夹下，并解压

3、配置Hadoop环境变量

export HADOOP_HOME=/root/install/hadoop-2.2.0

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

4、配置Hadoop

（1）向配置hadoop-env.sh文件加入

export JAVA_HOME=/root/install/jdk1.7.0_21

（2）向配置yarn-env.sh文件加入

export JAVA_HOME=/root/install/jdk1.7.0_21

（3）配置core-site.xml

<configuration>

        <property>

                <name>fs.defaultFS</name>

                <value>hdfs://spark1:9000</value>

        </property>

        <property>

                <name>hadoop.tmp.dir</name>

                <value>/root/install/hadoop/tmp</value>

        </property>

</configuration>

（3）配置hdfs-site.xml

<configuration>

        <property>

                <name>dfs.name.dir</name>

                <value>/root/install/hadoop/hdfs/name</value>

        </property>

        <property>

                <name>dfs.data.dir</name>

                <value>/root/install/hadoop/hdfs/data</value>

        </property>

        <property>

                <name>dfs.replication</name>

                <value>3</value>

        </property>

</configuration>

（4）配置mapred-site.xml

<configuration>

        <property>

                <name>mapreduce.cluster.local.dir</name>

                <value>/root/install/hadoop/mapred/local</value>

        </property>

        <property>

                <name>mapreduce.cluster.system.dir</name>

                <value>/root/install/hadoop/mapred/system</value>

        </property>

        <property>

                <name>mapreduce.framework.name</name>

                <value>yarn</value>

        </property>

        <property>

                <name>mapreduce.jobhistory.address</name>

                <value>spark1:10020</value>

        </property>

        <property>

                <name>mapreduce.jobhistory.webapp.address</name>

                <value>spark1:19888</value>

        </property>

        <property>

                 <name>mapred.child.java.opts</name>

                 <value>-Djava.awt.headless=true</value>

        </property>

        <!-- add headless to default -Xmx1024m -->

        <property>

                 <name>yarn.app.mapreduce.am.command-opts</name>

                 <value>-Djava.awt.headless=true -Xmx1024m</value>

        </property>

        <property>

                 <name>yarn.app.mapreduce.am.admin-command-opts</name>

                 <value>-Djava.awt.headless=true</value>

         </property>

</configuration>

（5）配置masters

把localhost改动为spark1

（6）配置slaves

把localhost改动为spark1,spark2，这两个分别各一行

（7）配置好之后将整个安装文件夹复制到spark2的/root/install文件夹下

（8）编写一个脚本，方便改动配置文件时好同步到其它机器

[root@spark1 install]# cat dispatchcfg.sh

#!/bin/bash

for target in spark2

do

    scp -r $HADOOP_CONF_DIR $target:/root/install/hadoop-2.2.0/etc

done

（9）格式化Hadoop的Namenode：hadoop namenode -format

5.Hadoop集群启动

（1）start-all.sh

（2）查看相关进程（jps）

6 Hadoop測试

（1）创建一个文件夹/input。并把数据文件上传到文件夹下

hadoop fs -mkdir /input

hadoop fs -put /etc/group /input

（2）执行wordcount

hadoop jar hadoop-mapreduce-examples-2.2.0.jar wordcount /input /output

四、安装部署spark1.0

（1）解压spark-1.0.0-bin-2.2.0.tgz

（2）在文件conf/spark-env.sh加入

export JAVA_HOME=/root/install/jdk1.7.0_21

export SPARK_MASTER_IP=spark1

export SPARK_MASTER_PORT=7077

export SPARK_WORKER_CORES=1

export SPARK_WORKER_INSTANCES=1

export SPARK_WORKER_MEMORY=1g

（3）启动spark集群：sbin/start-all.sh，并查看相关进程

（4）查看执行效果

（5）执行 bin/spark-shell --executor-memory 1g --driver-memory 1g --master spark://spark1:7077

Hadoop2.2集群安装配置-Spark集群安装部署的更多相关文章

安装配置Spark集群
首先准备3台电脑或虚拟机,分别是Master,Worker1,Worker2,安装操作系统(本文中使用CentOS7). 1.配置集群,以下步骤在Master机器上执行 1.1.关闭防火墙:syste ...
Linux中安装配置spark集群
一. Spark简介 Spark是一个通用的并行计算框架,由UCBerkeley的AMP实验室开发.Spark基于map reduce 算法模式实现的分布式计算,拥有Hadoop MapReduce所 ...
配置spark集群
配置spark集群 1.配置spark-env.sh [/soft/spark/conf/spark-env.sh] ... export JAVA_HOME=/soft/jdk 2.配置slaves ...
Windows32或64位下载安装配置Spark
[学习笔记] Windows 32或64位下载安装配置Spark:1)下载地址:http://spark.apache.org/downloads.html 马克-to-win @ 马克java社区: ...
从subversion开始(svn安装配置全过程（+全套安装文件与配置文件）)…..
从subversion开始(svn安装配置全过程(+全套安装文件与配置文件))-.. 博客分类: 工具使用 SVNsubversion配置管理Apache应用服务器 </div> 花了一 ...
hadoop 集群搭建配置 spark yarn 对效率的提升永无止境
[手动验证:任意2个节点间是否实现双向 ssh免密登录] 弄懂通信原理和集群的容错性任意2个节点间实现双向 ssh免密登录,默认在~目录下 [实现上步后,在其中任一节点安装\配置hadoop后,可 ...
linux上配置spark集群
环境: linux spark1.6.0 hadoop2.2.0 一.安装scala(每台机器) 1.下载scala-2.11.0.tgz 放在目录: /opt下,tar -zxvf scal ...
hadoop 集群搭建配置 spark yarn 对效率的提升永无止境 Hadoop Volume 配置
[手动验证:任意2个节点间是否实现双向 ssh免密登录] 弄懂通信原理和集群的容错性任意2个节点间实现双向 ssh免密登录,默认在~目录下 [实现上步后,在其中任一节点安装\配置hadoop后,可 ...
hadoop集群环境搭建之安装配置hadoop集群
在安装hadoop集群之前,需要先进行zookeeper的安装,请参照hadoop集群环境搭建之zookeeper集群的安装部署 1 将hadoop安装包解压到 /itcast/ (如果没有这个目录 ...

随机推荐

[HAOI2016]找相同字符（SAM+DP）
感觉很水. 因为SAM上一个点的子树大小代表这个点所表示子串的出现次数. 建出广义后缀自动机之后.在\(parent\)树上跑\(DP\),维护\(size[i][1]\),和\(size[i][0] ...
[Vijos P1369]难解的问题
题目大意:给你一个序列,叫你求最长上升子序列长度,但必须包含第k项. 解题思路:我们把k左边的比a[k]大的数去掉,k右边的比k小的数去掉,就可以保证选到a[k]了(因为左边的数小于a[k],而a[k ...
c traps and pitfalls reading note(1)
1. 一直知道char *p = 'a';这样写是错误的,但是为什么是错的,没想过,今天看书解惑. p指向一个字符,但是在c中,''引起来的一个字符代表一个整数,这样指针能不报错.o(^▽^)o 2. ...
一张图说docker
Solr DataImportHandler 配置
DIH主要用于从数据库抓取数据并创建索引.另外还能够从HTTP(RSS.ATOM)拉数据. 相关概念: Datasource:数据源,包含获取数据必需的信息:数据位置(url).数据库driver.登 ...
巧妇能为少米之炊（1）——Android下小内存下的生存之道
常常听到身边用安卓的朋友抱怨手机卡顿,内存动不动就快没了.而Google声称在512M的内存下也能流畅执行Android 4.4.究竟它做了什么? 总结一下它主要做了四件事: 1.优化内核,使用Act ...
MySQ学习笔记之十 NULL值处理
这是MySQL一大特殊之处. 概念上.NULL意味着"没有值"或"未知值",且它被看作有点与众不同的值. 为了測试NULL.你不能使用算术比較运算符比如=.&l ...
poj_1974，最长回文字串manacher
时间复杂度为O(n),参考:http://bbs.dlut.edu.cn/bbstcon.php?board=Competition&gid=23474 #include<iostrea ...
How to: Create Custom Configuration Sections Using ConfigurationSection
https://msdn.microsoft.com/en-us/library/2tw134k3.aspx You can extend ASP.NET configuration settings ...
英语音乐---二、Burning
英语音乐---二.Burning 一.总结一句话总结:Burning - Maria Arredondo 玛丽亚·亚瑞唐多(Maria Arredondo),1985年7月6日出生于文内斯拉小镇,挪 ...

Hadoop2.2集群安装配置-Spark集群安装部署

Hadoop2.2集群安装配置-Spark集群安装部署的更多相关文章

随机推荐

热门专题