前言 1.操作系统:Centos7 2.安装时使用的是root用户.也可以用其他非root用户,非root的话要注意操作时的权限问题. 3.安装的Hadoop版本是2.6.5,Spark版本是2.2.0,Scala的版本是2.11.8.   如果安装的Spark要同Hadoop搭配工作,则需注意他们之间的版本依赖关系.可以从Spark官网上查询到Spark运行需要的环境,如下: 4.需要的安装包: 安装包下载地址: JDK: http://www.oracle.com/technetwork/j…
前言 本篇演示如何使用 AWS EC2 云服务搭建集群.当然在只有一台计算机的情况下搭建完全分布式集群,还有另外几种方法:一种是本地搭建多台虚拟机,好处是免费易操控,坏处是虚拟机对宿主机配置要求较高,我就一台普通的笔记本,开两三个虚拟机实在承受不起: 另一种方案是使用 AWS EMR ,是亚马逊专门设计的集群平台,能快速启动集群,且具有较高的灵活性和扩展性,能方便地增加机器.然而其缺点是只能使用预设的软件,如下图: 如果要另外装软件,则需要使用 Bootstrap 脚本,详见 https://d…
前言 上一篇介绍了伪分布式集群的搭建,其实在我们的生产环境中我们肯定不是使用只有一台服务器的伪分布式集群当中的.接下来我将给大家分享一下全分布式集群的搭建! 其实搭建最基本的全分布式集群和伪分布式集群基本没有什么区别,只有很小的区别. 一.搭建Hadoop全分布式集群前提 1.1.网络 1)如果是在一台虚拟机中安装多个linux操作系统的话,可以使用NAT或桥接模式都是可以的.试一试可不可以相互ping通! 2)如果在一个局域网当中,自己的多台电脑(每台电脑安装相同版本的linux系统)搭建,将…
原文地址:http://www.cnblogs.com/zhangyinhua/p/7652686.html 阅读目录(Content) 一.搭建Hadoop全分布式集群前提 1.1.网络 1.2.安装jdk 1.3.安装hadoop 二.Hadoop全分布式集群搭建的配置 2.1.hadoop-env.sh 2.2.core-site.xml 2.3.hdfs-site.xml 2.4.mapred-site.xml 2.5.yarn-site.xml 2.6.创建上面配置的目录 三.全分布式…
『实践』VirtualBox 5.1.18+Centos 6.8+hadoop 2.7.3搭建hadoop完全分布式集群及基于HDFS的网盘实现 1.基本设定和软件版本 主机名 ip 对应角色 master 192.168.56.4 NameNode slave1 192.168.56.3 DataNode1 slave2 192.168.56.5 DataNode2 Windows主机设置的ip为192.168.56.88 hadoop压缩包解压地址:/usr/local/hadoop 虚拟机…
1.  背景描述和需求 数据分析程序部署在Docker中,有一些分析计算需要使用Spark计算,需要把任务提交到Spark集群计算. 接收程序部署在Docker中,主机不在Hadoop集群上.与Spark集群网络互通. 需求如下 1.在Docker中可程序化向Spark集群提交任务 2.在Docker中可对Spark任务管理,状态查询和结束 2.  解决方案 在Docker中搭建一套Spark.Hadoop环境.任务通过spark-submit --master yarn --deploy-mo…
Linux系统下安装Redis和Redis集群配置 一. 下载.安装.配置环境: 1.1.>官网下载地址: https://redis.io/download (本人下载的是3.2.8版本:redis-3.2.8.tar.gz) 1.2.>上传至Linux系统进行编译:/app/int44/tmp/xzh/Redis目录下 int44@/app/int44/tmp/xzh/Redis>tar xzvf redis-3.2.8.tar.gz   //执行解压命令tar xzvf redis…
用三台虚拟机搭建Hadoop全分布集群 所有的软件都装在/home/software下 虚拟机系统:centos6.5 jdk版本:1.8.0_181 zookeeper版本:3.4.7 hadoop版本:2.7.1 1.安装jdk 准备好免安装压缩包放在/home/software下 cd /home/software tar -xvf jdk-8u181-linux-x64.tar.gz 配置环境变量 vim /etc/profile 末尾添加 export JAVA_HOME=/home/…
解压redis 先到官网https://redis.io/下载redis安装包,然后在CentOS操作系统中解压该安装包: tar -zxvf redis-3.2.9.tar.gz 编译redis cd redis-3.2.9 make && make install 此时如果报如下错误: bash: make: command not found 说明系统没有安装make,所有要先安装make,即: yum -y install gcc automake autoconf libtool…
Hadoop 问题1: Hadoop Slave节点 NodeManager 无法启动 解决方法: yarn-site.xml reducer取数据的方式是mapreduce_shuffle 问题2: 启动hadoop,报错Error JAVA_HOME is not set and could not be found 解决方法: 因为JAVA_HOME环境没配置正确,还有一种情况是即使各结点都正确地配置了JAVA_HOME,但在集群环境下还是报该错误. 解决方法是 在 hadoop-env.…