1.  规划 1.1.  机器列表 NameNode SecondaryNameNode DataNodes 192.168.1.121 192.168.1.122 192.168.1.101 192.168.1.102 192.168.1.103 1.2.  机器列表 机器IP 主机名 用户组/用户 192.168.1.121 nameNode.smartmap.com hadoop/hadoop 192.168.1.122 secondaryNameNode.smartmap.com had…
@ 目录 前言 预先设置 修改主机名 关闭防火墙 创建hadoop用户 SSH安装免密登陆 单机免密登陆--linux配置ssh免密登录 linux环境配置Java变量 配置Java环境变量 安装Hadoop-3.3.0.tar.gz 运行 单机非分布式 伪分布式 1.修改配置文件 2.格式化NameNode 3.开启 NaneNode 和 DataNode 进程 4. 操作集群 5. 启动yarn(伪分布式也可以不启动) 6.运行测试实例 7. 配置日志保存在HDFS 分布式 规划 修改配置文…
安装前的准备 1. 准备4台机器.或虚拟机 4台机器的名称和IP对应如下 master:192.168.199.128 slave1:192.168.199.129 slave2:192.168.199.130 slave3:192.168.199.131 2.分别为4台机器安装JDK8 步骤详细请参考: CentOS7卸载 OpenJDK 安装Sun的JDK8   3.为4台机器配置host name 192.168.199.128配置hostname为master 192.168.199.1…
本篇介绍在centos7中大家hadoop2.10完全分布式,首先准备4台机器:1台nn(namenode);3台dn(datanode) IP hostname 进程 192.168.30.141 s141 nn(namenode) 192.168.30.142 s142 dn(datanode) 192.168.30.143 s143 dn(datanode) 192.168.30.144 s144 dn(datanode) 由于本人使用的是vmware虚拟机,所以在配置好一台机器后,使用克…
环境是centos6.4-32,hadoop2.2.0 伪分布式文档:http://pan.baidu.com/s/1kTrAcWB 完全分布式文档:http://pan.baidu.com/s/1sjK4gkl 和1.x.0.x有些不同,特别是yarn. 这里面有个小插曲,在完全分布式模式配置yarn的时候必须指定ResourceManager的地址 这个地址在伪分布式模式上不用指定,因为默认地址是0.0.0.0,也就是本地 但是完全分布式模式必须指定,因为不指定slave就不知道哪台是Res…
hadoop-2.6.0为分布式安装 伪分布模式集群规划(单节点)------------------------------------------------------------------------------------------------------------------------------------------------------------------------    host        -    ip                -    soft …
CentOS7 安装FastDFS分布式文件系统 最近要用到fastDFS,所以自己研究了一下,在搭建FastDFS的过程中遇到过很多的问题,为了能帮忙到以后搭建FastDFS的同学,少走弯路,与大家分享一下.FastDFS的作者淘宝资深架构余庆,这个优秀的轻量及的分布式文件系统的开源没多久,立马就火了. FastDFS是为互联网应用量身定做的一套分布式文件存储系统,非常适合用来存储用户图片.视频.文档等文件 版本介绍 系统:centos7.4 FastDFS:5.11 libfastcommo…
CentOS7环境RabbitMQ集群配置管理(转载)   CentOS7系统内核版本:3.10.0-514.26.2.el7.x86_64 一.对应主机host地址(三台主机host文件要保持一致) 1 2 3 10.100.2.10 v01-app-rabbitmq01 10.100.2.11 v01-app-rabbitmq02 10.100.2.12 v01-app-rabbitmq03 二.3台主机都安装相同的软件: 1.erlang安装: 1 2 3 4 5 6 7 8 9 下载地址…
centos7.2下编译安装git Git简介 Git是一个分布式版本控制系统 Git vs SVN SVN是典型的集中式版本控制起,版本库集中存放在服务器,当我们用自己的电脑干活儿的时候,需要先从中央服务器取得最新的版本,然后开始干活儿,完成之后再把自己修改过的文件推送给中央服务器.中央服务器就好比是一个图书馆,我们要修改一本书,就必须先从图书馆借出来,然后回到家自己改,改完了再放回图书馆. 弊端: A. 集中式版本控制系统最大的毛病就是必须联网才能工作 B. 中央服务器出问题了的话,所有人都…
在 <Docker中搭建Hadoop-2.6单机伪分布式集群>中在容器中操作来搭建伪分布式的Hadoop集群,这一节中将主要通过Dokcerfile 来完成这项工作. 1 获取一个简单的Docker系统镜像,并建立一个容器. 这里我选择下载CentOS镜像 docker pull centos 通过docker tag命令将下载的CentOS镜像名称换成centos,并删除老标签 docker tag docker.io/centos centosdocker rmr docker.io/ce…