【Hadoop 分布式部署三：基于Hadoop 2.x 伪分布式部署进行修改配置文件】

1.规划好哪些服务运行在那个服务器上

需要配置的配置文件

2. 修改配置文件，设置服务运行机器节点

首先在 hadoop-senior 的这台主机上进行解压 hadoop2.5 按照伪分布式的配置文件来进行配置

使用命令：tar -zxvf hadoop-2.5.0.tar.gz -C /opt/app/ （解压 hadoop 2.5）

　　　然后进入 cd /opt/app/hadoop-2.5.0/etc

　　　将里面一开始的配置文件重命令 mv hadoop backup-hadoop

然后将一开始伪分布式中的配置文件复制过来使用命令 cp -r /opt/moudles/hadoop-2.5.0/etc/hadoop ./

（如果在Windows下想使用方便，可以在C:\Windows\System32\drivers\etc目录下修改hosts文件配置虚拟机的主机IP）

开始配置

使用notepad 进行配置hadoop 的配置文件

hadoop.env export JAVA_HOME=/opt/modules/jdk1.7.0_67 (默认已经配置好了，不用更改)

core-site.xml 文件中的内容配置

<configuration>

	<!--这个配置的是 默认读取文件的位置，是从本地 还是从hdfs系统上 -->

	<!--指定 namenode 所在的机器-->

	<property>

        <name>fs.defaultFS</name>

        <value>hdfs://hadoop-senior.zuoyan.com:8020</value>

    </property>

	<!-- 配置数据 存放目录 -->

	<property>

        <name>hadoop.tmp.dir</name>

        <value>/opt/app/hadoop-2.5.0/data/tmp</value>

    </property>

	<!--配置垃圾箱中文件保存的时间-->

	<property>

        <name>fs.trash.interval</name>

        <value>604800</value>

    </property>

</configuration>

　　因为没有数据存放的目录所以需要配置一下 hadoop.tmp.dir 的目录

　　　命令： mkdir -p /opt/app/hadoop-2.5.0/data/tmp

配置hdfs

　　首先配置hdfs-site.xml 文件

　　　　　　因为是分布式所以不需要配置副本数去掉 dfs.replication

　　　　　　配置SecondaryNameNode 所在的节点 dfs.namenode.secondary.http-address hadoop-senior03.zuoyan.com

<configuration>

    <!--配置secondary namenode 所在的主机-->

    <property>

            <name>dfs.namenode.secondary.http-address</name>

            <value>hadoop-senior03.zuoyan.com:</value>

        </property>

</configuration>

配置slaves 也就是配制 DataNode NodeManager

配置的内容为

hadoop-senior.zuoyan.com

hadoop-senior02.zuoyan.com

hadoop-senior03.zuoyan.com

配置yarn

　　　　　　首先配置 yarn.env 配置yarn的环境变量（我这里已经配置好了，就不用更改了）

　　　　　　配置yarn-site.xml 这个文件

　　　　　　这个配置文件只需要将 resourcesmanager 所在的主机节点更改成第二台主机就可以了

　　　　　　剩下的配置文件不用修改，配置文件内容如下

<configuration>

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

	<!--配置resourcemanager 所在的主机名 -->

	<property>

        <name>yarn.resourcemanager.hostname</name>

        <value>hadoop-senior02.zuoyan.com</value>

    </property>

	<!--启用历史服务器的日志聚集功能-->

	<property>

        <name>yarn.log-aggregation-enable</name>

        <value>true</value>

    </property>

	<!--设置日志在文件系统上的存放时间-->

	<property>

        <name>yarn.log-aggregation.retain-seconds</name>

        <value>640800</value>

    </property>

	<!--配置NodeManager Resource-->

	<property>

        <name>yarn.nodemanager.resource.memory-mb</name>

        <value>4096</value>

    </property>

	<property>

        <name>yarn.nodemanager.resource.cpu-vcores</name>

        <value>4</value>

    </property>

</configuration>

配置 mapred-site.xml

　　　　配置 JobHistoryServer 的配置文件　　资源设计的时候就把他放在了第一台主机上，所以保持默认配置文件即可，修改一下主机名就行

　　　　配置文件的内容如下

<configuration>

	<property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

	<!--配置历史记录服务器所在地址-->

	<property>

	  <name>mapreduce.jobhistory.address</name>

	  <value>hadoop-senior.zuoyan.com:10020</value>

	</property>

	<property>

	  <name>mapreduce.jobhistory.webapp.address</name>

	  <value>hadoop-senior.zuoyan.com:19888</value>

	</property>

</configuration>

到此，配置文件就配置完成了！下一步就是分发到各个机器上去

（还有一个小点就是删除在 /opt/app/hadoop-2.5.0/share 下的 doc文件夹，这个文件是文档，我们一般，不用，而且还占用磁盘空间大概占用的磁盘空间是1.5G ）

好了，这篇随笔就到这里了，下一篇继续！

【Hadoop 分布式部署三：基于Hadoop 2.x 伪分布式部署进行修改配置文件】的更多相关文章

网站用户行为分析——Hadoop的安装与配置（单机和伪分布式）
Hadoop安装方式 Hadoop的安装方式有三种,分别是单机模式,伪分布式模式,伪分布式模式,分布式模式. 单机模式:Hadoop默认模式为非分布式模式(本地模式),无需进行其他配置即可运行.非分布 ...
Hadoop整理五（基于Hadoop的数据仓库Hive）
数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合.它是单个数据存储,出于分析性报告和决策支持目的而创建. 为需要业务智能的企业,提供指导业务流程改进.监视时间.成本.质量以及控 ...
【连载】redis库存操作，分布式锁的四种实现方式[三]--基于Redis watch机制实现分布式锁
一.redis的事务介绍 1. Redis保证一个事务中的所有命令要么都执行,要么都不执行.如果在发送EXEC命令前客户端断线了,则Redis会清空事务队列,事务中的所有命令都不会执行.而一旦客户端发 ...
hadoop搭建伪分布式集群（centos7+hadoop-3.1.0/2.7.7）
目录: Hadoop三种安装模式搭建伪分布式集群准备条件第一部分安装前部署 1.查看虚拟机版本2.查看IP地址3.修改主机名为hadoop4.修改 /etc/hosts5.关闭防火墙6.关闭SE ...
hadoop 2.7.3伪分布式环境运行官方wordcount
hadoop 2.7.3伪分布式模式运行wordcount 基本环境: 系统:win7 虚机环境:virtualBox 虚机:centos 7 hadoop版本:2.7.3 本次以伪分布式模式来运行w ...
hadoop伪分布式
一.安装jdk 1.下载解压 2.配置环境变量配置成功: 二.ssh免密码登录 https://www.cnblogs.com/suwy/p/9326087.html 三.hadoop伪分布式配置 ...
云计算课程实验之安装Hadoop及配置伪分布式模式的Hadoop
一．实验目的 1. 掌握Linux虚拟机的安装方法. 2. 掌握Hadoop的伪分布式安装方法. 二．实验内容 (一)Linux基本操作命令 Linux常用基本命令包括: ls,cd,mkdir,rm ...
java大数据最全课程学习笔记(1)--Hadoop简介和安装及伪分布式
Hadoop简介和安装及伪分布式大数据概念大数据概论大数据(Big Data): 指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发 ...
Hadoop学习笔记（一）：ubuntu虚拟机下的hadoop伪分布式集群搭建
hadoop百度百科:https://baike.baidu.com/item/Hadoop/3526507?fr=aladdin hadoop官网:http://hadoop.apache.org/ ...
Hadoop 2.7 伪分布式环境搭建
1.安装环境 ①.一台Linux CentOS6.7 系统 hostname ipaddress subnet mask ...

随机推荐

loadrunner 更新中......
一.安装及参考说明 1.51 testing 链接:http://www.51testing.com/zhuanti/LoadRunner.html 2.官网链接:http://learnloadru ...
【2017-03-13】Tsql 表连接
笛卡尔积穷举在未建立连接的情况下,将car表的name列和brand表的brand_name列进行笛卡尔积查询后,实际是将两列相乘,进行穷举,列举出所有可能性表连接:将多个表不 ...
OpenVPN 服务端（pritunl）的一些运维经验
1.当服务端部署在docker中,重启机器之后,docker服务会启动,pritunl的docker容器也会跟着自动启动.但此时,一些系统服务还未完全启动成功,导致会有一些pritunl server ...
Hive中如何快速的复制一张分区表（包括数据）
Hive中有时候会遇到复制表的需求,复制表指的是复制表结构和数据. 如果是针对非分区表,那很简单,可以使用CREATE TABLE new_table AS SELECT * FROM old_tab ...
kibana添加ES索引403错误解决
kibana添加ES索引时发现kibana添加索引不生效,没有创建成功只是一闪而过查看控制台发现报错403 解决办法: curl -XPUT -H "Content-Type: appli ...
linux利用scp远程上传下载文件/文件夹
scp是secure copy的简写,用于在Linux下进行远程拷贝文件的命令,和它类似的命令有cp,不过cp只是在本机进行拷贝不能跨服务器,而且scp传输是加密的.可能会稍微影响一下速度. 当你服务 ...
怎样从外网访问内网Jupyter Notebook？
本地安装了一个Jupyter Notebook,只能在局域网内访问,怎样从外网也能访问到本地的Jupyter Notebook呢?本文将介绍具体的实现步骤. 准备工作安装并启动Jupyter Not ...
QT开发基础教程
http://www.qter.org/portal.php?mod=view&aid=11
log4j2笔记 #01# Architecture
索引 Architecture Main Components Logger Hierarchy LoggerContext Configuration Logger LoggerConfig Fil ...
mysql/oracle jdbc大数据量插入优化
10.10.6 大数据量插入优化在很多涉及支付和金融相关的系统中,夜间会进行批处理,在批处理的一开始或最后一般需要将数据回库,因为应用和数据库通常部署在不同的服务器,而且应用所在的服务器一般也不会 ...

【Hadoop 分布式部署 三：基于Hadoop 2.x 伪分布式部署进行修改配置文件】

【Hadoop 分布式部署 三：基于Hadoop 2.x 伪分布式部署进行修改配置文件】的更多相关文章

随机推荐

热门专题

【Hadoop 分布式部署三：基于Hadoop 2.x 伪分布式部署进行修改配置文件】

【Hadoop 分布式部署三：基于Hadoop 2.x 伪分布式部署进行修改配置文件】的更多相关文章