【大数据系统架构师】1.2 大数据基础Hadoop 2.X

1. hadoop环境搭建

1.1 伪分布式环境搭建

1.1.1 伪分布式环境搭建

1.1.2 伪分布式搭建结果

hdfs可视化界面： http://od001:50070/dfshealth.html#tab-overview

yarn可视化界面： http://od001:8088/cluster

历史服务器可视化界面：http://od001:19888/

secondarynamenode可视化界面： http://od001:50090/status.html

1.1.3 批量启动脚本

#!/bin/bash

echo "启动namenode"

hadoop-daemon.sh start namenode

echo "启动datanode"

hadoop-daemon.sh start datanode

echo "启动resourcemanager"

yarn-daemon.sh start resourcemanager

echo "启动nodemanager"

yarn-daemon.sh start nodemanager

echo "启动historyserver"

mr-jobhistory-daemon.sh start historyserver

echo "启动secondarynamenode"

hadoop-daemon.sh start secondarynamenode

1.1.4 批量停止脚本

#!/bin/bash

echo "停止namenode"

hadoop-daemon.sh stop namenode

echo "停止datanode"

hadoop-daemon.sh stop datanode

echo "停止resourcemanager"

yarn-daemon.sh stop resourcemanager

echo "停止nodemanager"

yarn-daemon.sh stop nodemanager

echo "停止historyserver"

mr-jobhistory-daemon.sh stop historyserver

echo "停止secondarynamenode"

hadoop-daemon.sh stop secondarynamenode

1.2 集群环境

1.2.1 集群环境搭建

1）克隆虚拟机

2）使用root用户修改网卡信息

vi /etc/udev/rules.d/70-persistent-net.rules

vi /etc/sysconfig/network-scripts/ifcfg-eth0

1.2.2 资源规划

	od002	od003	od004
HDFS
	NameNode
	DataNode	DataNode	DataNode
			SecondaryNameNode
YARN		ResourceManger
	NodeManager	NodeManager	NodeManager
MapReduce
	JobHistoryServer

1.3.3 配置

hfds

　　hadoop-env.sh

　　core-site.xml

　　hdfs-site.xml

　　slaves

yarn

　　yarn-env.sh

　　yarn-site.xml

　　slaves

mapreduce

　　mapred-env.sh

　　mapred-site.xml

1.3.4 配置同步

1）在od002、od003、od004分别使用ssh-keygen -t rsa命令，生成公私钥文件

2）在每台服务器的.ssh目录，使用

ssh-copy-id od002

ssh-copy-id od003

ssh-copy-id od004

配置ssh无密码登录

3）使用scp命令，同步配置文件

scp -r ./hadoop-2.5.-cdh5.3.6/etc/ od003:/opt/modules/hadoop-2.5.-cdh5.3.6

scp -r ./hadoop-2.5.-cdh5.3.6/etc/ od004:/opt/modules/hadoop-2.5.-cdh5.3.6

1.3.5 启动命令

1）在od002上，执行start-dfs.sh命令

Starting namenodes on [od002]

od002: starting namenode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-namenode-od002.out

od004: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od004.out

od003: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od003.out

od002: starting datanode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-datanode-od002.out

Starting secondary namenodes [od004]

od004: starting secondarynamenode, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/hadoop-od-secondarynamenode-od004.out

2）在od003上，执行start-yarn.sh命令

starting yarn daemons

starting resourcemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-resourcemanager-od003.out

od004: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od004.out

od002: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od002.out

od003: starting nodemanager, logging to /opt/modules/hadoop-2.5.-cdh5.3.6/logs/yarn-od-nodemanager-od003.out

3）验证环境

yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.-cdh5.3.6.jar wordcount input output001

1.3.6 基准测试

1）基本测试：服务启动、是否可用、简单的应用

hdfs读写操作

2）

1.3.9 集群环境搭建结果

hdfs可视化界面： http://od002:50070/dfshealth.html#tab-overview

yarn可视化界面： http://od003:8088/cluster

历史服务器可视化界面：http://od002:19888/

secondarynamenode可视化界面： http://od004:50090/status.html

【大数据系统架构师】1.2 大数据基础Hadoop 2.X的更多相关文章

【大数据系统架构师】0.2 Linux基础
1. Linux基本环境 1.1 大数据Hadoop前置大纲讲解 1)Linux系统,基本命令 2)Java语言,JavaSE相关知识 3)MySQL基本的DML和DDL 1.2 常见Linux系统. ...
【大数据系统架构师】0.3 MySQL数据库
1. MySQL的基本操作 2. SQL语句 3. 高级查询 1)聚合函数.分组查询 2)联合查询.连接查询 3)子查询 4. 高级应用 1)视图与索引 2)数据可视化管理 5. 使用JDBC操作数据 ...
【大数据系统架构师】0.1 Java编程基础
1. 初识Java 2. Java语法快速入门点我 2.1 数据类型和运算符 2.2 流程控制语句 2.3 数组 2.4 类和对象 2.5 OOP三大特性 2.6 集合框架与泛型 2.7 反射机制 ...
App架构师实践指南三之基础组件
App架构师实践指南三之基础组件 1.基础组件库随着时间的增长,代码量的逐渐积累,新旧项目之间有太多可以服用的代码.下面是整理的公共代码库. 2.关于加密密钥的保护以及网络传输安全是移动应用安全最关键 ...
DKhadoop大数据系统架构设计方案
大数据作为当下最为热门的事件之一,其实已经不算是很新鲜的事情了.如果是三五年前在讨论大数据,那可能会给人一种很新鲜的感觉.大数据作为当下最为重要的一项战略资源,已经是越来越得到国家和企业的高度重视,我 ...
.NET 云原生架构师训练营（模块二基础巩固 EF Core 更新和迁移）--学习笔记
2.4.6 EF Core -- 更新状态自动变更检测不查询删除和更新并发状态 Entity State Property State Entity State Added 添加 Uncha ...
FunData — 电竞大数据系统架构演进
电竞出现在人们视野中的频率越来越高了,此次选取FunData作为电竞数据平台,v1.0 beta版本主要提供由Valve公司出品的顶级MOBA类游戏DOTA2相关数据接口(详情:open.varena ...
大数据基础Hadoop 2.x入门
hadoop概述存储和分析网络数据三大组件 MapReduce 对海量数据的处理思想: 分而治之每个数据集进行逻辑业务处理map 合并统计数据结果reduce HDFS 储存海量数据分布式存 ...
.NET 云原生架构师训练营（模块二基础巩固敏捷开发）--学习笔记
2.7.1 敏捷开发敏捷介绍敏捷的起源敏捷软件开发宣言敏捷开发十二原则生命周期对比敏捷开发的特点敏捷的发展敏捷的核心敏捷的起源 2001年,17个老头子在一起一边滑雪,一边讨论工作, ...

随机推荐

c# 各种tips
1.lock 类似于 java中的synchronized,对对象或代码块加上互斥锁. 2.c#中的lambda表达式, ForEach(x => f(n)) 3.c# 中的 something ...
分数CSD编码
有符号数系统:有三重值(1, 0, -1) SD编码:12 = 16 - 4 = 10000_0000 - 100 = 1_0000_0(-1)00; = 16 - 9 + 5 = 1_0000_00 ...
vsftpd设置被动模式
完整配置 listen=yes listen_port= max_clients= max_per_ip= local_max_rate= anonymous_enable=no local_enab ...
swift(Object Storage对象存储服务)(单节点)
# 在部署对象存储服务(swift)之前,你的环境必须包含身份验证服务(keystone); # keystone需要MySQL数据库,Rabbitmq服务,Memcached服务; # 内存:4G ...
spring-cloud配置服务器配置
本文介绍spring-cloud配置服务器 server端配置目录结构依赖 java代码 properties 运行 client端配置目录结构依赖 java代码 properties 运行 ...
java - 读取,导出 excel文件数据
首先需下载poi java包,添加至构建路径, 写处理方法: import java.io.FileInputStream;import java.io.FileOutputStream;import ...
深度剖析collections模块
namedtuple OrderedDict deque tuple defaultdict Counter ChainMap
使用avalon实现SKU组合查询功能
SKU(stock keeping unit库存量单位)组合查询是网上商场一个非常常用的功能.具体来说,一件商品会有许多型号,许多颜色,许多产地,许多码寸,而满足用户选中的这些条件的具体商品可能有库存 ...
Spring项目的发展历史和SpringBoot的发展历史
Spring项目的发展历史和SpringBoot的发展历史在Java做web应用的服务端开发领域,一直存在着两套技术体系,一套是Sun公司官方推出的JavaEE,另一套是Spring.Spring ...
java Web中页面跳转方式之重定向和请求转发的区别
请求转发: request.getRequestDispatcher().forward(); 重定向: response.sendRedirect(); 例如: 请求转发: request.getR ...

【大数据系统架构师】1.2 大数据基础Hadoop 2.X

【大数据系统架构师】1.2 大数据基础Hadoop 2.X的更多相关文章

随机推荐

热门专题