伪分布式安装Hadoop

Hadoop简单介绍

Hadoop：适合大数据分布式存储与计算的平台。

Hadoop两大核心项目：
1、HDFS：Hadoop分布式文件系统
　　HDFS的架构：主从结构：
　　　　　　　　　　主节点，只有一个：namenode
　　　　　　　　　　　　　　　　　　　　　　1、接收用户操作请求
　　　　　　　　　　　　　　　　　　　　　　2、维护文件系统的目录结构
　　　　　　　　　　　　　　　　　　　　　　3、管理文件与block之间关系，block与datanode之间关系
　　　　　　　　　　从节点，有很多个：datanodes
　　　　　　　　　　　　　　　　　　　　　　1、存储文件
　　　　　　　　　　　　　　　　　　　　　　2、文件被分成block存储在磁盘上
　　　　　　　　　　　　　　　　　　　　　　3、为保证数据安全，文件会有多个副本
2、MapReduce：并行计算框架
　　　MapReducede的架构：主从结构：
　　　　　　　　　　　　　　　　主节点，只有一个：JobTracker
　　　　　　　　　　　　　　　　　　　　　　　　　　1、接收客户端提交的计算任务
　　　　　　　　　　　　　　　　　　　　　　　　　　2、把计算任务分给TaskTrackers执行
　　　　　　　　　　　　　　　　　　　　　　　　　　3、监控TaskTracker的执行情况
　　　　　　　　　　　　　　　　从节点，有很多个：TaskTrackers
　　　　　　　　　　　　　　　　　　　　　　　　　　执行JobTracker分配的计算任务

Hadoop的特点：
　　1、扩容能力
　　2、成本低
　　3、高效率
　　4、可靠性

Hadoop部署方式：
　　1、本地模式
　　2、伪分布模式
　　3、集群模式

安装前准备软件：
　　1、Vitual Box/VMWare
　　2、centOS
　　3、jdk-6u24-linux-xxx.bin
　　4、hadoop-1.1.2.tar.gz

1.hadoop的伪分布安装
1.1 设置ip地址
　　执行命令 service network restart
　　验证: ifconfig
1.2 关闭防火墙
　　执行命令 service iptables stop
　　验证: service iptables status
1.3 关闭防火墙的自动运行
　　执行命令 chkconfig iptables off
　　验证: chkconfig --list | grep iptables //过滤出iptables
1.4 设置主机名（按下面这两步进行）
　　执行命令 (1)hostname chaoren //设置当前主机名为chaoren,但是重启系统后会失效
　　　　　　 (2)vi /etc/sysconfig/network //编辑文件设置主机名，重启后不会失效
1.5 ip与hostname绑定
　　执行命令 vi /etc/hosts //在文件下面增加一行 192.168.80.100 chaoren
　　验证: ping chaoren
1.6 设置ssh免密码登陆
　　执行命令 (1)ssh-keygen -t rsa //一直回车即可
　　　　　　 (2)cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys
　　验证： ssh chaoren
**************
windows与Linux之间传输文件工具: WinSCP
安装好，打开设置：主机名：192.168.56.100 用户名：root 密码：hadoop
然后点击保存，勾选上保存密码，然后双击连接登录。
将左侧Windows下的文件，拖动复制到右侧Linux下的目录/usr/local下。
**************
1.7 安装jdk
　　执行命令 (1)cd /usr/local
　　　　　　 (2)chmod u+x jdk-6u24-linux-i586.bin //增加执行的权限
　　　　　　 (3)./jdk-6u24-linux-i586.bin //解压
　　　　　　 (4)mv jdk-1.6.0_24 jdk //重命名
　　　　　　 (5)vi /etc/profile 增加内容如下:
　　　　　　　　　　　　　　　　export JAVA_HOME=/usr/local/jdk
　　　　　　　　　　　　　　　　export PATH=.:$JAVA_HOME/bin:$PATH
　　　　　　 (6)source /etc/profile //刷新环境变量
　　验证: java -version （改变后，OpenJdk就变成了oracle下的jdk了）
1.8 安装hadoop
　　执行命令 (1)tar -zxvf hadoop-1.1.2.tar.gz //解压
　　　　　　 (2)mv hadoop-1.1.2 hadoop //重命名
　　　　　　 (3)vi /etc/profile 修改环境变量，增加内容如下:
　　　　　　　　　　　　　　　　　　　　　　export JAVA_HOME=/usr/local/jdk
　　　　　　　　　　　　　　　　　　　　　　export HADOOP_HOME=/usr/local/hadoop
　　　　　　　　　　　　　　　　　　　　　　export PATH=.:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH
　　　　　　 (4)source /etc/profile
　　　　　　 (5)修改conf目录下的配置文件（直接在WinSCP中编辑修改保存）
　　　　　　　　　　　　　　hadoop-env.sh：
　　　　　　　　　　　　　　　　　　　　export JAVA_HOME=/usr/local/jdk/
　　　　　　　　　　　　　　core-site.xml：
　　　　　　　　　　　　　　　　　　　　<configuration>

　　　　　　　　　　　　　　　　　　　　　　<property>

　　　　　　　　　　　　　　　　　　　　　　　　<name>fs.default.name</name>

　　　　　　　　　　　　　　　　　　　　　　　　<value>hdfs://主机名:9000</value>

　　　　　　　　　　　　　　　　　　　　　　</property>

　　　　　　　　　　　　　　　　　　　　　　<property>

　　　　　　　　　　　　　　　　　　　　　　　　<name>hadoop.tmp.dir</name>

　　　　　　　　　　　　　　　　　　　　　　　　<value>/usr/local/hadoop/tmp</value>

　　　　　　　　　　　　　　　　　　　　　　</property>

　　　　　　　　　　　　　　　　　　　　</configuration>

　　　　　　　　　　　　　　hdfs-site.xml：
　　　　　　　　　　　　　　　　　　　　<configuration>

　　　　　　　　　　　　　　　　　　　　　　<property>

　　　　　　　　　　　　　　　　　　　　　　　　<name>dfs.replication</name>

　　　　　　　　　　　　　　　　　　　　　　　　<value>1</value>

　　　　　　　　　　　　　　　　　　　　　　</property>

　　　　　　　　　　　　　　　　　　　　　　<property>

　　　　　　　　　　　　　　　　　　　　　　　　<name>dfs.permissions</name>

　　　　　　　　　　　　　　　　　　　　　　　　<value>false</value>

　　　　　　　　　　　　　　　　　　　　　　</property>

　　　　　　　　　　　　　　　　　　　　</configuration>
　　　　　　　　　　　　　　mapred-site.xml：
　　　　　　　　　　　　　　　　　　　　<configuration>

　　　　　　　　　　　　　　　　　　　　　　<property>

　　　　　　　　　　　　　　　　　　　　　　　　<name>mapred.job.tracker</name>

　　　　　　　　　　　　　　　　　　　　　　　　<value>主机名:9001</value>

　　　　　　　　　　　　　　　　　　　　　　</property>

　　　　　　　　　　　　　　　　　　　　</configuration>
　　　　　　(6)hadoop namenode -format //存储之前，要对文件系统进行格式化
　　　　　　(7)start-all.sh
　　验证: (1)执行命令jps 如果看到5个新的java进程，分别是NameNode、SecondaryNameNode、DataNode、JobTracker、TaskTracker

　　　　 (2)在浏览器查看，http://chaoren:50070 　　 http://chaoren:50030

1.9 启动时没有NameNode的可能原因:
　　(1)没有格式化
　　(2)环境变量设置错误
　　(3)ip与hostname绑定失败

伪分布式安装Hadoop的更多相关文章

指导手册02：伪分布式安装Hadoop(ubuntuLinux)
指导手册02:伪分布式安装Hadoop(ubuntuLinux) Part 1:安装及配置虚拟机 1.安装Linux. 1.安装Ubuntu1604 64位系统 2.设置语言,能输入中文 3.创建 ...
第二章伪分布式安装hadoop hbase
安装单机模式的hadoop无须配置,在这种方式下,hadoop被认为是一个单独的java进程,这种方式经常用来调试.所以我们讲下伪分布式安装hadoop. 我们继续上一章继续讲解,安装完先试试SSH装 ...
CentOS 6.5 伪分布式安装 hadoop 2.6.0
安装 jdk -openjdk* 检查安装:java -version 创建Hadoop用户,设置Hadoop用户使之可以免密码ssh到localhost su - hadoop ssh-keygen ...
Hadoop单机和伪分布式安装
本教程为单机版+伪分布式的Hadoop,安装过程写的有些简单,只作为笔记方便自己研究Hadoop用. 环境操作系统 Centos 6.5_64bit 本机名称 hadoop001 本机IP ...
hadoop 2.7.3伪分布式安装
hadoop 2.7.3伪分布式安装 hadoop集群的伪分布式部署由于只需要一台服务器,在测试,开发过程中还是很方便实用的,有必要将搭建伪分布式的过程记录下来,好记性不如烂笔头. hadoop 2. ...
Hadoop入门进阶课程1--Hadoop1.X伪分布式安装
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,博主为石山园,博客地址为 http://www.cnblogs.com/shishanyuan ...
hadoop伪分布式安装之Linux环境准备
Hadoop伪分布式安装之Linux环境准备一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位二.实现Linux服务器联网功能网络适配器双击选择VMn ...
hadoop 0.20.2伪分布式安装详解
adoop 0.20.2伪分布式安装详解 hadoop有三种运行模式: 伪分布式不需要安装虚拟机,在同一台机器上同时启动5个进程,模拟分布式. 完全分布式至少有3个节点,其中一个做master,运行名 ...
Hadoop大数据初入门----haddop伪分布式安装
一.hadoop解决了什么问题 hdfs 解决了海量数据的分布式存储,高可靠,易扩展,高吞吐量mapreduce 解决了海量数据的分析处理,通用性强,易开发,健壮性 yarn 解决了资源管理调度二. ...

随机推荐

fopen()、fwrite()、fread()函数使用说明与示例
fopen()函数: 1.作用: 在C语言中fopen()函数用于打开指定路径的文件,获取指向该文件的指针. 2.函数原型: FILE * fopen(const char * path,const ...
mysql数据库脚本改为oracle脚本
前段时间公司项目数据库需要从mysql转为oracle,所以需要修改下原有的mysql脚本. 有两种方式:第一种,使用工具进行两种数据库的转换.第二种,手动修改数据库脚本. 第二种方法很笨,但能学习下 ...
Django 2.0.1 官方文档翻译: 快速安装向导 (Page5)
快速安装向导 (Page 5) 在你使用 Django 前,你需要先安装它.我们有一个完整的安装向导,它包含所有涉及的内容,这个向导会指导你进行一个简单的.最小化的安装,当你通过浏览介绍内容的时候,这 ...
C++利用cin输入时检测回车的方法
今天做TJU的OJ ,其中一道题是先读入一个字符串,再读入一个整数,循环往复,直到字符串是空,也就是说回车键结束循环. 但是cin对空格和回车都不敏感,都不影响继续读入数据,所以需要一种新的方式检测回 ...
【Linux 命令】 rsync 目录覆盖软链接,保持软链接不变并同步目录内容
需求:有两个相同文件名的目录需要使用其中一个目录覆盖另外一个问题: 被覆盖目录下存在软链接,但在源目录下软链接是一个目录需要解决的方案: 要求将原目录里和被覆盖目录里冲突的目录文件复制到B的软链 ...
python初步学习-python 模块之 json
json 模块 JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于人阅读和编写.一般API返回的数据大多是 JSON.XML,如果返回JSON的话,将获取 ...
支付宝hr终面,忐忑的等待结果
上周一,内推网投了支付宝上海的高级java软件开发工程师:阿里效率就是高,不到30分钟电话就过来了!约的上周五14:00面试:上周五技术面了2轮,第一轮是主管面试,貌似给了p6;第二轮部门总监面试, ...
2016.6.1——Min Stack
Min Stack 本题收获: 1.可以利用两个栈操作. 2.栈的基本操作. 题目: Design a stack that supports push, pop, top, and retrievi ...
我应该记录一下我不太了解的一些c语言函数
当然,现在还不分类 fmemopen getpagesize()
CertUtil.exe被利用来下载恶意软件
1.前言经过国外文章信息,CertUtil.exe下载恶意软件的样本. 2.实现原理 Windows有一个名为CertUtil的内置程序,可用于在Windows中管理证书.使用此程序可以在Windo ...

伪分布式安装Hadoop

伪分布式安装Hadoop的更多相关文章

随机推荐

热门专题