配置hadoop集群一
花了1天时间最终把环境搭建好了。整理了一下,希望对想学习hadoop的有所帮助。
资料下载:http://pan.baidu.com/s/1kTupgkn包括了linux虚拟机。jdk, hadoop1.0
环境搭建准备工作:hadoop_master 192.168.50.158hadoop_slave 192.168.50.136
网络配置:1:设置IP2:重新启动网卡 service network restart. 验证命令 ifconfig3:设置主机名 hostname hadoop 运行命令 vi /ect/sysconfig/network4:把hostname和IP绑定运行命令 vi /etc/hosts
192.168.50.158 master192.168.50.136 slave
验证:ping hadoop5:关闭防火墙 service iptables stop关闭防火墙自己主动执行: chkconfig iptables off验证: chkconfig --list |grep iptables
免password登陆ssh1:ssh-keygen -t rsa产生的密钥位于~/.ssh目录中2:cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys 本机就能够免password登录了3:配置多机器面password登录拷贝id_rsa.pub到须要登录的机器上: scp .ssh/id_rsa.pub chenlb@192.168.1.181:/home/chenlb/id_rsa.pub把文件的内容追加到authorized_keys上 cat id_rsa.pub >> .ssh/authorized_keyschmod 600 .ssh/authorized_keys配置完毕后ssh ip(对方的电脑)
配置环境变量1:拷贝jdk到/user/local文件夹下2:运行命令 chmod u+x jdk*.bin3:vi /etc/profileexport JAVA_HOME = /user/local/jdkexport PATH=.:$JAVA_HOME/bin:$PATH让配置文件生效: source /etc/profile
安装 hadoop1:tar -zxvf hadoop.tar.gz2:改名字 mv hadoop.1.2 hadoop3:vi /etc/profileexport HADOOP_NAME=/user/local/hadooppath环境变量须要改动一下。加入hadoop的bin
4:改动配置文件,配置文件在hadoop的conf文件夹下hadoop-env.shexport JAVA_HOME=/usr/local/jdk/
也能够配置垃圾回收机制:
比如,配置Namenode时,为了使其可以并行回收垃圾(parallelGC)。 要把以下的代码增加到hadoop-env.sh :
export HADOOP_NAMENODE_OPTS="-XX:+UseParallelGC ${HADOOP_NAMENODE_OPTS}"
其他可定制的经常使用參数还包含:
- HADOOP_LOG_DIR - 守护进程日志文件的存放文件夹。假设不存在会被自己主动创建。
- HADOOP_HEAPSIZE - 最大可用的堆大小,单位为MB。
比方。1000MB。 这个參数用于设置hadoop守护进程的堆大小。缺省大小是1000MB。
core-site.xml<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://hadoop0:9000</value> 定义HadoopMaster的URI和port
<description>change your own hostname</description>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>
</configuration>
hdfs-site.xml<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>hadoop0:9001</value> <!--hadoop0指的是你在hosts中配置的名字-->
<description>change your own hostname</description>
</property>
</configuration>
配置完毕后。假设是配置集群就须要在配置文件下的slaves和masters配置相应的datanode和secordaryNamenode。
5:对hadoop进行格式化 hadoop namenode -format格式化假设没有成功的话须要删除 /usr/local/hadoop/tmp目录
配置hadoop集群一的更多相关文章
- Linux中安装配置hadoop集群
一. 简介 参考了网上许多教程,最终把hadoop在ubuntu14.04中安装配置成功.下面就把详细的安装步骤叙述一下.我所使用的环境:两台ubuntu 14.04 64位的台式机,hadoop选择 ...
- hadoop集群环境搭建之安装配置hadoop集群
在安装hadoop集群之前,需要先进行zookeeper的安装,请参照hadoop集群环境搭建之zookeeper集群的安装部署 1 将hadoop安装包解压到 /itcast/ (如果没有这个目录 ...
- centos7配置hadoop集群
一:测试环境搭建规划: 主机名称 IP 用户 HDFS YARN hadoop11 192.168.1.101 hadoop NameNode,DataNode NodeManager hadoop1 ...
- 在 Linux 服务器上搭建和配置 Hadoop 集群
实验条件:3台centos服务器,jdk版本1.8.0,Hadoop 版本2.8.0 注:hadoop安装和搭建过程中都是在用户lb的home目录下,master的主机名为host98,slave的主 ...
- 安装和配置hadoop集群步骤
hadoop集群的安装步骤和配置 hadoop是由java语言编写的,首先我们肯定要在电脑中安装jdk,配置好jdk的环境,接下来就是安装hadoop集群的步骤了,在安装之前需要创建hadoop用户组 ...
- linux配置hadoop集群
①安装虚拟机 ②为虚拟机添加共享文件 右击已经安装好的虚拟机 设置—>选项—>共享文件 ③配置映射 sudo nano /etc/network/interfaces 重启网络:sud ...
- 为Linux集群创建新账户,并配置hadoop集群
转自:http://blog.csdn.net/bluesky8640/article/details/6945776 之前装python.jdk.hadoop都是用的root账户,这是一个绝对的失策 ...
- 配置hadoop集群的lzo压缩
MR-Job中使用lzop详见MR案例:Job中使用Lzo压缩 1). 配置前的环境准备 # yum -y install lzo-devel zlib-devel gcc autoconf auto ...
- 在Ubuntu18.04下配置hadoop集群
服务器准备 启动hadoop最小集群的典型配置是3台服务器, 一台作为Master, NameNode, 两台作为Slave, DataNode. 操作系统使用的Ubuntu18.04 Server, ...
随机推荐
- DiscuzX2.5数据库字典 值得学习
pre_common_admincp_cmenu – 后台菜单收藏表title => ‘菜单名称’url => ‘菜单地址’sort => ’0′ COMMENT ‘菜单类型,备用’ ...
- Day 14B 网络应用开发
网络应用开发 发送电子邮件 在即时通信软件如此发达的今天,电子邮件仍然是互联网上使用最为广泛的应用之一,公司向应聘者发出录用通知.网站向用户发送一个激活账号的链接.银行向客户推广它们的理财产品等几乎都 ...
- php第二十三节课
XML XML:页面之间传递数据,跨平台传递 HTML:超文本标记语言,核心标签 XML特点:1.标签名可以自己定义2.有且只有一个根3.大小写敏感4.标签必须完整 <!DOCTYPE html ...
- c++函数进阶
c++扩展了c语言的函数功能.通过将incline关键字用于函数定义,并在首次调用该函数前提供其函数定义,可以使得c++编译器将该函数视为内联函数.也就是说,编译器不是让程序跳到独立的代码段,以执行函 ...
- Cyclic Nacklace HDU - 3746 (kmp next数组应用)
题目大意 给出字符串,寻找最小要补全的字符个数,使得字符串是两次的循环 解法 通过寻找规律,我们又发现了len-next[len]又派上了用场 ①如果next[len]是0,说明最大前缀后缀和为0,那 ...
- python爬虫28 | 你爬下的数据不分析一波可就亏了啊,使用python进行数据可视化
通过这段时间 小帅b教你从抓包开始 到数据爬取 到数据解析 再到数据存储 相信你已经能抓取大部分你想爬取的网站数据了 恭喜恭喜 但是 数据抓取下来 要好好分析一波 最好的方式就是把数据进行可视化 这样 ...
- 洛谷 1012 拼数(NOIp1998提高组)
[题解] 我们要做的就是把这些数排序.排序的时候判断两个数是否交换的方法,就是把这两个数相接形成两个长度相同的数字,比较这两个数字的大小. #include<cstdio> #includ ...
- 54. spring boot日志升级篇—logback【从零开始学Spring Boot】
在<44. Spring Boot日志记录SLF4J>章节中有关相关的介绍,这里我们在深入的了解下logback框架. 为什么要使用logback ? --在开发中不建议使用System. ...
- [luoguP1854] 花店橱窗布置(DP)
传送门 f[i][j] 表示前 i 盆花,放到前 j 个花盆中的最优解 pre[i][j] 记录前驱 代码 #include <cstdio> #include <cstring&g ...
- [K/3Cloud] KSQL 关联表更新字段Update语法
关联表更新字段 UPDATE tmp369faa3f7d224b0595670425008 as t1 SET FStatus=-1 where exists(select 1 from t_BD_S ...