1)ssh配置

http://allthingshadoop.com/2010/04/20/hadoop-cluster-setup-ssh-key-authentication/

2) 修改打开文件数限制  - 主从配置一致

/etc/security/limits.conf中增加如下配置提高打开文件限制数

hadoop soft nofile 10240

hadoop hard nofile 65536



3)配置core-site.xml  - 主从配置一致(配置文件在hadoop/conf目录,下同)

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

    <property>

        <name>fs.default.name</name>

        <value>hdfs://server:6060/</value>

        <description>who is the namenode</description>

    </property>

</configuration>

4)配置hdfs-site.xml  - 主从配置一致

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

        <final>true</final>

        <description>default 3 in production environment</description>

    </property>

    <property>

        <name>dfs.data.dir</name>

        <value>/home/hadoop/hdfs/data</value>

        <description>where data file is saved</description>

    </property>

    <property>

        <name>dfs.name.dir</name>

        <value>/home/hadoop/hdfs/name</value>

        <description>where data meta file is saved (on namenode) </description>

    </property>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/home/hadoop/hdfs/tmp</value>

        <description>A base for other temporary directories.</description>

    </property>

</configuration>



目录权限

A)data目录权限

chmod 755 /home/hadoop/hdfs/data

B)namenode的数据目录不需要创建,hadoop namenode -format将自动创建

rm -rf /home/hadoop/hdfs/name



C)如果发现datanode也启动不了了

rm -rf /home/hadoop/hdfs/data



D)namenode几点显示只有一个datanode - 本机

从节点日志显示中显示

2013-11-04 15:37:29,138 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: server/192.168.16.133:6060. Already tried 0 time(s).

从节点无法连接到namenode,

修改方式:

在namenode上,hostname对应地址为127.0.0.1,需要修改/etc/hosts中的127.0.0.1(注释掉)

E) 如果主从仍旧无法连接,关闭防火墙



5)修改masters - 主从配置一致

server



6)修改slaves - 主动配置一致

server

slave1

slave2

7)mapred-site.xml配置  - 主动配置一致

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>

    <property>

        <name>mapred.job.tracker</name>

        <value>server:8021</value>

        <final>true</final>

    </property>

    <property>

        <name>mapred.local.dir</name>

        <value>/home/hadoop/mapred/local</value>

        <final>true</final>

    </property>

    <property>

        <name>mapred.system.dir</name>

        <value>/home/hadoop/mapred/system</value>

        <final>true</final>

    </property>

    <property>

        <name>mapred.tasktracker.map.tasks.maximum</name>

        <value>7</value>

        <final>true</final>

    </property>

    <property>

        <name>mapred.tasktracker.reduce.tasks.maximum</name>

        <value>7</value>

        <final>true</final>

    </property>

    <property>

        <name>mapred.child.java.opts</name>

        <value>-Xmx400m</value>

    </property>

</configuration>

8)hadoop-evn.sh中配置

export JAVA_HOME=/path/to/jdk

9)初始化、启动

$ bin/hadoop namenode -format
$ bin/hadoop start-all.sh

$ hadoop dfsadmin -report

Warning: $HADOOP_HOME is deprecated.



Configured Capacity: 288730824704 (268.9 GB)

Present Capacity: 188958699520 (175.98 GB)

DFS Remaining: 188958601216 (175.98 GB)

DFS Used: 98304 (96 KB)

DFS Used%: 0%

Under replicated blocks: 0

Blocks with corrupt replicas: 0

Missing blocks: 0



-------------------------------------------------

Datanodes available: 3 (3 total, 0 dead)



Name: 192.168.16.133:50010

Decommission Status : Normal

Configured Capacity: 119873626112 (111.64 GB)

DFS Used: 40960 (40 KB)

Non DFS Used: 7385841664 (6.88 GB)

DFS Remaining: 112487743488(104.76 GB)

DFS Used%: 0%

DFS Remaining%: 93.84%

Last contact: Mon Nov 04 16:03:57 CST 2013





Name: 192.168.16.113:50010

Decommission Status : Normal

Configured Capacity: 97833930752 (91.11 GB)

DFS Used: 28672 (28 KB)

Non DFS Used: 86688358400 (80.73 GB)

DFS Remaining: 11145543680(10.38 GB)

DFS Used%: 0%

DFS Remaining%: 11.39%

Last contact: Mon Nov 04 16:03:55 CST 2013





Name: 192.168.16.156:50010

Decommission Status : Normal

Configured Capacity: 71023267840 (66.15 GB)

DFS Used: 28672 (28 KB)

Non DFS Used: 5697925120 (5.31 GB)

DFS Remaining: 65325314048(60.84 GB)

DFS Used%: 0%

DFS Remaining%: 91.98%

Last contact: Mon Nov 04 16:03:56 CST 2013

Hadoop版本1.0.3

hadoop集群配置实例的更多相关文章

  1. Hadoop集群配置(最全面总结)

    Hadoop集群配置(最全面总结) 通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker.这些机器是masters.余下的机器即作为DataNode也作为Ta ...

  2. 大数据测试之hadoop集群配置和测试

    大数据测试之hadoop集群配置和测试   一.准备(所有节点都需要做):系统:Ubuntu12.04java版本:JDK1.7SSH(ubuntu自带)三台在同一ip段的机器,设置为静态IP机器分配 ...

  3. Hadoop集群配置(最全面总结 )(转)

    Hadoop集群配置(最全面总结) huangguisu 通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker.这些机器是masters.余下的机器即作为Da ...

  4. Hadoop 集群配置记录小结

    Hadoop集群配置往往按照网上教程就可以"配置成功",但是你自己在操作的时候会有很多奇奇怪怪的问题出现, 我在这里整理了一下常见的问题与处理方法: 1.配置/etc/hosts ...

  5. hadoop集群配置和在windows系统上运用java操作hdfs

    安装 配置 概念 hadoop常用shell命令 使用java操作hadoop 本文介绍hadoop集群配置和在windows系统上运用java操作hdfs 安装 http://mirror.bit. ...

  6. hadoop集群配置方法---mapreduce应用:xml解析+wordcount详解---yarn配置项解析

    注:以下链接均为近期hadoop集群搭建及mapreduce应用开发查找到的资料.使用hadoop2.6.0,其中hadoop集群配置过程下面的文章都有部分参考. hadoop集群配置方法: ---- ...

  7. Hadoop集群配置搭建

    环境:Centos 6.9,Hadoop 2.7.1,JDK 1.8.0_161,Maven 3.3.9 前言: 1.配置一台master服务器,两台或多台slave服务器.    2.master可 ...

  8. Hadoop集群配置过程中需要注意的问题

    环境:VMwareWorkstation8.0 和 Ubuntu14.04 1. 使用三台虚拟机搭建Hadoop集群 2. 一定要在每台机器上配置ssh免密码登录 3. 由于需要给/etc/hosts ...

  9. HADOOP集群配置

    http://wenku.baidu.com/view/92cbe435eefdc8d376ee32eb.html http://www.infoq.com/cn/articles/hadoop-co ...

随机推荐

  1. elastic

    学习链接 http://rfyiamcool.blog.51cto.com/1030776/1420811?utm_source=tuicool&utm_medium=referral

  2. poj1971Parallelogram Counting

    链接 越来越感觉到了数学的重要性!.. 这题本来用以斜率和长度为key值进行hash不过感觉很麻烦还TLE了.. 最后知道中点一样的话就可以组成平行四边形,初中数学就可以了.. #include &l ...

  3. Data truncated for column xxx

    对于字段XXX,数据发生截断.原因是:字段的取值,不满足约束条件.比如下面的情况: 原来的字段取值为null,现在约束字段not null,就会报错Data truncated for column ...

  4. @synchronized (object)使用详解

    synchronized关键字代表这个方法加锁,相当于不管哪一个线 程A每次运行到这个法时,都要检查有没有其它正在用这个方法的线程B(或者C D等),有的话要等正在使用这个方法的线程B(或者C D)运 ...

  5. openfire过滤脏话插件,控制消息是否发送

    参考:http://myopenfire.com/article/getarticle/9 package com.myopenfire.plugin; import java.io.File; im ...

  6. centos JDK安装

    第一步:查看Linux自带的JDK是否已安装 (卸载centOS已安装的1.4) 安装好的CentOS会自带OpenJdk,用命令 java -version ,会有下面的信息: java versi ...

  7. [Selenium] 根据预期的日期格式,获取昨天的日期

    我们不必考虑当前时间是否是本月1号,"MM/dd/yyyy"日期格式可以更改.

  8. VIM 打造 c/c++ IDE

    1. vim 的安装 $sudo apt-get install vim vim-scripts vim-doc <br> 其中vim-scripts包含了vim的一些基本插件,包括语法高 ...

  9. python 集合

    面向对象的集合: #coding:utf-8 __author__ = 'similarface' class Set: ''' list实现集合,及其集合操作 ''' def __init__(se ...

  10. js里面获取三位不重复值

    <html><body> <script type="text/javascript"> var d = new Date();var sz = ...