一、准备工作:

二、配置环境变量:

  • JAVA:

    • vim ~/.bash_profile:

      • export JAVA_HOME="/Library/Java/JavaVirtualMachines/jdk1.8.0_77.jdk/Contents/Home"      (jdk安装路径)

      • export PATH=${JAVA_HOME}/bin:$PATH       (有则不用加)

  • HADOOP:
    • vim ~/.bash_profile:

      • export HADOOP_HOME=/XXX/hadoop-2.6.4    (hadoop的解压缩路径)
        export YARN_HOME=/XXX/Code/hadoop-2.6.4
        export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
        export YARN_CONF_DIR=$YARN_HOME/etc/hadoop
      • 使之生效:source ~/.bash_profile

三、编辑hadoop配置文件:(cd $HASOOP_HOME/etc/hadoop)

  • hadoop-env.sh
    • export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_77.jdk/Contents/Home

      export YARN_HOME=/XXX/Code/hadoop-2.6.4

      export PATH=$PATH:/XXX/hadoop-2.6.4/bin

    • 使之生效:source hadoop-env.sh
  • 到此为止即可进行单机测试:
    • cd $HASOOP_HOME
    • mkdir in
    • cp file1 in (拷点东西进去)
    • hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar  wordcount in out  (out 是自动创建的,不能提前创建)
  • 继续进行为分布式配置
  • core-site.xml
    • <property>

      <name>fs.default.name</name>

      <value>hdfs://localhost:9000</value>

      <description>The name of the default file system. A URI whose

      sceme and authority determine the FileSystem implementation.

      </description>

      </property>

  • yarn-site.xml
    • <property>

      <name>yarn.noCHdemanager.aux-services</name>

      <value>mapreduce_shuffle</value>

      </property>

      <property>

      <name>yarn.nodemanager.aux-services</name>

      <value>mapreduce_shuffle</value>

      </property>

  • mapred-site.xml (创建一个,或者把mapred-site.xml.template 复制一份为mapred-site.xml)
    • <property>

      <name>mapreduce.framework.name</name>

      <value>yarn</value>

      </property>

  • hdfs-site.xml
    • 指定主机上作为namenode和datanode的目录:

      • $HADOOP_PATH/hdfs/name
      • $HADOOP_PATH/hdfs/data
    • <property>

      <name>dfs.replication</name>

      <value>1</value>

      </property>

      <property>

      <name>dfs.namenode.name.dir</name>

      <value>file:/$HADOOP_PATH/hdfs/name</value>  (HADOOP_PATH替换为hadoop的解压缩路径)

      </property>

      <property>

      <name>dfs.datanode.data.dir</name>

      <value>file:/$HADOOP_PATH/hdfs/data</value>

      </property>

四、启动:

  • 格式化hdfs:hdfs namenode -format
  • 启动hadoop
    • cd $HADOOP_PATH/sbin
    • ./start-dfs.sh
    • ./start-yarn.sh
    • http://localhost:50070/ ---hdfs管理页面     http://localhost:8088/  ---hadoop进程管理页面
  • jsp 会看到有五个进程在运行
  • 测试
    • hadooop fs -mkdir /user/zhangsan/in
    • hadooop fs -copyFromLocal ... /user/zhangsan/in   (拷贝一些东西到hdfs中)
    • hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar wordcount /user/zhansan/inp /user/zhangsan/out
    • hadoop fs -cat /user/zhangsan/out/*  (看到词频统计结果)

本地测试:

  cat in/* | ./map | sort | reduce

mac 配置hadoop 2.6(单机和伪分布式)的更多相关文章

  1. Ubuntu上搭建Hadoop环境(单机模式+伪分布模式) (转载)

    Hadoop在处理海量数据分析方面具有独天优势.今天花了在自己的Linux上搭建了伪分布模式,期间经历很多曲折,现在将经验总结如下. 首先,了解Hadoop的三种安装模式: 1. 单机模式. 单机模式 ...

  2. Mac配置Hadoop最详细过程

    Mac配置Hadoop最详细过程 原文链接: http://www.cnblogs.com/blog5277/p/8565575.html 原文作者: 博客园-曲高终和寡 https://www.cn ...

  3. java大数据最全课程学习笔记(1)--Hadoop简介和安装及伪分布式

    Hadoop简介和安装及伪分布式 大数据概念 大数据概论 大数据(Big Data): 指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发 ...

  4. 网站用户行为分析——Hadoop的安装与配置(单机和伪分布式)

    Hadoop安装方式 Hadoop的安装方式有三种,分别是单机模式,伪分布式模式,伪分布式模式,分布式模式. 单机模式:Hadoop默认模式为非分布式模式(本地模式),无需进行其他配置即可运行.非分布 ...

  5. Hadoop环境搭建-入门伪分布式配置(Mac OS,0.21.0,Eclipse 3.6)

    http://www.linuxidc.com/Linux/2012-10/71900p2.htm http://andy-ghg.iteye.com/blog/1165453 为Mac的MyEcli ...

  6. Ubuntu 14.04 (32位)上搭建Hadoop 2.5.1单机和伪分布式环境

    引言 一直用的Ubuntu 32位系统(准备下次用Fedora,Ubuntu越来越不适合学习了),今天准备学习一下Hadoop,结果下载Apache官网上发布的最新的封装好的2.5.1版,配置完了根本 ...

  7. Hadoop单机和伪分布式安装

    本教程为单机版+伪分布式的Hadoop,安装过程写的有些简单,只作为笔记方便自己研究Hadoop用. 环境 操作系统 Centos 6.5_64bit   本机名称 hadoop001   本机IP ...

  8. Ubuntu上搭建Hadoop环境(单机模式+伪分布模式)

    首先要了解一下Hadoop的运行模式: 单机模式(standalone)        单机模式是Hadoop的默认模式.当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选 ...

  9. Ubuntu上搭建Hadoop环境(单机模式+伪分布模式)【转】

    [转自:]http://blog.csdn.net/hitwengqi/article/details/8008203 最近一直在自学Hadoop,今天花点时间搭建一个开发环境,并整理成文. 首先要了 ...

随机推荐

  1. oracle数据库过期

    本文转载自http://soft.chinabyte.com/database/6/12320006.shtml[来源:比特网 作者:悠虎] 由于Oracle11G的新特性所致,经常会遇到使用sqlp ...

  2. MFC_1.3 控件子类化 消息反射

    控件子类化 如果想要在默认的控件类中添加一些功能,就需要子类化一个控件类 在类内可以响应控件所有的消息,并且可以添加自己的函数和数据 通过类向导子类化控件的步骤 打开类向导,创建一个 MFC 类,不要 ...

  3. C++标准库 vector排序

    前天要做一个对C++ STL的vector容器做一个排序操作,之前一直把vector当做一个容量可自动变化的数组,是的,数组,所以打算按照对数组进行排序的方法:用快速排序或是冒泡排序等算法自己写一个排 ...

  4. Compute和Linq的Field使用

    目录: Compute的使用 Field的使用 1.Compute 案例: private void ComputeBySalesSalesID(DataSet dataSet) { // Presu ...

  5. exists关键词和case表达式

    首先声明一下,exist和case没有必然联系,这里只是为了一起整理个笔记. EXIST谓词 如果存在对应的记录,返回TRUE.否则,返回FALSE.*实际使用中,即使不适用exist,基本也可以使用 ...

  6. BZOJ 4976 [Lydsy1708月赛]宝石镶嵌

    [题解] 我们设总共有m个二进制位出现过1,那么如果n-k≥m,显然所有的1都可以出现,那么答案就是把所有的数或起来. 如果n-k<m,那么因为k不超过100,ai不超过1e5,所以n不超过11 ...

  7. RequestMapping_Ant 路径

    [使用@RequestMapping映射请求] [Ant风格资源地址支持3种匹配符] (1)? :匹配文件名中的一个字符. (2) * :匹配文件名中的任意字符. (3) ** :**匹配多层路径. ...

  8. HDU 1042 大数计算

    这道题一开始就采用将一万个解的表打好的话,虽然时间效率比较高,但是内存占用太大,就MLE 这里写好大数后,每次输入一个n,然后再老老实实一个个求阶层就好 java代码: /** * @(#)Main. ...

  9. [luoguP1941] 飞扬的小鸟(DP)

    传送门 动归,用f[i][j]表示到达第I列高度为j时最少需要飞的次数,容易想到最裸的转移: f[i][j]=min(min(f[i-1][j-up[i-1]*k]+k),f[i-1][j+down[ ...

  10. Codeforces 158B (数学)

    B. Mushroom Scientists time limit per test 2 seconds memory limit per test 256 megabytes input stand ...