安装环境:

  1 linux系统

  2 或(windows下)虚拟机

本文在linux系统ubuntu下尝试安装hadoop

安装前提

1 安装JDK(安装oracle公司的JDK )

(1)检查是否已安装JDK

$ java -version

(2)(本人采用手动安装)官网下载jdk,解压文件,放置在 /usr/目录下 如:/usr/local/jdk

(3)配置环境变量,设置全局(也就是此系统下所有用户的)环境变量

命令:$ sudo vi ~/.bashrc (用vi编辑器)

    文件末尾添加:

   #set java environment - 注释

   export JAVA_HOME=/usr/local/jdk/jdk1..0_181

   export JRE_HOME=${JAVA_HOME}/jre

   export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

   export PATH=${JAVA_HOME}/bin:$PATH

   保存后结束

(4)检查

2 安装ssh

(1)检查是否安装ssh(一般会自带客户端服务:ssh-client,本机需要安装对应的服务端服务ssh-server·「ssh-client与ssh-server版本要对应」)

  命令:$ dpkg -l | grep ssh

    查看是否有 openssh-server

(2)安装openssh-server

  命令:sudo apt-get install openssh-server

    问题:因为本机已安装的openssh-client 与要安装的openssh-server不匹配,所以要先将openssh-client 降低版本

(3)查看ssh服务是否开启

  命令:ps -e | grep sshd

    如图:没有服务,而已安装,那就是没有启动

   命令 ps -e | grep ssh

说明ssh-client服务开启,而ssh-server服务没启动

(4)启动ssh-server

  命令:sudo /etc/init.d/ssh start  或  sudo service ssh start

    问题:依然没有启动,无法理解错误原因,但是找到解决方法,如图,当第四行 有 :::22表示开启22端口

(5)登录ssh

  命令:ssh localhost

(6)设置ssh免码登录( 没有详细了解,有待继续学习 )


$ ssh-keygen -t rsa
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
$ chmod ~/.ssh/authorized_keys

安装hadoop(搭建hadoop开发环境)

(1)官网下载hadoop,并解压好文件

(2)安装配置

     先了解hadoop的运行模式

    @运行模式

    单机模式:默认,非分布式模式运行,读取本地资源,不使用hdfs(分布式文件系统),不加载hadoop守护进程

    伪分布式:“单节点集群”上运行hadoop,所有守护进程运行在同一台机器上,读取hdfs上资源

    全分布式:守护进程运行在一个集群上

    @配置:

        1 单机环境配置:

    没有创建额外用户来使用hadoop,本次在当前用户下操作(可能会遇到权限问题)
   

  $ vi .bashrc (用vi编辑 .bashrc)
  将以下代码添加到 .bashrc 中
  #set hadoop environment  
  export HADOOP_HOME=/hadoop/hadoop-2.9.1 //hadoop文件路径
  export HADOOP_MAPRED_HOME=$HADOOP_HOME
  export HADOOP_COMMON_HOME=$HADOOP_HOME
  export HADOOP_HDFS_HOME=$HADOOP_HOME
  export YARN_HOME=$HADOOP_HOME
  export HADOOP_ISTALL=$HADOOP_HOME
  export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
  export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

  

  vi /hadoop/hadoop-2.9./etc/hadoop/hadoop-env.sh (配置hadoop-env.sh 的JAVA_HOME环境变量)
  export JAVA_HOME=/usr/local/jdk/..  //jdk文件路径

    查看是否安装

  

    2 伪分布式配置

       (一)修改 /hadoop/hadoop-2.9.1/etc/hadoop/  目录下的4个文件

     注:只是进行简单的初期配置,更详细的配置可以去官网或百度查阅

  (1)core-site.xml

  <configuration>
    <property>
    <name>hadoop.tmp.dir</name>
    <value>/hadoop/hadoop-2.9.1/tmp</value>
    <description>Abase for other temporary directories.</description>
    </property>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://Kouri:9000</value>
    </property>
  </configuration>

   (2)hdfs-site.xml

    <configuration>
  <property>
   <name>dfs.replication</name>
   <value>1</value>
   </property>
  <property>
   <name>dfs.namenode.name.dir</name>
   <value>/hadoop/hadoop-2.9.1/tmp/dfs/name</value>
   </property>
  <property>
   <name>dfs.datanode.data.dir</name>
   <value>/hadoop/hadoop-2.9.1/tmp/dfs/data</value>
   </property>
    </configuration>

   (3)mapred-site.xml

       因为初始只有mapred-site.xml.template,需要修改文件名

    mv mapred-site.xml.template mapred-site.xml
    <configuration>
   <property>
  <name>mapreduce.framework.name</name>
   <value>yarn</value>
   </property>
  <property>
    <name></name>
   <value></value>
  </property>
    </configuration>

  (4)yarn-site.xml

<configuration>
   <property>
  <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
   </property>
  <property>
    <name>yarn.resourcemanager.hostname</name> //主机名
   <value>Kouri</value>
  </property>
  <property>
   <name>yarn.resourcemanager.webapp.address</name> //浏览器地址
  <value>localhost:8088</value>
   </property>
    </configuration>

    

    (二)格式化HDFS

    $ cd ~    
    $ hdfs namenode -format

    (三)启动 (逐个启动/全部启动)

     全部启动:start-all.sh

    (四)查看进程

    $ jps  //列出守护进程

    安装成功结果

  

    (五)查看运行状态 - web界面

    http://localhost:50070/ - Hadoop hdfs 状态 
    http://localhost:8088/ - hadoop yarn 管理

  

ubuntu安装hadoop经验的更多相关文章

  1. Ubuntu安装Hadoop与Spark

    更新apt 用 hadoop 用户登录后,我们先更新一下 apt,后续我们使用 apt 安装软件,如果没更新可能有一些软件安装不了.按 ctrl+alt+t 打开终端窗口,执行如下命令: sudo a ...

  2. Ubuntu 安装 hadoop

    安装完Linux后,我们继续(VMWare 安装 Linux  http://blog.csdn.net/hanjun0612/article/details/55095955) 这里我们开始学习安装 ...

  3. Ubuntu 安装hadoop 伪分布式

    一.安装JDK  : http://www.cnblogs.com/E-star/p/4437788.html 二.配置SSH免密码登录1.安装所需软件        sudo apt-get ins ...

  4. Ubuntu安装Hadoop

    系统:Ubuntu16.04 JDK:jdk-8u201 Hadoop:3.1.2 一.安装JDK https://www.cnblogs.com/tanrong/p/10641803.html 二. ...

  5. ubuntu安装hadoop 若干问题的解决

    问题1:安装openssh-server失败 原因: 下列软件包有未满足的依赖关系: openssh-server : 依赖: openssh-client (= 1:5.9p1-5ubuntu1) ...

  6. Ubuntu - 安装hadoop(简约版)

    相关版本: VMware ubuntuKylin16.04 JDK :openjdk Hadoop-2.9.1 步骤: 1.SSH 配置 [ 远程登陆 ] [ 配置SSH免码登陆 ] *测试:ssh ...

  7. 在Ubuntu上单机安装Hadoop

    最近大数据比较火,所以也想学习一下,所以在虚拟机安装Ubuntu Server,然后安装Hadoop. 以下是安装步骤: 1. 安装Java 如果是新机器,默认没有安装java,运行java –ver ...

  8. [Hadoop入门] - 2 ubuntu安装与配置 hadoop安装与配置

    ubuntu安装(这里我就不一一捉图了,只引用一个网址, 相信大家能力) ubuntu安装参考教程:  http://jingyan.baidu.com/article/14bd256e0ca52eb ...

  9. 安装Hadoop及Spark(Ubuntu 16.04)

    安装Hadoop及Spark(Ubuntu 16.04) 安装JDK 下载jdk(以jdk-8u91-linux-x64.tar.gz为例) 新建文件夹 sudo mkdir /usr/lib/jvm ...

随机推荐

  1. DropShadowEffect导致下拉框控件抖动

    <!--<Border.Effect> <DropShadowEffect Direction="180" BlurRadius="1" ...

  2. ORA-28547:connection to server failed, probable Oracle Net admin error错误,解决方法

    当用navicat连接oralce数据库时报ORA-28547错误时,直接懵逼了,上网查了资料说是navicat自带的oci.dll文件的版本和服务器端的oralce数据库的版本不一致造成的. 修改O ...

  3. 机器学习:评价分类结果(ROC 曲线)

    一.基础理解 1)定义 ROC(Receiver Operation Characteristic Curve) 定义:描述 TPR 和 FPR 之间的关系: 功能:应用于比较两个模型的优劣: 模型不 ...

  4. 2016.7.10 SqlServer语句中类似decode、substr、instr、replace、length等函数的用法

    Decode() 对应 case when函数 case CHARINDEX('/',start_point_name) when 0 then start_point_name else subst ...

  5. nginx upstream的几种配置方式

    nginx 的upstream目前支持4种方式的分配 1.轮询(默认) 每个请求按时间顺序逐一分配到不同的后端服务器 ,如果后端服务器down掉,能自动剔除. 2.weight指定轮询几率,weigh ...

  6. java 多线程系列基础篇(十一)之生产消费者问题

    1. 生产/消费者模型 生产/消费者问题是个非常典型的多线程问题,涉及到的对象包括“生产者”.“消费者”.“仓库”和“产品”.他们之间的关系如下:(01) 生产者仅仅在仓储未满时候生产,仓满则停止生产 ...

  7. ffmpeg: ‘UINT64_C’ was not declared in this scope (转)

    ffmpeg 默认是用C文件来编译的,如果某个CPP文件想引用ffmpeg中的某些函数或者头文件,有可能出现 ‘UINT64_C’ was not declared in this scope的错误 ...

  8. 使用LaTeX按IEEE模板写论文时的参考文献管理方法(BibTeX使用小结)

    之前用LaTeX写论文时,参考文献都是手动添加管理的,真是让人很抓狂.所以这次趁着假期,简单看了一下怎么使用BibTeX对参考文献进行管理,这里以IEEE的最新模板为例. 首先说明,我之前用的是MiK ...

  9. Win 2008 R2安装SQL Server 2008“性能计数器注册表配置单元一致性”失败的解决办法

    Win 2008 R2安装SQL Server 2008“性能计数器注册表配置单元一致性”失败的解决办法(2011-02-23 19:37:32) 转载▼   今天在惠普服务器上安装数据库2008时, ...

  10. java输入输出--I/O操作基础知识学习

    一.java的I/O流 1. 输入流(字节流和字符流,字节流操作的数据单元是8位的字节,字符流操作的是16位的字符)(InputStream 和Reader作为基类) 2.输出流(字节流和字符流,字节 ...