debian下 Hadoop 1.0.4 集群配置及运行WordCount

说明：我用的是压缩包安装，不是安装包

官网安装说明：http://hadoop.apache.org/docs/r1.1.2/cluster_setup.html，繁冗，看的眼花...大部分人应该都不是按照这个来的...按照这个做我相信也会碰到各种问题

精简版安装说明：http://www.linuxidc.com/Linux/2013-01/77678.htm 言简，但如果照搬，绝对会遇到一些问题...

接下来记录我遇到的问题：

环境 jdk1.7.0_09 + debian6 32bit + 4核1G内存（虚拟机不是我配置的，诡异的配置...）

尽量按照精简版的来，注意根据实际情况修改路径等。

我发现在实际操作过程中，/usr/etc/hadoop里的配置是从$HADOOP_HOME里复制过来的，但主节点实际读取的是/usr/etc /hadoop里的配置，而不是$HADOOP_HOME里的配置。所以修改配置时，实际起作用的是/usr/etc/hadoop里的。

在主节点用start-all.sh启动集群，只有主节点的5个进程启动了，而从节点的一个都没启动，会报错。

由于精简版中，从节点只获得了主节点的配置文件，而从节点启动时，实际读取配置文件的位置可能不是$HADOOP_HOME。

根据异常信息（异常信息就不列出了），我是这样做的：

1.把$HADOOP_HOME里的bin sbin libexec 3个文件夹中的内容复制到 /usr 中

2.把主节点中的/usr/share/hadoop里的内容复制到从节点中的相同位置，否则从节点会说找不到某类(****.Platformname)

到这，应该就能启动集群了。如果报JAVA_HOME没有设置，就在主节点中找到所有 hadoop-env.sh 文件的位置，然后在从节点中的同样位置放置设置了JAVA_HOME的 hadoop-env.sh 文件。

运行WordCount遇到的问题主要是不知道dfs和本地fs处于逻辑上平行的空间，要用"hadoop dfs -put"和"hadoop dfs -get"上传或下载文件，可以用"hadoop dfs -help" 命令查看帮助。

ps. 运行速度好慢...

debian下 Hadoop 1.0.4 集群配置及运行WordCount的更多相关文章

Linux系统下安装Redis和Redis集群配置
Linux系统下安装Redis和Redis集群配置一. 下载.安装.配置环境: 1.1.>官网下载地址: https://redis.io/download (本人下载的是3.2.8版本:re ...
Redis-5.0.5集群配置
版本:redis-5.0.5 参考:http://redis.io/topics/cluster-tutorial. 集群部署交互式命令行工具:https://github.com/eyjian/re ...
Redis 3.0 Cluster集群配置
Redis 3.0 Cluster集群配置安装环境依赖安装gcc:yum install gcc 安装zlib:yum install zib 安装ruby:yum install ruby 安装 ...
CentOS7.1.x+Druid 0.12 集群配置
原文转载自:https://blog.csdn.net/bigtree_3721/article/details/79583008 先决条件:安装版本列表本次安装满足下面的条件: CentOS v7 ...
Hadoop(25)-高可用集群配置,HDFS-HA和YARN-HA
一. HA概述 1. 所谓HA(High Available),即高可用(7*24小时不中断服务). 2. 实现高可用最关键的策略是消除单点故障.HA严格来说应该分成各个组件的HA机制:HDFS的HA ...
Redis-4.0.11集群配置
版本:redis-3.0.5 redis-3.2.0 redis-3.2.9 redis-4.0.11 参考:http://redis.io/topics/cluster-tutorial. 集群 ...
hadoop之完全分布式集群配置（centos7）
一.基础环境现在我们有两台虚拟机了,再克隆两台: 克隆好之后需要做三件事:1.更改主机名称 2.修改ip地址 3.将ip地址和对应的主机号加入到/etc/hosts文件中 1.永久修改主机名 hos ...
Cloudera Hadoop 4 实战课程(Hadoop 2.0、集群界面化管理、电商在线查询+日志离线分析)
课程大纲及内容简介: 每节课约35分钟,共不下40讲第一章(11讲) ·分布式和传统单机模式 ·Hadoop背景和工作原理 ·Mapreduce工作原理剖析 ·第二代MR--YARN原理剖析 ·Cl ...
CentOS系统下Hadoop 2.4.1集群安装配置（简易版）
安装配置 1.软件下载 JDK下载:jdk-7u65-linux-i586.tar.gz http://www.oracle.com/technetwork/java/javase/downloads ...

随机推荐

PowerDesigner 16.5 使用VBScript脚本从Excel导入物理数据模型
本文使用的数据库类型是Oracle 11g 最近在工作中遇到一个问题:数据的设计以表格的形式保存在Excel文件中.(由于保密原因,我只能看到数据库设计文档,无法访问数据库.=_=!) 其中包括Nam ...
GMM算法的matlab程序（初步）
GMM算法的matlab程序在https://www.cnblogs.com/kailugaji/p/9648508.html文章中已经介绍了GMM算法,现在用matlab程序实现它. 作者:凯鲁嘎 ...
Spring Data JPA 简单查询--方法定义规则
一.常用规则速查 1 And 并且2 Or 或3 Is,Equals 等于4 Between 两者之间5 LessThan 小于6 LessThanEqual 小于等于7 Gre ...
用栈来实现队列的golang实现
使用栈实现队列的下列操作: push(x) -- 将一个元素放入队列的尾部. pop() -- 从队列首部移除元素. peek() -- 返回队列首部的元素. empty() -- 返回队列是否为空. ...
删除排序链表中的重复元素的golang实现
给定一个排序链表,删除所有重复的元素,使得每个元素只出现一次. 输入: ->-> 输出: -> 输入: ->->->-> 输出: ->-> 我们先 ...
postgreSQL 应用case when的例子
selectname,md5(indvl_id_nbr) as indvl_id_nbr,case when char_length(indvl_id_nbr)=18 or char_length(i ...
linux学习（杂项）
内存使用情况磁盘使用情况负载情况查看cpu 可视化磁盘循环创建文件夹删除文件夹移动文件 gg行首 G行尾 dd删除一行 u恢复 yy复制一行 p粘贴一行 enter下翻 less 与 mo ...
centos7下kubernetes（6。kubernetes创建资源的两种方式）
两种方式:1.命令:2.配置文件之前我们在部署K8S的时候分别用到了命令和配置文件创建K8s资源: 1.命令方式:kubectl run nginx-deployment --image=nginx ...
C# 编写windows服务及服务的安装、启动、删除、定时执行任务
一.编写windows服务 1.VS2017 - 创建服务Myservice 2.创建好项目之后 --- >> 双击 Service1.cs ---- >> 出现一个设计 ...
ubuntu18.04 下使用conda安装requirement.txt指定的依赖包
首先创建特定的虚拟环境 conda create -n temp_test python=3.5 conda install anaconda 切换到该环境 conda activate temp_t ...

debian下 Hadoop 1.0.4 集群配置及运行WordCount

debian下 Hadoop 1.0.4 集群配置及运行WordCount的更多相关文章

随机推荐

热门专题