自学hadoop（三）

chandlersong 2024-10-12 12:00:40 原文

1) 关于hadoop在eclipse插件。经过自己的摸爬滚打。总结一下三条。

a) 2.0或者0.23.0吧 google比较方便。其他的可以自己编译。（这个我不敢保证。我本地环境事2.1.0。就是google上搜到的，都是可以自己编的，听说2.0源代码里面也有。但是我没有找到）

b）2.0以后的，特别的是2.1.0的。人家独立了一个项目，叫做HDT。还在开发中。这个是项目网址

http://hdt.incubator.apache.org/

c) 感觉上，如果mapperreduce其实可以再本机跑，纯调试用。然后接一个分布式的hdfs即可。因为我刚学吗，而且是自学。也不敢保证。

总之是。我理论猜测为先，想想mapperreduce，其实也就是一个java程序。然后亲身试验了一下。发现居然行。估计着，mapreduce其实跑的就是本地一个单线程的程序，多线程也算不上，更别谈分布式了。有其形，而无其实。

项目中。maven的dependency。

<dependency>

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-common</artifactId>

<version>${hadoop.version}</version>

</dependency>

<dependency>

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-hdfs</artifactId>

<version>${hadoop.version}</version>

</dependency>

<dependency>

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-yarn-common</artifactId>

<version>${hadoop.version}</version>

</dependency>

<dependency>

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-mapreduce-client-app</artifactId>

<version>2.1.0-beta</version>

</dependency>

<dependency>

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-auth</artifactId>

<version>2.1.0-beta</version>

</dependency>

2）管理的web页面

http://master:18088/cluster/scheduler

http://master:23001/dfshealth.jsp

3)在把我写好的程序，放在master，用命令行调用的时候，扔了一个错误。

java.lang.OutOfMemoryError: Java heap space，google了一下，大致就是配置问题。默认的，每一个node的，运行时的内存大小大概为200m。

解决方案，就是增大内存

我用的是2.1.0的。

修改的是

hadoop-env.sh

export HADOOP_HEAPSIZE=1000

和

export HADOOP_CLIENT_OPTS="-Xmx512m $HADOOP_CLIENT_OPTS"

然后网上查的资料。以前版本是

hadoop-site.xml

<property>

<name>mapred.child.java.opts</name>

<value>-Xmx1024m</value>

</property>

根据下面这篇文章的说法，要把配置复制到node上去。不能只是部署到master。为了省点事情，我就这么做了。

http://blog.csdn.net/mango_song/article/details/8314392

自学hadoop（三）的更多相关文章

从零自学Hadoop(22)：HBase协处理器
阅读目录序介绍 Observer操作示例下载系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,Sour ...
从零自学Hadoop(20)：HBase数据模型相关操作上
阅读目录序介绍命名空间表系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
从零自学Hadoop(21)：HBase数据模型相关操作下
阅读目录序变量数据模型操作系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...
从零自学Hadoop(19)：HBase介绍及安装
阅读目录序介绍安装系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序上一篇, ...
从零自学Hadoop(18)：Hive的CLI和JDBC
阅读目录序 Hive CLI(old CLI) Beeline CLI(new CLI) JDBC Demo下载系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出 ...
从零自学Hadoop(02)：环境准备
阅读目录起因虚拟机 Linux 系统安装系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceL ...
从零自学Hadoop(03)：Linux准备上
阅读目录序检查列表常用Linux命令搭建环境系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,Sou ...
从零自学Hadoop(04)：Linux准备下
阅读目录序搭建环境系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序我们已经准 ...
从零自学Hadoop(05)：Ambari
阅读目录序引入背景 Ambari介绍在线安装系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,Sour ...
从零自学Hadoop(06)：集群搭建
阅读目录序集群搭建监控系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序上一 ...

随机推荐

iOS开发--即时通讯
什么是环信? 1.环信是一个第三平台,提供即时通信(IM–Instant Messaging )的服务 2.环信是在XMPP的基础上进行二次开发 3.环信在网络上传输的数据也是XML 4.使用环信,不 ...
C#中SaveFileDialog 和OpenFileDialog 的用法
1.OpenFileDialog private void btnOpen_Click(object sender, EventArgs e) { OpenFileDialog ofd = new O ...
Spring使用外部的配置文件
在使用Spring做web项目的时候,通常会使用到数据库的连接信息 jdbcUrl driverClass username password 那么应该如何使用这些属性呢? 如在Spring中使用数据 ...
基于SimHash的微博去重
一.需求:对微博数据进行去重,数据量比较小,几十万条左右. 二.解决方案 1.采用SimHash的指纹信息去重方法. 三.实现方案 1.对每一条微博使用tf-idf与特征词 2.使用每条微博的特征词, ...
POJ1037A decorative fence(好dp）
1037 带点组合的东西吧黑书P257 其实我没看懂它写的嘛玩意儿这题还是挺不错的一个模糊的思路可能会好想一些就是大体的递推方程 dp1［］［］表示降序 dp2［］［］表示升序数组的含义为长 ...
Oracle默认的用户名和密码
你是说默认的用户名和密码么scott 密码是 tigersys 密码是 change_on_installsystem 密码是 managersysman 密码是 oem_temp 其中直接管理模式可 ...
bzoj1563
P<=10一开始是吓死我了后来想到这就是一个经典的决策单调性解决1d1d动态规划的题目像决策单调性完全可以打表找规律,这里有一篇严谨的证明https://www.byvoid.com/blo ...
MSSQL中把表中的数据导出成Insert
use master go if exists (select name from sysobjects where name = 'sp_generate_insert_script') begin ...
Oracle存储过程格式
create or replace procedure sp_test ( -- 此地写传入的值 v_tjfs varchar2, --不用申明长度 v_kssj varchar2, v_ret ou ...
asp.net获取文件夹下的所有文件
using System; using System.Collections.Generic; using System.Web; using System.Web.UI; using System. ...