Hadoop window win10 基础环境搭建(2.8.1)(转)

下面运行步骤除了配置文件有部分改动，其他都是参照hadoop下载解压的share/doc/index.html。

hadoop下载：http://apache.opencas.org/hadoop/common/

下面配置windows环境：

JavaJDK
：

我采用的是1.8的，配置JAVA_HOME，如果默认安装，会安装在C:\Program Files\Java\jdk1.8.0_51。此目录存在空格，启动hadoop时将报错，JAVA_HOME
is incorrect ...此时需要将环境变量JAVA_HOME值修改为：C:\Progra~1\Java\jdk1.8.0_51，Program Files可以有Progra~代替。

Hadoop 环境变量：

新建HADOOP_HOME，指向hadoop解压目录，如：D:/hadoop。path环境变量中增加：%HADOOP_HOME%\bin;。

Hadoop 依赖库：

winutils相关，hadoop在windows上运行需要winutils支持和hadoop.dll等文件，下载地址：http://download.csdn.net/detail/fly_leopard/9503059

注意hadoop.dll等文件不要与hadoop冲突。为了不出现依赖性错误可以将hadoop.dll放到c:/windows/System32下一份。

hadoop环境测试：

起一个cmd窗口，起到hadoop/bin下，hadoop version，显示如下：

hadoop基本文件配置：hadoop配置文件位于：hadoop/etc/hadoop下

core-site.xml / hdfs-site.xml / mapred-site.xml / yarn-site.xml

core-site.xml:

[html] view
plain copy

print ?

<configuration>

<property>

<name></name>

<value></value>

</property>

</configuration>

hdfs-site.xml:

[html] view
plain copy

print ?

<configuration>

<property>

<name></name>

<value></value>

</property>

<property>

<name></name>

<value></value>

</property>

<property>

<name></name>

<value></value>

</property>

</configuration>

mapred-site.xml:

[html] view
plain copy

print ?

<configuration>

<property>

<name></name>

<value></value>

</property>

</configuration>

<configuration>

<property>

<name></name>

<value></value>

</property>

<property>

<name></name>

<value></value>

</property>

</configuration>

格式化系统文件：

hadoop/bin下执行 hdfs namenode -format

待执行完毕即可，不要重复format。

格式化完成后到hadoop/sbin下执行 start-dfs启动hadoop

访问：http://localhost:50070

（不是必须的 ) 创建目录：用于输入和输出，Linux上是/user/用户名/xx
windows上可能没具体要求，我创建也是按照liunx目录方式的。参照的api doc上面

创建完成可以通过hdfs dfs-ls 目录名称查看，也可以在浏览器中查看创建的目录或文件

input输入文件到目录：login_weibo2是我自己创建的文本文件，位于hadoop一个盘的。此处是D:/hadoop/login_weibo2

如果了解命令参数输入hdfs dfs回车查看dfs命令参数。hdfs dfs -put回车查看put相关参数。其他命令也是这样。

查看input输入的文件内容：

运行hadoop给的examples，做个参考，运行下面命令等待执行完成。hadoop jar jar文件位置 grep 输入目录(包含被处理文件的目录) 输出目录(运行结果输出目录)

然后查看文件夹下多了些东西，就是运行结果输出目录，结果般存在part-r-xxxx里面。

在hadoop/sbin下启动start-yarn，访问http://localhost:8088可查看资源、节点管理

Tip:
（1）自己按照这个帖子配置好了，也启动成功了，因此放到第一个，我用的版本的2.8.1，执行启动的时候不要先入为主的认为切换到bin目录，实际是切换到sbin目录！
（2）至于“winutils”和“hadoop.dll”的文件下载，文中地址失效了！可以去这个地址https://github.com/steveloughran/winutils下载，而且下载的时候不要用右键-->另存为，而是要点击“winutils.exe”后到页面中找到Download按钮下载！

Hadoop window win10 基础环境搭建(2.8.1)(转)的更多相关文章

Hadoop window win10 基础环境搭建(2.8.1)
下面运行步骤除了配置文件有部分改动,其他都是参照hadoop下载解压的share/doc/index.html. hadoop下载:http://apache.opencas.org/hadoop/c ...
hadoop3.1.0 window win7 基础环境搭建
https://blog.csdn.net/wsh596823919/article/details/80774805 hadoop3.1.0 window win7 基础环境搭建前言:在windo ...
Hadoop学习之基础环境搭建
期望目的基于VMware workstation 10.0 + CentOS 7 + hadoop 3.2.0,在虚拟机上搭建一套Hadoop集群环境,总共包含4个节点,其中1个master节点.3 ...
【Hadoop基础教程】1、Hadoop之服务器基础环境搭建（转）
本blog以K-Master服务器基础环境配置为例分别演示用户配置.sudo权限配置.网路配置.关闭防火墙.安装JDK工具等.用户需参照以下步骤完成KVMSlave1~KVMSlave3服务器的基础环 ...
【Hadoop基础教程】4、Hadoop之完全分布式环境搭建
上一篇blog我们完成了Hadoop伪分布式环境的搭建,伪分布式模式也叫单节点集群模式, NameNode.SecondaryNameNode.DataNode.JobTracker.TaskTrac ...
Spark入门实战系列--2.Spark编译与部署（上）--基础环境搭建
[注] 1.该系列文章以及使用到安装包/测试数据可以在<倾情大奉送--Spark入门实战系列>获取: 2.Spark编译与部署将以CentOS 64位操作系统为基础,主要是考虑到实际应用 ...
【转】android 最新 NDK r8 在window下开发环境搭建安装配置与使用详细图文讲解，完整实际配置过程记录(原创)
原文网址:http://www.cnblogs.com/zdz8207/archive/2012/11/27/android-ndk-install.html android 最新 NDK r8 在w ...
Spark环境搭建（上）——基础环境搭建
Spark摘说 Spark的环境搭建涉及三个部分,一是linux系统基础环境搭建,二是Hadoop集群安装,三是Spark集群安装.在这里,主要介绍Spark在Centos系统上的准备工作--linu ...
android 最新 NDK r8 在window下开发环境搭建安装配置与使用详细图文讲解，完整实际配置过程记录(原创)
android 最新 NDK r8 在window下开发环境搭建安装配置与使用详细图文讲解,完整实际配置过程记录(原创) 一直想搞NDK开发却一直给其他事情耽搁了,参考了些网上的资料今天终于把 ...

随机推荐

25、typing导入Python的数据类型模块、collections集合模块
一.typing模块 1.typing模块的作用类型检查,防止运行时出现参数和返回值类型不符合. 作为开发文档附加说明,方便使用者调用时传入和返回参数类型. 该模块加入后并不会影响程序的运行,不会报 ...
wordpress搜索结果排除某个分类如何操作
我们知道wordpress的搜索结果页search.php和分类页category.php是一样的,但是客户的网站是功能比较多的系统,有新闻又有产品,如果搜索结果只想展示产品要如何操作呢?随ytkah ...
spark调优——数据倾斜
Spark中的数据倾斜问题主要指shuffle过程中出现的数据倾斜问题,是由于不同的key对应的数据量不同导致的不同task所处理的数据量不同的问题. 例如,reduce点一共要处理100万条数据,第 ...
WHAT IS GAME-BASED LEARNING?
https://www.growthengineering.co.uk/what-is-game-based-learning/ Gamification and game-based learnin ...
基于 Keil MDK 移植 RT-Thread Nano
后文rtt代表RT-Thread 在官网公众号中,看到rtt发布了rtt nano,这个就很轻量级的rtos内核,把多余的驱动都裁剪了,因此移植工作量小,可以哪来学习一番,体验rtt之美 rtt现在也 ...
mybatis框架-使用resultMap实现高级结果映射，association属性
需求:查询数特定角色下的所有用户列表首先需要在在User类中引用Role类,因为引用了复杂的数据类型,所以要使用association属性进行映射,其实起主要作用的还是resultMap属性. /* ...
关于绿盟RSAS使用时遇到的问题
本周在使用绿盟RSAS扫描工具时遇到了一些问题: 一.扫描工具在家测试可以正常工作,到了现场设置正确但Web端页面打不开: 二.扫描器可以正常进行扫描,并且成功扫描出结果,但显示目标主机没有问题: 原 ...
Xamarin.Android开发中遇到的问题
开发 1.Resource.Id未包含xxx的定义打开了一个OK的Id,是位于\obj\Debug\90\designtime\Resource.designer.cs ,打开文件搜索xxx,果然没 ...
haproxy 2.0 dataplaneapi 类似的工具haproxyadmin
haproxyadmin 是一个python 的pip 包,提供了类似dataplaneapi 的功能,使用上也比较简单,同时提供的方法也比较全使用的技术与dataplaneapi 基本类似,也是一 ...
Git 自救指南：这些坑你都跳得出吗？
阅读本文大概需要 2 分钟. 菜单栏中添加我微信,私聊[加群]拉你入微信学习交流群 Git 虽然因其分布式管理方式,不完全依赖网络,良好的分支策略,容易部署等优点,已经成为最受欢迎的源代码管理方式. ...

Hadoop window win10 基础环境搭建(2.8.1)(转)

Hadoop window win10 基础环境搭建(2.8.1)(转)的更多相关文章

随机推荐

热门专题