hadoop学习笔记叁--简单应用

1、通过命令向HDFS传输文件

　　　　上传：./hadoop fs -put hdfs.cmd （本地文件名） hdfs://主机名称:9000/

　　　　　　hadoop fs -copyFromLocal ./hadoop-config.cmd（本地文件名） /user/（hadoop服务路径）

　　　　下载： ./hadoop fs -get hdfs://主机名称:9000/hdfs.cmd

　　　　　　　　hadoop fs -copyToLocal /user/jdk-7u65-linux-i586.tar.gz （hadoop文件位置路径） /home/hadoop/app/（本地路径）

　　　　在浏览器访问http://主机IP:50070，出现以下页面点击如图所示按钮，会看到上传的文件。

2、执行hadoop自带mapreduce程序

　　　　到hadoop-2.4.1/share/hadoop/mapreduce 目录下

　　　　执行命令：./hadoop jar ../share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.1.jar pi 5 5（jar的主类全路径）

3、hadoop ：hdfs 存放文件方式

　　　　hadoop存放文件方式：切分存放，就是讲一个文件切分为数块，然后放到集群DATANODE中，通过NAMENODE来映射每个DATANODE中存放的数据

　　相当于上传一个文件名为test.txt被分为ABC三块，集群中有三台主机，分别有三个DATANODE ：“123” 那么当test.txt被上传到hadoop时，A块放于1 ；B块放于2：C块放于3

　　　而 NAMENODE则记录：A对应1 B对应2 C对应3的映射关系

　　　　当向haddop下载时，则先经过NAMENODE映射关系进行文件组装，然后下载到请求指定的位置

　　　　总结：

　　　　1、hdfs是通过分布式集群来存储文件的，且提供虚拟目录用来便捷访问

　　　　2、文件存储到hdfs集群中去时，会被拆分为多个block

　　　　3、文件block存放于多个datanode中

　　　　4、hdfs文件系统中的文件与真实文件映射关系有namenode管理

　　　　5、block存储的是我们的数据文件，按照块号存储的物理文件。

　　　　6、每个block在集群中会出现多个副本，提高文件可靠性，和访问吞吐量。

4、core-site.xml设置的NAMENODE节点地址信息

　 slaves 设置的是DATANODE节点信息

hadoop学习笔记叁--简单应用的更多相关文章

Hadoop学习笔记—22.Hadoop2.x环境搭建与配置
自从2015年花了2个多月时间把Hadoop1.x的学习教程学习了一遍,对Hadoop这个神奇的小象有了一个初步的了解,还对每次学习的内容进行了总结,也形成了我的一个博文系列<Hadoop学习笔 ...
Hadoop学习笔记(6) ——重新认识Hadoop
Hadoop学习笔记(6) ——重新认识Hadoop 之前,我们把hadoop从下载包部署到编写了helloworld,看到了结果.现是得开始稍微更深入地了解hadoop了. Hadoop包含了两大功 ...
Hadoop学习笔记(2)
Hadoop学习笔记(2) ——解读Hello World 上一章中,我们把hadoop下载.安装.运行起来,最后还执行了一个Hello world程序,看到了结果.现在我们就来解读一下这个Hello ...
Hadoop学习笔记(5) ——编写HelloWorld(2)
Hadoop学习笔记(5) ——编写HelloWorld(2) 前面我们写了一个Hadoop程序,并让它跑起来了.但想想不对啊,Hadoop不是有两块功能么,DFS和MapReduce.没错,上一节我 ...
Hadoop学习笔记(2) ——解读Hello World
Hadoop学习笔记(2) ——解读Hello World 上一章中,我们把hadoop下载.安装.运行起来,最后还执行了一个Hello world程序,看到了结果.现在我们就来解读一下这个Hello ...
Hadoop学习笔记(1) ——菜鸟入门
Hadoop学习笔记(1) ——菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分布式系统基础架构,由Apache基金会所开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序. ...
Hadoop学习笔记（两）设置单节点集群
本文描写叙述怎样设置一个单一节点的 Hadoop 安装.以便您能够高速运行简单的操作,使用 Hadoop MapReduce 和 Hadoop 分布式文件系统 (HDFS). 參考官方文档:Hadoo ...
Hadoop学习笔记(1)（转）
Hadoop学习笔记(1) ——菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分布式系统基础架构,由Apache基金会所开发.用户可以在不了解分布式底层细节的情况下,开发分布式程序. ...
Hadoop学习笔记(10) ——搭建源码学习环境
Hadoop学习笔记(10) ——搭建源码学习环境上一章中,我们对整个hadoop的目录及源码目录有了一个初步的了解,接下来计划深入学习一下这头神象作品了.但是看代码用什么,难不成gedit?,单步 ...

随机推荐

Python国内豆瓣源
Python国内豆瓣源 https://pypi.doubanio.com/simple/
C#弹出窗体、C#导出Excel、C#数据展示框、C#弹出框
1.new 一个窗体,然后设置窗体属性. 2.添加数据展示控件,显示数据. 3.添加按钮控件,调用导出Excel代码,实现导出Excel功能. using System; using System.C ...
51nod"省选"模测 A 树的双直径(树形dp)
题意题目链接 Sol 比赛结束后才调出来..不多说啥了,就是因为自己菜. 裸的up-down dp,维护一下一个点上下的直径就行,一开始还想了个假的思路写了半天.. 转移都在代码注释里毒瘤题目卡空 ...
Java Filter防止sql注入攻击
原理,过滤所有请求中含有非法的字符,例如:, & < select delete 等关键字,黑客可以利用这些字符进行注入攻击,原理是后台实现使用拼接字符串,案例:某个网站的登入验证的SQ ...
Unity3D手机斗地主游戏开发实战（04）_出牌判断大小
之前我们实现了叫地主.玩家和电脑自动出牌主要功能,但是还有个问题,出牌的时候,没有有效性检查和比较牌力大小.比如说,出牌3,4,5,目前是可以出牌的,然后下家可以出任何牌如3,6,9. 问题1:出牌检 ...
【Wyn Enterprise BI知识库】认识多维数据建模与分析 ZT
与业务系统类似,商业智能的基础是数据.但是,因为关注的重点不同,业务系统的数据使用方式和商业智能系统有较大差别.本文主要介绍的就是如何理解商业智能所需的多维数据模型和多维数据分析. 数据立方体多维数 ...
java设计模式之模板模式以及钩子方法使用
1.使用背景模板方法模式是通过把不变行为搬到超类,去除子类里面的重复代码提现它的优势,它提供了一个很好的代码复用平台.当不可变和可变的方法在子类中混合在一起的时候, 不变的方法就会在子类中多次出现, ...
JMeter java.net.SocketException:Operationnotsupported:connect解决方案
java.net.SocketException: Operation not supported: connect解决方案 by:授客 QQ:1033553122 测试环境 apache-jme ...
sublime使用Package Control不能正常使用的解决办法
标签: Sublime作为一款非常优秀的编辑器,套用中学语文课本里一篇讲梁启超的文章里形容梁启超的一句话,就是“短小精悍”.说它“短小”,是因为它的轻量级:说它“精悍”,则得益于它那包罗万象以适用于任 ...
linux下ssh通过公钥登录服务器
经常会通过ssh登录远程服务器,一种是通过密码方式登录,一种是通过公钥登录. 如何设置通过公钥登录服务器 1. 首先生成自己的公钥和私钥 ssh-keygen 命令用来生成公钥和私钥 -t 用来指定密 ...

hadoop学习笔记叁--简单应用

hadoop学习笔记叁--简单应用的更多相关文章

随机推荐

热门专题