------------------bayaim_bayaim_hadoop2_hdfs_20181107---------------------------------

HDFS 原理:上传数据要分块(128M)分块存储
分布式文件系统
---------先启动HDFS----------------
1. sbin/start-dfs.sh
一直输入:yes
电脑密码: root/dba_2018
-----------再启动YARN-----------
2. sbin/start-yarn.sh
3 验证是否启动成功
# jps ------------------------------
使用jps命令验证
27408 NameNode ----hdfs 的老大
28218 Jps ----java 相关的命令
27643 SecondaryNameNode ----hdfs 的助理,帮助数据同步
28066 NodeManager ----YARN 的小弟
27803 ResourceManager ----YARN 的老大,资源的分配 调度
27512 DataNode ----hdfs 的小弟
[root@testoracle sbin]# ./stop-all.sh ---------------------------------

This script is Deprecated. Instead use stop-dfs.sh and stop-yarn.sh
Stopping namenodes on [testoracle]
testoracle: stopping namenode
localhost: stopping datanode
Stopping secondary namenodes [0.0.0.0]
0.0.0.0: stopping secondarynamenode
stopping yarn daemons
stopping resourcemanager
localhost: stopping nodemanager
no proxyserver to stop

[root@testoracle sbin]# ./start-dfs.sh ---------------------------------
[root@testoracle sbin]# hadoop fs -ls hdfs://testoracle:9000/
[root@testoracle sbin]# hadoop fs -copyFromLocal /home/oracle/import.log /import.log (管道,进行分页)
[root@testoracle ~]# hadoop fs -ls -R /
[root@testoracle ~]# hdfs dfs -ls -R /
[root@testoracle hadoop-2.2.0]# hadoop fs -chgrp root /import.log
[root@testoracle hadoop-2.2.0]# hadoop fs -ls /

http://192.168.210.82:50070 (HDFS管理界面)
http://192.168.210.82:8088 (MR管理界面YARN)

1.元数据 : 文件存了几个副本 、 有几块、 在哪台机器上(账本,数据的描述信息,namenode metadata)
2.数据:datanodes 怎么知道文件损坏:校验核 、 MD5值 算法(每个文件是唯一的)大数据采用C32 校验机制

bayaim_hadoop2_hdfs_20181107的更多相关文章

随机推荐

  1. oracle产销存的写法

    with TEMP as (select sum(MMT.TRANSACTION_QUANTITY) QTY_QC, MMT.INVENTORY_ITEM_ID --,CAH.Legal_Entity ...

  2. Cesium专栏-克里金插值(全国温度为例,附源码下载)

    Cesium Cesium 是一款面向三维地球和地图的,世界级的JavaScript开源产品.它提供了基于JavaScript语言的开发包,方便用户快速搭建一款零插件的虚拟地球Web应用,并在性能,精 ...

  3. HTML技巧篇:实现元素水平与垂直居中的几种方式

    如何使用html+css实现元素的水平与垂直居中效果,这也是我们网页在编码制作中会经常用到的问题. 1)单行文本的居中 主要实现css代码: 水平居中:text-align:center;垂直居中:l ...

  4. docker实用命令

    退出容器又不关闭容器:Ctrl + P + Q 比如这种情况: 直接输入exit 会退出且关闭容器,工程就stop了 或者Ctrl + C,会报错KeyboardInterrupt,工程就也stop了 ...

  5. 我的第一个Mybatis项目搭建

    1.新建maven项目,目录如下.第一个坑idea目录和eclipse不一样project就像workspace pom文件 jdk版本有点高建议8.0 <?xml version=" ...

  6. 攻防世界Web_php_unserialize

    本文借鉴 https://blog.csdn.net/qq_40884727/article/details/101162105 打开页面得到源码 <?php class Demo { priv ...

  7. IDEA2019 Win10 Tomcat Server控制台中文乱码的快速解决办法

    原理 Windows10的控制台使用GBK编码,而Tomcat使用UTF-8编码,导致乱码 解决办法 修改$tomcat/conf/logging.properties文件 # 注释这行 java.u ...

  8. 《大数据技术应用与原理》第二版-第二章大数据处理架构Hadoop

    2.1概述 Hadoop是Apache旗下的开源分布式计算平台,是基于Java开发的,具有很好的跨平台特性,其中核心文件是MapReduce和HDFS,而HDFS是根据谷歌文件系统GFS开源实现,是面 ...

  9. Go语言系列教程

    一 Go介绍与开发环境搭建 01-Go语言简介 02-开发环境搭建 03-Go语言集成开发环境之GoLand安装使用 04-Go语言集成开发环境之VS Code安装使用 05-Go包管理详解 二 Go ...

  10. django--DateTimeField字段orm操作

    django中的models.py是我们用来创建数据库里需要的表的,规定表中各个字段的类型,选择合适的字段类型尤为重要,常用的字段类型有:CharField.choice.IntegerField.T ...