日志 --排错

.log:通过log4j记录的,记录大部分应用程序的日志信息
.out:记录标准输出和标准错误日志,少量记录
 
 

hdfs 常用shell

    -ls
    -put <localsrc> ... <dst>   上传
    -cat   -text   查看文件内容
    -mkdir [-p] 
    -mv
    -cp
    -du
    -chmod
 
 
认识一些重要的配置选项:
namenode 元数据??
datanode 数据存储目录 ?
 
系统默认:
文件名:core-default.xml、hdfs-default.xml、yarn-default.xml、mapred-default.xml
 
自定义的:
位置:$HADOOP_HOME/etc/hadoop
文件名:core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml
 
 
自定义namenode节点  datanode节点
hdfs-site.xml:
    <property>
<name>dfs.namenode.http-address</name>
<value>hadoop1:50070</value>
</property>
 
core-site.xml
    <property>
<name>hadoop.tmp.dir</name>
<value>/opt/modules/hadoop-2.5.0/data</value>
</property>
 
yarn-site.xml

   <property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop1</value>
</property>
 
 
日志聚合
    --日志上传到HDFS
 
yarn-site.xml
    <property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
 
 
    <property> 
      <name>yarn.log-aggregation.retain-seconds</name>
<value>86400</value>
</property>
 
 
mapred-site.xml
    <property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>hadoop1:19888</value>
</property>
 
启动服务
$ sbin/mr-jobhistory-daemon.sh start historyserver
 
 
目前:
 NameNode
Jps
DataNode
NodeManager
JobHistoryServer
ResourceManager
 
hdfs      --namenode   datanode
        --resourcemanager  nodemanager
 
namenode   
    --元数据(文件名、权限、时间)
        fsimage(内存)      二进制
            --> put rm mkdir -->edits
        edits_log  二进制
    -->重启
 
    -->hdfs有很多修改(元数据-->edits很大) replay
        -->下一次重启namenode,合并变得很慢
 
secondary namenode(不是热备)
        -->周期性合并fsimage和edits,辅助namenode
        -->通常安装到另外一台物理服务器
            --周期性:1H
            --edits:64M
 
hdfs-site.xml
    <property>
<name>dfs.namenode.secondary.http-address</name>
<value>hadoop1:50090</value>
</property>
 
 
namenode       
    --HDFS的中心服务器
    --客户端访问HDFS集群的入口
    --响应给客户端的数据直接由datanode传出
    --读取文件时NameNode尽量让用户先读取最近的副本
    --周期性地从集群中的每个Datanode接收心跳信号和块状态报告(Blockreport)
 
datanode
    --存储数据
    --以块为单位进行存储(128M)
    --报告块的状态(1H)
    --周期性向namenode注册(3s)--(10min)
    --在线加入/卸载服务器
 
HDFS数据安全性??
 
safemode安全模式:  --HDFS
    --进入安全模式以后变成只读
    1、在namenode启动过程中
            -->datanode
    2、dfs.namenode.safemode.threshold-pct
            -->0.999f    -->block
 
 
HDFS   
    --存储大、动态扩展
    --运行在普通的商用服务器(容错高)
    --副本数、保证数据安全
    --一次写入、多次读写
    --不适合修改比较频繁的业务
    --适合存储大文件,不适合存储太多小文件
 
yarn  --资源管理
resourcemanager   
    --处理客户端请求
    --启动/监控ApplicationMaster
    --监控NodeManager
    --资源分配与调度
 
Application Master
    --作为job任务的管理者
    --为应用程序申请资源,并进一步分配给内部任务
    --任务监控与容错   
 
NodeManager
    --单个节点上的资源管理和任务管理
    --处理来自ResourceManager的命令
    --处理来自ApplicationMaster的命令
 
Container
    --对任务运行环境的抽象
    --描述一系列信息
    --任务运行资源(节点、内存、CPU)
    --任务启动命令
    --任务运行环境
 
 
yarn任务运行流程:
    1、resourcemanager收到客户端请求
    2、resourcemanager会去生产一个application master,作为当前job任务的管理者
    3、application master再去resource manager申请资源
    4、resource manager响应application master的资源申请
    5、application master分派任务给其他nodemanager(container)
    6、nodemanager接受到任务指派以后,开始执行job任务
    7、nodemanager执行完成以后向管理者报告
    8、application master向resourcemanager报告
 
 
yarn.nodemanager.resource.memory-mb  8G
yarn.nodemanager.resource.cpu-vcores
memory多少会影响任务执行是否失败
cpu只会job任务的快慢
 
 
 
 
 
 
 
 
 
 
 
 

2、HDFS和Yarn的基础学习笔记的更多相关文章

  1. 【C#编程基础学习笔记】4---Convert类型转换

    2013/7/24 技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com [C#编程基础学习笔记]4---Convert类型转换 ...

  2. 【C#编程基础学习笔记】6---变量的命名

    2013/7/24 技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com [C#编程基础学习笔记]6---变量的命名 ----- ...

  3. 1.C#基础学习笔记3---C#字符串(转义符和内存存储无关)

    技术qq交流群:JavaDream:251572072  教程下载,在线交流:创梦IT社区:www.credream.com ------------------------------------- ...

  4. Java基础学习笔记总结

    Java基础学习笔记一 Java介绍 Java基础学习笔记二 Java基础语法之变量.数据类型 Java基础学习笔记三 Java基础语法之流程控制语句.循环 Java基础学习笔记四 Java基础语法之 ...

  5. Mysql数据库基础学习笔记

    Mysql数据库基础学习笔记 1.mysql查看当前登录的账户名以及数据库 一.单表查询 1.创建数据库yuzly,创建表fruits 创建表 ) ) ,) NOT NULL,PRIMARY KEY( ...

  6. 0003.5-20180422-自动化第四章-python基础学习笔记--脚本

    0003.5-20180422-自动化第四章-python基础学习笔记--脚本 1-shopping """ v = [ {"name": " ...

  7. Java基础学习笔记(一)

    Java基础学习笔记(一) Hello World 基础代码学习 代码编写基础结构 class :类,一个类即一个java代码,形成一个class文件,写于每个代码的前端(注意无大写字母) XxxYy ...

  8. C#RabbitMQ基础学习笔记

    RabbitMQ基础学习笔记(C#代码示例) 一.定义: MQ是MessageQueue,消息队列的简称(是流行的开源消息队列系统,利用erlang语言开发).MQ是一种应用程序对应用程序的通信方法. ...

  9. handlebars.js基础学习笔记

    最近在帮学校做个课程网站,就有人推荐用jquery+ajax+handlebars做网站前端,刚接触发现挺高大上的,于是就把一些基础学习笔记记录下来啦. 1.引用文件: jquery.js文件下载:h ...

随机推荐

  1. Scalaz(24)- 泛函数据结构: Tree-数据游览及维护

    上节我们讨论了Zipper-串形不可变集合(immutable sequential collection)游标,在串形集合中左右游走及元素维护操作.这篇我们谈谈Tree.在电子商务应用中对于xml, ...

  2. hdu-4496-D-City

    D-City Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65535/65535 K (Java/Others)Total Subm ...

  3. 十一个行为模式之责任链模式(Responsible Chain Pattern)

    定义: 将具有相同接口的责任类串行在一起,解耦请求的发送者和处理者.沿着这条链进行请求,直到有对象处理它为止. 结构图: Handler:抽象处理类,定义了所有责任类处理方法的接口,不同的处理方法在子 ...

  4. 设置MySQL允许外网访问

    1:设置mysql的配置文件      /etc/mysql/my.cnf      找到 bind-address  =127.0.0.1  将其注释掉://作用是使得不再只允许本地访问:   重启 ...

  5. js的querySelector跟querySelectorAll

    querySelector:document.querySelector('.className')------->可以选中.className的一个dom(注意只是一个) document.q ...

  6. Bootstrap源码分析之dropdown

    源码分析: Dropdowns.scss:下拉框模块 Javascripts/bootstrap/dropdown.js:实现下拉框响应 实现功能及原理: 下拉选项卡,默认不能实现显示选中项的功能 原 ...

  7. MySQL支持的数据类型

    1.整型 MySQL数据类型 含义(有符号) tinyint(m) 1个字节 范围(-128~127) smallint(m) 2个字节 范围(-32768~32767) mediumint(m) 3 ...

  8. windows 安装 go语言

    下载地址:http://www.cnblogs.com/osfipin/p/4856839.html. 官方教程说明: Windows 对于Windows用户,Go项目提供两种安装选项(从源码安装除外 ...

  9. javascript --- Function模式

    回调函数 在javascript中,当一个函数A作为另外一个函数B的其中一个参数时,则称A函数为回调函数,即A可以在函数B的运行周期内执行(开始,中间,结束). 举例来说,有一个函数用于生成node. ...

  10. 精通 CSS 选择器

    CSS 选择器除了样式表匹配元素时需要用到,在使用 jQuery 等库的时候也可以利用 CSS 选择器来选择元素,因此作为前端开发需要熟练掌握.下面是一些常用的 CSS 选择器示例. 元素选择器 E, ...