问题1:改写DistributedShell程序,使得每个container运行在不同节点上(目前是随机的,可能运行在任意节点上). 问题2:改写DistributedShell程序,使得某个用户指定的命令可以在集群的每个节点上仅执行一次. 参考 http://tech.ddvip.com/2014-04/1396616894209607.html http://mail-archives.apache.org/mod_mbox/hadoop-common-user/201304.mbox/%3…
本文是董西成的Hadoop技术内幕一书的读书章节总结. 第八章 Task运行过程分析 所有Task需要周期性地向TaskTracker汇报最新进度和计数器值,而这正是由Reporter组件实现的,其中Reporter汇报的信息中包含两个部分:任务执行进度以及任务计数器值.任务执行进度hadoop采用简单的线性模型计算每个阶段的进度值,对于Map Task而言,作为一个大阶段不再分解,一般实用RecordReader中的getProgress()方法划定执行进度:对于Reduce Task而言,可…
developerWorks 图书频道: 深入分析 Java Web 技术内幕,第 10 章 深入理解 Session 与 Cookie Session 与 Cookie 不管是对 Java Web 的初学者还是熟练使用者来说都是一个令人头疼的问题.在初入职场时恐怕很多程序员在面试的时候都被问到过这个问题.其实这个问题回答起来既简单又复杂,简单是因为它们本身只是 HTTP 协议中的一个配置项,在 Servlet 规范中也只是对应到一个类而已:说它复杂原因在于当我们的系统大到需要用到很多 Cook…
这是我收集的两本关于Hadoop的书,高清PDF版,在此和大家分享: 1.<Hadoop技术内幕:深入理解MapReduce架构设计与实现原理>董西成 著  机械工业出版社2013年5月出版 2.<Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理>蔡斌.陈湘萍 著  机械工业出版社2013年4月出版 百度网盘下载地址: http://pan.baidu.com/s/1sjNmkFj…
1.1 源代码学习环境 1.1.1 基础软件的下载 JDK-http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html Ant-http://ant.apache.org/bindownload.cgi Cygwin-http://www.cygwin.com/ Eclipse-http://www.eclipse.org/downloads/ 1.1.2 Windows环境 D:\had…
第三章 查询处理 逻辑查询处理:(8) SELECT (9) DISTINCT <select_list> (1) FROM <left_table> (3) <join_type> JOIN <right_table> (2) ON <join_condition> (4) WHERE <where_condition> (5) GROUP BY <group_by_list> (6) WITH {CUBE|ROLLUP…
Hadoop核心 1.HDFS:高容错性.高伸缩性……,允许用户将Hadoop部署在廉价的硬件上,构建分布式系统 2.MapReduce:分布式计算框架,允许用户在不了解分布式系统底层细节的情况下,开发并行.分步的应用程序.充分利用大规模的计算资源,解决传统高性能单机无法解决的大数据用户 应用:分析海量数据 优势: 1.方便.可运行在一般商业机器构成的大型集群上||亚马逊弹性计算云Amazon EC2……云计算服务上 2.弹性:通过增加集群结点,可线性地扩展,以处理更大的数据集:在集群负载下降时…
java体系结构与工作方式 7.1 JVM体系结构 何谓JVM JVM(Java Virtual Machine) 通过模拟一个计算机来达到一个计算机所具有的计算功能 指令集:计算机所能识别的机器语言的命令集合 计算单元:能识别并且控制指令执行的功能模块 寻址方式:地址的位数.最小地址和最大地址范围,以及地址的运行规则 寄存器:包括操作数寄存器.变址寄存器.控制寄存器等的定义.数量和使用方式 存储单元:能够存储操作数寄存器和保存操作结构的单元 指令集与汇编语言: 指令集:可以直接执行的二进制代码…
javac编译的四个主要的流程: 词法分析器:将源码转换为Token流 将源代码划分成一个个Token(找出java语言中的关键字) 语法分析器:将Token流转化为语法树 将上述的一个个Token组成一句句话(或者说成一句句代码块),检查这一句句话是不是符合Java语言规范(如if后面跟的是不是布尔判断表达式) 语义分析器:将语法树转化为注解语法树 将复杂的语法转化成简单的语法(eg.注解.foreach转化为for循环.去掉永不会用到的代码块)并做一些检查,添加一些代码(默认构造器) 代码生…
事务格式如下: 1.开启事务: begin tran 2.提交事务:commit tran 3.回滚事务:rollback tran 判断事务是提交还是应该回滚有两种方式,一是全局变量 @@error,二是 begin try……end try begin catch……end catch 一.@@error @@error作为全局变量,保存着每次执行SQL语句的状态值,当值为0时表示执行正常,否则为错误,因此可以定义一个变量,在每次执行一条SQL语句时都要将该变量的值加上@@error的值,到…