[大牛翻译系列]Hadoop 翻译文章索引
| 原书章节 | 原书章节题目 | 翻译文章序号 | 翻译文章题目 | 链接 |
| 4.1 | Joining | Hadoop(1) | MapReduce 连接:重分区连接(Repartition join) | http://www.cnblogs.com/datacloud/p/3578509.html |
| 4.1.1 | Repartition join | Hadoop(1) | MapReduce 连接:重分区连接(Repartition join) | http://www.cnblogs.com/datacloud/p/3578509.html |
| 4.1.2 | Replicated joins | Hadoop(2) | MapReduce 连接:复制连接(Replication join) | http://www.cnblogs.com/datacloud/p/3579333.html |
| 4.1.3 | Semi-joins | Hadoop(3) | MapReduce 连接:半连接(Semi-join) | http://www.cnblogs.com/datacloud/p/3579975.html |
| 4.1.4 | Picking the best join strategy for your data | Hadoop(4) | MapReduce 连接:选择最佳连接策略 | http://www.cnblogs.com/datacloud/p/3582113.html |
| 4.2 | Sorting | Hadoop(5) | MapReduce 排序:次排序(Secondary sort) | http://www.cnblogs.com/datacloud/p/3584640.html |
| 4.2.1 | Secondary sort | Hadoop(5) | MapReduce 排序:次排序(Secondary sort) | http://www.cnblogs.com/datacloud/p/3584640.html |
| 4.2.2 | Total order sorting | Hadoop(6) | MapReduce 排序:总排序(Total order sorting) | http://www.cnblogs.com/datacloud/p/3586761.html |
| 4.3 | Sampling | Hadoop(7) | MapReduce:抽样(Sampling) | http://www.cnblogs.com/datacloud/p/3588120.html |
| 6.1 | Measuring MapReduce and your environment | Hadoop(8) | MapReduce 性能调优:性能测量(Measuring) | http://www.cnblogs.com/datacloud/p/3589875.html |
| 6.2 | Determining the cause of your performance woes | Hadoop(9) | MapReduce 性能调优:理解性能瓶颈,诊断map性能瓶颈 | http://www.cnblogs.com/datacloud/p/3591981.html |
| 6.2.1 | Understanding what can impact MapReduce job performance | Hadoop(9) | MapReduce 性能调优:理解性能瓶颈,诊断map性能瓶颈 | http://www.cnblogs.com/datacloud/p/3591981.html |
| 6.2.2 | Map woes | Hadoop(9) | MapReduce 性能调优:理解性能瓶颈,诊断map性能瓶颈 | http://www.cnblogs.com/datacloud/p/3591981.html |
| 6.2.3 | Reducer woes | Hadoop(10) | MapReduce 性能调优:诊断reduce性能瓶颈 | http://www.cnblogs.com/datacloud/p/3595682.html |
| 6.2.4 | General task woes | Hadoop(11) | MapReduce 性能调优:诊断一般性能瓶颈 | http://www.cnblogs.com/datacloud/p/3596294.html |
| 6.2.5 | Hardware woes | Hadoop(12) | MapReduce 性能调优:诊断硬件性能瓶颈 | http://www.cnblogs.com/datacloud/p/3597909.html |
| 6.4.3 | Optimizing the shuffle and sort phase | Hadoop(13) | MapReduce 性能调优:优化洗牌(shuffle)和排序阶段 | http://www.cnblogs.com/datacloud/p/3599920.html |
| 6.4.4 | Skew mitigation | Hadoop(14) | MapReduce 性能调优:减小数据倾斜的性能损失 | http://www.cnblogs.com/datacloud/p/3601624.html |
| 6.4.5 | Optimizing user space Java in MapReduce | Hadoop(15) | MapReduce 性能调优:优化MapReduce的用户JAVA代码 | http://www.cnblogs.com/datacloud/p/3603191.html |
| 6.4.6 | Data serialization | Hadoop(16) | MapReduce 性能调优:优化数据序列化 | http://www.cnblogs.com/datacloud/p/3608591.html |
| 6.5 | Chapter summary | Hadoop(16) | MapReduce 性能调优:优化数据序列化 | http://www.cnblogs.com/datacloud/p/3608591.html |
| 5.1 | Working with small files | Hadoop(17) | MapReduce 文件处理:小文件 | http://www.cnblogs.com/datacloud/p/3611459.html |
| 5.2 | Efficient storage with compression(tech 25, 26) | Hadoop(19) | MapReduce 文件处理:基于压缩的高效存储(一) | http://www.cnblogs.com/datacloud/p/3612817.html |
| 5.2 | Efficient storage with compression(tech 27) | Hadoop(19) | MapReduce 文件处理:基于压缩的高效存储(一) | http://www.cnblogs.com/datacloud/p/3616544.html |
| Appendix A.10 | LZOP | Hadoop(20) | 附录A.10 压缩格式LZOP编译安装配置 | http://www.cnblogs.com/datacloud/p/3617586.html |
| Appendix D.1 | An optimized repartition join framework | Hadoop(21) | 附录D.1 优化后的重分区框架 | http://www.cnblogs.com/datacloud/p/3617079.html |
| Appendix D.2 | A replicated join framework | Hadoop(22) | 附录D.2 复制连接框架 | http://www.cnblogs.com/datacloud/p/3617078.html |
[大牛翻译系列]Hadoop 翻译文章索引的更多相关文章
- [大牛翻译系列]Hadoop(19)MapReduce 文件处理:基于压缩的高效存储(二)
5.2 基于压缩的高效存储(续) (仅包括技术27) 技术27 在MapReduce,Hive和Pig中使用可分块的LZOP 如果一个文本文件即使经过压缩后仍然比HDFS的块的大小要大,就需要考虑选择 ...
- [大牛翻译系列]Hadoop(18)MapReduce 文件处理:基于压缩的高效存储(一)
5.2 基于压缩的高效存储 (仅包括技术25,和技术26) 数据压缩可以减小数据的大小,节约空间,提高数据传输的效率.在处理文件中,压缩很重要.在处理Hadoop的文件时,更是如此.为了让Hadoop ...
- [大牛翻译系列]Hadoop(20)附录A.10 压缩格式LZOP编译安装配置
附录A.10 LZOP LZOP是一种压缩解码器,在MapReduce中可以支持可分块的压缩.第5章中有一节介绍了如何应用LZOP.在这一节中,将介绍如何编译LZOP,在集群做相应配置. A.10.1 ...
- [大牛翻译系列]Hadoop(9)MapReduce 性能调优:理解性能瓶颈,诊断map性能瓶颈
6.2 诊断性能瓶颈 有的时候作业的执行时间会长得惊人.想靠猜也是很难猜对问题在哪.这一章中将介绍如何界定问题,找到根源.涉及的工具中有的是Hadoop自带的,有的是本书提供的. 系统监控和Hadoo ...
- [大牛翻译系列]Hadoop系列性能部分完结
Hadoop系列性能部分完结.其它的部分发布时间待定. Hadoop系列将不再一日一篇,开始不定期发布.
- [大牛翻译系列]Hadoop(6)MapReduce 排序:总排序(Total order sorting)
4.2.2 总排序(Total order sorting) 有的时候需要将作业的的所有输出进行总排序,使各个输出之间的结果是有序的.有以下实例: 如果要得到某个网站中最受欢迎的网址(URL),就需要 ...
- [大牛翻译系列]Hadoop(5)MapReduce 排序:次排序(Secondary sort)
4.2 排序(SORT) 在MapReduce中,排序的目的有两个: MapReduce可以通过排序将Map输出的键分组.然后每组键调用一次reduce. 在某些需要排序的特定场景中,用户可以将作业( ...
- [大牛翻译系列]Hadoop(22)附录D.2 复制连接框架
附录D.2 复制连接框架 复制连接是map端连接,得名于它的具体实现:连接中最小的数据集将会被复制到所有的map主机节点.复制连接的实现非常直接明了.更具体的内容可以参考Chunk Lam的<H ...
- [大牛翻译系列]Hadoop(21)附录D.1 优化后的重分区框架
附录D.1 优化后的重分区框架 Hadoop社区连接包需要将每个键的所有值都读取到内存中.如何才能在reduce端的连接减少内存开销呢?本文提供的优化中,只需要缓存较小的数据集,然后在连接中遍历较大数 ...
随机推荐
- iOS (UIButton封装)仿糯米首页缩放“按钮”效果
前言 过年期间,少不了各种聚会,当下聚会大多数情况下自然是团购,然后就是用各种APP...使用度娘糯米时(不是广告,不是广告,不是广告!),偶然注意到了它的首页中一个有意思的效果,就是那些“按钮”点击 ...
- 多线程和并发管理 .NET多线程服务
线程相关静态变量 默认静态变量应用程序域所有线程可见.如果静态变量需要在线程间共享,同步访问也就必然了. 线程相关静态变量保证线程安全,同一时间只有一个线程可访问,且每个线程都有该静态变量的拷贝. p ...
- 通过GCD、NSOperationQueue队列、NSThread三种方法来创建多线程
#import "ViewController.h" @interface ViewController () @property (weak, nonatomic) IBOutl ...
- UITextField的简单操作和实际应用
UITestField UITestField* testField = [UITestField alloc]initWithFrame]; /* 设置边框样式 typedef NS_ENUM(NS ...
- 精通CSS高级Web标准解决方案(1-2 层叠与特殊性)
层叠与特殊性 选择器的特殊性分成四个等级,a.b.c . d 如果样式是行内样式,那么a=1 b=ID选择器的总数 c=类.伪类.属性选择器的总数 d=标签选择器与伪元素选择器数量 例如:style ...
- Oracle 基础 <1> --存储过程
一.子程序 子程序是已命名的PL/SQL块,它们存储在数据库中,可以Wie它们指定参数,可以从任何数据库客户端和应用程序中调用它们.子程序包括存储过程和函数. 子程序包括: 1.声明部分:声明部分包括 ...
- VMware系统运维(十八)部署虚拟化桌面 通过View Client进行连接测试
1.打开VMware Horizon View Client添加服务器,配置连接服务器的IP地址等信息 2.点击云图标进行连接,点击继续,证书部分我们后面再讲 3.输入用户名密码,点击"登录 ...
- php的一些简单算法程序(冒泡、快速等)
冒泡排序: function buttle_sort($array) { $len=count($array); if($len<2){ return $array; } for($i=0;$i ...
- 运用DataTable进行行转列操作
public DataTable GetReverseTable(DataTable p_Table) { DataTable _Table = new DataTable(); ; i != p_T ...
- CSS之表格操作
表格的colspan和rowspan属性参考:http://erpoperator.blog.163.com/blog/static/17899637220123993031921/ colspan是 ...