Hadoop-2.2.0中文文档—— 从Hadoop 1.x 迁移至 Hadoop 2.x

【Hadoop-2.2.0中文文档—— 从Hadoop 1.x 迁移至 Hadoop 2.x】的更多相关文章

Apache Spark 2.2.0 中文文档

Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN Geekhoo 关注 2017.09.20 13:55* 字数 2062 阅读 13评论 0喜欢 1 快速入门使用 Spark Shell 进行交互式分析基础 Dataset 上的更多操作缓存独立的应用快速跳转本教程提供了如何使用 Spark 的快速入门介绍.首先通过运行 Spark 交互式的 shell(在 Python 或 Scala 中)来介绍 API, 然后展示如何使用 Java , Scal…

Apache Storm 1.1.0 中文文档 | ApacheCN

前言 Apache Storm 是一个免费的,开源的,分布式的实时计算系统. 官方文档: http://storm.apache.org 中文文档: http://storm.apachecn.org ApacheCN 最近组织了翻译 Storm 1.1.0 中文文档的活动,整体翻译进度为 96%. 感谢大家参与到该活动中来感谢无私奉献的贡献者,才有了这份 Storm 1.1.0 中文文档感谢一路有你的陪伴,我们才可以做的更好,走的更快,走的更远,我们一直在努力 ... 网页地址:…

Django2.0中文文档

title: Django2.0中文文档 tags: Python,Django,入沐三分 grammar_cjkRuby: true --- Django2.0版本已经发布了,我们先来看一个图片从图中可以看出来2.0版本其实支持的时间也就是一年多. 不过我还是想把这个文档给翻译了至少目前网上还没有中文的文档呢谁不想成为第一个呢每天都要上班呀,如果关注的人比较多的话我才能有更大的动力呀 @入沐三分…

webpack4.0中文文档踩坑记录

一直没有正儿八经去看过webpack4.0的文档,前段时间工作比较轻松,于是就有了此文...面都这样一个问题:请问在您的开发生涯中,令你最痛苦最无奈的是什么?小生的回答只有一个:“阅读那些令人发指的文档,你照着敲看不到效果的那种!” 以下就是我在复习webpack4.3文档中遇到的一些问题,当然必须声明的是,这些问题只是小生在中文文档中遇到的, 人家为我们翻译已经很不容易很辛苦了,毕竟肯定比我们去阅读英语文档要来得更容易理解,列出这些问题只是做个记录,便于大家学习: 也不知道上传之后是否还看得清…

Hadoop-2.2.0中文文档—— 从Hadoop 1.x 迁移至 Hadoop 2.x

简单介绍本文档对从 Apache Hadoop 1.x 迁移他们的Apache Hadoop MapReduce 应用到 Apache Hadoop 2.x 的用户提供了一些信息. 在 Apache Hadoop 2.x 中,我们已经把资源管理功能放入分布式应用管理框架的Apache Hadoop YARN,而 Apache Hadoop MapReduce (亦称 MRv2) 保持为一个纯分布式计算框架. 总之,之前的 MapReduce 执行时 (亦称 MRv1) 已经被重用而且不会有…

Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN

Spark 概述 Apache Spark 是一个快速的, 多用途的集群计算系统. 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎. 它还支持一组丰富的高级工具, 包括使用 SQL 处理结构化数据处理的 Spark SQL, 用于机器学习的 MLlib, 用于图形处理的 GraphX, 以及 Spark Streaming. 下载从该项目官网的下载页面获取 Spark. 该文档用于 Spark 2.2.0 版本. Spa…

Apache Spark 2.2.0 中文文档 - Spark RDD（Resilient Distributed Datasets）论文 | ApacheCN

Spark RDD(Resilient Distributed Datasets)论文概要 1: 介绍 2: Resilient Distributed Datasets(RDDs) 2.1 RDD 抽象 2.2 Spark 编程接口 2.2.1 例子 – 监控日志数据挖掘 2.3 RDD 模型的优势 2.4 不适合用 RDDs 的应用 3 Spark 编程接口 3.1 Spark 中 RDD 的操作 3.2 举例应用 3.2.1 线性回归 3.2.2 PageRank 4 表达 RDDs 5…

Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN

Spark 编程指南概述 Spark 依赖初始化 Spark 使用 Shell 弹性分布式数据集 (RDDs) 并行集合外部 Datasets(数据集) RDD 操作基础传递 Functions(函数)给 Spark 理解闭包示例 Local(本地)vs. cluster(集群)模式打印 RDD 的 elements 与 Key-Value Pairs 一起使用 Transformations(转换) Actions(动作) Shuffle 操作 Background(幕后) 性能…

Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN

Spark SQL, DataFrames and Datasets Guide Overview SQL Datasets and DataFrames 开始入门起始点: SparkSession 创建 DataFrames 无类型的Dataset操作 (aka DataFrame 操作) Running SQL Queries Programmatically 全局临时视图创建Datasets RDD的互操作性使用反射推断Schema 以编程的方式指定Schema Aggregatio…

Hadoop-2.2.0中文文档—— Shell命令

FS Shell 调用文件系统(FS)Shell命令应使用 bin/hadoop fs <args>的形式. 全部的的FS shell命令使用URI路径作为參数.URI格式是scheme://authority/path. 对HDFS文件系统,scheme是hdfs.对本地文件系统,scheme是file. 当中scheme和authority參数都是可选的,如果未加指定,就会使用配置中指定的默认scheme. 一个HDFS文件或文件夹比方/parent/child能够表示成hdfs://na…