Hadoop基本概念
  • 在当下的IT领域,大数据很“热”,实现大数据场 景的Hadoop系列产品更“热”。
  • Hadoop是一个开源的分布式系统基础架构,由 Apache基金会开发。
  • 此架构可以帮助用户可以在不了解分布式底层细 节的情况下,开发分布式程序。
  • 目前,主要的发展版本有Hadoop1.0和Hadoop2.0 。
  • 名字来源于创始人——Doug Cutting儿子的一个黄 色的玩具大象
  • 雏形:Doug Cutting用java代码编写,实现与 Google类似的全文搜索功能,它提供了全文检索 引擎的架构,包括完整的查询引擎和索引引擎。
  • 2001年年底成为apache软件基金会jakarta的一个 子项目。
  • Hadoop起源于Google的集群系统
  • Google的三大核心的分布式技术
            – 2003年,GFS分布式存储系统
            – 2004年,MapReduce分布式处理技术
            – 2006年,BigTable分布式数据库
  • 对于大数据量的场景,迫使Doug Cutting学习 和模仿Google解决这些问题。
目前最新应用领域
农业 • 地震台网监测 • 医疗 • 可穿戴设备 • 无人驾驶汽车
讨论课题
任何事物都具有两面性,请分组讨论:在你的眼中“大数据”处理技术给人类带来了哪些好处? 哪些问题?
课程安排
课程安排分为理论课(32学时)和实验课(16学时)
  • 理论课 
  – Hadoop概述
  – YARN设计理念与基础架构
   – MapReduce编程模型
  – HDFS详解
  • 实验课
  – Hadoop2.0的环境搭建
  – MapReduce开发环境搭建
  – 调试运行编写MapReduce词频统计程序
  – MapReduce程序编程
课程目标
• 了解YARN的基本工作原理
• 了解Hadoop2.0的两大核心模块的工作原理
• 熟悉Hadoop2.0环境搭建、配置与管理
• 熟练向Hadoop提交作业以及查询作业运行情况
• 能书写Map-Reduce程序 • 能熟练地对HDFS中的文件进行管理
参考文献
• Hadoop实战
• Hadoop权威指南
 
 
课堂笔记
(1)理解 集群 分布式 数据中心的概念 以及其中的关系?
答:集群大抵是指硬件,分布式大抵是指软件,集群加上分布式的商业化体现就是数据中心。
(2)理解可迁移技术与负载均衡的概念。
答:举个例子,一个游戏,有三个区,每个区各有三台服务器。我们都知道晚饭过后,登录游戏的人很多,倘若一区爆满,二区三区人相对比较少,此时可迁移技术就派上了用场,把二三区空闲的服务器迁移到一区或者将另外备用的服务器给一区,进而负载均衡。同样的道理,在游戏中,过不了的动画,副本排队,卡下线,都和可迁移技术和负载均衡有关。再举个例子,深夜的时候,打游戏的人相对会少很多,这时,运营商可能就会关掉二区三区的服务器,只留下一区的服务器,以此来减少成本。
(3)理解互联网 云计算 大数据 人工智能的概念 以及彼此之间的关系?
答:略。
 

hadoop第一课的更多相关文章

  1. 马士兵hadoop第一课:虚拟机搭建和安装hadoop及启动(转)

    马士兵hadoop第一课:虚拟机搭建和安装hadoop及启动 马士兵hadoop第二课:hdfs集群集中管理和hadoop文件操作 马士兵hadoop第三课:java开发hdfs 马士兵hadoop第 ...

  2. Hadoop第一课:Hadoop集群环境搭建

    一. 检查列表 1.1.网络访问 设置电脑IP以及可以访问网络设置:进入etc/sysconfig/network-scripts/,使用命令“ls -all” 查看文件.会看到ifcfg-lo文件然 ...

  3. 马士兵hadoop第二课:hdfs集群集中管理和hadoop文件操作

    马士兵hadoop第一课:虚拟机搭建和安装hadoop及启动 马士兵hadoop第二课:hdfs集群集中管理和hadoop文件操作 马士兵hadoop第三课:java开发hdfs 马士兵hadoop第 ...

  4. 马士兵hadoop第二课:hdfs集群集中管理和hadoop文件操作(转)

    马士兵hadoop第一课:虚拟机搭建和安装hadoop及启动 马士兵hadoop第二课:hdfs集群集中管理和hadoop文件操作 马士兵hadoop第三课:java开发hdfs 马士兵hadoop第 ...

  5. vue.js学习(第一课)

    学习资料 来自台湾小凡! vue.js是javascript的一个库,只专注于UI层面,核心价值永远是 API的简洁. 第一课: 不支持IE8. 1.声明式渲染: el元素的简称 element : ...

  6. Magento学习第一课——目录结构介绍

    Magento学习第一课--目录结构介绍 一.Magento为何强大 Magento是在Zend框架基础上建立起来的,这点保证了代码的安全性及稳定性.选择Zend的原因有很多,但是最基本的是因为zen ...

  7. <-0基础学python.第一课->

    初衷:我电脑里面的歌曲很久没换了,我想听一下新的歌曲,把他们下载下来听,比如某个榜单的,但是一首一首的点击下载另存为真的很恶心 所以我想有没有办法通过程序的方式来实现,结果还真的有,而且网上已经有有人 ...

  8. 留念 C语言第一课简单的计算器制作

    留念 C语言第一课简单的计算器制作 学C语言这么久了.  /* 留念 C语言第一课简单的计算器制作 */   #include<stdio.h>  #include<stdlib.h ...

  9. MFC学习-第一课 MFC运行机制

    最近由于兴趣爱好,学习了孙鑫的MFC教程的第一课.看完视频了,自己便用visual studio 2010尝试了MFC编程,其中遇到了一些问题. 1.vs2010不像vs6.0那样可以新建一个空的MF ...

随机推荐

  1. Nginx 静态资源缓存设置

    在开发调试web的时候,经常会碰到因浏览器缓存(cache)而经常要去清空缓存或者强制刷新来测试的烦恼,提供下apache不缓存配置和nginx不缓存配置的设置.在常用的缓存设置里面有两种方式,都是使 ...

  2. Angular2 ^ 资源链接

     Angular2 资源链接 Material Desgin 2 githubhttps://github.com/Promact/md2 DEMOhttp://code.promactinfo.co ...

  3. 【基础】26个命令玩转linux,菜鸟及面试必备

    1 查看目录与文件:ls #显示当前目录下所有文件的详细信息 ls -la 2 切换目录:cd #切换当前目录为/opt/test cd /opt/test 3 显示当前目录:pwd pwd 4 创建 ...

  4. selenium自动化测试学习(一)

    在学习selenium自动化测试前,我们需要先了解一点自动化测试的相关知识. (一)什么是自动化测试 (二)为什么要做自动化测试 (三)自动化测试优缺点 (1)什么是自动化测试 自动化测试是把以人为驱 ...

  5. CentOS 挂载 cdrom, iso文件作为源

    在生产系统环境中的机器都没有连接互联网,因此都是使用本地源. 首先,需要将cdrom, 或 iso文件挂载到本地目录. 1.挂载光驱: 将cdrom 放入光驱. $  mkdir /media/cdr ...

  6. 基于Jquery+Ajax+Json+存储过程 高效分页

    在做后台开发中,都会有大量的列表展示,下面给大家给大家分享一套基于Jquery+Ajax+Json+存储过程高效分页列表,只需要传递几个参数即可.当然代码也有改进的地方,如果大家有更好的方法,愿留下宝 ...

  7. python项目使用jsonschema进行参数校验

    python项目使用jsonschema进行参数校验 最近想要给一个新的openstack项目加上参数校验,过完年回来准备开工的时候,发现其他人已经在做了,对应的patch是:https://revi ...

  8. 自己编写的仿京东移动端的省市联动选择JQuery插件

    概述 什么是插件,插件就是即插即用叫插件,很少的配置,很少的代码就可以用都项目里,之所以做这个插件,是因为做了一个省市区的联动,其他项目如果要用怎么办,难道在ctrl+c,ctrl+v?那样做太low ...

  9. 沉淀,再出发——在Ubuntu Kylin15.04中配置Hadoop单机/伪分布式系统经验分享

    在Ubuntu Kylin15.04中配置Hadoop单机/伪分布式系统经验分享 一.工作准备 首先,明确工作的重心,在Ubuntu Kylin15.04中配置Hadoop集群,这里我是用的双系统中的 ...

  10. mongodb副本集中其中一个节点宕机无法重启的问题

    2-8日我还在家中的时候,被告知mongodb副本集中其中一个从节点因未知原因宕机,然后暂时负责代管的同事无论如何就是启动不起来. 当时mongodb的日志信息是这样的: 实际上这里这么长一串最重要的 ...