Hadop 基础
HDFS 体系结构
mapreduce 体系结构和算法
haddop 集群 zookeeper 操作;
HBase 体系结构
Hive /Sqoop 体系结构和基本操作;
mapreduce 逻辑处理数据;
HDFS 存放海量数据;
结构与非结构化数据
structured data ( RDBMS ) & Untructured data (flume scribe)
HBASE ( OLTP ) 在线事务处理应用;高延迟 处理高数据量;
数据流的处理语言;
分布式的存储 分布式的计算;
小规模数据获取不适用 { 分布式 额外的管理消耗,(网络 IO 等)}
3个版本线
HDFS 的架构
分布式文件系统
主从结构
主节点 namenode
接收用户的操作请求
维护文件系统目录结构
管理文件与block之间的关系 block与datanode 之间的关系;
从节点 datanode
存储文件
文件被分成block存储在磁盘上、block 可以存放在不同的机器上;
保障数据安全 文件有多个副本;
分块管理容易 :移动 读取 上传都比较麻烦、划分成块 。分明别类的进行存储;
{块文件64M}
map Reduce
并行计算框架
也是主从结构
主节点 只有一个 JOB tracker
负责 接收客户提交的计算任务
把计算任务分给 task trackers 执行
监控 task tracker 的执行情况
从节点 task trackers
执行 job trackers 分配的计算任务;
特点吗:(分布式)
扩容能力 (Sscalable)能可靠reliably 的存储和处理前兆字节PB的数据
成本低 计算能能是通过所有的机器运行 ;关联数据 oracle 贵 成本高;
高效率 通过分发数据 可以并行的处理数据
可靠性 Hadoop 能自动的维护数据的多分副本 并且在任务失败后能够自定重新部署
Hadoop 集群的物理分布 硬件没有要求还是有网络要求 (网络 与千兆网卡 网线 千兆交换机 )
switch
datanode/Task tracker
job tracker
namenode
Client
datanode/Task Tracker
datanode/Task Tracker
master slave 跑的都有 JVM Java虚拟机
安装 { 本地模式 分布式模式 和 集群模式 }
伪分布式 : 一台机器 上的进程
selinux 防火墙 hostname ssh jdk hadoop
启动:
可以全部启动也可以单独启动;
star-all.sh
stop-all.sh
可以单独进行启动
hadoop 启动警告;
提示配置文件 的告警的 条件语句配置;
# vi hadoop-config.sh
if [ "$HADOOP_HOME_WARN_SUPPRESS" = "" ] && [ "$HADOOP_HOME" != "" ]; then
echo "Warning: \$HADOOP_HOME is deprecated." 1>&2
echo 1>&2
可以修改配置 : 配置条件语句不为空;
vi /etc/profile
export HADOOP_HOME_WARN_SUPPRESS=1
jps
启动验证;
启动失败: 系统没有格式化 ( bin/hadoop namenode -format )
配置出错 (多次格式化、可以删除磁盘配置默认tmp文件)
初始化 第一次需要格式化
格式化:hadoop namenode -format
(可以删除 hadoop 目录下的tmp 文件)
Hadop 基础的更多相关文章
- hadoop面试100道收集(带答案)
1.列出安装Hadoop流程步骤 a) 创建hadoop账号 b) 更改ip c) 安装Java 更改/etc/profile 配置环境变量 d) 修改host文件域名 e) 安装ssh 配置无密码登 ...
- hadoop - 基础操作
查看文件: [root@hadoop hadoop]# hadoop fs -lsr /drwxr-xr-x - root supergroup 0 2016-12-27 10:49 /homedrw ...
- java基础集合经典训练题
第一题:要求产生10个随机的字符串,每一个字符串互相不重复,每一个字符串中组成的字符(a-zA-Z0-9)也不相同,每个字符串长度为10; 分析:*1.看到这个题目,或许你脑海中会想到很多方法,比如判 ...
- node-webkit 环境搭建与基础demo
首先去github上面下载(地址),具体更具自己的系统,我的是windows,这里只给出windows的做法 下载windows x64版本 下载之后解压,得到以下东西 为了方便,我们直接在这个目录中 ...
- js学习笔记:webpack基础入门(一)
之前听说过webpack,今天想正式的接触一下,先跟着webpack的官方用户指南走: 在这里有: 如何安装webpack 如何使用webpack 如何使用loader 如何使用webpack的开发者 ...
- Golang, 以17个简短代码片段,切底弄懂 channel 基础
(原创出处为本博客:http://www.cnblogs.com/linguanh/) 前序: 因为打算自己搞个基于Golang的IM服务器,所以复习了下之前一直没怎么使用的协程.管道等高并发编程知识 ...
- [C#] C# 基础回顾 - 匿名方法
C# 基础回顾 - 匿名方法 目录 简介 匿名方法的参数使用范围 委托示例 简介 在 C# 2.0 之前的版本中,我们创建委托的唯一形式 -- 命名方法. 而 C# 2.0 -- 引进了匿名方法,在 ...
- HTTPS 互联网世界的安全基础
近一年公司在努力推进全站的 HTTPS 化,作为负责应用系统的我们,在配合这个趋势的过程中,顺便也就想去搞清楚 HTTP 后面的这个 S 到底是个什么含义?有什么作用?带来了哪些影响?毕竟以前也就只是 ...
- Swift与C#的基础语法比较
背景: 这两天不小心看了一下Swift的基础语法,感觉既然看了,还是写一下笔记,留个痕迹~ 总体而言,感觉Swift是一种前后端多种语言混合的产物~~~ 做为一名.NET阵营人士,少少多多总喜欢通过对 ...
随机推荐
- Mysql 乐观锁
转载:http://chenzhou123520.iteye.com/blog/1863407 乐观锁介绍: 乐观锁( Optimistic Locking ) 相对悲观锁而言,乐观锁假设认为数据一般 ...
- 14.5 富文本编辑【JavaScript高级程序设计第三版】
富文本编辑,又称为WYSIWYG(What You See Is What You Get,所见即所得).在网页中编辑富文本内容,是人们对Web 应用程序最大的期待之一.虽然也没有规范,但在IE 最早 ...
- 一点点linux系统的学习心得
我相信你正在阅读本文的时候,可能是因为你渴望学习Linux技术.我想分享一下过去两年中我自己的一些学习经历,希望你能更顺利地成为Linuxer. 两年前在Linux系统的运行和维护方面找到了一份工作( ...
- BZOJ3522[Poi2014]Hotel——树形DP
题目描述 有一个树形结构的宾馆,n个房间,n-1条无向边,每条边的长度相同,任意两个房间可以相互到达.吉丽要给他的三个妹子各开(一个)房(间).三个妹子住的房间要互不相同(否则要打起来了),为了让吉丽 ...
- HDU4288-STL模拟
给你插入,删除的操作,维护一个降序排列的表,查询所有下标模5等于3的元素和. 2012年成都网络赛的一道签到题.但是还是搜了题解才做出来了,意志不坚定啊... 这道题给10s的时间,做法多种多样. 最 ...
- java 前台使用枚举方法(二)
最近发现,前台jsp使用枚举,有一个更方便的方法. 首先 枚举类的封装大家看一下:http://blog.csdn.net/hanjun0612/article/details/72845960 然后 ...
- easyui 功能介绍
最近使用easyui, 下面,我介绍下常用功能: //绑定Product总类型 $('#gdv_ProductParentType').datagrid({ url: '../api/BindData ...
- day30 __hash__ 计算哈希值
hash() # __hash__哈希的时候会根据内存地址进行哈希,因为地址不同所以哈希的值也不同,哪怕是完全一样子的属性得出的哈希值也不一样因此存在需要某些时刻期望属性相同得出相同哈希值可以控制对象 ...
- 洛谷 P2420 让我们异或吧 解题报告
P2420 让我们异或吧 题目描述 异或是一种神奇的运算,大部分人把它总结成不进位加法. 在生活中-xor运算也很常见.比如,对于一个问题的回答,是为1,否为0.那么: (A是否是男生 )xor( B ...
- luogu2024 食物链 (并查集)
把一个点拆成三个,分别对应它的同类.它的猎物和它的天敌,这样的话(以下的相等都是并查集意义上的): 如果令a,b同类,那么a的猎物不能是b的同类,a的天敌不能是b的同类 如果令a吃b,那么a的同类不能 ...