hbase、pig、hive配置与应用

------------------HBASE----------

[root@iClient~]#sudo yum install hbase                  #iClient安装Hbase客户端

[root@cMaster-]#sudo yum install hbase-master           #cMaster 安装主服务HMaster

[root@cSlave0~]#sudo yum install hbase-regionserver     #eSlave0安装从服务

[root@cSlavel~]#sudo yum install hbase-regionserver      #cSlavel安装从服务

[root@cSlave2~]#sudo yum install hbase-regionserver      #eSlave2安装从服务

4）配置Hbase编辑/etc/hbase/conf/hbase-site.xml将下面内容添加到configuration便笺切记iClient，cMaster，cSlave0~2这五台机器都要进行配置，且要求配置相同。

<property>

<name>hbase.cluster.distributed</name>

<value>true</value>

</property>

<property>

<name>hbase.rootdir</name>

<value>hdfs://cMaster:8020/hbase</value>

</property>

<property>

<name>hbase.zookeeper.quorum</name>

<value>cSlave0,cSlavel,cSlave2</value>

</property>

5）HDFS里新建Hbase存储目录

[root@iClient~]#sudo -u hdfs hdfs dfs -mkdir /hbase

[root@iClient~]#sudo -u hdfs hdfs dfs -chown -R hbase /hbase

6）启动Hbase集群

共分三步，即启动ZooKeeper集群（参考ZooKeeper部署），启动主服务HMaster和启动从服务HRegionServer。

[root@cMaster~]#sudo service hbase-master start    #cMaster开启主服务命令S
sudo service hbase-regionserver start     #cSlave0，cSlavel，cSlave2开启regionserver

Hbase后动好后，在iClient上浏览蓄打井“cMaster：60010”，即可以看到Hbase的Web页面。

2.Hbase接口

[root@iClient~]#hbase shell                      #进入Hbase命令行

hbase（main）：001：0>list                    #查看所有表

hbase（main）：002：0>create 'member'，'id'，'personalAttr'，'socialAttr'  #创建member表

hbase（main）：003：0>list

hbase（main）：004：0>scan 'member'               #查看member内容

hbase（main）：005：0>put 'member'，'201401'，'personalAttr:name'，'aa'  #向member表中插入数据

hbase（main）：006：0>put 'member'，'201401'，'personalAtr:gender'，'0'

hbase（main）：007：0>put 'member'，'201401'，'personalAttr:age'，'21'

hbase（main）：008：0>put 'member'，'201401'，'socialAttr:edu'，'e0'

hbase（main）：009：0>put 'member'，'201401，'socialAttr:job'， 'p3'

hbase（main）：010：0>put 'member'，'201401'，'socialAttr:imcome'，'m'

hbase（main）：011：0>scan 'member'

hbase（main）：012：0>disable  'member'               #废弃member表

hbase（main）：013：0>drop 'member'                   #删除member表

hbase（main）：014：0>quit

--------------------------- Pig------------------------

[root@iClient ~]# sudo yum install pig        #只在iclient上安装

2.Pig访问接口

[root@iClient~]#sudo -u joe pig                    #进入joe用户的Pig命令行

grunt> help；                                    #查看Pig操作

grunt>A=load 'input'；                   #载入待处理文件夹input

grunt>B=foreach A generate flatten (TOKENIZE((chararray)$0)) as word；  #划分单词

grunt>C=group B by word；                    #指定按单词聚合，即同一个单词到一起

grunt>D=foreach C generate COUNT(B),group；   #同一个单词出现次数相加

grunt>store D into 'out/wc-19'；           #将处理好的文件存入HDFS下/user/joe/out/wc-19

grunt> dump D into；                     #将处理结果D打印到屏幕

------------------------------------------Hive-----------------------

[root@iClient～]# sudo yum install hive         #只在iclient上安装

（2）HDFS里新建Hive存储目录。

[root@iClient ~]#sudo -u hdfs hdfs dfs-mkdir /user/hive         #HDFS里新建 Hive存储目录

[root@iClient~]#sudo -u hdfs hdfs dfs-chmod -R 1777    /user/hive    #为目录设置适当权限

只需上述两步就可以直接使用Hive了，当然，也可以使用jps命令查看Hive进程。

2.Hive接口

[root@iClient~]#Hive         #进入Hive命令行

hive>show functions；            #获取Hhive所有函数列表

hive>describe function count；    #查看count函数用法

首先为表准备数据，即在iClient目录“/root”下新建文件memberData并写入如下内容，注意记录间为换行符，字段间以Tab键分割。

201401    aa    0    21    e0    p3    m

201402    bb    1    22    el    p2    1

201403    cc    1    22    e2    pl    m

hive>show tables；          #查看当前 Hive仓库中所有表（以确定当前无member表）

hive>create table member(id int,name string,gender tinyint,age tinyint,edu string,prof string,income string)row format delimited fields terminated by\t'；

                #使用合适字段与类型，新建member表

hive>show tables；                                             #次查看，将显示member表

hive>load data local inpath '/root/memberData' into table member；  #将本地文件memberData载入HDFS

hive>select * from member；                                       #查看表中所有记录

hive>select * from member where gender=1；                #查看表中gender值为1的记录

hive>select * from member where gender=1 AND age=23；        #查看表中gender值为1且age为23的记录

hive>select gender,count(*)from member group by gender；    #统计男女出现总次数

hive>drop table member；                                    #删除member表

hive>quit；                                      #退出Hive命令行接口

hbase、pig、hive配置与应用的更多相关文章

hadoop生态圈安装详解（hadoop+zookeeper+hbase+pig+hive）
-------------------------------------------------------------------* 目录 * I hadoop分布式安装 * II zoo ...
pig hive hbase比较
Pig 一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了.当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护.不过现在还是有些公司在用,不过我 ...
Hive over HBase和Hive over HDFS性能比较分析
http://superlxw1234.iteye.com/blog/2008274 环境配置: hadoop-2.0.0-cdh4.3.0 (4 nodes, 24G mem/node) hbase ...
Hive综合HBase——经Hive阅读/书写 HBase桌子
社论: 本文将Hive与HBase整合在一起,使Hive能够读取HBase中的数据,让Hadoop生态系统中最为经常使用的两大框架互相结合.相得益彰. watermark/2/text/aHR0cDo ...
HBase的环境配置及其应用
-------------------------------------------------------------------------------------- [版权申明:本文系作者原创 ...
Hadoop+HBase+Spark+Hive环境搭建
杨赟快跑简书作者 2018-09-24 10:24 打开App 摘要:大数据门槛较高,仅仅环境的搭建可能就要耗费我们大量的精力,本文总结了作者是如何搭建大数据环境的(单机版和集群版),希望能帮助学弟 ...
HBase（六）HBase整合Hive，数据的备份与MR操作HBase
一.数据的备份与恢复 1. 备份停止 HBase 服务后,使用 distcp 命令运行 MapReduce 任务进行备份,将数据备份到另一个地方,可以是同一个集群,也可以是专用的备份集群. 即,把数 ...
hbase安装与配置-分布式
HBASE安装与配置备注: 1:本文在hadoop的完全分布式基础上部署hbase 2:本文使用的是小博主自己搭建的zookpeer服务,未使用hbase本身的zookpeer服务本文内容在以下前 ...
HBASE与hive对比使用以及HBASE常用shell操作。与sqoop的集成
2.6.与 Hive 的集成2.6.1.HBase 与 Hive 的对比1) Hive(1) 数据仓库Hive 的本质其实就相当于将 HDFS 中已经存储的文件在 Mysql 中做了一个双射关系,以方 ...
大数据技术之_11_HBase学习_02_HBase API 操作 + HBase 与 Hive 集成 + HBase 优化
第6章 HBase API 操作6.1 环境准备6.2 HBase API6.2.1 判断表是否存在6.2.2 抽取获取 Configuration.Connection.Admin 对象的方法以及关 ...

随机推荐

怎样才算精通Linux
1．掌握至少50个以上的常用命令(包括grep.awk.sed.ps.find等等吧,熟练使用,基础的选项不用man) 2．熟悉Gnome/KDE等X-windows桌面环境操作 3．掌握.tgz.. ...
egret之moveclip 序列帧动画
废话不多说,直接上代码: private addEffect(name, x: number, y: number, act?: string) { let data = RES.getRes(nam ...
[Python] 通过采集23万条数据，对《哪吒》影评分析
一.说明数据来源:猫眼: 运行环境:Win10/Python3.7 和 Win7/Python3.5: 分析工具:jieba.WorldCloud.pyecharts和matplotlib: 程序基 ...
SDU暑期集训排位（2）
A. Art solved by sdcgvhgj 3min 签到 B. Biology solved by sdcgvhgj 85min 暴力 C - Computer Science solved ...
牛客多校第六场 J Heritage of skywalkert 随即互质概率 nth_element（求最大多少项模板）
链接:https://www.nowcoder.com/acm/contest/144/J来源:牛客网 skywalkert, the new legend of Beihang University ...
天梯杯 L2-003. 月饼
L2-003. 月饼时间限制 100 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者陈越月饼是中国人在中秋佳节时吃的一种传统食品,不同地区有许多不 ...
CH4301 Can you answer on these queries III 题解
给定长度为N的数列A,以及M条指令 (N≤500000, M≤100000),每条指令可能是以下两种之一: "2 x y",把 A[x] 改成 y. "1 x y&quo ...
从SpringBoot构建十万博文聊聊Tomcat集群监控
前言在十万博文终极架构中,我们使用了Tomcat集群,但这并不能保证系统不会出问题,为了保证系统的稳定运行,我们还需要对 Tomcat 进行有效的运维监控手段,不至于问题出现或者许久一段时间才知道. ...
虚IP解决AlWaysON读库服务器过保替换
公司核心交易数据库,使用SQL 2012 AlWaysON的1主4从,有2台(8.14,8.15)从库服务器,已经使用3年多,过保替换,新买的2台服务器已经安装好,一开始方案如下: 服务器(8.14) ...
JS-特效～ 04. client对象、网页可视区域的宽高、client / offset / scroll 三大家族的区别、冒泡事件、事件委托、获取内嵌式和外链式属性getStyle（ele，attr）；、缓动动画封装
知识点: 模拟滚动条的解除事件问题 : event内置对象,包含了大量事件: page兼容性: pageX || clientX + scool().top : if (true === a)tr ...

hbase、pig、hive配置与应用

hbase、pig、hive配置与应用的更多相关文章

随机推荐

热门专题