目录:

1.修改主机名和用户名

2.配置静态IP地址

3.配置SSH无密码连接

4.安装JDK1.7

5.配置Hadoop

6.安装Mysql

7.安装Hive

8.安装Hbase

9.安装Sqoop

********************

为什么要安装Mysql?  因为Hive的元数据和数据是分开存放的,数据存放在HDFS中,元数据默认存储在Derby数据库中。

但是由于Derby数据库只支持同时一个用户访问Hive,因此将数据库的配置更改为Mysql。

6.安装Mysql

 (1)安装Mysql客户端:

 yum install mysql

 (2)安装Mysql服务器端:

yum install mysql-server   
yum install mysql-devel

(3)查看Mysql的状态 

service mysqld status

# Mysql启动   service mysqld start

# Mysql停止   service mysqld stop

(4)启动Mysql后,以root用户登录Mysql:

   mysql -u root
mysql> set PASSWORD FOR 'root'@'localhost'=PASSWORD('root') #设置密码root
mysql -u root -p

(5)创建数据库Hive,用来保存Hive元数据

create  database   hive

使用root用户操作hive中所有的表格

     GRANT  all  ON  hive.*  TO  root@'neusoft-master'    IDENTIFIED  BY  'hivepwd'

     flush  privileges;

     select   user,host from mysql.user

如下显示:

    

 7.安装Hive

    (1) 下载hive的安装包,并传到centos系统中,在对应目录解压即可

 tar  -zxvf  /opt/hive-1.1.-cdh5.6.0.tar.gz

    (2)修改hive的配置文件/opt/hive-1.1.0-cdh5.6.0/conf,在conf目录下创建hive-site.xml  

[root@neusoft-master conf]# cd /opt/hive-1.1.0-cdh5.6.0/conf/
[root@neusoft-master conf]# ll
total 20
-rw-r--r-- 1 1106 592 1139 Jan 29 2016 beeline-log4j.properties.template
-rw-r--r-- 1 1106 592 2459 Jan 6 21:09 hive-env.sh
-rw-r--r-- 1 1106 592 2662 Jan 29 2016 hive-exec-log4j.properties.template
-rw-r--r-- 1 1106 592 3505 Jan 29 2016 hive-log4j.properties.template
-rw-r--r-- 1 root root 740 Jan 6 21:36 hive-site.xml
[root@neusoft-master conf]# cat hive-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>hive.metastore.local</name>
<value>true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://neusoft-master:3306/hive?createDatabaseIfNotExist=true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>hivepwd</value>
</property>
</configuration>

  如图:

    

(3)配置hive-env.sh

     由于hive压缩包中只有hive-env.sh.template文件,因此需要复制一份文件并更改为hive-env.sh,如下命令:

cp hive-env.sh.template hive-env.sh

[root@neusoft-master conf]# vi  hive-env.sh

export JAVA_HOME=/usr/java/default
export HADOOP_HOME=/opt/hadoop-2.6.-cdh5.6.0

(4)移动jar包到hive的lib目录下

    将Mysql的JDBC驱动jar包移动到hive-1.1.0-cdh5.6.0/lib下,否则hive不能成功连接mysql

JDBC的jar包应选择相应版本,如:mysql-connector-5.1.30.jar,这里不是下载mysql安装包,而是找到mysql启动包放进lib目录下。

 (5)环境变量配置

vi  /etc/profile   #更改如下
export HIVE_HOME=/opt/hive-1.1.0-cdh5.6.0
export PATH=$JAVA_HOME/bin/:$PATH:$HADOOP_HOME/bin:$HIVE_HOME/bin

   

source  /etc/profile  #环境变量生效

(6)验证安装

首先启动Hadoop和Mysql,在执行Hive

执行创建表结构:create  table  test(id int);

执行含有mapreduce的查询

补充:如果用户通过SecureCRT链接虚拟机,则会出现进入hive命令行后无法使用退格键的情况?

详细描述: 通过SecureCRT连接服务器,使用Hive时,不能用Backspace或delete时

            解决方案:在选项里面有个会话选项--终端---仿真选项里面终端选择linux即可。

 END~

   

Hadoop伪分布安装详解(四)的更多相关文章

  1. Hadoop伪分布安装详解(五)

    目录: 1.修改主机名和用户名 2.配置静态IP地址 3.配置SSH无密码连接 4.安装JDK1.7 5.配置Hadoop 6.安装Mysql 7.安装Hive 8.安装Hbase 9.安装Sqoop ...

  2. Hadoop伪分布安装详解(三)

    目录: 1.修改主机名和用户名 2.配置静态IP地址 3.配置SSH无密码连接 4.安装JDK1.7 5.配置Hadoop 6.安装Mysql 7.安装Hive 8.安装Hbase 9.安装Sqoop ...

  3. Hadoop伪分布安装详解(二)

    目录: 1.修改主机名和用户名 2.配置静态IP地址 3.配置SSH无密码连接 4.安装JDK1.7 5.配置Hadoop 6.安装Mysql 7.安装Hive 8.安装Hbase 9.安装Sqoop ...

  4. Hadoop伪分布安装详解(一)

    注:以下截图针对Ubuntu操作系统,对Centos步骤类似.请读者选择不同镜像即可. 第一部分:VMware WorkStation10 安装 1.安装好VMware10虚拟机软件并下载好Ubunt ...

  5. hadoop 0.20.2伪分布式安装详解

    adoop 0.20.2伪分布式安装详解 hadoop有三种运行模式: 伪分布式不需要安装虚拟机,在同一台机器上同时启动5个进程,模拟分布式. 完全分布式至少有3个节点,其中一个做master,运行名 ...

  6. hadoop伪分布安装

    解压 将安装包hadoop-2.2.0.tar.gz存放到/home/haozhulin/install/目录下,并解压 #将hadoop解压到/home/haozhulin/install路径下,定 ...

  7. 转载 hadoop 伪分布安装

    一. 概要        经过几天的调试,终于在Linux Cent OS 5.5下成功搭建Hadoop测试环境.本次测试在一台服务器上进行伪分布式搭建.Hadoop 伪分布式模式是在单机上模拟 Ha ...

  8. Hadoop伪分布安装配置

    安装环境: 系统:Ubuntu 14.10   64bit hadoop:2.5.1 jdk:1.8.0_11 安装步骤: 一.安装JDK 安装 jdk,并且配置环境以及设置成默认 sudo gedi ...

  9. linux配置Hadoop伪分布安装模式

    1)关闭禁用防火墙: /etc/init.d/iptables status 会得到一系列信息,说明防火墙开着. /etc/rc.d/init.d/iptables stop 关闭防火墙 2)禁用SE ...

随机推荐

  1. Atitit. 最佳实践 QA----降低cpu占有率--cpu占用太高怎么办

    Atitit. 最佳实践 QA----降低cpu占有率--cpu占用太高怎么办 跟个磁盘队列长度雅十,一到李80%走不行兰.... 1. 寻找线程too 多的.关闭... Taskman>> ...

  2. Web 服务器被配置为不列出此目录的内容

    在Web.configue文件里,会多出来部分代码,应该是允许浏览目录: <?xml version="1.0" encoding="utf-8"?> ...

  3. LinkQ 组合查询与分页

    1.以开头查 public List<Car> Select1(string a){ return con.Car.Where(r => r.Name.StartsWith(a)). ...

  4. 分享8个常用的jQuery焦点图插件

    现在web网页jquery应用越来越广泛,目前几乎每一个WEB项目都在使用jQuery,因为jQuery插件实在太丰富,尤其是一些图片滑块插件和jQuery焦点图插件,更是多如牛毛,很多初学者只需稍微 ...

  5. postgresql解决锁表

    --查询是否锁表了select oid from pg_class where relname='可能锁表了的表'select pid from pg_locks where relation='上面 ...

  6. jquery 排除重复

    应用场景——双盒选择器 两个select可能会出现重复的情况 排除重复代码如下: /** * 删除$fromGroup中与$toGroup重复的option * @param $fromGroup = ...

  7. BlueZ--内核层+应用层

    BlueZ 1.Kernel层实现: bluetooth协议栈有多层结构,最底层的硬件协议在硬件中就已经实现了.软件级别的协议实现,从HCI这一层开始实现. BlueZ对各层协议的实现是依托于Sock ...

  8. C语言中对输入输出格式的控制

    格式化输出的控制 #include<stdio.h> int main(void){ float a=111123.681111f; printf("%1.3f",a) ...

  9. fmpeg

  10. Hive三种不同的数据导出的方式

    转自:http://blog.chinaunix.net/uid-27177626-id-4653808.html Hive三种不同的数据导出的方式,根据导出的地方不一样,将这些方法分为三类:(1)导 ...