在IDEA上用python来连接集群上的hive

1.在使用Python连接hive之前需要将hive中的文件拷贝到自己创建python项目中

cp -r apache-hive-0.14.-bin/lib/py  /home/jia/Desktop

2.把hive上的py目录下载到桌面之后，进入py目录，复制里面所有的文件到你创建的python项目下

3.新建一个myHiveLink.py文件，访问hive的代码如下

import sys

from hive_service import ThriftHive

from hive_service.ttypes import HiveServerException

from thrift import Thrift

from thrift.transport import TSocket

from thrift.transport import TTransport

from thrift.protocol import TBinaryProtocol

def hiveExe(sql):

    try:

        transport = TSocket.TSocket('121.8.xxx.xx', )

        transport = TTransport.TBufferedTransport(transport)

        protocol = TBinaryProtocol.TBinaryProtocol(transport)

        client = ThriftHive.Client(protocol)

        transport.open()

        client.execute(sql)

        print "The return value is : "

        resultSets=client.fetchAll()

        for j in range(len(resultSets)):

            print resultSets[j]

        print "............"

        transport.close()

    except Thrift.TException, tx:

        print '%s' % (tx.message)

        return resultSets

if __name__ == '__main__':

    hiveExe("select * from tableName limit 10")

4.访问结果如下：

/usr/bin/python2. /home/sendi/IdeaProjects/hive_python/.idea/HiveLink/myHiveLink.py

The return value is :

    1333280xxxx                    NULL    113.4092361    23.1117361

    1812682xxxx                        113.39436    23.42839

    1532152xxxx                        113.34354    23.28444

    1537219xxxx                       113.3470139    23.2713194

    1532570xxxx                       113.3468056    23.3133333

    1533673xxxx                       113.359375    23.2908333

    1530011xxxx                       113.3260417    23.2946528

    1532152xxxx                        113.3470139    23.2713194

    1895716xxxx                        113.35415    23.30307

    1534570xxxx                       113.3470139    23.2713194

5.如果访问不了，可能是没有启动hive，服务，则进入hive的bin目录启动服务

hive --service hiveserver &

在IDEA上用python来连接集群上的hive的更多相关文章

超详细实操教程！在现有K8S集群上安装JenkinsX，极速提升CI/CD体验！
在2018年年初,Jenkins X首次发布,它由Apache Groovy语言的创建者Jame Strachan创建.Jenkins X 是一个高度集成化的 CI/CD 平台,基于 Jenkins ...
有关python numpy pandas scipy 等能在YARN集群上运行PySpark
有关这个问题,似乎这个在某些时候,用python写好,且spark没有响应的算法支持, 能否能在YARN集群上运行PySpark方式, 将python分析程序提交上去? Spark Applicat ...
用python + hadoop streaming 编写分布式程序（二） -- 在集群上运行与监控
写在前面相关随笔: Hadoop-1.0.4集群搭建笔记用python + hadoop streaming 编写分布式程序(一) -- 原理介绍,样例程序与本地调试用python + hado ...
python脚本实现集群检测和管理
python脚本实现集群检测和管理场景是这样的:一个生产机房,会有很多的测试机器和生产机器(也就是30台左右吧),由于管理较为混乱导致了哪台机器有人用.哪台机器没人用都不清楚,从而产生了一个想法-- ...
spark在集群上运行
1.spark在集群上运行应用的详细过程 (1)用户通过spark-submit脚本提交应用 (2)spark-submit脚本启动驱动器程序,调用用户定义的main()方法 (3)驱动器程序与集群管 ...
Hadoop集群上搭建Ranger
There are two types of people in the world. I hate both of them. Hadoop集群上搭建Ranger 在搭建Ranger工程之前,需要完 ...
在local模式下的spark程序打包到集群上运行
一.前期准备前期的环境准备,在Linux系统下要有Hadoop系统,spark伪分布式或者分布式,具体的教程可以查阅我的这两篇博客: Hadoop2.0伪分布式平台环境搭建 Spark2.4.0伪分 ...
Linux上搭建Hadoop2.6.3集群以及WIN7通过Eclipse开发MapReduce的demo
近期为了分析国内航空旅游业常见安全漏洞,想到了用大数据来分析,其实数据也不大,只是生产项目没有使用Hadoop,因此这里实际使用一次. 先看一下通过hadoop分析后的结果吧,最终通过hadoop分析 ...
在Linux上使用Nginx为Solr集群做负载均衡
在Linux上使用Nginx为Solr集群做负载均衡在Linux上搭建solr集群时需要用到负载均衡,但测试环境下没有F5 Big-IP负载均衡交换机可以用,于是先后试了weblogic的proxy ...

随机推荐

Codevs 1231 最优布线问题
题目描述 Description 学校需要将n台计算机连接起来,不同的2台计算机之间的连接费用可能是不同的.为了节省费用,我们考虑采用间接数据传输结束,就是一台计算机可以间接地通过其他计算机实现和另外 ...
unity 3消游戏
3消游戏跟着智能手机流行到现在已经有很长一段时间,unity实现的3消 https://github.com/textcube/match3action 截图如下: 在阅读源码的时候不难发现,Game ...
私人定制自己的linux小系统
私人定制自己的linux小系统一.前言 linux操作系统至1991.10.5号诞生以来,就源其开源性和自由性得到了很多技术大牛的青睐,每个linux爱好者都为其贡献了自己的一份力,不管是在 ...
ADO.NET笔记——将DataReader作为函数返回值
相关知识: 在很多情况下,可能把数据库的访问封装到一个函数中,通过该函数返回一个DataReader对象给调用者.例如定义函数:SqlDataReader returnDR(),然后再Main函数中调 ...
android Timer and TImerTask
android Timer and TImerTask Caused by: java.lang.IllegalStateException: TimerTask is scheduled alrea ...
RHEL7 Ansible
[root@promote tt]# rpm -iUvh http://dl.Fedoraproject.org/pub/epel/7/x86_64/e/epel-release-7-8.noarch ...
重拾C，一天一点点_5
switch(表达式){ case 整型常量表达式:语句序列 case 整型常量表达式:语句序列 default:语句序列} while(表达式) 语句 for(表达式1; 表 ...
Python开发【第一篇】Python基础之反射
反射反射的作用:反射得作用是提高代码可读行. __import__导入模块和import导入模块的区别: __import__导入模块是通过字符串进行导入. import是常用得导入模块方法. 扩展 ...
使用本地光盘安装Microsoft .NET Framework 3.5 for Win8.1/WinServer2012R2
.NET Framework 3.5 作为的SQL Server 2012的先决条件,假如使用图形化方式需要使用internet,对于服务器部署时缓慢的一点(需要下载后安装) 以下提供一个使用使用安装 ...
http 4中 cache 头
// head['Cache-Control']='max-age=31536000'; // head['Expires']=new Date((new Date().getTime()+99999 ...

在IDEA上用python来连接集群上的hive

在IDEA上用python来连接集群上的hive的更多相关文章

随机推荐

热门专题