python 连接 hive数据库环境搭建

首先需要安装以下Python 包：（我用的是Python 2）

在安装Python包之前需要安装一些依赖工具：

Debian/Ubuntu: apt-get install python-dev libsasl2-dev gcc

CentOS/RHEL: yum install gcc-c++ python-devel.x86_64 cyrus-sasl-devel.x86_64 mysql-devel

bitarray-0.8.3.tar.gz

impyla-0.14.0.tar.gz

MySQL-python-1.2.5.zip

新建HiveHelper.py

# -*- coding: utf-8 -*-

from impala.dbapi import connect

class HiveHelper(object):

    def __init__(self):

        self.host = ''

        self.port =

        self.database = ''

        self.user = ''

        self.password = ''

        self.auth_mechanism = ''

        self.connect()

    def connect(self):

        """ connect

        Args:

            null

        Returns:

            null

        """

        self.conn = connect(

            host=self.host,

            port=self.port,

            database=self.database,

            user=self.user,

            password=self.password,

            auth_mechanism=self.auth_mechanism)

        self.cursor = self.conn.cursor()

    def close(self):

        """ close

        Args:

            null

        Returns:

            null

        """

        self.cursor.close()

        self.conn.close()

    def query(self, sql):

        """ query

        Args:

            sql

        Returns:

            sql result

        """

        result = ()

        try:

            self.cursor.execute(sql)

            result = self.cursor.fetchall()

        except Exception as e:

            print e.message

        return result

    def execute(self, sql):

        try:

            self.cursor.execute(sql)

            self.conn.commit()

        except:

            self.conn.rollback()

新建HiveSearch.py

#!/usr/bin/python

# -*- coding: utf-8 -*-

import os,sys

import re

import json

import math

import time

import operator

import urlparse

import threading

import HiveHelper

import requests

import calendar

import datetime

class PcdnSearch:

    def __init__(self):

        self.sql = HiveHelper.HiveHelper()

        self.punch_data = {}

        self.flow_data = {}

    def get_flow_data(self, time, clientid):

        sql = ""

     #   print sql

        try:

            result = self.sql.query(sql)

            for item in result:

                guid = item[1]

                flow = item[3]

                band = round(float(flow)*8/1000/1000/3600*1.1, 2)

                self.flow_data[guid] = (flow, band)

        except Exception, e:

            pass

    def get_punch_data(self, time, clientid):

        sql = ""

    def get_result(self):

if __name__ == '__main__':

    if len(sys.argv) == 3:

        run_time = sys.argv[1]

        client_id = int(sys.argv[2])

    else:

        print 'param error'

        exit(0)

    cb = PcdnSearch()

    cb.get_punch_data(run_time, client_id)

    cb.get_flow_data(run_time, client_id)

    cb.get_result()

python 连接 hive数据库环境搭建的更多相关文章

python 连接 hive
1.python连接hive,其实是连接hiveserver,连接的包的impyla impyla安装: error: cc1plus 没有文件或目录需要安装gcc 和g++,并且版本保持一致 er ...
python 连接 hive 的 HiveServer2 的配置坑
环境: hadoop 2.7.6 hive 2.3.4 Hive 的 thirft 启动: hadoop 单机或者集群需要: 启动 webhdfs 修改 hadoop 的代理用户 <proper ...
Hive 教程(九)-python with hive
本文介绍用 python 远程连接 hive,此时需要 hive 启动 hiveserver2 服务 windows 下报如下错误 thrift.transport.TTransport.TTrans ...
在 windows 下搭建 IDEA + Spark 连接 Hive 的环境
为了开发测试方便,想直接在 IDEA 里运行 Spark 程序,可以连接 Hive,需不是打好包后,放到集群上去运行.主要配置工作如下: 1. 把集群环境中的 hive-core.xml, hdfs- ...
InfluxDB 分布式时间序列数据库环境搭建——据qcon大会2016qiniu说集群很坑且闭源了
InfluxDB 分布式时间序列数据库环境搭建 1. 环境说明 Ubuntu14.04 + influxDB V0.10.1 搭建3个节点的分布式数据库,副本数量2,各节点之间自动进行数据备份并 ...
《OD大数据实战》Hive环境搭建
一.搭建hadoop环境 <OD大数据实战>hadoop伪分布式环境搭建二.Hive环境搭建 1. 准备安装文件下载地址: http://archive.cloudera.com/cd ...
Python+Selenium+webdriver环境搭建（windows）以及相关资源下载链接
今天记录一下测试小菜鸟alter在测试入门的一点关于python+Selenium+webdriver环境搭建的经历以及资源分享.欢迎交流学习,批评指正. 一.Python的下载与安装 1.pytho ...
Python之Django环境搭建(MAC+pycharm+Django++postgreSQL)
Python之Django环境搭建(MAC+pycharm+Django++postgreSQL) 转载请注明地址:http://www.cnblogs.com/funnyzpc/p/7828614. ...
【Python实战】使用Python连接Teradata数据库？？？未完成
1.安装Python 方法详见:[Python 05]Python开发环境搭建 2.安装Teradata客户端ODBC驱动安装包地址:TTU下载地址 (1)安装TeraGSS和tdicu(ODBC依 ...

随机推荐

mysql单表操作与多表操作
0. null和notnull: 使用null的时候: create table t8( id int auto_increment primary key, name varchar(32), em ...
通过实现接口runnable实现多线程
实现Runnable接口实现多线程的步骤(1)编写类实现Runnable接口(2)实现run(方法(3)通过Thread类的start(方法启动线程静态代理模式Thread >代理角色MyR ...
Acwing-100-IncDec序列(差分)
链接: https://www.acwing.com/problem/content/102/ 题意: 给定一个长度为 n 的数列 a1,a2,-,an,每次可以选择一个区间 [l,r],使下标在这个 ...
centos7安装bower遇到的问题
Bower依赖node, npm和git. 安装nodejs遇到 Error: Package: 1:nodejs-6.11.1-1.el7.x86_64 (epel) Requires: libht ...
js 创建节点以及节点属性删除节点
case 'copy': var B1 = document.getElementById("B1"); //获得B1下的html文本 var copy_dom = documen ...
python from…import* 语句
把一个模块的所有内容全都导入到当前的命名空间也是可行的,只需使用如下声明: from modname import * 这提供了一个简单的方法来导入一个模块中的所有项目.然而这种声明不该被过多地使用. ...
C# 两个进程之间通讯（管道通信）
#region 客户端 NamedPipeClientStream pipeClient = new NamedPipeClientStream("localh ...
JS中对小数取整的函数，向上（下），四舍五入取整
1.丢弃小数部分,保留整数部分 js:parseInt(7/2) 2.向上取整,有小数就整数部分加1 js: Math.ceil(7/2) 3,四舍五入. js: Math.round(7/2) 4, ...
Java多线程和并发（六），yield函数和中断线程
目录 1.yield函数 2.中断线程六.yield函数和中断线程 1.yield函数 2.中断线程 (1)已经被抛弃的方法 (2)目前使用的方法
BZOJ 2117: [2010国家集训队]Crash的旅游计划动态点分治+二分
感觉现在写点分治可快了~ 二分答案,就可以将求第 $k$ 大转换成一个判断问题,直接拿点分树判断一下就行了. #include <cstdio> #include <vector&g ...

python 连接 hive数据库环境搭建

python 连接 hive数据库环境搭建的更多相关文章

随机推荐

热门专题