hive向表格中插入数据并分析语句

1，---导入mds_imei_month_info

set hive.exec.max.dynamic.partitions= ; //最大的动态分区表

set hive.support.concurrency=false; //是否支持并发

set hive.exec.max.dynamic.partitions.pernode= ; //each mapper or reducer可以创建的最大动态分区数

set hive.exec.dynamic.partition.mode=nonstrict;  //strict是避免全分区字段是动态的，必须有至少一个分区字段是指定有值的

insert into table mds_imei_month_info partition(month)

select imei_p,dt,cnt ,month from

(

select  imei_p ,month,dt,cnt from

      (select imei_p,'' as month,sum(pow(,(dt-))) as dt,sum(cnt) cnt //将自下面取出的dt进行指数的转换，pow(2,(dt-1))表示2的dt-1次方，cnt表示imei在这个月出现的次数

        (

     select imei_p,cast(substring(dt,,) as int) as dt,count(*) cnt from mds_engine_basic where dt>= and dt<= and length(dt)= group by imei_p,dt //dt一共8位数，从第7位数开始的2位数取出，既01到31

      ) a group by imei_p)a where length(imei_p)>= and regexp_extract(imei_p,'([a-z,,.,A-Z,0-9,_,\\-]*)',)=imei_p  //这是对imei进行正则匹配

)a;

2，---导入mds_ip_month_info

set hive.exec.max.dynamic.partitions= ;

set hive.support.concurrency=false;

set hive.exec.max.dynamic.partitions.pernode= ;

set hive.exec.dynamic.partition.mode=nonstrict;

insert into table mds_ip_month_info partition(month)

select user_ip,country,province,city,longtitude,latitude,isp,dt,cnt ,month from

(

select  user_ip ,month,dt,cnt,country,city,province,latitude,longtitude,isp from

(select user_ip,'' as month,sum(pow(,(dt-))) as dt,sum(cnt) cnt,country,city,province,latitude,longtitude,isp

from(

select user_ip,cast(substring(dt,,) as int) as dt,count(*) cnt,ipaddressquery(,user_ip) country,

ipaddressquery(,user_ip) province,ipaddressquery(,user_ip) city, split(ipaddressquery(,user_ip),',')[]  longtitude ,

split(ipaddressquery(,user_ip),',')[]  latitude,

ipaddressquery(,user_ip) isp  from mds_engine_basic where dt>= and dt<= and length(dt)= and user_ip not like '%,%'

and      split(user_ip,',')[]  like '%.%.%' and regexp_extract( split(user_ip,',')[],'\.([0-9]{0,7})\.([0-9]{0,7})\.([0-9]{0,7})\.([0-9]{0,7})',)= split(user_ip,',')[]  and split(user_ip,'\\.')[]<

group by user_ip,dt,ipaddressquery(,user_ip) ,

ipaddressquery(,user_ip) ,ipaddressquery(,user_ip) , split(ipaddressquery(,user_ip),',')[]   ,

split(ipaddressquery(,user_ip),',')[]  ,

ipaddressquery(,user_ip)) a group by user_ip,country,city,province,latitude,longtitude,isp)a

)a ;

3，---导入mds_id_month_info

set hive.exec.max.dynamic.partitions= ;

set hive.support.concurrency=false;

set hive.exec.max.dynamic.partitions.pernode= ;

set hive.exec.dynamic.partition.mode=nonstrict;

insert into table mds_id_month_info partition(month)

select id,dt,cnt ,month from

(

select  id ,month,dt,cnt from

      (select id,'' as month,sum(pow(,(dt-))) as dt,sum(cnt) cnt

      from

        (

     select id,cast(substring(dt,,) as int) as dt,count(*) cnt from mds_engine_basic where dt>= and dt<= and length(dt)= group by id,dt

      ) a group by id)a where length(id)= and regexp_extract(id,'([a-z,,.,A-Z,0-9,_,\\-]*)',)=id

)a;

4，---导入mds_bssid_month_info

set hive.exec.max.dynamic.partitions= ;

set hive.support.concurrency=false;

set hive.exec.max.dynamic.partitions.pernode= ;

set hive.exec.dynamic.partition.mode=nonstrict;

insert into table mds_bssid_month_info partition(month)

select bssid,dt,cnt ,month from

(

select  bssid ,month,dt,cnt from

      (select bssid,'' as month,sum(pow(,(dt-))) as dt,sum(cnt) cnt

      from

        (

     select bssid,cast(substring(dt,,) as int) as dt,count(*) cnt from mds_engine_wifi where dt>= and dt<= and length(dt)= group by bssid,dt

      ) a group by bssid)a where length(bssid)>=

)a;

hive向表格中插入数据并分析语句的更多相关文章

在页面上绘制一张表格，使用 DOM 节点的动态添加和删除向表格中插入数据，点击表格每行后的“删除”超链接
查看本章节查看作业目录需求说明: 在页面上绘制一张表格,使用 DOM 节点的动态添加和删除向表格中插入数据,点击表格每行后的"删除"超链接,使用 DOM 节点的删除操作将对应的 ...
Hive通过查询语句向表中插入数据过程中发现的坑
前言近期在学习使用Hive(版本号0.13.1)的过程中,发现了一些坑,它们也许是Hive提倡的比关系数据库更加自由的体现(同一时候引来一些问题).也许是一些bug.总而言之,这些都须要使用Hive ...
Hive通过查询语句向表中插入数据注意事项
最近在学习使用Hive(版本0.13.1)的过程中,发现了一些坑,它们或许是Hive提倡的比关系数据库更加自由的体现(同时引来一些问题),或许是一些bug.总而言之,这些都需要使用Hive的开发人员额 ...
如何使用免费控件将Word表格中的数据导入到Excel中
我通常使用MS Excel来存储和处理大量数据,但有时候经常会碰到一个问题—我需要的数据存储在word表格中,而不是在Excel中,这样处理起来非常麻烦,尤其是在数据比较庞大的时候, 这时我迫切地需要 ...
如何使用poi在word表格中插入行的4种方法
本文记录了,在word表格中插入新行的几种方法.直接上代码说明 table.addNewRowBetween 没实现,官网文档也说明,只有函数名,但没具体实现,但很多文章还介绍如何使用这个函数,真是害 ...
SQL语句的使用,SELECT - 从数据库表中获取数据 UPDATE - 更新数据库表中的数据 DELETE - 从数据库表中删除数据 INSERT INTO - 向数据库表中插入数据
SQL DML 和 DDL 可以把 SQL 分为两个部分:数据操作语言 (DML) 和数据定义语言 (DDL). SQL (结构化查询语言)是用于执行查询的语法. 但是 SQL 语言也包含用于更新. ...
使用C#向ACCESS中插入数据
使用C#向ACCESS中插入数据 1.创建并打开一个OleDbConnection对象 string strConn = " Provider = Microsoft.Jet.OLEDB ...
jQuery Ajax遍历表格，填充数据，将表格中的数据一条一条拼成Jason数组
$.ajax({ url: baseURL + "InvoiceSale/OnQuotaInvoiceSale", //点击核销单号时,点击核销时,交互的页面 ...
触发器修改后保存之前的数据表中插入数据时ID自动增长
create or replace trigger t before update on test5 for each rowbegin insert into test55 values (:old ...

随机推荐

开启TCP BBR拥塞控制算法
原文来自:https://github.com/iMeiji/shadowsocks_install/wiki/%E5%BC%80%E5%90%AFTCP-BBR%E6%8B%A5%E5%A1%9E% ...
hibernate 各历史版本下载 spring各历史版本下载
hibernate 各历史版本下载http://sourceforge.net/projects/hibernate/files/ spring各历史版本下载http://www.springsour ...
什么鬼，又不知道怎么命名class了
什么鬼,又不知道怎么命名class了 2015/10/25 · CSS · class 分享到:5 原文出处: 结一(@结一w3cplus) 相信写css的人都会遇到下面的问题: 糟糕,怎么命名 ...
「Haskell 学习」二类型和函数（上）
随着学习的深入,笔记会补充和修订.当然,这个补充修订也许会鸽,但我一定会坚持写完. 这个笔记假定你至少学过C/C++及Python,或与这两种语言类型相同的语言. 类型系统概述 “Haskell’s ...
bug单的提交
顶头信息所属产品,所属项目,所属模块,影响版本,当前指派,bug类型:代码错误,界面优化,设计缺陷,性能问题,标准规范,其他,安全相关.bug标题,严重程度,优先级缺陷描述 bug描述,预置条件, ...
教你如何用Docker快速搭建深度学习环境
本教程搭建集 Tensorflow.Keras.Coffe.PyTorch 等深度学习框架于一身的环境,及jupyter. 本教程使用nvidia-docker启动实例,通过本教程可以从一个全新的Ub ...
Python 3 学习笔记之——数据类型
1. 数字类型 int, float, bool, complex type() 查看变量类型 isinstance(a, int) 查看变量类型运算符 % 取余 // 返回商的整数部分 ** 幂 ...
并查集——poj2524（入门）
传送门:Ubiquitous Religions 许多次WA,贴上错的代码随时警示简单没多加修饰的并查集 [WA1] #include <iostream> #include <c ...
201621123033 《Java程序设计》第14周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结与数据库相关内容. 2. 使用数据库技术改造你的系统 2.1 简述如何使用数据库技术改造你的系统.要建立什么表?截图你的表设计. 2 ...
web相关基础知识3
一 .浮动布局 ★元素浮动之后不占据原来的位置,脱离标准流 ★浮动的盒子在一行上显示 ★行内元素浮动之后转换为行内块元素.(不推荐使用,会脱离标准流,转行内元素最好使用display: inlin ...

hive向表格中插入数据并分析语句

hive向表格中插入数据并分析语句的更多相关文章

随机推荐

热门专题