hive sql基础了解
会有些不一样
1 例如使用SQL 之前,要了解用了那个库,use jz_daojia
2 使用GET_JSON_OBJECT 函数等,以及参数 匹配 $.childBrithDay
挺有意思的。新玩意哦
--odps sql
--********************************************************************--
--author:jz_admin
--create time:2019-11-11 10:14:49
--********************************************************************--
-- 这是什么意思?
-- 获取线索id,以及线索标签。
use jz_daojia;
SELECT a.id
,CONCAT_WS(',', COLLECT_SET(b.dict_value)) AS clue_labels
FROM (
SELECT a.id
,b.clue_label
FROM (
SELECT a.id
,GET_JSON_OBJECT(a.prop, '$.busSnapshotDto.clueLable') clue_label
FROM o_jz_clue_t_sale_clue a
WHERE dt = '${bdp.system.bizdate}'
) a
LATERAL VIEW EXPLODE(SPLIT(clue_label, ',')) b AS clue_label
) a LEFT
JOIN (
SELECT *
FROM o_jz_clue_t_dict
WHERE dt = '${bdp.system.bizdate}'
AND type IN ('target_unconform_label', 'clue_label','target_conform_label')
) b
ON a.clue_label = b.dict_key
GROUP BY a.id; -- 获取 SELECT a.*
,GET_JSON_OBJECT(a.prop, '$.busSnapshotDto.clueLable') clue_label
,GET_JSON_OBJECT(
GET_JSON_OBJECT(prop,'$.busSnapshotDto')
,'$.childBrithDay'
) AS childbrithday
,CASE WHEN a.category_id = 205 THEN '月嫂'
WHEN a.category_id = 270 THEN '育儿嫂'
WHEN a.category_id = 212 THEN '保姆'
ELSE '其他'
END AS category_name
FROM o_jz_clue_t_sale_clue a
WHERE dt = '${bdp.system.bizdate}'
AND delete_flag = 0
AND source_id != 100000680
基础的GET_JSON_OBJECT函数运用:
--odps sql
--********************************************************************--
--author:jz_admin
--create time:2019-11-11 14:27:08
--********************************************************************--
获取职员的职业。
use jz_daojia; SELECT us.* , GET_JSON_OBJECT(us.additional_info,'$.jobTitle') as title_s FROM d_sys_user as us
WHERE us.name LIKE "喜"
LIMIT 10 ;
hive sql基础了解的更多相关文章
- Hive SQL基础操作
创建表 hive 查看本地的文件#Can execute local commands within CLI, place a command in between ! and ;!cat data/ ...
- 【原创】大数据基础之Hive(2)Hive SQL执行过程之SQL解析过程
Hive SQL解析过程 SQL->AST(Abstract Syntax Tree)->Task(MapRedTask,FetchTask)->QueryPlan(Task集合)- ...
- 【原创】大数据基础之Hive(1)Hive SQL执行过程之代码流程
hive 2.1 hive执行sql有两种方式: 执行hive命令,又细分为hive -e,hive -f,hive交互式: 执行beeline命令,beeline会连接远程thrift server ...
- 揭秘FaceBook Puma演变及发展——FaceBook公司的实时数据分析平台是建立在Hadoop 和Hive的基础之上,这个根能立稳吗?hive又是sql的Map reduce任务拆分,底层还是依赖hbase和hdfs存储
在12月2日下午的“大数据技术与应用”分论坛的第一场演讲中,来自全球知名互联网公司——FaceBook公司的软件工程师.研发经理邵铮就带来了一颗重磅炸弹,他将为我们讲解FaceBook公司的实时数据处 ...
- Spark(Hive) SQL中UDF的使用(Python)
相对于使用MapReduce或者Spark Application的方式进行数据分析,使用Hive SQL或Spark SQL能为我们省去不少的代码工作量,而Hive SQL或Spark SQL本身内 ...
- Spark(Hive) SQL数据类型使用详解(Python)
Spark SQL使用时需要有若干“表”的存在,这些“表”可以来自于Hive,也可以来自“临时表”.如果“表”来自于Hive,它的模式(列名.列类型等)在创建时已经确定,一般情况下我们直接通过Spar ...
- 【甘道夫】使用HIVE SQL实现推荐系统数据补全
需求 在推荐系统场景中,假设基础行为数据太少,或者过于稀疏,通过推荐算法计算得出的推荐结果非常可能达不到要求的数量. 比方,希望针对每一个item或user推荐20个item,可是通过计算仅仅得到8个 ...
- 深入浅出Hive企业级架构优化、Hive Sql优化、压缩和分布式缓存(企业Hadoop应用核心产品)
一.本课程是怎么样的一门课程(全面介绍) 1.1.课程的背景 作为企业Hadoop应用的核心产品,Hive承载着FaceBook.淘宝等大佬 95%以上的离线统计,很多企业里的离线统 ...
- Spark(Hive) SQL中UDF的使用(Python)【转】
相对于使用MapReduce或者Spark Application的方式进行数据分析,使用Hive SQL或Spark SQL能为我们省去不少的代码工作量,而Hive SQL或Spark SQL本身内 ...
随机推荐
- [Linux] 009 链接命令
链接命令:ln 命令名称:ln 命令英文原意:link 命令所在路径:/bin/ln 执行权限:所有用户 语法:ln -s [原文件] [目标文件] 功能描述:生成链接文件 范例: 创建文件 /etc ...
- kmp(所有长度的前缀与后缀)
http://poj.org/problem?id=2752 Seek the Name, Seek the Fame Time Limit: 2000MS Memory Limit: 65536 ...
- dp(不连续和)
I - I HDU - 2845 Bean-eating is an interesting game, everyone owns an M*N matrix, which is fille ...
- 洛谷 P1440 求m区间内的最小值(单调队列)
题目链接 https://www.luogu.org/problemnew/show/P1440 显然是一道单调队列题目…… 解题思路 对于单调队列不明白的请看这一篇博客:https://www.cn ...
- Debian(Linux)+XAMPP(LAMPP)+Zend Studio + PHP +XDebug 完整的开发环境配置方法。 转摘:http://www.cnblogs.com/kungfupanda/archive/2010/11/25/1887812.html
经历了3天左右的挣扎,终于在Linux下将 php开发工具 Zend Studio 的 xdebug安装成功,分享如下: 1,装XAMPP,安装方法链接如下:这里假设XAMPP的安装路径为:/opt/ ...
- differential evolution代码实例(DE算法)
DE算法是遗传算法中一种比较流行的算法,这种算法比较简单,速度也比较快,下面给出一份示例代码 clear all; close all; clc 2 %Function to be minimized ...
- html中内联元素和块级元素的区别
1.下表列出了内联元素和块级元素的主要区别 html中内联元素和块级元素的区别 块级元素 行内元素 独占一行,默认情况下,其宽度自动填满其父元素宽度 相邻的行内元素会排列在同一行里,直到一行排不下,才 ...
- Java中的关键字--synchronized
在并发编程中,synchronized关键字是常出现的角色.之前我们都称呼synchronized关键字为重量锁,但是在JDK1.6中对synchronized进行了优化,引入了偏向锁.轻量锁.本篇介 ...
- 2019-9-2-win10-uwp-标题栏
title author date CreateTime categories win10 uwp 标题栏 lindexi 2019-09-02 12:57:38 +0800 2018-2-13 17 ...
- day17 python re模块 简易爬虫
day17 python 一.re模块 1.re模块的基础方法 查找findall() import re #re.findall(pattern,string,flags ...