hive笔记:转义字符的使用】的更多相关文章

hive中的转义符 Hadoop和Hive都是用UTF-8编码的,所以, 所有中文必须是UTF-8编码, 才能正常使用 备注:中文数据load到表里面, 如果字符集不同,很有可能全是乱码需要做转码的, 但是hive本身没有函数来做这个 一.转义字符的特殊情况: 自身的转义,比如java有时候需要两个转义字符"\\",或者四个转义字符“\\\\”. 1)java的俩种情况: a.正则表达式匹配和string的split函数,这两种情况中字符串包含转义字符“\”时,需要先对转义字符自身转义…
Hive SQL 语法详解:http://blog.csdn.net/hguisu/article/details/7256833Hive SQL 学习笔记(常用):http://blog.sina.com.cn/s/blog_66474b16010182yu.html Hive中的分区:http://blog.csdn.net/jiedushi/article/details/6660185 Hive基础知识:http://www.csdn.net/article/2014-01-07/281…
DESCRIBE EXTENDED mydb.employees  DESCRIBE EXTENDED mydb.employees DESCRIBE EXTENDED mydb.employees hive> SHOW PARTITIONS employees;   SHOW PARTITIONS command Hive : select from group by : group by 对聚合操作之外的字段使用. 先是 from group by 执行后, 才执行select操作. Hiv…
第一部分:用户管理 创建用户:CREATE DATABASE XXX 查看用户:SHOW DATABASES; 关键查看用户:show databases like 'de.*'   讲解:创建一个用户就等于在物理目录下创建了一个文件,该文件是以.db结尾的,           默认的路径是:/user/hive/warehouse/zqx.db           创建用户时可以指定路径: create database XXX                               …
ubuntu安装mysql  http://www.2cto.com/database/201401/273423.html Hive安装: http://www.aboutyun.com/forum.php?mod=viewthread&tid=6902  (aboutyun)http://wangqiaowqo.iteye.com/blog/1618565http://www.it165.net/admin/html/201403/2528.html   (解释详细)http://www.l…
目录 · 概况 · 手工安装 · 引言 · 创建HDFS目录 · 创建元数据库 · 配置文件 · 测试 · 原理 · 架构 · 与关系型数据库对比 · API · WordCount · 命令 · 数据类型 · 文件存储格式 · 数据格式 · 数据库 · 数据表 · 装载数据 · 插入数据 · 导出数据 · 查询数据 · 函数 · 性能调优 · join调优 · Reduce任务数 · 合并小文件 · multi-group-by insert和multiple insert · union a…
map 结构 1. 语法:map(k1,v1,k2,v2,…)   操作类型:map ,map类型的数据可以通过'列名['key']的方式访问 案例: select deductions['Federal Taxes'],deductions['State Taxes'], deductions['Insurance'] from employees limit 1;   (1)如果没有查到结果可以使用if判断: select if(deductions['Federal Taxes'] is…
cast cast(number as string),  可以将整数转成字符串 lpad  rpad lpad(target, 10, '0')   表示在target字符串前面补0,构成一个长度为10的字符串 concat_ws 列拼接 concat_ws('@', 'zhaopei', 'mail.bnu.edu.cn') split split('aa|bb','[|]')  形成一个list, ['aa', 'bb'] row_number() 可实现组内排序 分组后 topK, 可以…
一.string类型,年月日部分包含的时间统一格式: 原数据格式(时间字段为string类型) 取数时间和格式的语法  2018-11-01 00:12:49.0 substr(regexp_replace(created_at,'-',''),0,8)>='20181101' month=201809,day=01 concat(month,day)>= '20180901' dt=181101 concat('20',a.dt)>=‘20181101’   二.日期函数(时间戳)以及…
array 结构 (1)语法:array(val1,val2,val3,…)  操作类型:array array类型的数据可以通过'数组名[index]'的方式访问,index从0开始: (2)建表: create external table  temp.array_20181101_v2  ( did string,  meiti array<string> ) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' COLLECTION ITEMS …