UNION用于联合多个select语句的结果集,合并为一个独立的结果集,结果集去重. UNION ALL也是用于联合多个select语句的结果集.但是不能消除重复行.现在hive只支持UNION ALL. 这里需要特别注意,每个select语句返回的列的数量和名字必须一样,同时字段类型必须完全匹配,否则会抛出语法错误. 这种时候可以使用别名处理.例如 使用别名之后就不会报错了.
功能:将两个表中的 同样的字段拼接到一起 測试: create external table IF NOT EXISTS temp_uniontest_ta ( a1 string, a2 string ) partitioned by (dt string) row format delimited fields terminated by '\t' stored as textfile; ALTER TABLE temp_uniontest_ta ADD IF NOT EXISTS PART
1. Hive的分区作用 命令:创建分区 create table t_sz_part(id int, name string) partitioned by (country string) row format delimited fields terminated by ',' 往分区中插入数据:load data local inpath '/home/hadoop/sz.dat' into table t_sz_part partition(country = 'China'): 说明
Hadoop 2.X 管理与开发 一.Hadoop的起源与背景知识 (一)什么是大数据 大数据(Big Data),指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力的海量.高增长率和多样化的信息资产. 大数据的5个特征(IBM提出): l Volume (大量) l Velocity(高速) l Variety (多样) l Value (价值) l Veracity(真实性) 大数据的典型案例:
直接上硬菜.盲注的一段语句: 1170 UNION SELECT IF(SUBSTRING(current,1,1)) = CHAR(119) , BENCHMARK(5000000,ENCODE('MSG','by 5 seconds')),null) FROM (SELECT Database() as current) as tb1; 意思是想搞库名.判断库名的第一个字母时否是w(CHAR(119)).如果为真那就会通过BENCHMARK()函数造成较长延时,如果不为真很快就执行完了.这样
1.关于Union的知识 select 11 from dual union select 11 from dual 和 select 11 from dual union all select 11 from dual 有区别,Union的作用是合并查询结果 All保留重复行 2. 关于Order By的知识 2.1 select t.*, t.rowid from users t ,2--按照列号排序 2.2 select t.*, t.rowid from users t order b