一,操作语法

　　01,创建数据库

[gpadmin@greenplum01 ~]$ createdb testDB -E utf-8

--创建用户--

[gpadmin@greenplum01 ~]$ export PGDATABASE=testDB

--指定数据库名字

[gpadmin@greenplum01 ~]$  psql

--连接本地数据库

psql (8.3.23)

Type "help" for help.

testDB=# SELECT version();

                                                                                               version

-------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------

 PostgreSQL 8.3.23 (Greenplum Database 5.16.0 build commit:23cec7df0406d69d6552a4bbb77035dba4d7dd44) on x86_64-pc-linux-gnu, co

mpiled by GCC gcc (GCC) 6.2.0, 64-bit compiled on Jan 16 2019 02:32:15

(1 row)

　　02,使用说明

postgres=# \h create view;

Command:     CREATE VIEW

Description: define a new view

Syntax:

CREATE [ OR REPLACE ] [ TEMP | TEMPORARY ] VIEW name [ ( column_name [, ...] ) ]

    AS query

postgres=# \h create

Command:     CREATE AGGREGATE

Description: define a new aggregate function

Syntax:

CREATE AGGREGATE name ( input_data_type [ , ... ] ) (

.....

---\h 为语句的使用说明书

　　03,建表语句

--语法查询

\h create table

--创建表

create table test001(id int,name varchar(128)); --id 为分布键

create table test002(id int,name varchar(128)) distributed by (id); --同上

create table test003(id int,name varchar(128)) distributed by (id,name) --多个分布键

create table test004(id int,name varchar(128)) distributed randomly; --随机分布键

create table test005(id int primary,name varchar(128));

create table test006(id int unique,name varchar(128));

create table test007(id int unique,name varchar(128)) distributed by (id,name);

---创建一模一样的 表

create table test_like (like test001);

　　04,插入语句

　　执行insert语句注意分布键不要为空,否则分布键默认变成null',数据都被保存到一个节点上会导致分布不均

insert into test001 values (100,'tom'),(101,'lily'),(102,'jack'),(103,'linda');

insert into test002 values (200,'tom'),(101,'lily'),(202,'jack'),(103,'linda');

　　05,更新语句

　　不能批量对分布键执行update,因为分布键执行update需要将数据重分布.

update test002 set id=203 where id=202;

　　06,删除语句delete--truncate

delete 删除整张表比较慢,所以建议使用truncate

truncate test001;

　　07,查询语句

postgres=# select * from test2;

 id  | name

-----+------

 102 | zxc

 203 | rty

 105 | bnm

 101 | qwe

 201 | asd

 204 | dfg

(6 rows)

　　08,执行计划

postgres=# select * from test1 x,test2 y where x.id=y.id;

 id  | name | id  | name

-----+------+-----+------

 101 | lily | 101 | qwe

 102 | jack | 102 | zxc

(2 rows)

postgres=# explain select * from test1 x,test2 y where x.id=y.id;

                                              QUERY PLAN

------------------------------------------------------------------------------------------------------

 Gather Motion 8:1  (slice2; segments: 8)  (cost=0.00..862.00 rows=4 width=17)

   ->  Hash Join  (cost=0.00..862.00 rows=1 width=17)

         Hash Cond: test1.id = test2.id

         ->  Table Scan on test1  (cost=0.00..431.00 rows=1 width=9)

         ->  Hash  (cost=431.00..431.00 rows=1 width=8)

               ->  Redistribute Motion 8:8  (slice1; segments: 8)  (cost=0.00..431.00 rows=1 width=8)

                     Hash Key: test2.id

                     ->  Table Scan on test2  (cost=0.00..431.00 rows=1 width=8)

 Optimizer status: PQO version 3.21.0

(9 rows)

二,常用数据类型

　　1.数值类型

　　02,字符类型

　　03,时间类型

三,常用函数

　　1,字符串函数

--

postgres=# VALUES ('hello|world!'),('greenplum|database');

      column1

--------------------

 hello|world!

 greenplum|database

(2 rows)

--

postgres=# SELECT substr('hello world!',2,3);

 substr

--------

 ell

(1 row)

--

postgres=# SELECT position('world' in 'hello world!');

 position

----------

        7

(1 row)

　　2,时间函数

postgres=# SELECT now(),current_date,current_time,current_timestamp;

              now              |    date    |       timetz       |              now

-------------------------------+------------+--------------------+-------------------------------

 2019-03-17 22:26:58.330843-04 | 2019-03-17 | 22:26:58.330843-04 | 2019-03-17 22:26:58.330843-04

(1 row)

　　3,数值计算

四,其他函数

　　1,序列号生成函数——generate_series

postgres=# SELECT * from generate_series(6,10);

 generate_series

-----------------

               6

               7

               8

               9

              10

(5 rows)

语法: generate_series(x,y,t) 

生成多行数据从x到另外y，步长为t，默认是1

　　2,字符串列转行——string_agg

string_agg(str,symbol [order by str])

（按照某字段排序）将str列转行，以symbol分隔

　　3,字符串行转列——regexp_split_to_table

把转成行的数据变成列数据

　　4,hash函数——md5，hashbpchar

　　md5的hash算法精度为128位，返回一个字符串
　　Hashbpchar的精度是32位，返回一个integer类型

postgres=# SELECT md5('admin')

postgres-# ;

               md5

----------------------------------

 21232f297a57a5a743894a0e4a801fc3

(1 row)

postgres=# SELECT hashbpchar('admin');

 hashbpchar

-------------

 -2087781708

(1 row)

GreenPlum 大数据平台--基础使用(一)的更多相关文章

GreenPlum 大数据平台--基础使用(二)
连接参数连接参数描述环境变量应用名称连接到数据库的应用名称,保存在application_name连接参数中.默认值是psql. $PGAPPNAME 数据库名用户想要连接的数据库名称.对 ...
GreenPlum 大数据平台--介绍
一,GreenPlum 01,介绍: Greenplum是一种基于PostgreSQL的分布式数据库,其采用shared-nothing架构,主机.操作系统.内存.存储都是自我控制的,不存在共享. 官 ...
GreenPlum 大数据平台--监控
数据库状态监控活动活动过程纠正措施列出当前状态为down的Segment.如果有任何行被返回,就会生成一个警告或者告警. 推荐频率:每5到10分钟重要度: IMPORTANT 在postgr ...
GreenPlum 大数据平台--外部表(三)
一,外部表介绍 Greenplum 在数据加载上有一个明显的优势,就是支持数据的并发加载,gpfdisk是并发加载的工具,数据库中对应的就是外部表所谓外部表,就是在数据库中只有表定义.没有数据,数据 ...
GreenPlum 大数据平台--非并行备份(六)
一,非并行备份(pg_dump) 1) GP依然支持常规的PostgreSQL备份命令pg_dump和pg_dumpall 2) 备份将在Master主机上创建一个包含所有Segment数据的大的备份 ...
GreenPlum 大数据平台--运维(三)
一,操作命令 01,启动gpstart 参数说明 COMMAND NAME: gpstart Starts a Greenplum Database system. ***************** ...
GreenPlum 大数据平台--备份-邮件配置-gpcrondump & gpdbrestore(五)
01,备份生成备份数据库 [gpadmin@greenplum01 ~]$ gpcrondump -l /gpbackup/back2/gpcorndump.log -x postgres -v [ ...
GreenPlum 大数据平台--并行备份(四)
01,并行备份(gp_dump) 1) GP同时备份Master和所有活动的Segment实例 2) 备份消耗的时间与系统中实例的数量没有关系 3) 在Master主机上备份所有DDL文件和GP相关的 ...
GreenPlum 大数据平台--安装
1. 环境准备 01, 安装包准备: Greenplum : >>>>链接地址 Pgadmin客户端 : >>>链接地址 greenplum-cc-web ...

随机推荐

进程间传递文件描述符fd
众所周知,子进程会继承父进程已经打开的文件描述符fd,但是fork之后的是不会被继承的,这个时候是否无能无力了?答应是NO.Linux提供了一个系统调用sendmsg,借助它,可以实现进程间传递文件描 ...
Spring学习整理-MyEclipse设置xml自动提示
操作流程如下图: 1.找到:MyEclipse中打开window–>Preferences–>MyEclipse –>Files and Editors –>XML–>X ...
Java Thread.join()详解--父线程等待子线程结束后再结束
目录(?)[+] 阅读目录一.使用方式. 二.为什么要用join()方法三.join方法的作用 join 四.用实例来理解打印结果: 打印结果: 五.从源码看join()方法 join是Th ...
[原创]Java源代码学习
一.一些关键字方法声明中的native:调用本地方法,该方法一般是用C或者C++写的变量声明中的transient:在序列化过程中会忽略该变量,即不进行序列化保存变量声明中的volatile:编 ...
去除两张img中间的间隙
这样写图片之间肯定有间隙正确写法就是去掉空格 <img src="hlppic.png" /><img src="hlppic.png" ...
停止Nginx服务
查询nginx进程信息 chen@ubuntu:~$ ps -ef |grep nginx root : ? :: nginx: master process /usr/sbin/nginx -g d ...
php 可变数量的参数列表
可变数量的参数列表 PHP 在用户自定义函数中支持可变数量的参数列表.在 PHP 5.6 及以上的版本中,由 ... 语法实现:在 PHP 5.5 及更早版本中,使用函数func_num_args() ...
历届试题小数第n位
问题描述我们知道,整数做除法时,有时得到有限小数,有时得到无限循环小数. 如果我们把有限小数的末尾加上无限多个0,它们就有了统一的形式. 本题的任务是:在上面的约定下,求整数除法小数点后的第n位开始 ...
Squid系统服务脚本
#!/bin/bash # chkconfig: - 90 25 #其中-的意思是所有运行级别 # config: /etc/squid.conf # pidfile: /usr/local/squi ...
洛谷 P2096 最佳旅游线路
某旅游区的街道成网格状.其中东西向的街道都是旅游街,南北向的街道都是林阴道.由于游客众多,旅游街被规定为单行道,游客在旅游街上只能从西向东走,在林阴道上则既可从南向北走,也可以从北向南走. 阿龙想到这 ...

GreenPlum 大数据平台--基础使用(一)

一,操作语法

01,创建数据库

02,使用说明

03,建表语句

04,插入语句

05,更新语句

06,删除语句delete--truncate

07,查询语句

08,执行计划

二,常用数据类型

1.数值类型

02,字符类型

03,时间类型

三,常用函数

1,字符串函数

2,时间函数

3,数值计算

四,其他函数

1,序列号生成函数——generate_series

2,字符串列转行——string_agg

3,字符串行转列——regexp_split_to_table

4,hash函数——md5，hashbpchar

GreenPlum 大数据平台--基础使用(一)的更多相关文章

随机推荐

热门专题

　　01,创建数据库

　　02,使用说明

　　03,建表语句

　　04,插入语句

　　05,更新语句

　　06,删除语句delete--truncate

　　07,查询语句

　　08,执行计划

　　1.数值类型

　　02,字符类型

　　03,时间类型

　　1,字符串函数

　　2,时间函数

　　3,数值计算

　　1,序列号生成函数——generate_series

　　2,字符串列转行——string_agg

　　3,字符串行转列——regexp_split_to_table

　　4,hash函数——md5，hashbpchar