https://github.com/sumitchawla/docker-vertica

You can either pull the image from Docker Registry using following command:

docker pull sumitchawla/vertica

Or, build your own image using following command. Download the Vertica DEB package from https://my.vertica.com and put it in this folder as "vertica9.deb". Then run:

docker build -t sumitchawla/vertica .

To run without a persistent datastore

docker run -p 5433:5433 sumitchawla/vertica

To run with a persistent datastore

docker run -p 5433:5433 -d -v /path/to/vertica_data:/home/dbadmin/docker sumitchawla/vertica

Connection Parameters

Default DB Name - docker

Default User - dbadmin

Default Password (NO PASSWORD) -

./vsql -d docker -U dbadmin

./vsql --help

This is vsql, the Vertica Analytic Database interactive terminal.

Usage:

vsql [OPTIONS]... [DBNAME [USERNAME]]

General options:

-d DBNAME specify database name to connect to (default: "root")

-c COMMAND run only single command (SQL or internal) and exit

-f FILENAME execute commands from file, then exit

-l list available databases, then exit

-v NAME=VALUE set vsql variable NAME to VALUE

-X do not read startup file (~/.vsqlrc)

--help show this help, then exit

--version output version information, then exit

Input and output options:

-a echo all input from script

-e echo commands sent to server

-E display queries that internal commands generate

-q run quietly (no messages, only query output)

-o FILENAME send query results to file (or |pipe)

-n disable enhanced command line editing (readline)

-s single-step mode (confirm each query)

-S single-line mode (end of line terminates SQL command)

Output format options:

-A unaligned table output mode (-P format=unaligned)

-b beep on command completion

-H HTML table output mode (-P format=html)

-t print rows only (-P tuples_only)

-T TEXT set HTML table tag attributes (width, border) (-P tableattr=)

-x turn on expanded table output (-P expanded)

-P VAR[=ARG] set printing option VAR to ARG (see \pset command)

-F STRING set field separator for unaligned output (default: "|") (-P fieldsep=)

-R STRING set record separator (default: newline) (-P recordsep=)

Connection options:

-4 prefer IPv4 addresses when resolving hostnames

-6 prefer IPv6 addresses when resolving hostnames

-B SERVER:PORT set connection backup server/port (default: not set)

-C enable connection load balancing (default: not enabled)

-h HOSTNAME database server host or socket directory (default: "local socket")

-k KRB SERVICE kerberos service name (default: "vertica")

-K KRB HOST kerberos host name

-m SSLMODE SSL mode (require, prefer, allow or disable; default: prefer)

-p PORT database server port (default: "5433")

-U NAME database user name (default: "root")

-W prompt for password (should happen automatically)

-w PASSWORD database user's password

For more information, type "?" (for vsql commands)

from within vsql, or consult the vsql section in

the Vertica Analytic Database documentation.

vertca 镜像

https://github.com/bluelabsio/docker-vertica 需要下载rpm

下载vertica 客户端

https://www.vertica.com/download/vertica/

https://softwaresupport.softwaregrp.com/ 下载页面

greenplum

https://github.com/greenplum-db/gpdb/releases

https://hub.docker.com/r/kevinmtrowbridge/greenplumdb_singlenode

https://github.com/kevinmtrowbridge/greenplumdb_singlenode_docker

https://github.com/kevinmtrowbridge/greenplumdb_singlenode_docker/blob/master/Dockerfile

单机版安装

https://www.jianshu.com/p/513935550350

greenplum 源码安装

https://yq.aliyun.com/articles/609855#

单机安装(容器安装的重要节点时刻)

系统:centos7 greenplum版本:greenplum-db-6.0.0-rhel7-x86_64.rpm

使用root用户操作:

一,前期准备

关闭防火墙

systemctl disable firewalld.service

systemctl enable firewalld.service

关闭selinux

sed -i '/SELINUX/s/enforcing/disabled/' /etc/selinux/config

配置网络与内存参数

vim /etc/sysctl.conf
加入以下内容
net.ipv4.ip_forward = 0
net.ipv4.conf.default.accept_source_route = 0
kernel.sysrq = 1
kernel.core_uses_pid = 1
net.ipv4.tcp_syncookies = 1
kernel.msgmnb = 65536
kernel.msgmax = 65536
kernel.sem = 250 64000 100 512
kernel.shmmax = 500000000
kernel.shmmni = 4096
kernel.shmall = 4000000000
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_max_syn_backlog = 4096
net.core.netdev_max_backlog = 10000
vm.overcommit_memory = 2
net.ipv4.conf.all.arp_filter = 1 vim /etc/security/limits.conf * soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072

参数生效

sysctl -p

确定sshd 启动正常 ss -tanl 看端口

二,安装greenplum

安装依赖包(可能还有,使用yum -y localinstall xxxx.rpm 自动解决依赖问题)

yum install -y net-tools which openssh-clients openssh-server less zip unzip iproute rsync openssl openssh perl bzip2 apr apr-util ed libevent-devel libyaml

rpm -ivh greenplum-db-6.0.0-rhel7-x86_64.rpm 缺少依赖装之

默认安装在 /usr/local/greenplum-db/

三,配置单机模式

使用root 操作

1,配置hosts解析

vim /etc/hosts

10.1.5.10 mdw sdw

注:10.1.5.10是虚拟机的ip地址,使用127.0.0.1 不成功

2,创建用户

groupadd gpadmin

useradd -g gpadmin gpadmin

passwd gpadmin 设置简单的密码

3,改变greenplum安装目录的用户和用户组

chown -R gpadmin.gpadmin /usr/local/greenplum-db/

4,切换到gpadmin账户下,在家目录下建立master和segment的数据存放目录。你也可以自行设定数据存放目录,如果你不是以gpadmin建立的目录,还需要修改目录的用户和用户组,最好是建在家目录下

su - gpadmin

mkdir -p /home/gpadmin/masterdata

mkdir -p /home/gpadmin/segmentdata

mkdir -p /home/gpadmin/segmentmirror

以下是su - gpadmin 后的操作

5,创建包含所有主机的文件all_hosts

vim /home/gpadmin/all_hosts

mdw

sdw

6,建包含segment主机名的文件

vim /home/gpadmin/seg_hosts

sdw

7,更改主机的名称

这里使用root 修改(以下都执行)

hostnamectl set-hostname "mdw"

hostname mdw

vim /etc/sysconfig/network

mdw

退出服务器重新登录

8,将MASTER_DATA_DIRECTORY加入Master主机环境中,修改gpadmin用户的.bashrc

这里使用gpadmin 用户登录后操作

cd /home/gpadmin

vim .bashrc

export MASTER_DATA_DIRECTORY=/home/gpadmin/masterdata/gpseg-1 #(配置的masterdata路径)

source /usr/local/greenplum-db/greenplum_path.sh #安装的greenplum路径

忘记在哪里可以搜索

9,时间同步

因为master和segment是在同一台机器,所以不需要做时间同步,如果不在同一台机器,需要做时间同步

10,python模块转移,防止提示失败

\cp -R -f /usr/lib64/python2.7/site-packages/. /data/program/gpsql/lib/python/

11,centos 7执行(原因未知)

echo "RemoveIPC=no" >> /etc/systemd/logind.conf

systemctl restart systemd-logind.service

12,编辑gp初始化配置文件,

vim /home/gpadmin/gpinitsystem_config

添加以下内容

ARRAY_NAME="EMC Greenplum DW"

SEG_PREFIX=gpseg

PORT_BASE=33000

declare -a DATA_DIRECTORY=(/home/gpadmin/segmentdata)

MASTER_HOSTNAME=mdw

MASTER_DIRECTORY=/home/gpadmin/masterdata

MASTER_PORT=5432

MACHINE_LIST_FILE=/home/gpadmin/seg_hosts

TRUSTED_SHELL=ssh

CHECK_POINT_SEGMENTS=8

ENCODING=UNICODE

MIRROR_PORT_BASE=43000

REPLICATION_PORT_BASE=34000

MIRROR_REPLICATION_PORT_BASE=44000

declare -a MIRROR_DATA_DIRECTORY=(/home/gpadmin/segmentmirror)

有多个segment,declare就多加几个路径 参考其他资料

13,建立信任关系,主要为了免密码登录的麻烦,若果提示命令不存在,先source一下.bashrc

gpssh-exkeys -f /home/gpadmin/all_hosts

如果tab 键无法搞出该命令,可能环境变量未生效

14,初始化数据库

gpinitsystem -c /home/gpadmin/gpinitsystem_config

15,等待log出现,中间需要按y

完成后可以gpstop

再执行 gpstart 报成功后完成

集群模式(未做)

:参考他的做吧

https://www.cnblogs.com/scoter2008/p/5928972.html

如果在容器内操作,需要注意的是容器内无sshd服务,所以安装完openssh-server后使用/usr/sbin/sshd 后启动sshd服务,

使用ss -tanl 查看端口信息

vertical-greenplum的更多相关文章

  1. Greenplum 的分布式框架结构

    Greenplum 的分布式框架结构 1.基本架构 Greenplum(以下简称 GPDB)是一款典型的 Shared-Nothing 分布式数据库系统.GPDB 拥有一个中控节点( Master ) ...

  2. 海量数据处理利器greenplum——初识

    简介及适用场景 如果想在数据仓库中快速查询结果,可以使用greenplum. Greenplum数据库也简称GPDB.它拥有丰富的特性: 第一,完善的标准支持:GPDB完全支持ANSI SQL 200 ...

  3. Vertical Menu ver4

    以前一直使div来创建Vertical菜单,也曾有过3个版本.http://www.cnblogs.com/insus/archive/2011/10/19/2217314.html 现今Insus. ...

  4. GreenPlum高效去除表重复数据

    1.针对PostgreSQL数据库表的去重复方法基本有三种,这是在网上查找的方法,在附录1给出.但是这些方法对GreenPlum来说都不管用. 2.数据表分布在不同的节点上,每个节点的ctid是唯一的 ...

  5. 实现从Oracle增量同步数据到GreenPlum

    简介: GreenPlum是一个基于PostgreSQL数据库开发的MPP架构的数据库仓库,适用于OLAP系统,支持50PB(1PB=1000TB)级海量数据的存储和处理. 背景: 目前有一个业务是需 ...

  6. Greenplum 源码安装教程 —— 以 CentOS 平台为例

    Greenplum 源码安装教程 作者:Arthur_Qin 禾众 Greenplum 主体以及orca ( 新一代优化器 ) 的代码以可以从 Github 上下载.如果不打算查看代码,想下载编译好的 ...

  7. [LeetCode] Binary Tree Vertical Order Traversal 二叉树的竖直遍历

    Given a binary tree, return the vertical order traversal of its nodes' values. (ie, from top to bott ...

  8. 大数据系列-java用官方JDBC连接greenplum数据库

    这个其实非常简单,之所以要写此文是因为当前网上搜索到的文章都是使用PostgreSQL的驱动,没有找到使用greenplum官方驱动的案例,两者有什么区别呢? 一开始我也使用的是PostgreSQL的 ...

  9. Greenplum安装

    最近需要安装Greenplum测试一些东西,在安装过程中出现了许多问题,所以在这里将安装过程整理一下,主要参考<Greenplum企业应用实践>和http://jxzhfei.blog.5 ...

  10. Greenplum查询计划分析

    这里对查询计划的学习主要是对TPC-H中Query2的分析. 1.Query的查询语句 select s_acctbal, s_name, n_name, p_partkey, p_mfgr, s_a ...

随机推荐

  1. redis缓存与数据一致性

    目录 缓存 缓存穿透 缓存雪崩(缓存失效) 缓存击穿(热点key) 缓存并发竞争(并发set) 数据一致性 缓存(双写)一致性 Redis集群(Redis-cluster)一致性原理 哨兵(Senti ...

  2. Shell编程、part5

    本节内容 1. 三剑客简介 2. sed命令详解 3. awk命令详解 文本处理三剑客 在 Shell 下使用这些正则表达式处理文本最多的命令有下面几个工具: |                 命令 ...

  3. PHP 静态变量的介绍

    PHP静态变量 变量在程序里是生命周期,存储在栈上,函数执行完就会被释放,而静态变量不同之处在于,函数执行完后并不会被释放,而是保留到下次函数调用,直到程序执行完,才从栈上释放 在PHP中有3类全局变 ...

  4. get、set快捷键那码事儿

    今天发现一个省时间的方法.get一下,哈哈 在快捷get/set.或其他那个页面上的方法时,只需Shift+Alt+s 然后,选择哪个方法,就按该方法字母下有横线的那个字母(只按单个字母就行) 在ge ...

  5. AndroidStudio ADB WIFI :adb wifi scan ip address

    笔记本使用Android studio的adb wifi插件时,AS 最下方报 adb wifi scan ip address.一直无法使用. 解决办法: ----在Terminal窗口中输入: a ...

  6. python 并发编程 多进程 生产者消费者模型介绍

    一 生产者消费者模型介绍 为什么要使用生产者消费者模型 生产者指的是生产数据的任务,消费者指的是处理数据的任务, 生产数据目的,是为了给消费者处理. 在并发编程中,如果生产者处理速度很快,而消费者处理 ...

  7. HTML标签-->列表,表格

    只有努力奔跑,才能一直停留在原地. 无序列表 <ul><!--默认列表编号为(实心圆)--> <li>第一项</li> <li>第二项< ...

  8. Elasticsearch-搜索并获取数据

    Elasticsearch-搜索并获取数据 在group中搜索elasticsearch curl -XGET "localhost:9200/get-together/group/_sea ...

  9. awk 命令使用指南

    一:awk 的执行流程 (1) 首先执行BEGIN{} 块中的初始化操作 (2) 然后从指定的数据文件中循环读取一个数据行 ( 自动更新 NF.NR.$0.$1....., 等内建变量的值) (3) ...

  10. Linux学习笔记(14)linux在6.x和7.x系列的安装与基本使用区别

    关键词,centos7 centos6.x安装与使用:https://www.cnblogs.com/gered/p/9440551.html centos7.x安装与使用(本文)转自:https:/ ...