FlinkX的安装与简单使用
- FlinkX的安装
- FlinkX的简单使用

FlinkX的安装与简单使用

FlinkX的安装与简单使用
- FlinkX的安装
- FlinkX的简单使用

FlinkX的安装

安装unzip：yum install unzip

1、上传并解压

unzip flinkx-1.10.zip -d /usr/local/soft/

2、配置环境变量

3、给bin/flinkx这个文件加上执行权限

chmod a+x flinkx

4、修改配置文件，设置运行端口

vim flinkconf/flink-conf.yaml

## web服务端口，不指定的话会随机生成一个

rest.bind-port: 8888

配置环境变量、

vim /etc/profile

FLINKX_HOME=

flinkX开源网址：https://github.com/DTStack/flinkx

FlinkX的简单使用

读取mysql中student表中数据

{

  "job": {

    "content": [

      {

        "reader": {

          "parameter": {

            "username": "root",

            "password": "123456",

            "connection": [{

              "jdbcUrl": ["jdbc:mysql://master:3306/student?userSSL=false&useUnicode=true&characterEncoding=utf8"],

              "table": ["student"]

            }],

            "column": ["*"],

            "customSql": "",

            "where": "id > 1500100900",

            "splitPk": "id",

            "queryTimeOut": 1000

          },

          "name": "mysqlreader"

        },

        "writer": {

          "name": "streamwriter",

          "parameter": {

            "print": true

          }

        }

      }

    ],

    "setting": {

      "speed": {

        "channel": 3,

        "bytes": 0

      },

      "errorLimit": {

        "record": 100

      },

      "restore": {

        "maxRowNumForCheckpoint": 0,

        "isRestore": false,

        "restoreColumnName": "",

        "restoreColumnIndex": 0

      },

      "log" : {

        "isLogger": false,

        "level" : "debug",

        "path" : "",

        "pattern":""

      }

    }

  }

}

FlinkX本地运行

flinkx -mode local -job flinkx3.json -pluginRoot ../syncplugins -flinkconf ../flinkconf

运行时文件所处路径为：/usr/local/soft/flinkx-1.10/package

MySQLToHDFS

配置文件

{

    "job": {

        "content": [

            {

                "reader": {

                    "parameter": {

                        "username": "root",

                        "password": "123456",

                        "connection": [

                            {

                                "jdbcUrl": [

                                    "jdbc:mysql://master:3306/student?characterEncoding=utf8"

                                ],

                                "table": [

                                    "student"

                                ]

                            }

                        ],

                        "column": [

                            "*"

                        ],

                        "customSql": "",

                        "where": "clazz = '理科二班'",

                        "splitPk": "",

                        "queryTimeOut": 1000,

                        "requestAccumulatorInterval": 2

                    },

                    "name": "mysqlreader"

                },

                "writer": {

                    "name": "hdfswriter",

                    "parameter": {

                        "path": "hdfs://master:9000/data/flinkx/student",

                        "defaultFS": "hdfs://master:9000",

                        "column": [

                            {

                                "name": "col1",

                                "index": 0,

                                "type": "string"

                            },

                            {

                                "name": "col2",

                                "index": 1,

                                "type": "string"

                            },

                            {

                                "name": "col3",

                                "index": 2,

                                "type": "string"

                            },

                            {

                                "name": "col4",

                                "index": 3,

                                "type": "string"

                            },

                            {

                                "name": "col5",

                                "index": 4,

                                "type": "string"

                            },

                            {

                                "name": "col6",

                                "index": 5,

                                "type": "string"

                            }

                        ],

                        "fieldDelimiter": ",",

                        "fileType": "text",

                        "writeMode": "overwrite"

                    }

                }

            }

        ],

        "setting": {

            "restore": {

                "isRestore": false,

                "isStream": false

            },

            "errorLimit": {},

            "speed": {

                "channel": 1

            }

        }

    }

}

启动任务

flinkx -mode local -job /usr/local/soft/flinkx-1.10/jsonConf/mysqlToHDFS.json -pluginRoot /usr/local/soft/flinkx-1.10/syncplugins/ -flinkconf /usr/local/soft/flinkx-1.10/flinkconf/

监听日志

flinkx 任务启动后，会在执行命令的目录下生成一个nohup.out文件

tail -f nohup.out

通过web界面查看任务运行情况

http://master:8888

MySQLToHive

配置文件

{

    "job": {

        "content": [

            {

                "reader": {

                    "parameter": {

                        "username": "root",

                        "password": "123456",

                        "connection": [

                            {

                                "jdbcUrl": [

                                    "jdbc:mysql://master:3306/student?characterEncoding=utf8"

                                ],

                                "table": [

                                    "student"

                                ]

                            }

                        ],

                        "column": [

                            "*"

                        ],

                        "customSql": "",

                        "where": "clazz = '文科二班'",

                        "splitPk": "id",

                        "queryTimeOut": 1000,

                        "requestAccumulatorInterval": 2

                    },

                    "name": "mysqlreader"

                },

                "writer": {

                    "name": "hivewriter",

                    "parameter": {

                        "jdbcUrl": "jdbc:hive2://master:10000/testflinkx",

                        "username": "",

                        "password": "",

                        "fileType": "text",

                        "fieldDelimiter": ",",

                        "writeMode": "overwrite",

                        "compress": "",

                        "charsetName": "UTF-8",

                        "maxFileSize": 1073741824,

                        "tablesColumn": "{\"student\":[{\"key\":\"id\",\"type\":\"string\"},{\"key\":\"name\",\"type\":\"string\"},{\"key\":\"age\",\"type\":\"string\"}]}",

                        "defaultFS": "hdfs://master:9000"

                    }

                }

            }

        ],

        "setting": {

            "restore": {

                "isRestore": false,

                "isStream": false

            },

            "errorLimit": {},

            "speed": {

                "channel": 3

            }

        }

    }

}

在hive中创建testflinkx数据库，并创建student分区表

create database testflinkx;

use testflinkx;

CREATE TABLE `student`(

  `id` string,

  `name` string,

  `age` string)

PARTITIONED BY (

  `pt` string)

ROW FORMAT DELIMITED

  FIELDS TERMINATED BY ','

启动hiveserver2

# 第一种方式：

hiveserver2

# 第二种方式:

hive --service hiveserver2

启动任务

flinkx -mode local -job /usr/local/soft/flinkx-1.10/jsonConf/mysqlToHive.json -pluginRoot /usr/local/soft/flinkx-1.10/syncplugins/ -flinkconf /usr/local/soft/flinkx-1.10/flinkconf/

查看日志及运行情况同上

MySQLToHBase

配置文件

{

    "job": {

        "content": [

            {

                "reader": {

                    "parameter": {

                        "username": "root",

                        "password": "123456",

                        "connection": [

                            {

                                "jdbcUrl": [

                                    "jdbc:mysql://master:3306/student?characterEncoding=utf8"

                                ],

                                "table": [

                                    "score"

                                ]

                            }

                        ],

                        "column": [

                            "*"

                        ],

                        "customSql": "",

                        "splitPk": "student_id",

                        "queryTimeOut": 1000,

                        "requestAccumulatorInterval": 2

                    },

                    "name": "mysqlreader"

                },

                "writer": {

                    "name": "hbasewriter",

                    "parameter": {

                        "hbaseConfig": {

                            "hbase.zookeeper.property.clientPort": "2181",

                            "hbase.rootdir": "hdfs://master:9000/hbase",

                            "hbase.cluster.distributed": "true",

                            "hbase.zookeeper.quorum": "master,node1,node2",

                            "zookeeper.znode.parent": "/hbase"

                        },

                        "table": "testFlinkx",

                        "rowkeyColumn": "$(cf1:student_id)_$(cf1:course_id)",

                        "column": [

                            {

                                "name": "cf1:student_id",

                                "type": "string"

                            },

                            {

                                "name": "cf1:course_id",

                                "type": "string"

                            },

                            {

                                "name": "cf1:score",

                                "type": "string"

                            }

                        ]

                    }

                }

            }

        ],

        "setting": {

            "restore": {

                "isRestore": false,

                "isStream": false

            },

            "errorLimit": {},

            "speed": {

                "channel": 3

            }

        }

    }

}

启动hbase 并创建testflinkx表

create 'testFlinkx','cf1'

启动任务

flinkx -mode local -job /usr/local/soft/flinkx-1.10/jsonConf/mysqlToHBase.json -pluginRoot /usr/local/soft/flinkx-1.10/syncplugins/ -flinkconf /usr/local/soft/flinkx-1.10/flinkconf/

查看日志及运行情况同上

MySQLToMySQL

配置文件

{

    "job": {

      "content": [

        {

          "reader": {

            "name": "mysqlreader",

            "parameter": {

              "column": [

                {

                  "name": "id",

                  "type": "int"

                },

                {

                  "name": "name",

                  "type": "string"

                },

                {

                  "name": "age",

                  "type": "int"

                },

                {

                  "name": "gender",

                  "type": "string"

                },

                {

                  "name": "clazz",

                  "type": "string"

                }

              ],

              "username": "root",

              "password": "123456",

              "connection": [

                {

                  "jdbcUrl": [

                    "jdbc:mysql://master:3306/student?useSSL=false"

                  ],

                  "table": [

                    "student"

                  ]

                }

              ]

            }

          },

          "writer": {

            "name": "mysqlwriter",

            "parameter": {

              "username": "root",

              "password": "123456",

              "connection": [

                {

                  "jdbcUrl": "jdbc:mysql://master:3306/student?useSSL=false",

                  "table": [

                    "student2"

                  ]

                }

              ],

              "writeMode": "insert",

              "column": [

                {

                    "name": "id",

                    "type": "int"

                  },

                  {

                    "name": "name",

                    "type": "string"

                  },

                  {

                    "name": "age",

                    "type": "int"

                  },

                  {

                    "name": "gender",

                    "type": "string"

                  },

                  {

                    "name": "clazz",

                    "type": "string"

                  }

              ]

            }

          }

        }

      ],

      "setting": {

        "speed": {

          "channel": 1,

          "bytes": 0

        }

      }

    }

  }

数据集成工具—FlinkX的更多相关文章

数据集成工具Kettle、Sqoop、DataX的比较
数据集成工具很多,下面是几个使用比较多的开源工具. 1.阿里开源软件:DataX DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL.Oracle等).H ...
数据集成工具Teiid Designer的环境搭建
由于实验室项目要求的关系,看了些数据汇聚工具 Teiid 的相关知识.这里总结下 Teiid 的可视化配置工具 Teiid Designer 的部署过程. 背景知识数据集成是把不同来源.格式.特点性 ...
数据集成工具：Teiid实践
数据集成是把不同来源.格式.特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享.数据集成的方式多种多样,这里介绍的 Teiid 是其中的一种:通过抽象和联邦技术,实现分布式数据源的 ...
数据集成工具—Sqoop
数据集成/采集/同步工具 @ 目录数据集成/采集/同步工具 Sqoop简介 Sqoop安装 1.上传并解压 2.修改文件夹名字 3.修改配置文件 4.修改环境变量 5.添加MySQL连接驱动 6.测 ...
【ODI】| 数据ETL：从零开始使用Oracle ODI完成数据集成（一）
0. 环境说明及软件准备 ODI(Oracle Data Integrator)是Oracle公司提供的一种数据集成工具,能高效地实现批量数据的抽取.转换和加载.ODI可以实现当今大多数的主流关系型数 ...
Tapdata 肖贝贝：实时数据引擎系列(六)-从 PostgreSQL 实时数据集成看增量数据缓存层的必要性
摘要:对于 PostgreSQL 的实时数据采集, 业界经常遇到了包括:对源库性能/存储影响较大, 采集性能受限, 时间回退重新同步不支持, 数据类型较复杂等等问题.Tapdata 在解决 Pos ...
[Hadoop 周边] Hadoop和大数据：60款顶级大数据开源工具（2015-10-27）【转】
说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱.弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hado ...
Hadoop和大数据：60款顶级大数据开源工具
一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...
【转载】Hadoop和大数据：60款顶级大数据开源工具
一.Hadoop相关工具 1. Hadoop Apache的Hadoop项目已几乎与大数据划上了等号.它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算. 支持的操作系统: ...

随机推荐

Huffman算法
一.Huffman算法介绍霍夫曼编码(英语:Huffman Coding),又译为哈夫曼编码.赫夫曼编码,是一种用于无损数据压缩的熵编码(权编码)算法.在计算机数据处理中,霍夫曼编码使用变长编码表对 ...
猫狗收容所牛客网程序员面试金典 C++
猫狗收容所牛客网程序员面试金典 C++ 题目描述有家动物收容所只收留猫和狗,但有特殊的收养规则,收养人有两种收养方式,第一种为直接收养所有动物中最早进入收容所的,第二种为选择收养的动物类型(猫或 ...
SpringMVC配置版到注解版
什么是springmvc? 1.1.什么是MVC MVC是模型(Model).视图(View).控制器(Controller)的简写,是一种软件设计规范. 是将业务逻辑.数据.显示分离的方法来组织代码 ...
istio基础详解
1.Istio介绍? 官方文档:https://istio.io/docs/concepts/what-is-istio/ 中文官方文档:https://istio.io/zh/docs/concep ...
学习JS的第四天
一.循环 1.循环嵌套 1.一个循环内包含完整的另一个循环语句. 2.被包含的循环语句叫内循环,包含别的循环的循环语句叫外循环. 3.外循环每执行一次循环,内循环都会完全执行所有循环次数. 4.循环嵌 ...
.net工程师学习vue的心路历程（一）
实习一年后,想做一个属于自己的博客网站,准备用core api去搭建服务端接口,前端准备采用vue这样的一个框架.本身时一个服务端程序员,所以来学习记录一些vue的知识点,有什么不足的希望大家指正,谢 ...
【数据结构】【图文】【oj习题】图的拓扑排序（邻接表）
拓扑排序: 按照有向图给出的次序关系,将图中顶点排成一个线性序列,对于有向图中没有限定次序关系的顶点,则可以人为加上任意的次序关系,由此所得顶点的线性序列称之为拓扑有序序列.显然对于有回路的有向图得不 ...
Tomcat无法启动解决办法
[2014-04-12 12:34:39] [error] [ 1080] 操作系统找不到已输入的环境选项. [2014-04-12 12:34:39] [error] [ 1052] Failed ...
[hdu6978]New Equipments II
显然可以费用流来做,具体建图如下-- 点集:源点,汇点,左边$n$个工人,右边$n$个设备边集:源点向第$i$个工人连$(1,a_{i})$的边,第$i$个设备向汇点连$(1,b_{i ...
Jenkins快速上手安装
目录环境准备 - JDK 安装 1. APT 安装 2. WAR包方式运行 3.Docker 方式运行 Jenkins 是一个独立的开源自动化服务器,可以用来自动化与构建.测试.交付或部署软件相关的 ...

数据集成工具—FlinkX

FlinkX的安装与简单使用

FlinkX的安装

FlinkX的简单使用

读取mysql中student表中数据

FlinkX本地运行

MySQLToHDFS

MySQLToHive

MySQLToHBase

MySQLToMySQL

数据集成工具—FlinkX的更多相关文章

随机推荐

热门专题