1. Canal入门

1. Canal简介

官方文档: https://github.com/alibaba/canal/wiki/简介

早期，阿里巴巴B2B公司因为存在杭州和美国双机房部署，存在跨机房同步的业务需求。早期的数据库同步业务，主要是基于trigger的方式获取增量变更，不过从2010年开始，阿里系公司开始逐步的尝试基于数据库的日志解析获取增量变更进行同步，由此衍生出了增量订阅&消费的业务，从此开启了一段新纪元,也就是Canal,翻译为管道的意思

工作原理

官网截图

先简单了解一下关于Mysql,master和slave的同步机制:

master将改变记录到二进制日志(binary log)中（这些记录叫做二进制日志事件，binary log events，可以通过show binlog events进行查看）；需要手动打开,master在更新数据时,会同步操作日志文件,会有性能方面的影响,如果没有同步需要,关闭即可
slave将master的binary log events拷贝到它的中继日志(relay log)；
slave重做中继日志中的事件，将改变反映它自己的数据。

详细信息可以参考:

以上是mysql主从备份的简单了解,以下是Canal的工作原理:

canal模拟mysql slave的交互协议，伪装自己为mysql slave，向mysql master发送dump协议
mysql master收到dump请求，开始推送binary log给slave(也就是canal)
canal解析binary log对象(原始为byte流)
canal将数据推送给指定的目标位置,并封装为对象的形式操作

2. Canal服务端搭建

2.1 部署Mysql

Mysql的搭建我这里就不说了,搭建完毕后,需要修改一些信息:

修改Mysql配置文件(我是在windows下,默认文件夹是C:\ProgramData\MySQL\MySQL Server 5.7\my.ini,需要打开隐藏目录):

[mysqld]

log-bin=mysql-bin # 开启 binlog

binlog-format=ROW # 选择 ROW 模式

server_id=1 # 配置 MySQL replaction 需要定义，不要和 canal 的 slaveId 重复

创建Canal连接的账号,并赋予slave的权限:

CREATE USER canal IDENTIFIED BY 'canal';

GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';

-- GRANT ALL PRIVILEGES ON *.* TO 'canal'@'%' ;

FLUSH PRIVILEGES;

然后重启mysql服务即可

可以使用如下命令查看是否打开binlog模式:

show variables like 'log_bin';

查看binlog日志文件列表:

show binary logs

2.2 Canal服务搭建

下载canal包: https://github.com/alibaba/canal/releases ,我下载的是 1.1.5 版本, canal.deployer-1.1.5.tar.gz

解压完毕后, 修改conf/example/instance.properties 配置文件,如下:



# enable gtid use true/false

canal.instance.gtidon=false

# 数据库地址

canal.instance.master.address=127.0.0.1:3306

#执行binlog文件

canal.instance.master.journal.name=mysql-bin.000001

#起始位置.跳过Mysql初始的一部分

canal.instance.master.position=154

canal.instance.master.timestamp=

canal.instance.master.gtid=

# rds oss binlog

canal.instance.rds.accesskey=

canal.instance.rds.secretkey=

canal.instance.rds.instanceId=

# table meta tsdb info

canal.instance.tsdb.enable=true

# 数据库账号密码

canal.instance.dbUsername=canal

canal.instance.dbPassword=canal

canal.instance.connectionCharset = UTF-8

# enable druid Decrypt database password

canal.instance.enableDruid=false

# 指定同步的表名 这里是全部

canal.instance.filter.regex=.*\\..*

# table black regex

canal.instance.filter.black.regex=mysql\\.slave_.*

# mq config

canal.mq.topic=example

#canal.mq.dynamicTopic=mytest1.user,mytest2\\..*,.*\\..*

canal.mq.partition=0

然后执行bin目录下对应操作系统的启动脚本即可:

这样就启动成功了

3. 客户端搭建

创建客户端连接Canal服务

创建maven项目,导入依赖:

    <dependencies>

        <dependency>

            <groupId>com.alibaba.otter</groupId>

            <artifactId>canal.client</artifactId>

            <version>1.1.5</version>

        </dependency>

        <dependency>

            <groupId>com.alibaba.otter</groupId>

            <artifactId>canal.protocol</artifactId>

            <version>1.1.5</version>

        </dependency>

    </dependencies>

客户端代码:

class SimpleCanalClientExample {

    public static void main(String args[]) {

        // 创建链接

        CanalConnector connector = CanalConnectors.newSingleConnector(new InetSocketAddress(AddressUtils.getHostIp(),

                11111), "example", "root", "root");

        int batchSize = 1000;

        int emptyCount = 0;

        try {

            connector.connect();

            connector.subscribe(".*\\..*");

            connector.rollback();

            int totalEmptyCount = 120;

            while (emptyCount < totalEmptyCount) {

                // 获取指定数量的数据

                Message message = connector.getWithoutAck(batchSize);

                long batchId = message.getId();

                int size = message.getEntries().size();

                if (batchId == -1 || size == 0) {

                    emptyCount++;

                    System.out.println("empty count : " + emptyCount);

                    try {

                        Thread.sleep(1000);

                    } catch (InterruptedException e) {

                    }

                } else {

                    emptyCount = 0;

                    // System.out.printf("message[batchId=%s,size=%s] \n", batchId, size);

                    printEntry(message.getEntries());

                }

                connector.ack(batchId); // 提交确认

                // connector.rollback(batchId); // 处理失败, 回滚数据

            }

            System.out.println("empty too many times, exit");

        } finally {

            connector.disconnect();

        }

    }

    private static void printEntry(List<CanalEntry.Entry> entrys) {

        for (CanalEntry.Entry entry : entrys) {

            //如果是事务开启关闭时间则跳过

            if (entry.getEntryType() == CanalEntry.EntryType.TRANSACTIONBEGIN || entry.getEntryType() == CanalEntry.EntryType.TRANSACTIONEND) {

                continue;

            }

            CanalEntry.RowChange rowChage = null;

            try {

                rowChage = CanalEntry.RowChange.parseFrom(entry.getStoreValue());

            } catch (Exception e) {

                throw new RuntimeException("ERROR ## parser of eromanga-event has an error , data:" + entry.toString(),

                        e);

            }

            CanalEntry.EventType eventType = rowChage.getEventType();

            System.out.println(String.format("================&gt; binlog[%s:%s] , name[%s,%s] , eventType : %s",

                    entry.getHeader().getLogfileName(), entry.getHeader().getLogfileOffset(),

                    entry.getHeader().getSchemaName(), entry.getHeader().getTableName(),

                    eventType));

            for (CanalEntry.RowData rowData : rowChage.getRowDatasList()) {

                if (eventType == CanalEntry.EventType.DELETE) {

                    printColumn(rowData.getBeforeColumnsList());

                } else if (eventType == CanalEntry.EventType.INSERT) {

                    printColumn(rowData.getAfterColumnsList());

                } else {

                    System.out.println("-------&gt; before");

                    printColumn(rowData.getBeforeColumnsList());

                    System.out.println("-------&gt; after");

                    printColumn(rowData.getAfterColumnsList());

                }

            }

        }

    }

    private static void printColumn(List<CanalEntry.Column> columns) {

        for (CanalEntry.Column column : columns) {

            System.out.println(column.getName() + " : " + column.getValue() + "    update=" + column.getUpdated());

        }

    }

}

当我们操作数据库时,客户端则可以获取到事件的发生:

empty count : 1

empty count : 2

empty count : 3

empty count : 4

empty count : 5

empty count : 6

empty count : 7

empty count : 8

empty count : 9

empty count : 10

empty count : 11

empty count : 12

empty count : 13

empty count : 14

================&gt; binlog[mysql-bin.000001:1893] , name[test,aa_test] , eventType : CREATE

empty count : 1

empty count : 2

empty count : 3

empty count : 4

empty count : 5

empty count : 6

empty count : 7

empty count : 8

empty count : 9

empty count : 10

empty count : 11

empty count : 12

empty count : 13

empty count : 14

empty count : 15

empty count : 16

empty count : 17

empty count : 18

================&gt; binlog[mysql-bin.000001:2698] , name[test,aa_test] , eventType : INSERT

id : 1111110946    update=true

status : 1    update=true

orderId : 1    update=true

orderProductId : 1    update=true

stanId : 1    update=true

quantity : 1    update=true

paymentDate : 2021-07-07 14:07:23    update=true

warehouse : 1    update=true

pid : 1    update=true

customerId : 1    update=true

type : 1    update=true

empty count : 1

empty count : 2

empty count : 3

empty count : 4

如上日志显示, 创建表和向中插入一条数据的时间都被记录,并打印出插入的数据

1. Canal入门的更多相关文章

canal入门Demo
关于canal具体的原理,以及应用场景,可以参考开发文档:https://github.com/alibaba/canal 下面给出canal的入门Demo (一)部署canal服务器可以参考官方文 ...
（1）Canal入门
1.前言在我们系统开发过程中,根据业务场景很多数据库数据并不会直接给用户访问的,需要同步保存到ElasticSearch.Redis等存储应用当中(例如最常见的是搜索页面的ElasticSearch ...
canal 入门（基于docker）
第一步:安装MySQL:(可以参考:https://my.oschina.net/amhuman/blog/1941540) 命令: sudo docker run -it -d --restart ...
canal 入门
参考文章:Canal - 安装 https://www.aliyun.com/jiaocheng/1131288.html?spm=5176.100033.2.7.7b422237XAirIe 前 ...
canal入门使用
1.下载canal安装包: 地址:https://github.com/alibaba/canal/releases 图例: 2.将下载好的安装包复制到Linux,解压 3.修改配置文件 vi con ...
Canal入门
配置mysql 1.mysql开启binlog mysql默认没有开启binlog,修改mysql的my.cnf文件,添加如下配置,注意binlog-format必须为row,因为binlog如果为S ...
数据的异构实战（一）基于canal进行日志的订阅和转换
什么是数据的异构处理.简单说就是为了满足我们业务的扩展性,将数据从某种特定的格式转换到新的数据格式中来. 为什么会有这种需求出现呢? 传统的企业中,主要都是将数据存储在了关系型数据库中,例如说MySQ ...
使用canal分析binlog(一) 入门
canal介绍 canal是应阿里巴巴存在杭州和美国的双机房部署,存在跨机房同步的业务需求而提出的.早期,阿里巴巴B2B公司因为存在杭州和美国双机房部署,存在跨机房同步的业务需求.不过早期的数据库同步 ...
canal 结合 kafka 入门
1.kafka的安装: 略 2.cannal 配置使用卡夫卡: 修改 /home/admin/canal-server/conf/canal.properties 2.1 修改canal.ser ...
「从零单排canal 01」 canal 10分钟入门（基于1.1.4版本）
1.简介 canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费.应该是阿里云DTS(Data Transfer Servi ...

随机推荐

linux root用户密码输入正确还是提示access denied
问题:之前用远程工具连接一直都是好的,第二天上班找开远程工具要输root的密码了,输入用户密码后还是无效,可以确定用户密码是对的,其中有一个远程工具一直是连着的就没有问题. 排查问题: 1.相接用pa ...
C语言输出狗头
使用printf()函数输出样式 #include <stdio.h> int main() { printf(" * ii. ;9ABH,\n"); printf(& ...
超级AI助手：全新提升！中文NLP训练框架，快速上手，海量训练数据
"超级AI助手:全新提升!中文NLP训练框架,快速上手,海量训练数据,ChatGLM-v2.中文Bloom.Dolly_v2_3b助您实现更智能的应用!" 1.简介目标:基于py ...
找工作、备考、面试刷题网站推荐（牛客网、力扣、计蒜客、hihocoder、七月在线）以及acm竞赛oj
不管是找工作笔试面试白板试进大厂,还是研究生参加初试复试,数据结构和算法都是都是重中之重,刷题就很必要,来拿走自己的offer 吧! 一.offer刷题推荐 1.牛客网链接:牛客网 - 找工作神器| ...
C/C++ x32 Inline Hook 代码封装
Hook 技术常被叫做挂钩技术,挂钩技术其实早在DOS时代就已经存在了,该技术是Windows系统用于替代DOS中断机制的具体实现,钩子的含义就是在程序还没有调用系统函数之前,钩子捕获调用消息并获得控 ...
从浏览器原理出发聊聊 Chrome 插件
浏览器架构演进单进程浏览器时代单进程浏览器是指浏览器的所有功能模块都是运行在同一个进程里,这些模块包含了网络.插件.JavaScript 运行环境.渲染引擎和页面等.在 2007 年之前,市面上浏 ...
痞子衡嵌入式：我入选了2023年度与非网(eefocus)最佳创作者Top15
最近收到了「与非网」发来的 2023 年度最佳创作者证书,证书做得一如既往地有质感,这是与非网第二次给痞子衡发证书了,足见与非网对痞子衡的认可. 与非网自 2021 年起,每年都会评选一次年度创作者 ...
Oracle多租户架构之如何快速创建一个PDB
Oracle自从12c版本开始引入多租户的架构,整个管理理念也发生了很大的变化. 比如之前再小的业务只要选择了Oracle,DBA都会选择新建一套独立的数据库,因为传统的架构只能在schema级别作区 ...
.NET Core开发实战（第35课：MediatR：让领域事件处理更加优雅）--学习笔记
35 | MediatR:让领域事件处理更加优雅核心对象 IMediator INotification INotificationHandler 这两个与之前的 Request 的行为是不一样的, ...
HBase执行stop-hbash.sh关闭命令等待时间过长
问题描述执行stop-hbase.sh时,等待很长时间都没结束(出来很多"...") 解决办法: hbase-daemons.sh stop masterhbase-daemon ...