需求:解决私有环境数据库的基础数据同步问题,每当中心库基础数据发生改变时,其他私有库都会增量同步

Canal主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费

Canal将自己伪装成MySQL的从服务器,接收主服务器的binlog日志,然后转发给客户端消费

搭建环境

MySQL环境

这里使用docker来快速启动一个mysql来模拟

docker run --name mysql -p 3307:3306 -d -e MYSQL_ROOT_PASSWORD=mysql mysql

启动后需要开启binlog,还需要将binlog的储存格式设置为ROW模式因为用的镜像是8.0的,默认开启了binlig,模式也是ROW

可以根据

SHOW VARIABLES LIKE 'log_bin'
SHOW VARIABLES LIKE 'binlog_format'

这两个sql来查看mysql是设置好

如果要设置的话可以进入到容器里边设置

docker exec -it mysql bash

配置文件在/etc/mysql/

echo 'log-bin=mysql-bin' >> my.cnf
echo 'binlog-format=ROW' >> my.cnf

将配置追加到my.cnf里,然后重启容器即可

以上命令可以简化为

docker exec -it mysql  bash -c "echo 'log-bin=mysql-bin' >> /etc/mysql/my.cnf"
docker exec -it mysql bash -c "echo 'binlog-format=ROW' >> /etc/mysql/my.cnf"

这样就可以省去进入容器的那一步

如果修改了配置记得重启容器

docker restart mysql

最后需要授权一个账号给canal

CREATE USER canal IDENTIFIED BY 'canal';
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';
-- GRANT ALL PRIVILEGES ON *.* TO 'canal'@'%' ;
FLUSH PRIVILEGES;

Canal环境

Canal使用的是软件包

官网:https://github.com/alibaba/canal/wiki/QuickStart

下载

wget https://github.com/alibaba/canal/releases/download/canal-1.0.17/canal.deployer-1.0.17.tar.gz

解压

mkdir /tmp/canal
tar zxvf canal.deployer-$version.tar.gz -C /tmp/canal

配置文件夹里有个example的文件夹,这是一个实列配置(instance),需要将这个实列配置成自己的数据源

vi conf/example/instance.properties

主要是修改数据库地址和用户名

canal.instance.master.address
canal.instance.dbUsername
canal.instance.dbPassword

在启动前还需要改一下启动脚本,因为canal启动默认是需要1G以上的jvm内存,如果内存太小会报错

canal Cannot allocate memory

在启动脚本startup.sh里找到JAVA_OPTS,将内存参数改成256m

然后启动

sh bin/startup.sh

logs里查看canal的日志,观察是否启动成功

客户端

启动成功后需要一个客户端来接收消息

先添加依赖

<dependency>
<groupId>com.alibaba.otter</groupId>
<artifactId>canal.client</artifactId>
<version>1.1.0</version>
</dependency>

官网提供了一个Java版本得Demo

https://github.com/alibaba/canal/wiki/ClientExample

将程序里得ip地址改成canal所在得ip,然后就可以启动了

在连接后会注册一个过滤规则

connector.subscribe(".*\\..*");

这个规则可以指定哪些表被监听

常见例子:

1.  所有表:.*   or  .*\\..*
2. canal schema下所有表: canal\\..*
3. canal下的以canal打头的表:canal\\.canal.*
4. canal schema下的一张表:canal\\.test1
5. 多个规则组合使用:canal\\..*,mysql.test1,mysql.test2 (逗号分隔)

注意在canal中得instance.properties配置文件里也有这个配置canal.instance.filter.regex,如果在客户端重新注册新的规则,配置文件的规则会被覆盖

使用了哪个规则可以看example日志

2022-02-14 14:41:59.773 [main] INFO  c.a.otter.canal.instance.core.AbstractCanalInstance - subscribe filter change to .*\..*
2022-02-14 14:41:59.773 [main] WARN c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - --> init table filter : ^.*\..*$

在这个demo中,处理空事件超过120次就会停止

int totalEmptyCount = 120;
while (emptyCount < totalEmptyCount)

可以设置为while(true)

接下来获取事件

Message message = connector.getWithoutAck(batchSize);

Message中保存了List<CanalEntry.Entry>,遍历这个集合就能拿到消息,CanalEntry.Entry保存了元数据以及变更的详情

//反序列化
CanalEntry.RowChange rowChage = CanalEntry.RowChange.parseFrom(entry.getStoreValue());
//具体事件
CanalEntry.EventType eventType = rowChage.getEventType();

接下来就是消费消息

 for (CanalEntry.RowData rowData : rowChage.getRowDatasList()) {
if (eventType == CanalEntry.EventType.DELETE) {
printColumn(rowData.getBeforeColumnsList());
} else if (eventType == CanalEntry.EventType.INSERT) {
printColumn(rowData.getAfterColumnsList());
} else {
System.out.println("-------&gt; before");
printColumn(rowData.getBeforeColumnsList());
System.out.println("-------&gt; after");
printColumn(rowData.getAfterColumnsList());
}
}

demo中监听了删除事件、新增事件和修改事件,可以看到

getBeforeColumnsList()是变更前的
getAfterColumnsList()是变更后的

更多的事件类型被封装在EventType

最后需要转化为具体的SQL,并在具体环境中执行变更SQL来解决业务场景

新增

   /**
* @param entry
* @param rowData
* @param flag 忽略主键新增
*/
static void insertSql(CanalEntry.Entry entry, CanalEntry.RowData rowData, boolean flag) { StringBuilder sql = new StringBuilder();
sql.append("insert into ").append(entry.getHeader().getTableName()).append(" (");
for (int i = 0; i < rowData.getAfterColumnsList().size(); i++) {
if (flag && rowData.getAfterColumnsList().get(i).getIsKey()) {
continue;
}
sql.append(rowData.getAfterColumnsList().get(i).getName());
if (i != (rowData.getAfterColumnsList().size() - 1)) {
sql.append(",");
}
} sql.append(") ").append("values ("); for (int i = 0; i < rowData.getAfterColumnsList().size(); i++) {
if (flag && rowData.getAfterColumnsList().get(i).getIsKey()) {
continue;
}
sql.append(rowData.getAfterColumnsList().get(i).getValue());
if (i != (rowData.getAfterColumnsList().size() - 1)) {
sql.append(",");
}
}
sql.append(") ");
System.out.println(sql);
}

更新

  static void updateSql(CanalEntry.Entry entry, CanalEntry.RowData rowData) {
StringBuilder sql = new StringBuilder();
sql.append("update ").append(entry.getHeader().getTableName()).append(" set ");
for (int i = 0; i < rowData.getAfterColumnsList().size(); i++) {
sql.append(rowData.getAfterColumnsList().get(i).getName())
.append("=").append(rowData.getAfterColumnsList().get(i).getValue());
if (i != (rowData.getAfterColumnsList().size() - 1)) {
sql.append(",");
}
} sql.append(" where "); for (CanalEntry.Column column : rowData.getAfterColumnsList()) {
if (column.getIsKey()) {
sql.append(column.getName()).append("=").append(column.getValue());
}
}
System.out.println(sql); }

删除

    static void deleteSql(CanalEntry.Entry entry, CanalEntry.RowData rowData) {
StringBuilder sql = new StringBuilder();
sql.append("delete ").append(entry.getHeader().getTableName()).append(" where ");
for (CanalEntry.Column column : rowData.getBeforeColumnsList()) {
if (column.getIsKey()) {
sql.append(column.getName()).append("=").append(column.getValue());
}
}
System.out.println(sql); }

最后消费了需要提交或者回滚事务

/logs/example中的meta.log中可以看到消费到哪个binlog,哪个偏移量

总结

Canal使用起来并不是非常复杂,虽然需要额外的写一个客户端,但实现起来代码量并不大

在我这个业务场景中,因为基础数据的变更不会非常频繁,所以对性能这方面没有太高要求

Canal搭建的更多相关文章

  1. 阿里Canal框架(数据同步中间件)初步实践

    最近在工作中需要处理一些大数据量同步的场景,正好运用到了canal这款数据库中间件,因此特意花了点时间来进行该中间件的的学习和总结. 背景介绍 早期,阿里巴巴B2B公司因为存在杭州和美国双机房部署,存 ...

  2. canal数据同步

    前面提到数据库缓存不一致的几种解决方案,但是在不同的场景下各有利弊,而今天我们使用的canal进行缓存与数据同步的方案是最好的,但是也有一个缺点,就是相对前面几种解决方案会引入阿里巴巴的canal组件 ...

  3. canal demo搭建全记录

    一.环境介绍 canal是阿里开源的中间件,主要用于同步mysql数据库变更.具体参见:https://github.com/alibaba/canal/releases 搭建环境: vmware c ...

  4. mysql同步之otter/canal环境搭建完整详细版

    接上一篇mysql 5.7多源复制(用于生产库多主库合并到一个查询从库). 这一篇详细介绍otter/canal环境搭建以及当同步出现异常时如何排查.本文主要参考https://blog.csdn.n ...

  5. 「从零单排canal 02」canal集群版 + admin控制台 最新搭建姿势(基于1.1.4版本)

    canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据 订阅 和 消费.应该是阿里云DTS(Data Transfer Service)的开 ...

  6. 阿里Canal中间件的初步搭建和使用

    一.前言 Binlog是MySQL数据库的二进制日志,用于记录用户对数据库操作的SQL语句(除了数据查询语句)信息.而Binlog格式也有三种,分别为STATEMENT.ROW.MIXED.STATM ...

  7. CanalAdmin搭建Canal Server集群

    CanalAdmin搭建Canal Server集群 一.背景 二.机器情况 三.实现步骤 1.下载canal admin 2.配置canalAdmin 3.初始化canal admin数据库 4.启 ...

  8. Canal监控Mysql同步到Redis(菜鸟也能搭建)

    首先要Canal服务端下载:链接: https://pan.baidu.com/s/1FwEnqPC1mwNXKRwJuMiLdg 密码: r8xf 连接数据库的时候需要给予连接数据库权限:在my.i ...

  9. canal 环境搭建 canal 与kafka通信(三)

    canal 占用了生产者 .net core端 使用消费者获取canal 消息 安装 Confluent.Kafka  demo使用 1.3.0 public static void Consumer ...

随机推荐

  1. 深入理解Kafka核心设计及原理(三):消费者

    转载请注明出处:https://www.cnblogs.com/zjdxr-up/p/16114877.html 深入理解Kafka核心设计及原理(一):初识Kafka 深入理解Kafka核心设计及原 ...

  2. 两数之和II_LeetCode_167_1099

    LeetCode_167原题链接:https://leetcode-cn.com/problems/two-sum-ii-input-array-is-sorted/ LeetCode_1099原题链 ...

  3. jsp中c:forEach使用

    首先需要在jsp中引入<%@ taglib prefix="c" uri="http://java.sun.com/jsp/jstl/core" %> ...

  4. 2022.02.20 SA

    2022.02.20 SA 如果我还能看见明天黎明,如果我还能再爬起来,我仍会走我的路,哪怕这条路已经荒废许久,也许我们无法拥有感情,我们甚至无法像个正常人一样接受太阳的洗礼,但是我依然会执行我的条约 ...

  5. 【原创】浅谈指针(十二)关于static(上)

    0.前言 这个系列基本上是一月一更到两月一更 今天写一篇关于static的,内含大量干货,做好准备 1.基础知识的回顾 1.1.内存的种类 一般来说,我们之前已经讲过的变量(或者说是内存)可以大体分为 ...

  6. ABP应用开发(Step by Step)-下篇

    测试 ProductAppService 类 启动模板附带测试基础架构,包括xUnit.Shouldly和NSubstitute库.它使用SQLite 内存数据库来模拟数据库,并为每个测试创建一个单独 ...

  7. Java继承实例解析

    Java继承 前言 继承是面向对象语法的三大特征之一.继承可以降低代码编写的冗余度,提高编程的效率.通过继承,子类获得了父类的成员变量和方法.一个子类如何继承父类的字段和方法,如何修改从父类继承过来的 ...

  8. 阿里CBU技术面试小结

    一个执着于技术的公众号 前言 今天给大家分享一篇胡文兴同学阿里CBU技术面试的自我总结,希望通过本篇文章也让正在准备求职面试的你有所帮助. 本篇文章已经征得原作者同意转载至本公众号,并且征得他的同意标 ...

  9. Linux强制用户首次登录修改密码

    一个执着于技术的公众号 地方 前言 Linux强制用户首次登陆修改密码,这应该是RHCE认证中用户管理部分, 属于很基础的内容了.可是我忘记了,所以就有了下面的记录~ 实验过程 1.创建用户并设置登录 ...

  10. HCNP Routing&Switching之RSTP保护

    前文我们了解了RSTP相关话题,回顾请参考https://www.cnblogs.com/qiuhom-1874/p/16240348.html:今天我们来聊一聊RSTP保护相关话题: 我们知道RST ...