背景:

MySQL的架构中,Master-Slave是目前最受欢迎的,用的也最多,但是对于主从的延迟一般都是按照他自己的状态【Seconds_Behind_Master】来查看的,最近看了【不要用该值来衡量主备延迟】,发现用该状态值去判断主从延迟也不太靠谱。文章中也介绍了pt-heartbeat 来监控能更好的了解主从延迟时间。本文就介绍下该工具的使用方法。

工作原理:

1,在主上创建一张heartbeat表,按照一定的时间频率更新该表的字段(把时间更新进去)。

2,连接到从上检查复制的时间记录,和从库的当前系统时间进行比较,得出时间的差异。

使用方法:

pt-heartbeat [OPTIONS] [DSN] --update|--monitor|--check|--stop

在主上开启守护进程来更新test.heartbeat表:

pt-heartbeat -D test --update -h master-server --daemonize

监控从的延迟情况:

#一直执行,不退出
pt-heartbeat -D test --monitor -h slave-server
#执行一次就退出
pt-heartbeat -D test --check h=slave-server

常用参数:

注意:需要指定的参数至少有 --stop,--update,--monitor,--check。其中--update,--monitor和--check是互斥的,--daemonize和--check也是互斥。

--ask-pass
隐式输入MySQL密码 --charset
字符集设置 --check
检查从的延迟,检查一次就退出,除非指定了--recurse会递归的检查所有的从服务器。 --check-read-only
如果从服务器开启了只读模式,该工具会跳过任何插入。 --create-table
在主上创建心跳监控的表,如果该表不存在。可以自己建立,建议存储引擎改成memory。通过更新该表知道主从延迟的差距。
CREATE TABLE heartbeat (
ts varchar() NOT NULL,
server_id int unsigned NOT NULL PRIMARY KEY,
file varchar() DEFAULT NULL, -- SHOW MASTER STATUS
position bigint unsigned DEFAULT NULL, -- SHOW MASTER STATUS
relay_master_log_file varchar() DEFAULT NULL, -- SHOW SLAVE STATUS
exec_master_log_pos bigint unsigned DEFAULT NULL -- SHOW SLAVE STATUS
);
heratbeat表一直在更改ts和position,而ts是我们检查复制延迟的关键。
--daemonize
执行时,放入到后台执行 --user
-u,连接数据库的帐号 --database
-D,连接数据库的名称 --host
-h,连接的数据库地址 --password
-p,连接数据库的密码 --port
-P,连接数据库的端口 --socket
-S,连接数据库的套接字文件 --file 【--file=output.txt】
打印--monitor最新的记录到指定的文件,很好的防止满屏幕都是数据的烦恼。 --frames 【--frames=1m,2m,3m】
在--monitor里输出的[]里的记录段,默认是1m,5m,15m。可以指定1个,如:--frames=1s,多个用逗号隔开。可用单位有秒(s)、分钟(m)、小时(h)、天(d)。 --interval
检查、更新的间隔时间。默认是见是1s。最小的单位是0.01s,最大精度为小数点后两位,因此0.015将调整至0.。 --log
开启daemonized模式的所有日志将会被打印到制定的文件中。 --monitor
持续监控从的延迟情况。通过--interval指定的间隔时间,打印出从的延迟信息,通过--file则可以把这些信息打印到指定的文件。 --master-server-id
指定主的server_id,若没有指定则该工具会连到主上查找其server_id。 --print-master-server-id
在--monitor和--check 模式下,指定该参数则打印出主的server_id。 --recurse
多级复制的检查深度。模式M-S-S...不是最后的一个从都需要开启log_slave_updates,这样才能检查到。 --recursion-method
指定复制检查的方式,默认为processlist,hosts。 --update
更新主上的心跳表。 --replace
使用--replace代替--update模式更新心跳表里的时间字段,这样的好处是不用管表里是否有行。 --stop
停止运行该工具(--daemonize),在/tmp/目录下创建一个“pt-heartbeat-sentinel” 文件。后面想重新开启则需要把该临时文件删除,才能开启(--daemonize)。 --table
指定心跳表名,默认heartbeat。

更多的参数请见官方文档

测试:

环境:
主:192.168.200.25:3306
从:192.168.200.25:3307
从:192.168.200.201:3307

测试一:
1,在主上运行:--daemonize表示守护进程,后台运行。

zhoujy@zhoujy:~$ pt-heartbeat --user=root --ask-pass --host=192.168.200.25 --create-table -D aaa --interval=1 --update --replace --daemonize
Enter password: 或则指定日志文件:
zhoujy@zhoujy:~$ pt-heartbeat --user=root --ask-pass --host=192.168.200.25 --create-table -D aaa --interval=1 --log=/tmp/pt-heartbeat.log --update --daemonize Enter password:
zhoujy@zhoujy:~$ ps -ef | grep pt-heartbeat
zhoujy 15656 1 0 14:42 ? 00:00:00 perl /usr/local/bin/pt-heartbeat --user=root --ask-pass --host=192.168.200.25 --create-table -D aaa --interval=1 --update --daemonize

2,在从上运行:

#执行一次就退出
zhoujy@zhoujy:~$ pt-heartbeat --user=root --password=123456 --host=192.168.200.25 --port=3307 --create-table -D aaa --check
0.00 #一直执行,不退出
zhoujy@zhoujy:~$ pt-heartbeat --user=root --password=123456 --host=192.168.200.25 --port=3307 --create-table -D aaa --monitor
0.00s [ 0.00s, 0.00s, 0.00s ]
0.00s [ 0.00s, 0.00s, 0.00s ]
0.00s [ 0.00s, 0.00s, 0.00s ]

0表示从没有延迟。 [ 0.00s, 0.00s, 0.00s ] 表示1m,5m,15m的平均值。可以通过--frames去设置。

指定 --file 参数,把输出保存到一个文件中。文件只会保留最新的一条记录。

zhoujy@zhoujy:~$ pt-heartbeat --user=root --password=123456 --host=192.168.200.25 --port=3307 --create-table -D aaa --frames=1s,5s,15s --file=output.txt --monitor

文件output.txt的内容为:

3.00s [ 13.00s, 11.00s,  6.07s ]

在1,2中主更新的间隔时间为默认1s(--interval),检查延迟不需要1s这么频繁,设置10s检查一次从的延迟情况:

zhoujy@zhoujy:~$ pt-heartbeat --user=root --password=123456 --host=192.168.200.25 --port=3307 --create-table -D aaa --interval=10 --frames=1s,5s,15s --monitor
0.00s [ 0.00s, 0.00s, 0.00s ]
0.00s [ 0.00s, 0.00s, 0.00s ]
0.00s [ 0.00s, 0.00s, 0.00s ]

打印出主的server_id,可以先指定主的server_id,也可以不指定,让其自己去找。

zhoujy@zhoujy:~$ pt-heartbeat --user=root --password=123456 --host=192.168.200.25 --port=3307 --create-table -D aaa --interval=2 --print-master-server-id --frames=1s --monitor
0.00s [ 0.00s ] 12
0.00s [ 0.00s ] 12
0.00s [ 0.00s ] 12
0.00s [ 0.00s ] 12

参数:--master-server-id 先指定主的server_id。

测试二:
1,多级复制的检查深度(--recurse),必须在--check 模式下运行。

zhoujy@zhoujy:~$ pt-heartbeat --user=rep --password=rep --host=192.168.200.25 --port=3307 --create-table -D aaa --interval=1 --frames=1s --master-server-id=12 --print-master-server-id --recurse=3 --recursion-method=processlist --check
192.168.200.25:3307 0.00 12
192.168.200.201:3307 0.00 12

上面的结果现实找到了2个从服务器,其中201是25的从,25必须要开启log_slave_updates参数,否则无效。通过该方法可以找到所有的从服务器。

2,如何关闭主上面执行的后台进程。可以用参数--stop 去关闭:

zhoujy@zhoujy:~$ pt-heartbeat --stop
Successfully created file /tmp/pt-heartbeat-sentinel

这样就把在主上开启的进程杀掉了,后续要继续开启后台进行的话,需要把/tmp/pt-heartbeat-sentinel 文件删除,否则启动不了。

总结:

通过pt-heartbeart工具可以很好的弥补默认主从延迟的问题,但需要搞清楚该工具的原理。而默认的Seconds_Behind_Master值是通过将服务器当前的时间戳与二进制日志中的事件时间戳相对比得到的,所以只有在执行事件时才能报告延时。备库复制线程没有运行,也会报延迟null。还有一种情况:大事务,一个事务更新数据长达一个小时,最后提交。这条更新将比它实际发生时间要晚一个小时才记录到二进制日志中。当备库执行这条语句时,会临时地报告备库延迟为一个小时,执行完后又很快变成0。

通过上面的测试,总结下该工具的使用方法:

1,M-S环境运行:

zhoujy@zhoujy:~$ pt-heartbeat --user=rep --password=rep --host=192.168.200.25 --port=3307 --create-table -D aaa --interval=1 --frames=1s,2s,3s --master-server-id=12 --print-master-server-id --monitor
0.00s [ 0.00s, 0.00s, 0.00s ] 12
0.00s [ 0.00s, 0.00s, 0.00s ] 12
0.00s [ 0.00s, 0.00s, 0.00s ] 12
0.00s [ 0.00s, 0.00s, 0.00s ] 12
0.00s [ 0.00s, 0.00s, 0.00s ] 12
0.00s [ 0.00s, 0.00s, 0.00s ] 12

2,M-S-S环境运行:

zhoujy@zhoujy:~$ pt-heartbeat --user=rep --password=rep --host=192.168.200.25 --port=3307 --create-table -D aaa --interval=1 --frames=1s --master-server-id=12 --print-master-server-id --recurse=3 --recursion-method=processlist --check
192.168.200.25:3307 0.00 12
192.168.200.201:3307 0.00 12

具体的参数参考上面的说明。

更多参考信息:

http://www.percona.com/doc/percona-toolkit/2.2/pt-heartbeat.htmlhttp://blog.csdn.net/z1547840014/article/details/10174667

percona-toolkit 之 【pt-heartbeat】说明的更多相关文章

  1. Percona Toolkit mysql辅助利器

    1 PT介绍 Percona Toolkit简称pt工具—PT-Tools,是Percona公司开发用于管理MySQL的工具,功能包括检查主从复制的数据一致性.检查重复索引.定位IO占用高的表文件.在 ...

  2. Percona Toolkit工具使用

    Percona Toolkit简称pt工具-PT-Tools,是Percona公司开发用于管理MySQL的工具,功能包括检查主从复制的数据一致性.检查重复索引.定位IO占用高的表文件.在线DDL等 下 ...

  3. Centos 安装Percona Toolkit工具集

    1.下载 下载地址:   https://www.percona.com/downloads/percona-toolkit/LATEST/ [root@bogon ~]# wget https:// ...

  4. RDS for MySQL 如何使用 Percona Toolkit

    Percona Toolkit 包含多种用于 MySQL 数据库管理的工具. 下面介绍常用的 pt-online-schema-change  和  pt-archiver 搭配 RDS MySQL ...

  5. Percona Toolkit工具集介绍

    部署mysql工具是一个非常重要的部分,所以工具的可靠性和很好的设计非常重要.percona toolkit是一个有30多个mysql工具的工具箱.兼容mysql,percona server,mar ...

  6. Want to archive tables? Use Percona Toolkit’s pt-archiver--转载

    原文地址:https://www.percona.com/blog/2013/08/12/want-to-archive-tables-use-pt-archiver/ Percona Toolkit ...

  7. Percona Toolkit工具连接MySQL 8报错的解决方案

    使用Percona Toolkit的工具连接MySQL 8.x数据库时,会遇到类似"failed: Plugin caching_sha2_password could not be loa ...

  8. pt-heartbeat(percona toolkit)

    pt-heartbeat是用来监控主从延迟的一款percona工具,现在我们大部分的MySQL架构还是基于主从复制,例如MHA,MMM,keepalived等解决方案.而主从环境的话,我们很关心的就是 ...

  9. Percona Toolkit 使用

    安装 percona-toolkit perl Makefile.PL make make test make install 默认安装到 /usr/local/bin 目录下 可能需要 DBI-1. ...

  10. 使用Percona Toolkit解决Mysql主从不同步问题【备忘】

    由于各种原因,mysql主从架构经常会出现数据不一致的情况出现,大致归结为如下几类 1:备库写数据 2:执行non-deterministic query 3:回滚掺杂事务表和非事务表的事务 4:bi ...

随机推荐

  1. 为IIS Express添加MIME映射

    VS2013自带IIS Express,无法发布JSON文件,需添加MIME映射. 没有图形界面,只能命令行. 进入C:\Program Files(x86)\IIS Express文件夹,输入:ap ...

  2. AngularJS常用指令用法详解

    ng-class 1>ng-init   ng-bind 11111 2>ng-class 111 3>ng-repeat 3.1-数据绑定     ng-repeat可以绑定数组和 ...

  3. Linux平台延时之sleep、usleep、nanosleep、select比较

    Linux平台延时之sleep.usleep.nanosleep.select比较 标签: 嵌入式thread线程cpu多线程 2015-05-05 15:28 369人阅读 评论(0) 收藏 举报 ...

  4. mysql 分页性能优化

    最简单的分页方法是这样的 , 该表中存在5w左右数据 执行时间平均在10s左右,因此该种方式在数据量大的情况下查询效率极低. 优化方式有以下几种 1.此种方式平均在7-8s之间(CreateDate ...

  5. mysql 总结一

    mysql 总结一 数据类型(四类): 整型(5种:tinyint,smallint,mediumint, int(或integer),bigint ): 浮点型:(float,double), 日期 ...

  6. linux 中断理解

    1.进程.线程只针对的是应用层,而内核调用.驱动没有这种概念,调用的都是内核调用里相同的函数或变量,所以应用层多个应用操作同个硬件时,特别是要加互斥操作,8250通过cs针脚决定发送数据给哪个串口 2 ...

  7. git之常用指令

    参考:Git教程 - 廖雪峰的官方网站 1.git  //linux上检测是否安装git 2.sudo apt-get install git //linux上安装git 3.git config - ...

  8. CSS3属性选择通配符

    CSS3增加了更多的CSS选择器,可以实现更简单但是更强大的功能,比如:nth-child()等. Attribute selectors:在属性中可以加入通配符,包括^,$,* [att^=val] ...

  9. thusc滚粗记

    day0 下午到了北京,雾霾还是那么大.. 到宾馆报个到,和哥哥吃了一波饭,去不起西郊...只能去五道口了... 晚上和wyz队长见面,wyz队长好帅啊...没带手机拍照真是个错误TAT day1 今 ...

  10. 谷歌黑科技WaveNet,更先进的语音合成

    导读 Google 的 DeepMind 研究实验室昨天公布了其在计算机语音合成领域的最新成果——WaveNet.该语音合成系统能够模仿人类的声音,生成的原始音频质量优于目前的文本转语音系统(text ...