想要获取每天数据库每张表的DML的次数,统计热度表,可以使用该脚本

# coding:utf-8
# 解析binlog,统计热度表,表的DML个数 import sys
import os # mysqlbinlog解析binlog日志
def binlog_output():
binlog_file = sys.argv[1]
file_num = binlog_file.split('.')[1] binlog_log = 'binlog_%s.log' % file_num
os.system('/usr/local/mysql5637/mysql/bin/mysqlbinlog -v --base64-output=decode-rows %s > %s' %(binlog_file, binlog_log)) return binlog_log # 对
def binlog_parse(binlog_log): delete_count = 0
update_count = 0
insert_count = 0
update_li = []
insert_li = []
delete_li = []
stop_time_li = [] binlog_f = open(binlog_log, 'r',encoding='utf-8')
for line in binlog_f.readlines():
if line.startswith('### INSERT INTO'):
insert_count += 1
insert_li.append(line[16:].replace('`', '').strip())
if line.startswith('### UPDATE'):
update_count += 1
update_li.append(line[11:].replace('`', '').strip())
if line.startswith('### DELETE FROM'):
delete_count += 1
delete_li.append(line[16:].replace('`','').strip())
if 'Start: binlog' in line:
start_time = line.split('server')[0].replace('#', '')
if 'end_log_pos' in line:
stop_time_li.append(line)
binlog_f.close()
stop_time = stop_time_li[-1].split('server')[0].replace('#', '') start_time = '20' + start_time[:2] + '-' + start_time[2:4] + '-' + start_time[4:]
stop_time = '20' + stop_time[:2] + '-' + stop_time[2:4] + '-' + stop_time[4:] return delete_count,update_count,insert_count,update_li,insert_li,delete_li,start_time,stop_time # 对库和表进统计排序
def DbTableCount(arr):
result = {}
for i in set(arr):
result[i] = arr.count(i)
sort_li = sorted(result.items(), key=lambda x: x[1], reverse=True) return sort_li if __name__ == '__main__': binlog_log = binlog_output()
delete_count, update_count, insert_count, update_li, insert_li, delete_li, start_time,stop_time= binlog_parse(binlog_log)
sort_update_li = DbTableCount(delete_li)
sort_inser_li = DbTableCount(insert_li)
sort_delete_li = DbTableCount(update_li) # 删除解析日志
os.system('rm -f %s' % binlog_log) # 收集时间
print('开始时间: ;', start_time)
print('结束时间: ;', stop_time) # 统计DML总次数
print('\nDML总次数: ', insert_count+update_count+delete_count) # 统计DML次数
print(' Insert总次数: ', insert_count)
print(' Delete总次数: ', delete_count)
print(' Update总次数: ', update_count) # Insert统计
print('\nInsert 统计: ')
for i in sort_inser_li:
print(' DB.Table:', i[0], ', Count:', i[1]) # Delete统计
print('\nDelete 统计: ')
for i in sort_delete_li:
print(' DB.Table:', i[0], ', Count:', i[1]) # Update统计
print('\nUpdate 统计: ')
for i in sort_update_li:
print(' DB.Table:', i[0], ', Count:', i[1])

  

对MySQL binlog日志解析,统计每张表的DML次数的更多相关文章

  1. 阿里云mysql数据库恢复总结,mysql binlog日志解析

    由于意外..阿里云mysql中有一张表被全部删除了,深吸三口气候,开始解决. 首先用凌晨的自动备份的,进行全量恢复,然后找binlog日志(见下文),查找从全量备份到数据删除之间的记录 这导致了一个问 ...

  2. Mysql binlog日志解析

    1. 摘要: Mysql日志抽取与解析正如名字所将的那样,分抽取和解析两个部分.这里Mysql日志主要是指binlog日志.二进制日志由配置文件的log-bin选项负责启用,Mysql服务器将在数据根 ...

  3. 转载:阿里canal实现mysql binlog日志解析同步redis

    from: http://www.cnblogs.com/duanxz/p/5062833.html 背景 早期,阿里巴巴B2B公司因为存在杭州和美国双机房部署,存在跨机房同步的业务需求.不过早期的数 ...

  4. Mysql Binlog日志详解

    一.Mysql Binlog格式介绍       Mysql binlog日志有三种格式,分别为Statement,MiXED,以及ROW! 1.Statement:每一条会修改数据的sql都会记录在 ...

  5. MySQL binlog格式解析

    MySQL binlog格式解析   binlog想必大家都不陌生,在主从复制或者某些情况下的数据恢复会用到.由于binlog是二进制数据,要查看一般都借助mysqlbinlog工具.这篇笔记分析了b ...

  6. 看数据库的文件大小 MySQL Binlog日志的生成和清理规则

    小结: 1.避免并行大大事务对磁盘.内存的消耗: MySQL数据文件导致实例空间满的解决办法_空间/内存_常见问题_云数据库 RDS 版-阿里云 https://help.aliyun.com/kno ...

  7. 【转载】mysql binlog日志自动清理及手动删除

    说明:当开启mysql数据库主从时,会产生大量如mysql-bin.00000* log的文件,这会大量耗费您的硬盘空间.mysql-bin.000001mysql-bin.000002mysql-b ...

  8. mysql binlog日志自动清理及手动删除

    说明:当开启mysql数据库主从时,会产生大量如mysql-bin.00000* log的文件,这会大量耗费您的硬盘空间.mysql-bin.000001mysql-bin.000002mysql-b ...

  9. 自动清理MySQL binlog日志

    开启MySQL binlog日志的服务器,如果不设置自动清理日志,默认binlog日志一直保留着,时间一长,服务器磁盘空间被binlog日志占满,导致MySQL数据库出错. 使用下面方法可以安全清理b ...

随机推荐

  1. C++随笔(1)——关于C++11中的线程创建,join和detach

    主要是和之前的博文有关,之前在这里有一部分代码是通过创建新的进程来应对新的用户请求的,但是基本没怎么解释怎么用的,所以这里做点小笔记. join 首先引入的库: #include <thread ...

  2. 【miscellaneous】监狱智能视频监控系统设计解决方案

    监狱智能视频监控系统设计解决方案 一.系统概况 随着司法监狱管理系统内视频监控系统的日益发展,现有的被动式人工监控这一传统模式已无法满足新形势下的监管工作需求,尤其是现在靠轮询的视频监控方式,无法对突 ...

  3. C#程序员经常用到的10个实用代码片段 - 操作系统

    原文地址  如果你是一个C#程序员,那么本文介绍的10个C#常用代码片段一定会给你带来帮助,从底层的资源操作,到上层的UI应用,这些代码也许能给你的开发节省不少时间.以下是原文: 1 读取操作系统和C ...

  4. Qt - 基于UDP的网络编程

    UDP(用户数据报协议 User Data Protocol) 轻量级.不可靠.面向数据报.无连接  的传输层协议. 适用情况: 网络数据大多为短消息: 拥有大量客户端: 对数据安全无特殊要求: 网络 ...

  5. [LeetCode] 223.矩形面积

    题目链接: https://leetcode-cn.com/problems/rectangle-area 难度:中等 通过率:41.3% 题目描述: 在 二维 平面上计算出两个 由直线构成的 矩形重 ...

  6. jQuery jsonp跨域请求详解

    跨域的安全限制都是对浏览器端来说的,服务器端是不存在跨域安全限制的. 浏览器的同源策略限制从一个源加载的文档或脚本与来自另一个源的资源进行交互. 如果协议,端口和主机对于两个页面是相同的,则两个页面具 ...

  7. 使用T4模板为EF框架添加数据库实体注释(转)

    1. 下载文件GetSummery.ttinclude2. 把我们下载下来的文件解压,将解压出来的文件放入解决方案中3. 修改下app.config,添加一个连接字符串: <add name=& ...

  8. 088、Docker 如何支持多种日志方案 (2019-05-10 周五)

    参考https://www.cnblogs.com/CloudMan6/p/7762369.html   将容器日志发送到 STDOUT 和 STDERR 是Docker 的默认日志行为.实际上,Do ...

  9. qt json操作

    json文件结构形式 {    "xiao1": [        {            "000100": {                " ...

  10. django admin站点美化

    使用django-simpleui 安装 pip install  django-simpleui 源码地址 https://github.com/newpanjing/simpleui django ...