最近在mysqldump时,遭遇mysqldump: Error 2013错误。以为是常见的参数设置有问题,调整之后,也没有任何成效。原来发生了OOM,以下是其具体描述。

一、故障现象

环境
# more /etc/redhat-release
CentOS Linux release 7.4.1708 (Core) # mysql -V ##PXC 5.7
mysql Ver 14.14 Distrib 5.7.20-18, for Linux (x86_64) using 6.2 # mysqldump -hlocalhost -uroot -p --port=33006 --default-character-set=utf8 -F -R -E --triggers -e \
> --single-transaction --all-databases >/tmp/alldb.sql
Enter password:
mysqldump: Error 2013: Lost connection to MySQL server during query when dumping table `tel_send_log` at row: 390486
表并不是很大,也就200w左右的数据行。

二、故障分析

起初以为是相关变量设置有问题,因此调整相关参数
mysql > set global connect_timeout=1800;
mysql > set global net_read_timeout=1800;
mysql > set global net_write_timeout=1800;
mysql > set global max_allowed_packet=1024*1024*1024;
mysql > set global net_buffer_length=1024*1024; 之后再次导出,问题依旧,而且报错之后,mysqld就直接挂了
查看mysqld的error log也未得到相关报错的具体信息,还以为是版本太新遭遇Bug呢
后来加上一个选项--skip-extended-insert(这个是不启用mysql 生成insert包含多values)也不行
换到另一个节点后,导出却是正常的。
于是打开报错系统日志message一看,竟然out of memory # tail -fn 50 /var/log/message
Apr 26 15:13:10 zcd kernel: Out of memory: Kill process 10274 (firewalld) score 5 or sacrifice child
Apr 26 15:13:10 zcd kernel: Killed process 10274 (firewalld) total-vm:333984kB, anon-rss:21980kB, file-rss:44kB, shmem-rss:0kB
Apr 26 15:13:10 zcd systemd: firewalld.service: main process exited, code=killed, status=9/KILL
Apr 26 15:13:10 zcd mysqld_safe: /usr/bin/mysqld_safe: line 220: 9658 Killed
nohup /usr/sbin/mysqld --basedir=/usr --datadir=/u02/pxcdata --plugin-dir=/usr/lib64/mysql/plugin --user=mysql
--wsrep-provider=/usr/lib64/galera3/libgalera_smm.so --log-error=/var/log/mysqld.log
--pid-file=/var/run/mysqld/mysqld.pid --socket=/var/lib/mysql/mysql.sock --port=33006
--wsrep_start_position=e12b32d1-06f1-11e8-b907-d7b0846b449d:68722 < /dev/null > /dev/null 2>&1
Apr 26 15:13:10 zcd mysqld_safe: 2018-04-26T07:13:10.742581Z mysqld_safe Number of processes running now: 0
Apr 26 15:13:10 zcd mysqld_safe: 2018-04-26T07:13:10.831232Z mysqld_safe WSREP: not restarting wsrep node automatically
Apr 26 15:13:10 zcd mysqld_safe: 2018-04-26T07:13:10.835441Z mysqld_safe mysqld from pid file /var/run/mysqld/mysqld.pid ended 于是重启mysql,然后再次导出,观察内存占用情况,如下,可以看到free列值不断减少
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 1 0 625288 31836 1347284 0 0 19840 372 3181 3394 9 3 42 46 0
0 1 0 586820 31844 1365304 0 0 19840 60 2385 3264 7 3 46 44 0
0 1 0 515076 31956 1400024 0 0 19312 564 2681 3327 7 4 43 46 0
0 1 0 478708 31964 1417948 0 0 20368 24 3057 3301 8 4 43 46 0
0 1 0 400960 31964 1452688 0 0 19840 0 2213 3278 7 3 44 47 0
0 1 0 364868 31964 1468268 0 0 19840 24648 3053 3500 7 4 40 50 0
0 2 0 324640 31976 1488112 0 0 4544 43656 1079 1688 2 2 14 83 0
0 1 0 286768 32116 1505272 0 0 19840 760 3412 3877 7 5 25 64 0
0 1 0 248916 32132 1520528 0 0 19840 36 4065 5746 13 4 43 41 0
0 1 0 127684 30816 1523336 0 0 24064 28 2960 3367 31 5 33 30 0
0 2 0 118504 7912 1451700 0 0 7760 85816 1290 1439 7 2 11 80 0
1 1 0 103628 7912 1462920 0 0 10292 48940 1381 1544 12 2 6 80 0
4 0 0 118168 4796 1351416 0 0 45280 36 4926 5351 56 9 28 7 0 ###三、故障解决
由于当前服务器内存较小,也没有配置交换分区,因此考虑为其添加交换分区。
再次导出观察内存的使用情况。 procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 1 0 840868 7156 1202532 0 0 19840 0 2890 3263 8 4 42 46 0
0 1 0 796156 7156 1220716 0 0 19840 0 2420 3354 8 4 42 46 0
...............................................
0 0 0 140568 2704 1436180 0 0 41776 72 3076 2674 42 6 34 18 0
2 0 40 150880 2460 1381652 0 40 44468 24708 3669 4236 42 7 50 2 0
2 0 132 141280 2448 1355680 0 92 37668 24716 4748 5562 68 6 22 4 0
1 1 196 105804 2296 1283964 0 0 20992 8720 4494 5943 34 5 14 47 0
1 0 252 146424 2204 1220072 0 56 26596 844 5927 7514 51 7 22 19 0
2 0 468 148704 2076 1177068 0 216 41748 584 4132 4234 61 7 25 8 0
......................可以看到swpd的值不断的增加,si的值也不断增加............
0 1 2656 140876 544 888484 0 444 26844 19424 2286 2654 12 5 22 62 0
0 1 2836 149376 468 828172 0 180 53712 220 2499 2212 25 7 48 20 0
0 1 3312 149976 568 781156 0 476 46224 29220 3385 3351 22 8 38 32 0
0 1 3696 150440 692 743464 0 384 37484 62616 3310 3924 17 7 34 42 0
0 0 4188 150300 688 699140 0 492 44896 33304 3010 3352 21 8 41 31 0
0 0 4576 142428 660 653872 0 388 55204 58748 2487 2050 26 8 49 17 0 --查看交换分区使用情况
# cat /proc/meminfo|grep -i swap
SwapCached: 375664 kB -- Author : Leshami
SwapTotal: 4194300 kB -- Blog : https://blog.csdn.net/leshami
SwapFree: 2624524 kB
--至此故障解决。

四、几个参数描述

connect_timeout
  连接响应超时时间。服务器端在这个时间内如未连接成功,则会返回连接失败。

wait_timeout
  连接空闲超时时间。与服务器端无交互状态的连接,直到被服务器端强制关闭而等待的时间。
  可以认为是服务器端连接空闲的时间,空闲超过这个时间将自动关闭。

interactive_timeout
  连接空闲超时时间。与服务器端无交互状态的连接,直到被服务器端强制关闭而等待的时间。

interactive_timeout和wait_timeoutu两者差异

  interactive_timeout针对交互式连接(比如通过mysql客户端连接数据库),
  wait_timeout针对非交互式连接(比如一般在PHP中使用PDO连接数据库,当然你可以设置CLIENT_INTERACTIVE选项来改变)。
  所谓的交互式连接,即在mysql_real_connect()函数中使用了CLIENT_INTERACTIVE选项。

net_read_timeout
  数据读取超时时间。在终止读之前,从一个连接获得数据而等待的时间秒数;
  当服务正在从客户端读取数据时,net_read_timeout控制何时超时。
  即客户端执行数据读取,等待多少秒仍未执行成功时自动断开连接。

net_write_timeout
  数据库写超时时间。和net_read_timeout意义类似,在终止写之前,等待多少秒把block写到连接;
  当服务正在写数据到客户端时,net_write_timeout控制何时超时。

slave-net-timeout
  从库延后同步的时间,当slave认为连接master的连接有问题时,就等待N秒,然后断开连接,
  重新连接masterslave-net-timeout在主从同步时从库上起作用;

connect_timeout:在获取连接阶段起作用;
interactive_timeout和wait_timeout:在连接空闲阶段起作用;
net_read_timeout和net_write_timeout:则是在连接执行时起作用。

max_allowed_packet 
  一个数据包或任何生成/中间字符串的最大大小,设置过小时发出“信息包过大”错误,并关闭连接

mysqldump: Error 2013的更多相关文章

  1. mysqldump导出报错"mysqldump: Error 2013: Lost connection to MySQL server during query when dumping table `file_storage` at row: 29"

    今天mysql备份的crontab自动运行的时候,出现了报警,报警内容如下 mysqldump: Error 2013: Lost connection to MySQL server during ...

  2. mysqldump: Error: Binlogging on server not active

    在学习使用mysqldump时,使用mysqldump备份时,遇到了下面两个错误: [root@DB-Server backup]# ./mysql_dump_back.sh Warning: Usi ...

  3. [笔记] MySql Workbench 导出表结构和数据报错 mysqldump: [ERROR] unknown variable 'delayed-insert=FALSE'

    下午使用MySql Workbench导出数据库表结构,设置完导出选项后执行导出,报如下错误: :: Dumping nacweixindb (tb_app) Running: mysqldump.e ...

  4. MySQL5.1升级5.6后,执行grant出错:ERROR 2013 (HY000): Lost connection to MySQL server during query【转载】

    转载: MySQL5.5升级5.6后,执行grant出错:ERROR 2013 (HY000): Lost connection to -mysql教程-数据库-壹聚教程网http://www.111 ...

  5. mysql备份数据库出错mysqldump: [ERROR] unknown option '--no-beep'

    公司数据库前一版本是部署在windows上面的,由于业务需要,迁移到linux,之前一段脚本在windows下使用定时任务执行正常. mysqldump -uzzz -pxxxx --opt --de ...

  6. [奇葩问题] ERROR 2013 (HY000): Lost connection to MySQL server during query

    查询一条耗时30s以上语句,实际为2分钟多. mysql> select version(); +------------+ | version() | +------------+ | 5.6 ...

  7. ERROR 2013 (HY000): Lost connection to MySQL server at 'reading authorization packet', system error: 0

    最近遇到一个MySQL连接的问题,远程连接MySQL时遇到"ERROR 2013 (HY000): Lost connection to MySQL server at 'reading a ...

  8. mysql登陆时出现ERROR 2013 (HY000): Lost connection to MySQL server at 'reading initial communication packet', system error: 0

    有4到5天没开mysql,这天晚上打=打开phpstudy,想进去mysql练习练习,结果丢给我这个 ERROR 2013 (HY000): Lost connection to MySQL serv ...

  9. 问题MySQL Error (2013): Lost connection to MySQL server at waiting for initial communication packet

    错误说明: SQL Error (2013): Lost connection to MySQL server at 'waiting for initial communication packet ...

随机推荐

  1. php 冒泡排序的两种思路以及优化

    php冒泡排序,两种思路,时间复杂度都是O(n^2),当然最优的时间复杂度就是O(n),以下说的都是正序排列(倒序的话,把内层循环的大于号换成小于号就好了) 第一种冒泡排序 思路就是把第一个数跟所有的 ...

  2. 【nginx笔记】系统参数设置-使Nginx支持更多并发请求的TCP网络参数

    首先,需要修改/etc/sysctl.conf来更改内核参数.例如,最常用的配置: fs.file-max = 999999 net.ipv4.tcp_tw_reuse = 1 net.ipv4.tc ...

  3. UIView动画上

    主要参考:http://blog.csdn.net/huifeidexin_1/article/details/7597868  http://www.2cto.com/kf/201409/33566 ...

  4. .Net Core MVC实现自己的AllowAnonymous

    全局过滤,在Startup中ConfigureServices里面添加如下代码 services.AddMvc(options => { options.Filters.Add(typeof(M ...

  5. 30分钟搞定后台登录界面(103个后台PSD源文件、素材网站)

    去年八月时要做一个OA系统为了后台界面而烦恼,后来写了一篇博客(<后台管理UI的选择>)介绍了选择过程与常用后台UI,令我想不到的时竟然有许多开发者与我一样都为这个事情而花费不少时间,最后 ...

  6. 关于ASPxComboBox通过ClientInstanceName,js获取不到控件的问题

    今天突然遇到一个很奇葩的问题 ASPxComboBox中设置了ClientInstanceName.但是通过cmbOrganization.GetValue()获取不到值. 报错cmbOrganiza ...

  7. .netcore使用vscode多项目调试

    开发环境:windows    编辑器: Visual Studio Code 环境安装: .Net Core 1.1 SDK     https://www.microsoft.com/net/co ...

  8. 安装Mysql报错**此用户已存在!**

    我是安装了两个installer下载器,将其中一个删除运行另一个就会报这个错. 解决办法:将删除的那个installer从回收站还原.

  9. Flask 中路由系统

    1. @app.route() 装饰器中的参数 methods : 当前 url 地址,允许访问的请求方式 @app.route("/info", methods=["G ...

  10. CSS计数器(序列数字字符自动递增)详解———张鑫旭

    by zhangxinxu from http://www.zhangxinxu.com本文地址:http://www.zhangxinxu.com/wordpress/?p=4303 一.挖坟不可耻 ...