PHP+MySQL百万级数据插入的优化

插入分析

MySQL中插入一个记录需要的时间由下列因素组成，其中的数字表示大约比例：

连接：（3）
发送查询给服务器：（2）
分析查询：（2）
插入记录：（1x记录大小）
插入索引：（1x索引）
关闭：（1）

如果我们每插入一条都执行一个SQL语句，那么我们需要执行除了连接和关闭之外的所有步骤N次，这样是非常耗时的，优化的方式有一下几种：

在每个insert语句中写入多行，批量插入
将所有查询语句写入事务中
利用Load Data导入数据

每种方式执行的性能如下。

Innodb引擎

InnoDB 给 MySQL 提供了具有事务(commit)、回滚(rollback)和崩溃修复能力(crash recovery capabilities)的事务安全(transaction-safe (ACID compliant))型表。InnoDB 提供了行锁(locking on row level)以及外键约束(FOREIGN KEY constraints)。

InnoDB 的设计目标是处理大容量数据库系统，它的 CPU 利用率是其它基于磁盘的关系数据库引擎所不能比的。在技术上，InnoDB 是一套放在 MySQL 后台的完整数据库系统，InnoDB 在主内存中建立其专用的缓冲池用于高速缓冲数据和索引。

测试环境

Macbook Air 12mid apache2.2.26 php5.5.10 mysql5.6.16

总数100W条数据

插入完后数据库大小38.6MB（无索引），46.8（有索引）

无索引单条插入总耗时：229s 峰值内存：246KB
有索引单条插入总耗时：242s 峰值内存：246KB
无索引批量插入总耗时：10s 峰值内存：8643KB
有索引批量插入总耗时：16s 峰值内存：8643KB
无索引事务插入总耗时：78s 峰值内存：246KB
有索引事务插入总耗时：82s 峰值内存：246KB
无索引Load Data插入总耗时：12s 峰值内存：246KB
有索引Load Data插入总耗时：11s 峰值内存：246KB

MyIASM引擎

MyISAM 是MySQL缺省存贮引擎。设计简单，支持全文搜索。

测试环境

Macbook Air 12mid apache2.2.26 php5.5.10 mysql5.6.16

总数100W条数据

插入完后数据库大小19.1MB（无索引），38.6（有索引）

无索引单条插入总耗时：82s 峰值内存：246KB
有索引单条插入总耗时：86s 峰值内存：246KB
无索引批量插入总耗时：3s 峰值内存：8643KB
有索引批量插入总耗时：7s 峰值内存：8643KB
无索引Load Data插入总耗时：6s 峰值内存：246KB
有索引Load Data插入总耗时：8s 峰值内存：246KB

总结

我测试的数据量不是很大，不过可以大概了解这几种插入方式对于速度的影响，最快的必然是Load Data方式。这种方式相对比较麻烦，因为涉及到了写文件，但是可以兼顾内存和速度。

引用：http://www.codeceo.com/article/mysql-insert-compare.html

二、PHP+MySQL百万数据插入

第一种方法：使用insert into 插入，代码如下：

最后显示为：23:25:05 01:32:05 也就是花了2个小时多! 这是时间撸几把都行。。。

第二种方法：使用事务提交，批量插入数据库(每隔10W条提交下)

最后显示消耗的时间为：22:56:13 23:04:00 ，一共8分13秒，代码如下：

时间是一下缩短不少但还是有点长。

第三种方法：使用优化SQL语句：将SQL语句进行拼接，使用 insert into table () values (),(),(),()然后再一次性插入，如果字符串太长，

则需要配置下MYSQL，在mysql 命令行中运行：set global max_allowed_packet = 2*1024*1024*10;消耗时间为：11:24:06 11:24:11;

我擦插入200W条测试数据仅仅用了不到6秒钟!代码如下：

可能这里又会有人说数据不大 sql文件导出来也是小200M 5秒钟对一表格进行200万条数据速度已经不错了。

这个再跟大家说一个 TP框架了的 addall方法

速度也很快但是还不如原生。

着了说一下其中可能会遇到的问题比如试验时可能会出现PHP内存限制和mysql的SQL语句溢出甚至宕机

这里数几个方案

1、可以进行相关的配置php.ini my.ini 等

2、大家可以用队列进行分批处理

3、或者自己的一些方法

PHP+MySQL百万级数据插入的优化的更多相关文章

MYSQL百万级数据，如何优化
MYSQL百万级数据,如何优化首先,数据量大的时候,应尽量避免全表扫描,应考虑在 where 及 order by 涉及的列上建立索引,建索引可以大大加快数据的检索速度.但是,有些情况索引是 ...
(转载)MYSQL千万级数据量的优化方法积累
转载自:http://blog.sina.com.cn/s/blog_85ead02a0101csci.html MYSQL千万级数据量的优化方法积累 1.分库分表很明显,一个主表(也就是很重要的表 ...
Mysql百万级数据索引重新排序
参考https://blog.csdn.net/pengshuai007/article/details/86021689中思路解决自增id重排方式一 alter table `table_name ...
MySQL百万级数据分页查询及优化
方法1: 直接使用数据库提供的SQL语句语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N 适应场景: 适用于数据量较少的情况(元组百/千级) 原因/缺 ...
MySQL 百万级数据量分页查询方法及其优化
方法1: 直接使用数据库提供的SQL语句语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N 适应场景: 适用于数据量较少的情况(元组百/千级) 原因/缺 ...
（转载）mysql中百万级数据插入速度测试
(转载)http://www.111cn.net/database/mysql/42453.htm 100W的数据对于很多朋友来说算小菜了,但今天我就想到创建一个大量数据的测试环境,于是找了一下怎么插 ...
mysql百万级数据分页查询缓慢优化-实战
作为后端攻城狮,在接到分页list需求的时候,内心是这样的画面是这样的代码大概是这样的 select count(id) from … 查出总数 select * from …. li ...
MYSQL千万级数据量的优化方法积累
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...
Mysql百万级数据查询优化
1. 直接用limit start, count分页语句, 也是我程序中用的方法: select * from product limit start, count当起始页较小时,查询没有性能问题 ...

随机推荐

JSP（Java Server Pages，即：Java服务器页面
是一种跨平台的动态网页技术标准,由Sun Microsystems公司倡导.多家公司参与建立. 它在HTML文件中插入Java程序段(Scriptlet)和JSP标记(tag),从而形成JSP文件(* ...
Google Gson实现JSON字符串和对象之间相互转换
User实体类 package com.test.json; /** * User 实体类 */ public class User { private String name; private St ...
TP框架的修改，删除
先把数据库的素具显示出来 public function xiugai() { $code= "n001";//修改的主键值 $n = M("nation"); ...
EasyNVR无插件直播服务器软件使用详情功能-通道配置Excel
背景需求使用EasyNVR的用户都有知道,由于EasyNVR是将设备与EasyNVR的通道进行绑定的,因此EasyNVR是通过手动的通道配置来进行设备接入的,这样可以做到将设备的和通道对应的接入.但 ...
java Filter的简单使用
java web中的过滤器的简单使用.直接上代码.1.web.xml <?xml version="1.0" encoding="UTF-8"?> ...
Inno Step教程
最近为js页面做了几个activex控件(只能ie内核浏览器使用),最后要完成打包,之前一直使用winrar的自解压包实现,现在改用Inno Step来做. 工具使用还是比较简单的,语法使用Inno ...
python基础17 ---继承补充知识
一.继承的顺序 1.在python中的类可以集成多个类,既然是继承多个类就有类的寻找顺序这么一说.其寻找方法就有广度优先和深度优先两种. 2.当类是新式类,多继承的情况下会按照广度优先的顺序查找. 如 ...
interface -- 接口类
<?php /** *为了声明接口,需要使用关键字interface *interface IExampleInterface {} *说明(大多数开发人员选择在节后名称前加上大写字母I作为前缀 ...
每天一个Linux命令（16）which命令
which命令用于查找并显示给定命令的绝对路径. 环境变量PATH中保存了查找命令时需要遍历的目录.which指令会在环境变量$PATH设置的目录里查找符合条件的文件.也就是说,使用which命令,就 ...
Python 3 并发编程多进程之进程同步（锁）
Python 3 并发编程多进程之进程同步(锁) 进程之间数据不共享,但是共享同一套文件系统,所以访问同一个文件,或同一个打印终端,是没有问题的,竞争带来的结果就是错乱,如何控制,就是加锁处理. 1. ...

PHP+MySQL百万级数据插入的优化

PHP+MySQL百万级数据插入的优化的更多相关文章

随机推荐

热门专题