在并行系统中并发问题永远不可忽视。尽管PHP语言原生没有提供多线程机制,那并不意味着所有的操作都是线程安全的。尤其是在操作诸如订单、支付等业务系统中,更需要注意操作数据库的并发问题。

接下来我通过一个案例分析一下PHP操作数据库时并发问题的处理问题。

首先,我们有这样一张数据表:

 mysql> select * from counter;
+----+-----+
| id | num |
+----+-----+
|  1 | 0 |
+----+-----+
1 row in set (0.00 sec)

这段代码模拟了一次业务操作:

 <?php
function dummy_business() {
$conn = mysqli_connect('127.0.0.1', 'public', 'public') or die(mysqli_error());
mysqli_select_db($conn, 'test');
for ($i = 0; $i < 10000; $i++) {
mysqli_query($conn, 'UPDATE counter SET num = num + 1 WHERE id = 1');
}
mysqli_close($conn);
} for ($i = 0; $i < 10; $i++) {
$pid = pcntl_fork(); if($pid == -1) {
die('can not fork.');
} elseif (!$pid) {
dummy_business();
echo 'quit'.$i.PHP_EOL;
break;
}
}
?>

上面的代码模拟了10个用户同时并发执行一项业务的情况,每次业务操作都会使得num的值增加1,每个用户都会执行10000次操作,最终num的值应当是100000。

运行这段代码,num的值和我们预期的值是一样的:

 mysql> select * from counter;
+----+--------+
| id | num  |
+----+--------+
|  1 | 100000 |
+----+--------+
1 row in set (0.00 sec)

这里不会出现问题,是因为单条UPDATE语句操作是原子的,无论怎么执行,num的值最终都会是100000。

然而很多情况下,我们业务过程中执行的逻辑,通常是先查询再执行,并不像上面的自增那样简单:

 <?php
function dummy_business() {
$conn = mysqli_connect('127.0.0.1', 'public', 'public') or die(mysqli_error());
mysqli_select_db($conn, 'test');
for ($i = 0; $i < 10000; $i++) {
$rs = mysqli_query($conn, 'SELECT num FROM counter WHERE id = 1');
mysqli_free_result($rs);
$row = mysqli_fetch_array($rs);
$num = $row[0];
mysqli_query($conn, 'UPDATE counter SET num = '.$num.' + 1 WHERE id = 1');
}
mysqli_close($conn);
} for ($i = 0; $i < 10; $i++) {
$pid = pcntl_fork(); if($pid == -1) {
die('can not fork.');
} elseif (!$pid) {
dummy_business();
echo 'quit'.$i.PHP_EOL;
break;
}
}
?>

改过的脚本,将原来的原子操作UPDATE换成了先查询再更新,再次运行我们发现,由于并发的缘故程序并没有按我们期望的执行:

 mysql> select * from counter;
+----+------+
| id | num  |
+----+------+
|  1 | 21495|
+----+------+
1 row in set (0.00 sec)

程序员特别容易犯的错误是,认为这是没开启事务引起的。现在我们给它加上事务:

 <?php
function dummy_business() {
$conn = mysqli_connect('127.0.0.1', 'public', 'public') or die(mysqli_error());
mysqli_select_db($conn, 'test');
for ($i = 0; $i < 10000; $i++) {
mysqli_query($conn, 'BEGIN');
$rs = mysqli_query($conn, 'SELECT num FROM counter WHERE id = 1');
mysqli_free_result($rs);
$row = mysqli_fetch_array($rs);
$num = $row[0];
mysqli_query($conn, 'UPDATE counter SET num = '.$num.' + 1 WHERE id = 1');
if(mysqli_errno($conn)) {
mysqli_query($conn, 'ROLLBACK');
} else {
mysqli_query($conn, 'COMMIT');
}
}
mysqli_close($conn);
} for ($i = 0; $i < 10; $i++) {
$pid = pcntl_fork(); if($pid == -1) {
die('can not fork.');
} elseif (!$pid) {
dummy_business();
echo 'quit'.$i.PHP_EOL;
break;
}
}
?>

依然没能解决问题:

 mysql> select * from counter;
+----+------+
| id | num  |
+----+------+
|  1 | 16328|
+----+------+
1 row in set (0.00 sec)

请注意,数据库事务依照不同的事务隔离级别来保证事务的ACID特性,也就是说事务不是一开启就能解决所有并发问题。通常情况下,这里的并发操作可能带来四种问题:

  • 更新丢失:一个事务的更新覆盖了另一个事务的更新,这里出现的就是丢失更新的问题。
  • 脏读:一个事务读取了另一个事务未提交的数据。
  • 不可重复读:一个事务两次读取同一个数据,两次读取的数据不一致。
  • 幻象读:一个事务两次读取一个范围的记录,两次读取的记录数不一致。

通常数据库有四种不同的事务隔离级别:

隔离级别 脏读 不可重复读 幻读
Read uncommitted
Read committed ×
Repeatable read × ×
Serializable × × ×

大多数数据库的默认的事务隔离级别是提交读(Read committed),而MySQL的事务隔离级别是重复读(Repeatable read)。对于丢失更新,只有在序列化(Serializable)级别才可得到彻底解决。不过对于高性能系统而言,使用序列化级别的事务隔离,可能引起死锁或者性能的急剧下降。因此使用悲观锁和乐观锁十分必要。

并发系统中,悲观锁(Pessimistic Locking)和乐观锁(Optimistic Locking)是两种常用的锁:

  • 悲观锁认为,别人访问正在改变的数据的概率是很高的,因此从数据开始更改时就将数据锁住,直到更改完成才释放。悲观锁通常由数据库实现(使用SELECT…FOR UPDATE语句)。
  • 乐观锁认为,别人访问正在改变的数据的概率是很低的,因此直到修改完成准备提交所做的的修改到数据库的时候才会将数据锁住,完成更改后释放。

上面的例子,我们用悲观锁来实现:

 <?php
function dummy_business() {
$conn = mysqli_connect('127.0.0.1', 'public', 'public') or die(mysqli_error());
mysqli_select_db($conn, 'test');
for ($i = 0; $i < 10000; $i++) {
mysqli_query($conn, 'BEGIN');
$rs = mysqli_query($conn, 'SELECT num FROM counter WHERE id = 1 FOR UPDATE');
if($rs == false || mysqli_errno($conn)) {
// 回滚事务
mysqli_query($conn, 'ROLLBACK');
// 重新执行本次操作
$i--;
continue;
}
mysqli_free_result($rs);
$row = mysqli_fetch_array($rs);
$num = $row[0];
mysqli_query($conn, 'UPDATE counter SET num = '.$num.' + 1 WHERE id = 1');
if(mysqli_errno($conn)) {
mysqli_query($conn, 'ROLLBACK');
} else {
mysqli_query($conn, 'COMMIT');
}
}
mysqli_close($conn);
} for ($i = 0; $i < 10; $i++) {
$pid = pcntl_fork(); if($pid == -1) {
die('can not fork.');
} elseif (!$pid) {
dummy_business();
echo 'quit'.$i.PHP_EOL;
break;
}
}
?>

可以看到,这次业务以期望的方式正确执行了:

 mysql> select * from counter;
+----+--------+
| id | num  |
+----+--------+
|  1 | 100000 |
+----+--------+
1 row in set (0.00 sec)

由于悲观锁在开始读取时即开始锁定,因此在并发访问较大的情况下性能会变差。对MySQL Inodb来说,通过指定明确主键方式查找数据会单行锁定,而查询范围操作或者非主键操作将会锁表。

接下来,我们看一下如何使用乐观锁解决这个问题,首先我们为counter表增加一列字段:

 mysql> select * from counter;
+----+------+---------+
| id | num | version |
+----+------+---------+
| 1 | 1000 | 1000 |
+----+------+---------+
1 row in set (0.01 sec)

实现方式如下:

 <?php
function dummy_business() {
$conn = mysqli_connect('127.0.0.1', 'public', 'public') or die(mysqli_error());
mysqli_select_db($conn, 'test');
for ($i = 0; $i < 10000; $i++) {
mysqli_query($conn, 'BEGIN');
$rs = mysqli_query($conn, 'SELECT num, version FROM counter WHERE id = 1');
mysqli_free_result($rs);
$row = mysqli_fetch_array($rs);
$num = $row[0];
$version = $row[1];
mysqli_query($conn, 'UPDATE counter SET num = '.$num.' + 1, version = version + 1 WHERE id = 1 AND version = '.$version);
$affectRow = mysqli_affected_rows($conn);
if($affectRow == 0 || mysqli_errno($conn)) {
// 回滚事务重新提交
mysqli_query($conn, 'ROLLBACK');
$i--;
continue;
} else {
mysqli_query($conn, 'COMMIT');
}
}
mysqli_close($conn);
} for ($i = 0; $i < 10; $i++) {
$pid = pcntl_fork(); if($pid == -1) {
die('can not fork.');
} elseif (!$pid) {
dummy_business();
echo 'quit'.$i.PHP_EOL;
break;
}
}
?>

这次,我们也得到了期望的结果:

 mysql> select * from counter;
+----+--------+---------+
| id | num | version |
+----+--------+---------+
| 1 | 100000 | 100000 |
+----+--------+---------+
1 row in set (0.01 sec)

由于乐观锁最终执行的方式相当于原子化UPDATE,因此在性能上要比悲观锁好很多。

在使用Doctrine ORM框架的环境中,Doctrine原生提供了对悲观锁和乐观锁的支持。具体的使用方式请参考手册:
http://docs.doctrine-project.org/projects/doctrine-orm/en/latest/reference/transactions-and-concurrency.html#locking-supportHibernate框架中同样提供了对两种锁的支持,在此不再赘述了。

在高性能系统中处理并发问题,受限于后端数据库,无论何种方式加锁性能都无法高效处理如电商秒杀抢购量级的业务。使用NoSQL数据库、消息队列等方式才能更有效地完成业务的处理。

参考文章

PHP使用数据库的并发问题的更多相关文章

  1. PHP使用数据库的并发问题(转)

    在并行系统中并发问题永远不可忽视.尽管PHP语言原生没有提供多线程机制,那并不意味着所有的操作都是线程安全的.尤其是在操作诸如订单.支付等业务系统中,更需要注意操作数据库的并发问题. 接下来我通过一个 ...

  2. 【巨杉数据库SequoiaDB】巨杉Tech | 巨杉数据库的并发 malloc 实现

    本文由巨杉数据库北美实验室资深数据库架构师撰写,主要介绍巨杉数据库的并发malloc实现与架构设计.原文为英文撰写,我们提供了中文译本在英文之后. SequoiaDB Concurrent mallo ...

  3. MySQL数据库高并发优化配置

    在Apache, PHP, mysql的体系架构中,MySQL对于性能的影响最大,也是关键的核心部分.对于Discuz!论坛程序也是如此,MySQL的设置是否合理优化,直接 影响到论坛的速度和承载量! ...

  4. hibernate5学习之理解数据库级并发

    本文作者:苏生米沿 本文地址:http://blog.csdn.net/sushengmiyan/article/details/50551741 当我们谈起隔离的时候,我们总是假定两个物体直接要么隔 ...

  5. mysql解决数据库高并发

    分表分库 数据库索引 redis缓存数据库 读写分离 负载均衡: 将大量的并发请求分担到多个处理节点,由于单个处理节点的故障不影响服务,负载均衡集群同事也实现了高可用性.

  6. spring学习笔记---数据库事务并发与锁详解

    多事务运行并发问题 在实际应用中,往往是一台(或多台)服务器向无数客户程序提供服务,当服务器查询数据库获取数据时,如果没有采用必要的隔离机制,可能会存在数据库事务的并发问题,下面是一些常见的并发问题分 ...

  7. 多事务运行并发问题spring学习笔记——数据库事务并发与锁详解

    多事务运行并发问题 在实际应用中,往往是一台(或多台)服务器向无数客户程序提供服务,当服务器查询数据库获取数据时,如果没有采用必要的隔离机制,可能会存在数据库事务的并发问题,下面是一些常见的并发问题分 ...

  8. 一段经典的node.js 数据库高并发实现

    var proxy = new EventProxy();var status = "ready";var select = function(callback){ proxy.o ...

  9. powershel连接数据库监控数据库状态并发报警邮件

    function Get-DatabaseData {    [CmdletBinding()]    param (        [string]$connectionString,        ...

随机推荐

  1. 172. Remove Element【LintCode by java】

    Description Given an array and a value, remove all occurrences of that value in place and return the ...

  2. DevOps架构下如何进行微服务性能测试?

    一. 微服务架构下的性能测试挑战 微服务与DevOps 微服务是实现DevOps的重要架构 微服务3S原则 DevOps核心点 微服务架构下的业务特点 亿级用户的平台 单服务业务随时扩容 服务之间存在 ...

  3. 了不起的Node.js--之二

    安装模块 使用NPM包管理器可以让你轻松对模块进行管理,它会下载指定的包.解决包的依赖.进行测试脚本及安装命令行脚本. 安装二进制工具包 有的项目分发的是Node编写的命令行工具.这个时候,安装时要增 ...

  4. PAT甲题题解-1028. List Sorting (25)-水排序

    #include <iostream> #include <cstdio> #include <algorithm> #include <string.h&g ...

  5. linux第十八章学习笔记

    第十八章 调试 内核级开发的调试工作远比用户级开发艰难,它带来的风险比用户级别更高. 一.准备开始 1. 准备工作需要: 一个bug 一个藏匿bug的内核版本 相关内核代码的知识和运气 2. 在用户级 ...

  6. 20135202闫佳歆--week7 可执行程序的装载--学习笔记

    此为个人学习笔记存档 week 7 可执行程序的装载 一.预处理.编译.链接和目标文件的格式 可执行文件的创建--预处理.编译和链接 cd Code vi hello.c gcc -E -o hell ...

  7. Linux内核分析作业三

    构造一个简单的Linux系统MenuOS 复习 计算机三大法宝 存储程序计算机 函数调用堆栈 中断 操作系统两把宝剑 中断上下文的切换 进程上下文的切换 一.Linux内核源代码简介 函数目录 Lin ...

  8. LINUX内核分析第二周学习总结——操作系统是如何工作的

    LINUX内核分析第二周学习总结——操作系统是如何工作的 张忻(原创作品转载请注明出处) <Linux内核分析>MOOC课程http://mooc.study.163.com/course ...

  9. C#Dictionary使用记录

    一.区别 在工作中经常遇到C#数组.ArrayList.List.Dictionary存取数据,其区别和优劣势为: 初始化 数组: int[] buff = new int[6]; ArrayList ...

  10. 在eclipse中编译调试ns3

    1首先把ns3项目导入eclipse 然后把上面的的ns3按照上面的提示即可导入成功.   然后可以运行一下 ./waf configure     2 配置C/C++ Build 右键工程,选择属性 ...