PHP/MYSQL 查询大数据/遍历表

PHP：PHP 5.3.6 (cli) (built: Jun 15 2011 16:29:50)

　　MYSQL：5.1.51

　　如果我们有的一张表有几百万或几千万的记录，我们要使用 PHP 将所有的记录都获取过来(遍历数据表)进行处理。查询语句：

　　SELECT * FROM largetable;

　　PS：为了证明上面的做法是最佳的办法，我尝试使用 largetable 中的一个字段做 where ，以及 LIMIT，OFFSET 。上面那种 WHERE 获得结果很慢，虽然用了索引。后面这种 LIMIT 可以让你有一种想死的感觉(有兴趣可以了解下，《分页优化》)。

　　以 MYSQL 以及PDO_MYSQL 为例，尝试直接使用以下代码，必然会出现超内存的情况：

$result = mysql_query($sql);

　　while ($rowset = mysql_fetch_assoc($mysql)) {

　　...

　　$stmt = $dbh->prepare($sql);

　　$stmt->execute();

　　while ($row = $stmt->fetch(PDO::FETCH_ASSOC, PDO::FETCH_ORI_NEXT)) {

　　...

　　原因在于在查询执行后，PHP 的MYSQL、PDO_MYSQL 将查询结果全部缓存到了客户端，也就是 PHP 执行所在机器上。这样如果我们要 SELECT * FROM LARGETABLE 查询的记录在百万以上的时候，缓存的结果就会非常大，超出 PHP 使用内存。所以为了避免这样情况就需要关闭客户端的缓存。

　　这里提供二个测试脚本，分别为 MYSQL、PDO_MYSQL 关闭缓存后查询样例。点击下载：mysql_query

　　以下是 PDO_MYSQL 在查询 ~100W 以及 ~200W (540M)数据结果(因为我的 PHP 内存使用设置了1G所以没挂：) )

　　可以很明显的看出在缓存结果后占用内存惊人…，当我们处理千万数据的时候必挂。

以下是 PDO_MYSQL 关闭缓存查询 ~200W 的数据结果。这下处理千万以及E级的数据的时候，对内存表示很淡定。

PS：如果你要处理的数据就几十万，你还是调大点内存好了。比如 MYSQL：

　　mysql_unbuffered_query() 的好处是有代价的：在 mysql_unbuffered_query() 返回的结果集之上不能使用 mysql_num_rows() 和 mysql_data_seek()。此外在向 MySQL 发送一条新的 SQL 查询之前，必须提取掉所有未缓存的 SQL 查询所产生的结果行。

PHP/MYSQL 查询大数据/遍历表的更多相关文章

mysql处理大数据量的查询速度究竟有多快和能优化到什么程度
mysql处理大数据量的查询速度究竟有多快和能优化到什么程度深圳-ftx(1433725026) 18:10:49 mysql有没有排名函数啊横瓜(601069289) 18:13:06 无 ...
mysql的大数据量的查询
mysql的大数据量查询分页应该用where 条件进行分页,limit 100000,100,mysql先查询100100数据量,查询完以后,将这些100000数据量屏蔽去掉,用100的量,但是如果 ...
MySQL查询关键数据方法
MySQL查询关键数据方法操作表的SQL语句补充 1.修改表名 alter table 表名 reame 新表名: 2.新增字段名 alter table 表名 add 字段名字段类型(数字) 约 ...
WinForm查询大数据界面假死,使用异步调用解决
用DataGridView无分页绑定一个几千条数据的查询,查询的时候界面直接卡死十几秒,用户体验非常不好,因此用异步操作解决界面卡死的问题原本场景:点击[查询]后,界面直接卡死优化场景:点击[查询]后 ...
在HDInsight中从Hadoop的兼容BLOB存储查询大数据的分析
在HDInsight中从Hadoop的兼容BLOB存储查询大数据的分析低成本的Blob存储是一个强大的.通用的Hadoop兼容Azure存储解决方式无缝集成HDInsight.通过Hadoop分布式 ...
MySql查询分页数据
MySql查询分页数据
MySQL分页查询大数据量优化方法
方法1: 直接使用数据库提供的SQL语句语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N适应场景: 适用于数据量较少的情况(元组百/千级)原因/缺点: ...
mysql优化----大数据下的分页，延迟关联，索引与排序的关系，重复索引与冗余索引，索引碎片与维护
理想的索引,高效的索引建立考虑: :查询频繁度(哪几个字段经常查询就加上索引) :区分度要高 :索引长度要小 : 索引尽量能覆盖常用查询字段(如果把所有的列都加上索引,那么索引就会变得很大) : 索引 ...
[转] MySql 优化大数据优化
一.我们可以且应该优化什么? 硬件操作系统/软件库 SQL服务器(设置和查询) 应用编程接口(API) 应用程序 ------------------------------------------ ...

随机推荐

Java Abstract class and Interface
Abstract Class 在定义class的时候必须有abstract 关键字抽象方法必须有abstract关键字. 可以有已经实现的方法. 可以定义static final 的常量. 可以实现 ...
FileCopy
/*[入]指的是到内存里,[出]指的是到内存外*/ import java.io.*; public class MyReadFile{ public static void main(String[ ...
poj1266Cover an Arc（三角形外接圆）
链接求出三角形的外接圆,通过圆心和半径可以知道这个圆的上下左右最远点,分别判断这个四个点跟弧的两端点A,B的关系,假如判断P点,弧内给出点为C,判断PC是否与AB相交即可判断出P是否在弧上. 精度问 ...
mysql 大数据量求平均值
需求是:对于一个设备,求一天内每个小时的平均值,一个月内每天的平均值,更通用的需求是,从起始时间到结束时间,每隔一段时间,求一个平均值.目前的解决策略是:在存储过程中进行处理,从起始时间到结束时间,切 ...
VIM跳到指定行
ngg nG :n n is the line number
[mysql]支持emoji（字符集问题）！
问题的根源主要问题就是在字符集,一般解决这种问题都是靠试验.我实验了一通,得出的结论和大家分享一下(如有错误,还望指正): 数据库的字符集数据库连接的字符集配置方法设置数据库的字符集为utf8 ...
SVN标准目录结构
Trunk 这是SVN目录的主分支,表示日常开发中的项目,任何时候Trunk里包含的都是最新的开发代码. 这里的代码将会工作到你的下一个主要发布版本. Trunk应该只被用来开发将会成为你的下一个重要 ...
在Maven中设置Nexus私有服务为中央工厂（repository）
原文:http://blog.csdn.net/mexican_jacky/article/details/50275695 nexus中的仓库列表第一种方式: <repositories&g ...
D3.js 第一个程序 HelloWorld
一.HTML 是怎么输出 HelloWorld 的 <html> <head> <meta charset="utf-8"> <title ...
jquery获得option的值和对option进行操作作者：字体：[增加减小] 类型：转载时间：2013-12-13 我要评论
jquery获得option的值和对option进行操作作者: 字体:[增加减小] 类型:转载时间:2013-12-13我要评论本文为大家介绍下jquery获得option的值和对option ...

PHP/MYSQL 查询大数据/遍历表

PHP/MYSQL 查询大数据/遍历表的更多相关文章

随机推荐

热门专题