[mysql] 随机查询 效率比较
select
primary_count as primaryCount,
primary_score as primaryScore,
junior_count as juniorCount,
junior_score as juniorScore,
senior_count as seniorCount,
senoir_score as senoirScore,
total_score as totalScore,
pass_score as passScore
from pd_paper p
where p.is_valid = ''
order by RAND() limit 1 分析:
ORDER BY从句里面不能使用RAND()函数,因为这样会导致数据列被多次扫描。
测试发现这样效率非常低。一个15万余条的库,查询5条数据,要8秒以上。 You cannot use a column with RAND() values in an ORDER BY clause, because ORDER BY
would evaluate the column multiple times. 更高效的做法:查询max(id) * rand()来随机获取数据。 SELECT *
FROM `table` AS t1
JOIN (
SELECT ROUND(RAND()
* (SELECT MAX(id) FROM `table`)) AS id
) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id ASC LIMIT 5; 但是这样会产生连续的5条记录。解决办法只能是每次查询一条,查询5次。
即便如此也值得,因为15万条的表,查询只需要0.01秒不到。
采用join 语法 可以实现真正的随机。 SELECT *
FROM `table`
WHERE id >= (SELECT FLOOR( MAX(id) * RAND()) FROM `table` )
ORDER BY id LIMIT 1; 把语句完善一下,加上MIN(id)的判断。
如果没有加上MIN(id)的判断,结果有一半的时间总是查询到表中的前面几行。
完整的语句: ① where 子句 SELECT * FROM `table`
WHERE id >= (SELECT floor( RAND() * ((SELECT MAX(id) FROM `table`)-
(SELECT MIN(id) FROM `table`)) + (SELECT MIN(id) FROM `table`)))
ORDER BY id LIMIT 1; ② join SELECT *
FROM `table` AS t1
JOIN (
SELECT ROUND(RAND()
* ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`))
+(SELECT MIN(id) FROM `table`)) AS id) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id LIMIT 1; #随机查询一套考卷定义
SELECT
p.primary_count as primaryCount,
p.primary_score as primaryScore,
p.junior_count as juniorCount,
p.junior_score as juniorScore,
p.senior_count as seniorCount,
p.senoir_score as senoirScore,
p.total_score as totalScore,
p.pass_score as passScore FROM
pd_paper AS p
JOIN
(
SELECT ROUND(
RAND()
*((SELECT MAX(id) FROM pd_paper)-(SELECT MIN(id) FROM pd_paper))
+(SELECT MIN(id) FROM pd_paper)
) AS id
)
AS p2
WHERE p.id >= p2.id
ORDER BY p.id LIMIT 1; 最后在程序对这两个语句进行分别查询10次,
前者花费时间 0.147433 秒
后者花费时间 0.015130 秒
看来采用JOIN的语法比直接在WHERE中使用函数效率还要高很多。 附加一个复杂sql:按题目类型(三种)随机查询全部考题信息 SELECT * from (
select
p.id as id,
p.title as title,
p.question as question,
p.answer as answer,
p.crt_time as crtTime
from
pd_problem p
join
(SELECT ROUND(RAND()
* ((SELECT MAX(pp.id) FROM pd_problem pp)-(SELECT MIN(pp.id) FROM pd_problem pp))
+(SELECT MIN(pp.id) FROM pd_problem pp)) AS pid) AS p2
where p.id >= p2.pid
and p.is_valid = ''
and p.paper_type = ''
and p.paper_class = ''
order by p.id limit 5
) as t1
union all
SELECT * from (
select
p.id as id,
p.title as title,
p.question as question,
p.answer as answer,
p.crt_time as crtTime
from
pd_problem p
join
(SELECT ROUND(RAND()
* ((SELECT MAX(pp.id) FROM pd_problem pp)-(SELECT MIN(pp.id) FROM pd_problem pp))
+(SELECT MIN(pp.id) FROM pd_problem pp)) AS pid) AS p2
where p.id >= p2.pid
and p.is_valid = ''
and p.paper_type = ''
and p.paper_class = ''
order by p.id limit 5
) as t2
union all
SELECT * from (
select
p.id as id,
p.title as title,
p.question as question,
p.answer as answer,
p.crt_time as crtTime
from
pd_problem p
join
(SELECT ROUND(RAND()
* ((SELECT MAX(pp.id) FROM pd_problem pp)-(SELECT MIN(pp.id) FROM pd_problem pp))
+(SELECT MIN(pp.id) FROM pd_problem pp)) AS pid) AS p2
where p.id >= p2.pid
and p.is_valid = ''
and p.paper_type = ''
and p.paper_class = ''
order by p.id limit 5
) as t3
[mysql] 随机查询 效率比较的更多相关文章
- 分享:mysql 随机查询数据
在mysql中查询5条不重复的数据,使用以下: 1 SELECT * FROM `table` ORDER BY RAND() LIMIT 5 就可以了.但是真正测试一下才发现这样效率非常低.一个1 ...
- 提高MySQL数据库查询效率的几个技巧(转载)
[size=5][color=Red]提高MySQL数据库查询效率的几个技巧(转)[/color][/size] MySQL由于它本身的小巧和操作的高效, 在数据库应用中越来越多的被采用.我 ...
- 如何实现MySQL随机查询数据与MySQL随机更新数据?
以下的文章主要介绍的是MySQL随机选取数据,对实现MySQ随机查询数据与MySQ随机更新数据的实际操作步骤的描述,以及对其实际操作中所要用到的语句的描述,以下就是对其具体操作步骤的描述. MySQL ...
- mysql随机查询记录的高效率方法
mysql使用rand随机查询记录的高效率方法 一直以为mysql随机查询几条数据,就用 SELECT * FROM `table` ORDER BY RAND() LIMIT 5 就可以了. 但是真 ...
- mysql随机查询符合条件的几条记录
随机查询,方法可以有很多种.比如,查询出所有记录,然后随机从列表中取n条记录.使用程序便可实现.可是程序实现必须查询出所有符合条件的记录(至少是所有符合条件的记录id),然后再随机取出n个id,查询数 ...
- mysql 随机查询 记录集
有时候需求需要随机从数据库查询若干条记录集,网上搜了一下,几篇博文都是些重复的.....不知道他们谁抄的谁的,这里除了介绍提供一种笔者自己想到的方法,本质都是利用mysql 的rand() 第一种方法 ...
- 如何提高Mysql的查询效率???
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...
- Mysql 随机查询10条数据效率最快的查询方法
1)使用join 和 rand() 耗时 0.009 SELECT * FROM `t_topic` AS t1 JOIN ( SELECT ROUND( RAND() * ( (SELECT MAX ...
- mysql随机查询若干条数据
条不重复的数据,使用以下: 秒以上 搜索Google,网上基本上都是查询max(id) * rand()来随机获取数据. SELECT * FROM `table` AS t1 JOIN (SELE ...
随机推荐
- Android用shareUserID实现多个Activity显示在同一界面
近来整理文档,发现两年前研究Android多个Activity叠加显示的方案.时光荏苒,一去不回. 虽然后来没有用上,但还是整理如下,Android版本还是2.2的: ActivityGroup描画方 ...
- LevelDB场景分析1--整体结构分析
基本用法 数据结构 class DBImpl : public DB { private: struct CompactionState; struct Writer;// Infor ...
- Unix环境高级编程(六)进程控制
本章介绍Unix的进程控制,包括进程创建,执行程序和进程终止,进程的属性,exec函数系列,system函数,进程会计机制. 1.进程标识符 每一个进程都有一个非负整数标识的唯一进程ID.ID为0表示 ...
- Python count() 方法
描述 count() 方法用于统计字符串中某个子字符串出现的次数,可选参数为开始搜索与结束搜索的位置索引. 语法 count() 方法语法: S.count(sub[,start=0[,end=len ...
- [转]玩转UltraEdit,UE常见快捷键操作
编辑器Ultraedit快捷键说到编辑器的快捷键,VIM是无与伦比的.要反对,也得是带脚踏板的EmaCS.UE还是有差距的,很大差距.注意:VIM是开源.免费的,而UE则需要注册.UE是Windows ...
- 在 Windows 8 中启用可匿名访问的共享
就是不用输入用户名和密码,直接通过网上邻居可以访问的共享. 1.打开本地组策略编辑器(快捷键Win+R,打开运行,输入gpedit.msc,确定): 2.打开:"本地计算机策略->计算 ...
- Python学习笔记11:标准库之文件管理(os包,shutil包)
1 os包 os包包含各种各样的函数,以实现操作系统的很多功能.这个包很庞杂.os包的一些命令就是用于文件管理. 我们这里列出最经常使用的: mkdir(path) 创建新文件夹.path为一个字符串 ...
- windows环境下VS2008编译程序在有些电脑上执行不了的问题
近期遇到一种情况,在windows下.用vs2008编译程序,在本机(XP系统)能够执行,但放在别的系统上执行不了.这样的情况是因为执行库在别的系统上没有,或许能够安装执行库能解决问题.可是,这样似乎 ...
- Understanding The Linux Virtual Memory Manager
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.588.4660&rep=rep1&type=pdf http://e ...
- 如何做一个像btbook.net这样的搜片神器?
这几天btbook.net这个搜片神器网站火了, 让我这个无工作的人, 也想做一个出来, 不然时间不好打发, 本人的草稿站: fastbot.me (刚发布几个小时, 体验等几天再做) 现在说说这种搜 ...