一个有趣的 SQL 查询

一个朋友有这样一个SQL查询需求：
有一个登录表(tmp_test)，包含用户ID(uid)和登录时间(login_time)。表结构如下：

*************************** 1. row ***************************

Field: uid

Type: int(10) unsigned

Null: NO

Key: MUL

Default: NULL

Extra:

*************************** 2. row ***************************

Field: login_time

Type: timestamp

Null: NO

Key: MUL

Default: 0000-00-00 00:00:00

Extra:

问如何查询出所有在某一段时间内（如：2012-1-1至2012-1-17)连续7天都有登录的用户。

在写这个SQL时，发现一些很有意思东西，也许对大家写SQL有帮助，因此记录一下。

- 基本思路 Loop Join
首先想到的思路是一个类似于Loop Join的方法：
A. 取出2012-1-1到2012-1-11的每一条记录.
B. 对取出的每一条记录，再去表中查询这个用户的接下来6天的记录。
如果总数为6条记录，则满足连续7天的条件

- Range Join
Loop Join的思路可以通过一个Join语句来实现。姑且称之为Range Join。通常join时，使用的都是
等值join. 如果join列的值是唯一的，那么就是左表的一条记录对应右表的一条记录。而Range Join
中，左表的一行数据对应右表的一个范围内的所有记录。

SQL 语句为：

SELECT DISTINCT t.uid FROM tmp_test AS t JOIN tmp_test AS t1

ON date(t.login_time) + 1 <= date(t1.login_time) AND

   date(t.login_time) + 7 > date(t1.login_time) AND

   t.uid = t1.uid

WHERE t.login_time BETWEEN ’2012-1-1 00:00:00′ AND ’2012-1-11 23:59:59′ AND

      t1.login_time >= ’2012-1-2′ AND t.login_time < ’2012-1-18′(可去掉）

- COUNT(DISTINCT)
“计算连续7天”,可以通过GROUP BY分组和COUNT()来完成。因为一个用户在1天内可能会有多次登录，
这里需要使用(COUNT DISTINCT）. SQL 语句为：

GROUP BY t.login_time, t.uid

HAVING COUNT(DISTINCT date(t1.login_time))=6

- BIT_OR
考虑到DISTINCT操作需要缓存数据，就想到了用bit逻辑运算（可能会效率高一些)。因为连续的七天
与第一天的差分别为，1,2,3,4,5,6,7.可以分别用1-7bit位来表示。根据这个特点，可以对分组中
的每一行进行或(|)运算.如果最后的值等于b’1111110′(6个1）.那么就是连续的7天。这个办法可以
避免DISTINC操作。没想到MySQL中真的有了bit操作的聚合函数。BIT_OR就是我们要用的。

SQL 语句为：

GROUP BY t.login_time, t.uid

  HAVING BIT_OR(1 << datediff(t1.login_time, t.login_time)) = b’1111110′;

- 去掉Range Join
虽说上面的思路实现了这个查询要求，但是由于使用了Range Join,效率并不好。在对uid建索引的情
况下，大约需要3.5s(总共约50000条记录). 有没有更好的方法呢？
受BIT_OR的启发，可以通过单表扫描，用bit位来记录每个用户2012-1-1至2012-1-17是否有登录。
然后根据这个值来判断是否有连续7天的情况。

我们需要一个辅助的函数来进行bit的运算：

DELIMITER |

  /* 判断一个Bit序列中，是否存在若干个连续的1 */

  /* 参数bits: bit序列*/

  /* 参数trait: 指定的若干连续的1.如b’111111‘ */

  CREATE FUNCTION bits_find_N1(bits BIGINT, trait BIGINT)

  RETURNS BOOL

  BEGIN

    WHILE bits <> 0 DO

      IF ((bits & trait) = trait) THEN

        RETURN TRUE;

      END IF;

      SET bits = bits >> 1;

    END WHILE;

    RETURN FALSE;

  END|

DELIMITER ;

SQL 语句为：

SELECT uid AS bit FROM tmp_test

  WHERE login_time BETWEEN ’2012-1-1 00:00:00′ AND ’2012-1-17 23:59:59′

  GROUP BY uid

  HAVING bits_find_N1(BIT_OR(1 << datediff(login_time, ’2012-1-1′)),

                             b’1111111′) IS TRUE;

这个语句效率还是比较好的，即使不对uid建索引，也只需约0.27s

- 超高效率的语句
下面是另一个朋友写的SQL，虽然有点复杂，但是效率超高，只需要约0.17s是这样的

SET @wy=0;

SELECT DISTINCT uid

FROM (SELECT MAX(date)-MIN(date) less,uid

      FROM (SELECT date-rn diff, uid, date, rn

            FROM (SELECT @wy:=@wy+1 rn, uid,

                         datediff(login_time,’1971-01-01′) date,login_time

                  FROM (SELECT date(login_time) login_time, uid FROM tmp_test

                        WHERE login_time>=’2012-01-01 00:00:00′ AND

                              login_time <’2012-01-18 00:00:00′

                        GROUP BY uid, date(login_time)

                        ORDER BY uid, date(login_time)

                       )x

                 )x

           )x

       GROUP BY diff,uid

      )x

WHERE less>=6;

http://www.oschina.net/question/28_41179?sort=default&p=1

SELECT DISTINCT t.USER_ID FROM T_SD_COMMENT AS t JOIN T_SD_COMMENT AS t1

ON date(t.CREATE_TIME) + 1 <= date(t1.CREATE_TIME) AND

   date(t.CREATE_TIME) + 7 > date(t1.CREATE_TIME) AND

   t.USER_ID = t1.USER_ID

GROUP BY t.CREATE_TIME, t.USER_ID

  HAVING( BIT_OR(1 << datediff(t1.CREATE_TIME, t.CREATE_TIME)) = b'' );

SELECT DISTINCT USER_ID

FROM (SELECT MAX(date) - MIN(date) AS less, USER_ID

    FROM (SELECT date - rn AS diff, USER_ID  , date, rn

        FROM (SELECT @wy := @wy + 1 AS rn, USER_ID, datediff(CREATE_TIME, '1971-01-01') AS date, CREATE_TIME

            FROM (SELECT date(CREATE_TIME) AS CREATE_TIME, USER_ID

                FROM T_SD_COMMENT, (SELECT @wy := 0

                    ) w

                GROUP BY USER_ID, date(CREATE_TIME)

                ORDER BY USER_ID, date(CREATE_TIME)

                ) x

            ) x

        ) x

    GROUP BY diff, USER_ID

    ) x

WHERE less >= 6

一个有趣的 SQL 查询(查询7天连续登陆)的更多相关文章

一个有趣的SQL Server 层级汇总数据问题
看SQL Server大V宋大侠的博客文章,发现了一个有趣的sql server层级汇总数据问题. 具体的问题如下: parent_id emp_id emp_nam ...
一个有趣的 SQL 查询
来源:站长资讯一个朋友有这样一个SQL查询需求: 有一个登录表(tmp_test),包含用户ID(uid)和登录时间(login_time).表结构如下: ********************* ...
分享一个绿色版本 sql server 查询器，
首先感谢原作者源码来原于网络此查询器增加了一些功能, 可以高亮显示导出sql 语句可以把左边树型拖入脚本编辑器 http://pan.baidu.com/s/1dDjaSbn
[转]一个用户SQL慢查询分析，原因及优化
来源:http://blog.rds.aliyun.com/2014/05/23/%E4%B8%80%E4%B8%AA%E7%94%A8%E6%88%B7sql%E6%85%A2%E6%9F%A5%E ...
怎样用SQL语句查询一个数据库中的所有表?
怎样用SQL语句查询一个数据库中的所有表? --读取库中的所有表名 select name from sysobjects where xtype='u'--读取指定表的所有列名select nam ...
怎么用sql语句查询一个数据库有多少张表
今天在技术群中闲谈时忽然聊到一个问题,那就是当一个数据库中有多张表时怎么快速的获取到表的个数,从而给问询者一个准确的回答. 大家或许会说,这个问题和我们的数据库操作没有太大关系或者不是很挂钩,所以没意 ...
SQL点滴10—使用with语句来写一个稍微复杂sql语句，附加和子查询的性能对比
原文:SQL点滴10-使用with语句来写一个稍微复杂sql语句,附加和子查询的性能对比今天偶尔看到sql中也有with关键字,好歹也写了几年的sql语句,居然第一次接触,无知啊.看了一位博主的文章 ...
MyBatis是一个支持普通SQL查询，存储过程和高级映射的优秀持久层框架
MyBatis是一个支持普通SQL查询,存储过程和高级映射的优秀持久层框架.MyBatis消除了几乎所有的JDBC代码和参数的手工设置以及对结果集的检索封装.MyBatis可以使用简单的XML或注解用 ...
Linq to SQL 语法查询(链接查询，子查询 & in操作 & join，分组统计等)
Linq to SQL 语法查询(链接查询,子查询 & in操作 & join,分组统计等) 子查询描述:查询订单数超过5的顾客信息查询句法: var 子查询 = from c i ...

随机推荐

win7安装office2007出错被中断-已经解决
觉得雨林木风win7系统本身的office2007不好,但不能卸载,用360强力删除工具,把整个安装的文件夹全部删除,重新用之前能够在另外xp和win7系统成功安装的破解版office2007,安装开 ...
1. 走进java
走进java 1.java简介 1.1 java分类: 1.2 开发包JDK 1.3.一处编译,到处运行的特点 2. 配置开发环境 3. java基本语法 3.1关键字和保留字 3.2 标识符命名规则 ...
解析XML文档之二：使用PULL解析
第一步:解析文档为一下文档 <?xml version="1.0" encoding="UTF-8"?> <students> < ...
Linux驱动编程--基于I2C子系统的I2C驱动的Makefile
ifeq ($(KERNELRELEASE),) KERNELDIR ?= /lib/modules/$(shell uname -r)/buildPWD := $(shell pwd) TEST = ...
FIR滤波器（1）- 基础知识
FIR滤波器广泛应用于数字信号处理中,主要功能就是将不感兴趣的信号滤除,留下有用信号.FIR滤波器是全零点结构,系统永远稳定:并且具有线性相位的特征,在有效频率范围内所有信号相位上不失真.在无线通信收 ...
Linux操作系统启动流程浅析
启动BIOS程序当电源键按下之后,BIOS(Basic nput Output System)就会由主板上的闪存来运行.BIOS程序会把自己解压缩到系统的内存之中,然后读取CMOS(Compleme ...
memcached/redis安全性
最近看到说redis,memcached服务器安全的问题,想想也是,使用这两种服务N年了,由于历史问题吧,工作中基本是以memcached为主,后来才慢慢引入运用redis.由于memcached是没 ...
devpress控件属性说明表
XtraEditors 库中所有控件的公共功能全部都可以绑定数据: 全部都可以独立使用或用于由 Developer Express 提供的容器控件(XtraGrid.XtraVerticalGrid ...
Markdown 使用说明
使用说明 ========= @[手册|帮助|Markdown] - **马克飞象**是一款专为印象笔记打造的Markdown编辑器. - 特别需要说明的一点是增加了`@(笔记本)[标签]`语法,以此 ...
Android 多国语言
参考android 开发文档, ISO 639-1 ISO 3166-1-alpha-2 关于中国的: 中国其他地区: https://en.wikipedia.org/wiki/ISO_3166 ...

一个有趣的 SQL 查询(查询7天连续登陆)

一个有趣的 SQL 查询

一个有趣的 SQL 查询(查询7天连续登陆)的更多相关文章

随机推荐

热门专题