面试突击 | Redis 如何从海量数据中查询出某一个 Key？附视频

1 考察知识点

本题考察的知识点有以下几个：

Keys 和 Scan 的区别
Keys 查询的缺点
Scan 如何使用？
Scan 查询的特点

2 解答思路

Keys 查询存在的问题
Scan 的使用
Scan 的特点

3 Keys 使用相关

1）Keys 用法如下

2）Keys 存在的问题

此命令没有分页功能，我们只能一次性查询出所有符合条件的 key 值，如果查询结果非常巨大，那么得到的输出信息也会非常多；
keys 命令是遍历查询，因此它的查询时间复杂度是 o(n)，所以数据量越大查询时间就越长。

4 Scan 使用相关

我们先来模拟海量数据，使用 Pipeline 添加 10w 条数据，Java 代码实现如下：

import redis.clients.jedis.Jedis;

import redis.clients.jedis.Pipeline;

import utils.JedisUtils;

public class ScanExample {

    public static void main(String[] args) {

        // 添加 10w 条数据

        initData();

    }

    public static void initData(){

        Jedis jedis = JedisUtils.getJedis();

        Pipeline pipe = jedis.pipelined();

        for (int i = 1; i < 100001; i++) {

            pipe.set("user_token_" + i, "id" + i);

        }

        // 执行命令

        pipe.sync();

        System.out.println("数据插入完成");

    }

}

我们来查询用户 id 为 9999* 的数据，Scan 命令使用如下：

127.0.0.1:6379> scan 0 match user_token_9999* count 10000

1) "127064"

2) 1) "user_token_99997"

127.0.0.1:6379> scan 127064 match user_token_9999* count 10000

1) "1740"

2) 1) "user_token_9999"

127.0.0.1:6379> scan 1740 match user_token_9999* count 10000

1) "21298"

2) 1) "user_token_99996"

127.0.0.1:6379> scan 21298 match user_token_9999* count 10000

1) "65382"

2) (empty list or set)

127.0.0.1:6379> scan 65382 match user_token_9999* count 10000

1) "78081"

2) 1) "user_token_99998"

   2) "user_token_99992"

127.0.0.1:6379> scan 78081 match user_token_9999* count 10000

1) "3993"

2) 1) "user_token_99994"

   2) "user_token_99993"

127.0.0.1:6379> scan 3993 match user_token_9999* count 10000

1) "13773"

2) 1) "user_token_99995"

127.0.0.1:6379> scan 13773 match user_token_9999* count 10000

1) "47923"

2) (empty list or set)

127.0.0.1:6379> scan 47923 match user_token_9999* count 10000

1) "59751"

2) 1) "user_token_99990"

   2) "user_token_99991"

   3) "user_token_99999"

127.0.0.1:6379> scan 59751 match user_token_9999* count 10000

1) "0"

2) (empty list or set)

从以上的执行结果，我们看出两个问题：

查询的结果为空，但游标值不为 0，表示遍历还没结束；
设置的是 count 10000，但每次返回的数量都不是 10000，且不固定，这是因为 count 只是限定服务器单次遍历的字典槽位数量 (约等于)，而不是规定返回结果的 count 值。

相关语法：scan cursor [MATCH pattern] [COUNT count]

其中：

cursor：光标位置，整数值，从 0 开始，到 0 结束，查询结果是空，但游标值不为 0，表示遍历还没结束；
match pattern：正则匹配字段；
count：限定服务器单次遍历的字典槽位数量 (约等于)，只是对增量式迭代命令的一种提示 (hint)，并不是查询结果返回的最大数量，它的默认值是 10。

5 Scan 代码实战

本文我们使用 Java 代码来实现 Scan 的查询功能，代码如下：

import redis.clients.jedis.Jedis;

import redis.clients.jedis.Pipeline;

import redis.clients.jedis.ScanParams;

import redis.clients.jedis.ScanResult;

import utils.JedisUtils;

public class ScanExample {

    public static void main(String[] args) {

        Jedis jedis = JedisUtils.getJedis();

        // 定义 match 和 count 参数

        ScanParams params = new ScanParams();

        params.count(10000);

        params.match("user_token_9999*");

        // 游标

        String cursor = "0";

        while (true) {

            ScanResult<String> res = jedis.scan(cursor, params);

            if (res.getCursor().equals("0")) {

                // 表示最后一条

                break;

            }

            cursor = res.getCursor(); // 设置游标

            for (String item : res.getResult()) {

                // 打印查询结果

                System.out.println("查询结果：" + item);

            }

        }

    }

}

以上程序执行结果如下：

查询结果：user_token_99997

查询结果：user_token_9999

查询结果：user_token_99996

查询结果：user_token_99998

查询结果：user_token_99992

查询结果：user_token_99994

查询结果：user_token_99993

查询结果：user_token_99995

查询结果：user_token_99990

查询结果：user_token_99991

查询结果：user_token_99999

6 总结

通过本文我们了解到，Redis 中如果要在海量的数据数据中，查询某个数据应该使用 Scan，Scan 具有以下特征：

Scan 可以实现 keys 的匹配功能；
Scan 是通过游标进行查询的不会导致 Redis 假死；
Scan 提供了 count 参数，可以规定遍历的数量；
Scan 会把游标返回给客户端，用户客户端继续遍历查询；
Scan 返回的结果可能会有重复数据，需要客户端去重；
单次返回空值且游标不为 0，说明遍历还没结束；
Scan 可以保证在开始检索之前，被删除的元素一定不会被查询出来；
在迭代过程中如果有元素被修改， Scan 不保证能查询出相关的元素。

7 视频版

视频版：https://www.bilibili.com/video/av88076985/

面试突击 | Redis 如何从海量数据中查询出某一个 Key？附视频的更多相关文章

Redis实战（20）Redis 如何从海量数据中查询出某一个 Key？
序言资料 https://www.cnblogs.com/vipstone/p/12373734.html
[翻译] C# 8.0 新特性 Redis基本使用及百亿数据量中的使用技巧分享（附视频地址及观看指南）【由浅至深】redis 实现发布订阅的几种方式 .NET Core开发者的福音之玩转Redis的又一傻瓜式神器推荐
[翻译] C# 8.0 新特性 2018-11-13 17:04 by Rwing, 1179 阅读, 24 评论, 收藏, 编辑原文: Building C# 8.0[译注:原文主标题如此,但内容 ...
海量数据中找出前k大数（topk问题）
海量数据中找出前k大数(topk问题) 前两天面试3面学长问我的这个问题(想说TEG的3个面试学长都是好和蔼,希望能完成最后一面,各方面原因造成我无比想去鹅场的心已经按捺不住了),这个问题还是建立最小 ...
从海量数据中寻找出topK的最优算法代码
package findMinNumIncludedTopN;/** * 小顶堆 * @author TongXueQiang * @date 2016/03/09 * @since JDK 1.8 ...
原创：从海量数据中查找出前k个最小或最大值的算法（java）
现在有这么一道题目:要求从多个的数据中查找出前K个最小或最大值分析:有多种方案可以实现.一.最容易想到的是先对数据快速排序,然后输出前k个数字. 二.先定义容量为k的数组,从源数据中取出前k个填 ...
Redis基本使用及百亿数据量中的使用技巧分享（附视频地址及观看指南）
作者:依乐祝原文地址:https://www.cnblogs.com/yilezhu/p/9941208.html 主讲人:大石头时间:2018-11-10 晚上20:00 地点:钉钉群(组织代码 ...
sql语句中查询出的数据添加一列，并且添加默认值
查询出数据,并且要添加一列表中都不存在的数据,且这一列的值都是相等的 select app_id,app_secret from wx_ticket group by app_id; 查询出的数据是 ...
ybatis中查询出多个以key,value的属性记录,封装成一个map返回的方法
可以采用值做映射,也可以不采用映射方式 <resultMap id="configMap" type="java.util.Map" > <r ...
Redis使用场景一，查询出的数据保存到Redis中，下次查询的时候直接从Redis中拿到数据。不用和数据库进行交互。
maven使用:  <dependency> <groupId>redis.clients</groupId> < ...

随机推荐

关于爬虫的日常复习（6）—— pyquery库
DirectX11 Windows Windows SDK--28 计算着色器：波浪(水波)
前言有关计算着色器的基础其实并不是很多.接下来继续讲解如何使用计算着色器实现水波效果,即龙书中所实现的水波.但是光看代码可是完全看不出来是在做什么的.个人根据书中所给的参考书籍找到了对应的实现原理, ...
如何在匿名thread子类中保证线程安全
在做性能测试的过程中,我写了两个虚拟类ThreadLimitTimeCount和ThreadLimitTimesCount做框架,通过对线程的标记来完成超时请求的记录.旧方法如下: @Override ...
java.lang.UnsupportedOperationException: Manual close is not allowed over a Spring managed SqlSession
java.lang.UnsupportedOperationException: Manual close is not allowed over a Spring managed SqlSessio ...
【java面试】集合类篇
java中主要的类集合接口如下 Collection ├List │├LinkedList │├ArrayList │└Vector │ └Stack └Set Map ├Hashtable ├Has ...
SSM前后端分离/不分离对比Demo
之前某些原因,整理了一个小的Demo,用于演示.个人认为在SSM前后端不分离的基础上在前端处理上比较麻烦一点之后就是注解的使用.总结一些对比,仅是自己掌握的,不够严谨,不足之处请大佬批评指正. 路由控 ...
ArcGIS10.2安装教程
1,首先要下载Arcgis 10.2软件,很大大约有2个多G.下载后分别全部解压. 2,首先,安装相应的LicenseManager,双击Arcgis 10.2打开安装界面,选择安装. 3,开始安装L ...
19_07_08校内训练[grid]
题意现有n*m的长方形网格,每个格子中写着一个数,并构成了[0,n*m)的排列.每次可以将一行循环平移x格,也可以将一列循环平移x格.给出初始状态,给出一个到达给定状态的方案.n*m<=100 ...
利用在线绘制3d几何图形工具分析投影变化
业余写了个在线绘制几何图形工具,工具链接如下: https://tinygltf.xyz/drawgeometry/ 通过脚本代码在可视化窗口添加对应的点,线段,成像平面推到投影后坐标的计算: 点A通 ...
Day8-Python3基础-Socket网络编程
目录: 1.Socket语法及相关 2.SocketServer实现多并发 Socket语法及相关 socket概念 socket本质上就是在2台网络互通的电脑之间,架设一个通道,两台电脑通过这个通道 ...