【Redis的那些事 · 续集】Redis的位图、HyperLogLog数据结构演示以及布隆过滤器

一、Redis位图

1、位图的最小单位是bit,每个bit的值只能是0和1，位图的应用场景一般用于一些签到记录，例如打卡等。

场景举例: 例如某APP要存储用户的打卡记录，如果按照正常的思路来做，可能是用户每天是否打卡的记录都单独设置一个key-value键值对来存储，这样的话，每个用户每天都需要耗费一个键值对空间。而如果是位图，就可以很方便地通过位图来进行记录，例如如下图：

位图不算基础数据结构或者特殊数据结构，其本质上还是字符串。由于每个bit代表一个数据，所以还可以当作是bit数组来看待。

2、可以通过命令：

setbit key 偏移量(索引位) value(0/1,默认是0)

进行设置对应位置的位图数据。

通过命令:

getbit key 偏移量

可以获取到对应的位图索引数据。

也可以通过：

get key

来获取位图对应的字符串信息。

3、例如hello字符串的ascii码对应的二进制，分别是：

h: 01101000

e: 01100101

l: 01101100

o: 01101111

以下设置字符串hello的位图操作，如图所示，字符串对应二进制数拼接起来的二进制，值为1所在的bit索引位（offset），使用:

setbit key offset 1

进行设置1即可。

setbit/gitbit 和 set/get 实际上是可以互相转换的，只是一种是操作bit位，一种是操作直接的值。同时可以互相交叉操作使用，例如setbit存储，get读取；set 存储，getbit读取等等。

4、可以通过命令: bitcount key 起始字符索引结束字符索引

对指定key里面的数据，指定的字符索引区间内，获取到对应的位图数据是1的个数。如果不指定，则会获取到全部字符串对应位图的1的个数。如下图所示，结合以上二进制数据可知，h字符有3个1，o字符有6个1。

以上指令操作可以适用于在类似打卡天数统计上使用，可以快速统计出区间内为1的数据个数。

5、通过命令：bitops key bit值(0/1) 起始字符索引结束字符索引

可以获取到指定的区间内，第一次出现指定的bit值(0或1)所在的位图索引。如果不指定区间，默认代表字符串全部区间。如下图所示，hello里面，第一次出现1是在位图的第一个索引位置；第一次出现0是在第0个位图索引位；字符索引位为1代表第二个字符，第一次出现的值为1的位图索引位置为9。

注意：字符串的索引，0到N，0代表第一个字符，例如’h’。位图的索引，也是0到N，0代表位图上面第一个bit位，值为0或者1，例如h的位图索引位置是0的值是0 (01101000)

6、可以通过命令：

bitfield key get 类型位图索引

来获取指定类型数据的ascii码。

例如，以下截图中，命令：

bitfield hello get u8 0

其中，u8代表类型，u开头代表无符号数据，8代表获取8个bit位。如果是有符号的数据，是以i开头的。最后面的0，代表要获取的起始位图下标索引，此处是第0个索引。

hello五个字符，对应的ascii码分别为：104,101,108,108,111

如果以上命令的类型 u8 换成 u4 ，则获取到的值是0110，对应的值是6；以此类推。

也可以并列get获取，例如：

bitfield key get type1 offset1 type2 offset2 ……

其他玩法，大佬们可以自己尝试。我这边有关操作可以参考如下截图所示内容。

7、通过命令：

bitfield key set type 位图索引 ascii码

可以把对应的ascii码根据类型写入到指定的索引中，并且会返回原来索引被替换的ascii码值。

例如下图所示操作，位图索引从0开始，代表第一个字符h所在位置。97代表a的ascii码，执行以后，返回104(h的ascii码)，并且通过get命令可以查看到字符串已经被替换了。

8、可以使用命令:

bitfield key incrby type 索引自增值

对指定类型和索引区间的值进行累加，如下图所示。h通过 u8 类型自增1，即h+1=i

注意：对于累加的数据不能超出指定类型的最大值，例如 u4 最大值是15，累加到15以后会自动折返为0。

9、针对以上会出现折返的情况，可以使用溢出报错或者保持最大或最小值的方式来避免折返的情况。

使用命令：

Bitfield key overflow fail incrby type offset value

可以实现溢出的时候，会返回nil；

使用命令：

Bitfield key overflow sat incrby type offset value

可以实现当要溢出的时候，还是会返回当前的最大值或最小值。如下图所示。

二、HyperLogLog

10、HyperLogLog是一种可以快速去重的数据结构。但是有一定的误差率，大概在0.81%左右。应用场景一般是在需要针对一些大数据量的情况下进行去重计算大概的统计值使用，例如网站的PV量等等。

使用命令:

pfadd key value1 value2 ……

可以添加对应的多个数据集到指定的key里面去。

如果添加已经存在的数据，会被自动去重。

使用命令：pfcount key

可以统计数据集的个数。

使用命令:pfmerge 目标key 源key1 源key2 ……

可以对多个不同的key进行数据合并，并且数据集重复的会自动排重。

使用HyperLogLog的用途，是在针对大数据量的情况下，在允许一定的容错率的情况下，用它可以节约资源并且快速地进行排重。例如使用set来设置数据，资源损耗肯定是巨大的；但是使用hyperloglog来处理，资源损耗是固定的12kb，可以处理的数据量大约是2^64个数据。

冷门科普：命令是pf开头，是为了纪念HyperLogLog的作者——Philippe Flajolet

三、布隆过滤器

11、布隆过滤器，最常见的场景是商品推荐业务。例如购物时候浏览的信息被记录以后，可以进行推荐其他同类型的其他商品。推荐的其他商品不会和浏览过的商品重复(去重)，但是也存在一定的误差。

布隆过滤器源地址链接：

https://github.com/RedisBloom/RedisBloom

先进行下载，下载方式可以按照自己喜欢的方式下载。例如此处我下载到d目录下的wesky/bloom文件夹下。

然后进入到文件夹内，使用make命令进行编译。编译成功的话，会产生一个 redisbloom.so的文件。如下，我也很尴尬，没成功，就暂且到这里吧。

假如上面配置成功的话，启动redis服务的时候，可以把.so文件配置到redis.conf配置文件下,例如我上面所在的位置，新增的样式如下：

loadmodule D:/Wesky/Bloom/RedisBloom/redisbloom.so

或者使用命令启动的时候，使用命令进行指定：

redis-server --loadmodule D:/Wesky/Bloom/RedisBloom/redisbloom.so

由于当前我本机无法编译布隆过滤器源码，所以就暂且到这吧，请见谅。

布隆过滤器下，会有一些命令，供参考，大家可以根据自己情况，进行自己尝试，当作是留个悬念了。

命令：

bf.add key xxx

bf.madd key 数据1 数据2 ……

bf.exists key 数据

bf.mexists key 数据1 数据2 ……

……

今天是2022年的第一天，祝大家元旦快乐~~

【Redis的那些事 · 续集】Redis的位图、HyperLogLog数据结构演示以及布隆过滤器的更多相关文章

09 redis中布隆过滤器的使用
我们在使用新闻客户端看新闻时,它会给我们不停地推荐新的内容,它每次推荐时要去重,去掉那些已经看过的内容.问题来了,新闻客户端推荐系统如何实现推送去重的? 会想到服务器记录了用户看过的所有历史记录,当推 ...
关于Redis的那些事
1. MySql+Memcached架构的问题 Memcached采用客户端-服务器的架构,客户端和服务器端的通讯使用自定义的协议标准,只要满足协议格式要求,客户端Library可以用任何语言实现. ...
【Redis的那些事 · 上篇】Redis的介绍、五种数据结构演示和分布式锁
Redis是什么 Redis,全称是Remote Dictionary Service,翻译过来就是,远程字典服务. redis属于nosql非关系型数据库.Nosql常见的数据关系,基本上是以key ...
redis持久化那些事(kēng)儿
这是一篇包含了介绍性质和吐槽性质的日志.主要介绍一下我学习redis持久化时候被坑的经历.redis的使用介绍现在没有打算写,因为比较多,以我如此懒的性格...好吧,还是有点这方面想法的,不过一篇博客 ...
第十章· Logstash深入-Logstash与Redis那点事
Logstash将日志写入Redis 为什么要使用Redis 在企业中,日志规模的量级远远超出我们的想象,这就是为什么会有一家公司日志易专门做日志收集,给大型金融公司收集日志,比如银行,因为你有可能看 ...
Redis进阶实践之十一 Redis的Cluster集群搭建
一.引言本文档只对Redis的Cluster集群做简单的介绍,并没有对分布式系统的详细概念做深入的探讨.本文只是提供了有关如何设置集群.测试和操作集群的说明,而不涉及Redis集群规范中涵 ...
【Redis】Redis学习（一） Redis初步入门
一.Redis基础知识 1.1 Redis简介 Redis是一个开源(BSD许可),内存存储的数据结构服务器,可用作数据库,高速缓存和消息队列代理.它支持字符串.哈希表.列表.集合.有序集合,位图,h ...
Redis入门（二）-Redis能够做什么
引言在上篇文章中,我们讲述了Redis的基本知识让读者对Redis有了基本的了解.那么这一节我们就来看一下Redis究竟能做什么. 上一节我们提到了Redis可用作数据库,高速缓存和消息队列代理.这 ...
NoSql数据库Redis系列（1）——Redis简介
一.redis介绍 (一).Redis 简介 Redis 是完全开源免费的,遵守BSD协议,是一个高性能的key-value数据库. Redis 与其他 key - value 缓存产品有以下三个特点 ...

随机推荐

nodejs-CommonJS规范
JavaScript 标准参考教程(alpha) 草稿二:Node.js CommonJS规范 GitHub TOP CommonJS规范来自<JavaScript 标准参考教程(alpha) ...
03-Collection用例管理及批量执行
当我们对一个或多个系统中的很多用例进行维护时,首先想到的就是对用例进行分类管理,同时还希望对这批用例做回归测试 .在postman也提供了这样一个功能,就是Collection .通过这个Collec ...
tableView和tableViewCell的背景颜色问题
当在tableView中添加cell数据时,我们会发现原本设置的tableView的背景颜色不见了,这是因为加载cell数据时,tableView的背景颜色被cell数据遮盖住了,此时,可以通过设置c ...
zabbix之被动模式之编译安装proxy
#:准备源码包,编译安装 root@ubuntu:/usr/local/src# ls zabbix-4.0.12.tar.gz root@ubuntu:/usr/local/src# tar xf ...
vue引入d3
单页面使用 cnpm install d3 --save-dev 指定版本安装 cnpm install d3@6.3.1 -S <script> import * as d3 from ...
Vue中如何书写js来渲染页面填充数据的部分代码
new Vue({ el:"#app" , data:{ user:{ id:"", username:"", password:" ...
pandas基础学习一
生成对象用值列表生成 Series 时,Pandas 默认自动生成整数索引: In [3]: s = pd.Series([1, 3, 5, np.nan, 6, 8]) In [4]: s Out ...
通过js禁用浏览器的回退事件
js代码: <script> history.pushState(null, null, document.URL); window.addEventListener('popstate' ...
软件开发生命周期(SDLC)
一.简介软件开发生命周期又叫做 SDLC(Software Development Life Cycle),它是集合了计划.开发.测试和部署过程的集合.如下图所示 : 二.五个阶段 1.分析阶段: ...
Log4j漏洞源码分析
Log4j漏洞源码分析这几天Log4j的问题消息满天飞,今天我们就一起来看看从源码角度看看这个漏洞是如何产生的. 大家都知道这次问题主要是由于Log4j中提供的jndi的功能. 具体涉及到的入口类是 ...

【Redis的那些事 · 续集】Redis的位图、HyperLogLog数据结构演示以及布隆过滤器

【Redis的那些事 · 续集】Redis的位图、HyperLogLog数据结构演示以及布隆过滤器的更多相关文章

随机推荐

热门专题