博客:博客园 | CSDN | blog

写在前面

在数值计算中,为了控制精度以及避免越界,需要严格控制数值的范围,有时需要知道二进制表示中"left-most 1"或"right-most 1”的位置,这篇文章就来介绍一下通过德布鲁因序列(De Bruijn sequence)来快速定位的方法。

标记left-most 1与right-most 1

对于一个二进制数\(v\),如何仅保留最低位或最高位的1?

最低位的1,即right-most 1,其特点是这一位右侧均为0,可通过v & -v或者v & ((~v)+1)来标记最低位的1。

比如0101 1010,取反后为1010 0101,再加1为1010 0110,与后为0000 0010

最高位的1,即left-most 1,其特点是这一位左侧均为0,可通过下面来标记最高位的1。

  1. uint32_t keepHighestBit( uint32_t n )
  2. {
  3. n |= (n >> 1);
  4. n |= (n >> 2);
  5. n |= (n >> 4);
  6. n |= (n >> 8);
  7. n |= (n >> 16);
  8. return n - (n >> 1);
  9. }

前5行移位将最高位1右侧的所有位均置为1,n-(n >> 1)再将他们清0。

至此,我们已经得到了一个二进制的“one hot”表示,只有1位为1,它标记了最高位或最低位1的位置。

确定位置

假设,得到的“one hot”表示为0000 0100 0000 0000,如何确定1在哪一位呢?

比较直接的想法是通过移位计数,不断右移,并计数,直到最低位为1。

有没有更好的方法?

令得到的“one hot”表示为h,对于uint32h只有32种,我们希望找到的这32种one hot表示与\(0\sim 31\)的映射关系,即\(f(h) \rightarrow 0\sim 31\)。

  • 查表:以h对应的uint32数为下标,构建数组,通过查表方式得到,但h最大为\(2^{31}\),直接构建数组不现实
  • 哈希:再增加一层映射,\(f(g(h)) \rightarrow 0\sim 31\),即找到一个hash函数\(g\),先将\(h\)映射到\(0 \sim 31\),再通过查表\(0\sim 31 \rightarrow 0\sim 31\),但一般哈希会涉及到取余操作,还要考虑不要有碰撞

对这个特殊问题,可以使用 德布鲁因序列——可视为一种特殊的哈希,不需要取余,且绝不会发生碰撞。

德布鲁因序列(De Bruijn sequence)

先看一个德布鲁因序列的例子,令字符集\(A = \{0, 1\}\),字符有\(k=2\)种,子串长度\(n=2\),则所有可能的子串有\(\{00, 01, 10, 11\}\),则循环序列\(0011\)是一个德布鲁因序列,\(0011\)的所有连续子串恰好为\(\{00, 01, 10, 11\}\),都出现且只出现一次,同样,循环序列\(1001\)也是一个德布鲁因序列。

可见,德布鲁因序列并不唯一,且是个循环序列,长度恰好为\(k^n\),与所有可能子串的数量相同

wiki上的定义如下,

In combinatorial mathematics, a de Bruijn sequence of order \(n\) on a size-\(k\) alphabet A is a cyclic sequence in which every possible length-\(n\) string on \(A\) occurs exactly once as a substring (i.e., as a contiguous subsequence). Such a sequence is denoted by \(B(k, n)\) and has length \(k^n\), which is also the number of distinct strings of length \(n\) on \(A\).

——from wiki De Bruijn sequence

再举一个\(B(2, 4)\)的例子,序列长度为\(2^4=16\),如下

\[0 0 0 0 1 1 1 1 0 1 1 0 0 1 0 1
\]

其所有循环子串如下,

每个位置的子串均不相同,所有子串对应着\(0\sim 2^n-1\)范围的整数,恰好形成了\(2^n\)个位置与\(2^n\)个数的映射。

德布鲁因序列的使用

h与德布鲁因序列相乘,相当于左移操作,把某位置的子串移到了最左端,再将该子串右移至最右,即仅保留该子串,可知道该子串是什么,因为序列中每个子串的位置都是唯一的,根据映射关系可知道该子串的位置,相当于知道了h。为此需要建立 子串与位置 对应关系的检索表。

  1. unsigned int v;
  2. int r;
  3. static const int MultiplyDeBruijnBitPosition[32] =
  4. {
  5. 0, 1, 28, 2, 29, 14, 24, 3, 30, 22, 20, 15, 25, 17, 4, 8,
  6. 31, 27, 13, 23, 21, 19, 16, 7, 26, 12, 18, 6, 11, 5, 10, 9
  7. };
  8. r = MultiplyDeBruijnBitPosition[((uint32_t)((v & -v) * 0x077CB531U)) >> 27];
  9. // The index of the LSB in v is stored in r
  10. //return the index of the most significant bit set from a 32 bit unsigned integer
  11. uint8_t highestBitIndex( uint32_t b )
  12. {
  13. static const uint32_t deBruijnMagic = 0x06EB14F9;
  14. static const uint8_t deBruijnTable[32] = {
  15. 0, 1, 16, 2, 29, 17, 3, 22, 30, 20, 18, 11, 13, 4, 7, 23,
  16. 31, 15, 28, 21, 19, 10, 12, 6, 14, 27, 9, 5, 26, 8, 25, 24,
  17. };
  18. return deBruijnTable[(keepHighestBit(b) * deBruijnMagic) >> 27];
  19. }

因为德布鲁因序列是循环序列,而左移操作会自动在最低位填0,所以习惯将全0子串放在序列的最高位,这样比较方便,不需要特殊处理。

德布鲁因序列的生成与索引表的构建

德布鲁因序列可以通过构建德布鲁因图得到,图中每条哈密顿路径(Hamiltonian path)都对应一个德布鲁因序列,

数量共有

\[\frac{(k !)^{k^{n-1}}}{k^{n}}
\]

具体生成方式和证明可查看De Bruijn sequence神奇的德布鲁因序列

保存子串与位置映射关系的检索表可通过如下方式生成,其中debruijn32为德布鲁因序列对应的uint32正整数。

  1. uint8 index32[32] = {0};
  2. void setup( void )
  3. {
  4. int i;
  5. for(i=0; i<32; i++)
  6. index32[ (debruijn32 << i) >> 27 ] = i;
  7. }

参考

德布鲁因序列与indexing 1的更多相关文章

  1. Ural2004: Scientists from Spilkovo(德布鲁因序列&思维)

    Misha and Dima are promising young scientists. They make incredible discoveries every day together w ...

  2. 神秘常量0x077CB531,德布莱英序列的恩赐

    本文发布于游戏程序员刘宇的个人博客, 转载请注明来源https://www.cnblogs.com/xiaohutu/p/10950011.html 某天我在优化游戏的算法,在将一个个关键数据结构优化 ...

  3. De Bruijn序列

    最近文章中经常出现及De Bruijin 这个关键字,网上搜索了一下,记录下来. De Bruijn序列 (德布鲁因序列) 问题:能否构造一个长度为2的n次方的二进制环状串,使得二进制环状串中总共2的 ...

  4. 高效的多维空间点索引算法 — Geohash 和 Google S2

    原文地址:https://www.jianshu.com/p/7332dcb978b2   引子 每天我们晚上加班回家,可能都会用到滴滴或者共享单车.打开 app 会看到如下的界面:     app ...

  5. 3D-camera结构光原理

    3D-camera结构光原理 目前主流的深度探测技术是结构光,TOF,和双目.具体的百度就有很详细的信息. 而结构光也有双目结构光和散斑结构光等,没错,Iphone X 的3D深度相机就用 散斑结构光 ...

  6. <..................> 哈佛大学哲学系 && 历史哲学笔记文献集

    哈佛大学哲学系课程表            (一)概况    (1)哈佛大学哲学系现有教师21人,其中访问教授7人,教师流动性较大,每年有一定的变化.以下为现任教师:Richard Moran(系主任 ...

  7. Thenao tutorial – indexing

    Theano和numpy一样,支持基本的下标取值方法和高级的下标取值方法. 因为theano中没有boolean类型,所以不支持boolean类型的masks. # head file support ...

  8. 【循序渐进学Python】2. Python中的序列——列表和元组

    序列概览 在Python中有六种内建的序列:列表.元组.字符串.Unicode字符串.buffer对象和xrange对象.在这里暂时只讨论列表和元组.列表和元组的主要区别在于:列表可以修改,元组(不可 ...

  9. Python列表,元组,字典,序列,引用

    1.列表 # Filename: using_list.py # This is my shopping list shoplist=["apple", "mango&q ...

随机推荐

  1. Ubuntu 20.04下源码编译安装ROS 2 Foxy Fitzroy

    ROS 2 Foxy Fitzroy(以下简称Foxy)于2020年6月5日正式发布了,是LTS版本,支持到2023年5月.本文主要根据官方的编译安装教程[1]完成,并记录编译过程中遇到的问题. 1. ...

  2. Jenkins登录无效

    解决办法: 进入Jenkins安装目录: 1:进入D:\jenkins\users\admin 这个目录下找到config.xml  可以看到里面的用户名是admin 2:进入D:\jenkins\s ...

  3. CODING DevOps 系列第四课:DevOps 中的质量内建实践

    什么是质量内建 随着时间的推移,我们项目的开发效率会逐渐降低,直到几年之后整个项目可能就无法维护,只能推倒重来.具体的表现首先就是随着时间推移,我们会发现整个需求列表里面能做的需求越来越少,因为每当我 ...

  4. [转载] WLAN:BSS,ESS,SSID

    转载地址:http://blog.sina.com.cn/s/blog_71c6e0ea0100l686.html (2010-05-24 15:20:47) SSID(Service Set Ide ...

  5. 虹软人脸识别——官方 Qt Demo 移植到 Linux

    一.前言 最近需要在 Linux 平台下开发一个人脸识别相关的应用,用到了虹软的人脸识别 SDK.之前在 Windows 平台用过,感觉不错,SDK 里面还带了 Demo 可以快速看到效果.打开 Li ...

  6. elk5

    在百度指数上面可以看到二者热度的一个对比 es要先建立索引index,才能进行检索 elasticSearch的安装 1.jdk要1.8版本以上,并且每台elasticserach的jdk版本要一致 ...

  7. 2、尚硅谷_SSM高级整合_使用ajax操作实现页面的查询功能

    16.尚硅谷_SSM高级整合_查询_返回分页的json数据.avi 在上一章节的操作中我们是将PageInfo对象存储在request域中,然后list页面解析request域中的对象实现信息的显示. ...

  8. RabbitMQ:一、入门

    消息中间件 使用消息中间件的作用 解耦 削峰 异步 顺序保证 冗余(存储) RabbitMQ的特点 可靠性 灵活的路由 扩展性 高可用 多语言客户端 插件机制 多协议(主要还是AMQP) 相关概念 P ...

  9. java多线程并发执行demo,主线程阻塞

    其中有四个知识点我单独罗列了出来,属于多线程编程中需要知道的知识: 知识点1:X,T为泛型,为什么要用泛型,泛型和Object的区别请看:https://www.cnblogs.com/xiaoxio ...

  10. c语言二维数组的转置

    #include <stdio.h> #include <string.h> #include <stdlib.h> #define maxsize 3 #defi ...