Hash基础

BKDR Hash：

选取恰当的进制，可以把字符串中的字符看成一个大数字中的每一位数字，不过比较字符串和比较大数字的复杂度并没有什么区别

首先不要把任意字符对应到数字0，比如假如把a对应到数字0，那么将不能只从Hash结果上区分ab和b（虽然可以额外判断字符串长度，但不把任意字符对应到数字0更加省事且没有任何副作用），一般而言，把a-z对应到数字1-26比较合适。

关于进制的选择实际上非常自由，大于所有字符对应的数字的最大值，不要含有模数的质因数，比如一个字符集是a到z的题目，选择27、233、19260817都是可以的。

模数的选择（尽量还是要选择质数）：

绝大多数情况下，不要选择一个109级别的数，因为这样随机数据都会有Hash冲突，根据生日悖论，随便找上109−−−√109个串就有大概率出现至少一对Hash 值相等的串（参见BZOJ 3098 Hash Killer II）。

最稳妥的办法是选择两个109级别的质数，只有模这两个数都相等才判断相等，但常数略大，代码相对难写，目前暂时没有办法卡掉这种写法（除了卡时间让它超时）（参见BZOJ 3099 Hash Killer III）。

如果能背过或在考场上找出一个1018级别的质数(Miller-Rabin)，也相对靠谱，主要用于前一种担心会被卡，后一种担心超时。

偷懒的写法就是直接使用unsigned long long，不手动进行取模，它溢出时会自动对264（自然溢出也可以被卡）

用luogu P3370为例。

自然溢出hash(100)

#include <cstdio>

#include <cstring>

#include <algorithm>

using namespace std;

typedef unsigned long long ull;

ull base=;

ull a[];

char s[];

int n,ans=;

ull hashs(char s[])

{

    int len=strlen(s);

    ull ans=;

    for (int i=;i<len;i++)

        ans=ans*base+(ull)s[i];

    return ans&0x7fffffff;

}

main()

{

    scanf("%d",&n);

    for (int i=;i<=n;i++)

    {

        scanf("%s",s);

        a[i]=hashs(s);

    }

    sort(a+,a+n+);

    for (int i=;i<=n;i++)

        if (a[i]!=a[i-])

            ans++;

    printf("%d\n",ans);

}

单模数hash(80)

#include <cstdio>

#include <cstring>

#include <algorithm>

using namespace std;

typedef unsigned long long ull;

ull base=;

ull a[];

char s[];

int n,ans=;

ull mod=;

ull hashs(char s[])

{

    int len=strlen(s);

    ull ans=;

    for (int i=;i<len;i++)

        ans=(ans*base+(ull)s[i])%mod;

    return ans;

}

main()

{

    scanf("%d",&n);

    for (int i=;i<=n;i++)

    {

        scanf("%s",s);

        a[i]=hashs(s);

    }

    sort(a+,a+n+);

    for (int i=;i<=n;i++)

        if (a[i]!=a[i-])

            ans++;

    printf("%d\n",ans);

}

双hash

#include <cstdio>

#include <cstring>

#include <algorithm>

using namespace std;

typedef unsigned long long ull;

ull base=;

struct data

{

    ull x,y;

}a[];

char s[];

int n,ans=;

ull mod1=;

ull mod2=;

ull hash1(char s[])

{

    int len=strlen(s);

    ull ans=;

    for (int i=;i<len;i++)

        ans=(ans*base+(ull)s[i])%mod1;

    return ans;

}

ull hash2(char s[])

{

    int len=strlen(s);

    ull ans=;

    for (int i=;i<len;i++)

        ans=(ans*base+(ull)s[i])%mod2;

    return ans;

}

bool comp(data a,data b)

{

    return a.x<b.x;

}

main()

{

    scanf("%d",&n);

    for (int i=;i<=n;i++)

    {

        scanf("%s",s);

        a[i].x=hash1(s);

        a[i].y=hash2(s);

    }

    sort(a+,a+n+,comp);

    for (int i=;i<=n;i++)

        if (a[i].x!=a[i-].x || a[i-].y!=a[i].y)

            ans++;

    printf("%d\n",ans);

}

只用一个10^18质数的hash(100)

#include <cstdio>

#include <cstring>

#include <algorithm>

using namespace std;

typedef unsigned long long ull;

ull base=;

ull a[];

char s[];

int n,ans=;

ull mod=212370440130137957ll;

ull hashs(char s[])

{

    int len=strlen(s);

    ull ans=;

    for (int i=;i<len;i++)

        ans=(ans*base+(ull)s[i])%mod;

    return ans;

}

main()

{

    scanf("%d",&n);

    for (int i=;i<=n;i++)

    {

        scanf("%s",s);

        a[i]=hashs(s);

    }

    sort(a+,a+n+);

    for (int i=;i<=n;i++)

        if (a[i]!=a[i-])

            ans++;

    printf("%d\n",ans);

}

例题：http://www.yhzq-blog.cc/%E5%AD%97%E7%AC%A6%E4%B8%B2hash%E6%80%BB%E7%BB%93/

Hash基础的更多相关文章

i春秋DMZ大型靶场实验(四)Hash基础
下载工具包打开目标机通过目录爆破发现 phpmyadmin 在登录位置尝试注入返现可以注入直接上sqlmap 上 bp 代理抓包 sqlmap.py -r bp.txt ...
Redis 源码简洁剖析 03 - Dict Hash 基础
Redis Hash 源码 Redis Hash 数据结构 Redis rehash 原理为什么要 rehash? Redis dict 数据结构 Redis rehash 过程什么时候触发 re ...
redis字典快速映射+hash釜底抽薪+渐进式rehash | redis为什么那么快
前言相信你一定使用过新华字典吧!小时候不会读的字都是通过字典去查找的.在Redis中也存在相同功能叫做字典又称为符号表!是一种保存键值对的抽象数据结构本篇仍然定位在[redis前传]系列中,因为本 ...
最新Android面试题集锦
近期由于某些原因想换工作,整理一下个人认为面试中还比較值得记录的一些题目,给须要找这方面工作的人一个借鉴. 下面基本仅仅记录题目或者大概答案,假设大家有比較具体的解答或者比較好的面试题木,希望各位看到 ...
面试必问：HashMap 底层实现原理
HashMap是在面试中经常会问的一点,很多时候我们仅仅只是知道HashMap他是允许键值对都是Null,并且是非线程安全的,如果在多线程的环境下使用,是很容易出现问题的. 这是我们通常在面试中会说的 ...
python学习之操作redis
一.Redis安装网上很多可以查找二.redis-py的安装,使用命令pip install redis. 安装过程中如果产生连接超时的错误,可以使用国内镜像参考如下豆瓣:pip install ...
Redis 实战 —— 01. Redis 数据结构简介
一些数据库和缓存服务器的特性和功能 P4 名称类型数据存储选项查询类型附加功能 Redis 使用内存存储(in-memory)的非关系数据库字符串.列表.哈希表.集合.有序集合每种数据类型 ...
Redis 源码简洁剖析 07 - main 函数启动
前言问题阶段 1:基本初始化阶段 2:检查哨兵模式,执行 RDB 或 AOF 检测阶段 3:运行参数解析阶段 4:初始化 server 资源管理初始化数据库创建事件驱动框架阶段 5:执 ...
最基础的Hash
type thash=^node; node=record state:longint; next:thash; end; var a,i:longint; p:thash; hash:..]of t ...

随机推荐

HTML基础之DOM
DOM(Document Object Model 文档对象模型) 一个web页面的展示,是由html标签组合成的一个页面,js是一门语言,dom对象实际就是将html标签转换成了一个文档对象.可以通 ...
阶段3 2.Spring_06.Spring的新注解_6 Qualifier注解的另一种用法
复制上面的数据源到下面改改名字现在就是有两个数据源创建一个eesy02的数据库找到sql语句再创建Account表现在就相当于有连个库一个eesy一个是eesy02这连个库. account里 ...
40组合总和II
题目:给定一个数组 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合.candidates 中的每个数字在每个组合中只能使用一 ...
dcef3 基本使用经验总结
dcef3 基本使用经验总结 https://www.cnblogs.com/h2285409/p/10517483.html 加载命令启动参数 --enable-system-flash 会加 ...
慕课网_反射——Java高级开发必须懂的
第1章 Class类的使用 1-1 Class类的使用 (15:18) 第2章动态加载类 2-1 Java 动态加载类 (13:19) 第3章获取方法信息 3-1 Java 获取方法信息 (17: ...
tensorflow-2.0 技巧 | ImageNet 归一化
_MEAN_RGB = [123.15, 115.90, 103.06] def _preprocess_subtract_imagenet_mean(inputs): ""&qu ...
运维日常之机房浪潮服务器硬盘红灯亮起，服务器一直响，raid磁盘红色。。。故障解决方法
按Ctrl+H进入到WebBIOS内,看见的错误如下所示: 错误是PDMissing,只不过维护的IBM服务器错误的磁盘不是第一块,而是第三块而已,不过坏哪块硬盘没有影响,重要的是错误的原因.这种错误 ...
Ubuntu 19.04
Ubuntu 19.04自动挂载机械盘创建要挂载的文件夹 sudo mkdir /home/soldier/SOLDIER 获取UUID sudo blkid 分区的TYPE是“ntfs” 编辑/e ...
shiro三连斩之概念
1, 什么是Shiro? Shiro是一个安全框架,用于解决系统的认证和授权问题,同时提供了会话管理,数据加密,与WEB集成,缓存等机制. Authentication:身份认证/登录,验证用户是不是 ...
【6.28校内test】T3 【音乐会】道路千万条
[音乐会]道路千万条[题目链接] 首先,你可以忽略上面的一大坨题面,只需要看说明的那一小部分就好啦. 然后理解题意: 就是说我们要给这n-1个运算符指定一个顺序,统计所有值为true的方案数pt,统计 ...

Hash基础

Hash基础的更多相关文章

随机推荐

热门专题