这里将讲述【字符串算法1】字符串Hash

老版原文： RK哈希（Rabin_Karp 哈希）仅仅具有参考价值

新版题目：【字符串算法1】再谈字符串Hash（优雅的暴力）

概念

- 什么是字符串Hash？

- 就是把字符串映射成一个数字使每个字符串的映射结果不一样（把字符串有效的转化为数字）

对字符进行映射

对一个字符进行唯一编码，如A-->1,B-->2,C-->3等等

一般不用ASCII码表来映射而是转化为相对小一点的值来映射

提示信息：（字符串内包含数字、大小写字母，大小写敏感）

写出val函数映射字符：

int val(char ch)

{

    if (isdigit(ch)) return(ch-''+);

    if (isupper(ch)) return(ch-'A'+);

    if (islower(ch)) return(ch-'a'+);

}

对字符串进行映射

一般映射方法：hash[i]=(hash[i-1]*p+idx(s[i]))%mod （保险度：****）

hash[i]表示字符串的第i个前缀的hash值

Hash值的性质

①这样子，我们就可以记录下每个字符串对应的整数，当下一次出现了一个已经出现的字符串时，查询整数是否出现过，就可以知道字符串是否重复出现。
②判断两个字符串是否一致，怎么办呢？直接用它们的hash值判断即可，若hash值一致，则认为字符串一致；
若hash值不一致，则认为是不同的字符串。

例子

假设我们取p=13 ，mod=101
先把abc映射为一个整数
hash[0]=1，表示 a 映射为1
hash[1]=(hash[0]*p+idx(b))%mod=15，表示 ab 映射为 15
hash[2]=(hash[1]*p+idx(c))%mod=97
这样，我们就把 abc 映射为 97 这个数字了。

冲突：

假设mo数和基底e取值不当时就会发生冲突

就是两个字符串明明不同但映射出来的结果相同

举个极端的例子

e=0的情况字符串"a"和字符串"b"映射出来的值都是0，就产生冲突

那么怎么调整才能使冲突概率小之又小呢？
- p取一个较大素数，mo取一个大素数。
习惯上，p取一个6到8位的素数即可，mo一般取大素数 1e9+7（1000000007）或
1e9+9（1000000009）【逃 19260817】

求出每个子串的hash值

注意到每一个hash[i]都是前缀和数字那么我们借用前缀和的思想，已知hash[r]和hash[l]求出Hash(l,r)表示前[l,r]子串的hash值

Hash[l]=(x₁*e^l-1+x₂*e^l-2+......+x_l*e⁰)mod mo

Hash[l-1]=(x₁*e^l-2+x₂*e^l-3+......+x_l-1*e⁰)mod mo

Hash[r]=(x₁*e^r-1+x₂*e^r-2+......+x_r*e⁰)mod mo

Hash(l,r)=(x_l*e^r-l+x_l+1*e^r-l-1+......x_r-1*e¹+x_r*e⁰)mod mo

Hash[l-1]*e^r-l+1=(x₁*e^l-2+x₂*e^l-3+......+x_l-1*e⁰)*e^r-l+1mod mo=(x₁*e^r-1+x₂*e^r-2+......+x_l-1*e^r-l+1)mod mo

Hash[r]-Hash[l-1]*e^r-l+1=（(x₁*e^r-1+x₂*e^r-2+...x_l-1*e^r-l+1+x_l*e^r-l...+x_r*e⁰)-(x₁*e^r-1+x₂*e^r-2+......+x_l*e^r-l+1)）mod mo =(x_l*e^r-l+x_l+1*e^r-l-1+......x_r-1*e¹+x_r*e⁰)mod mo=Hash(l,r)

所以：Hash[r]-Hash[l-1]*e^r-l+1=Hash(l,r)

ll pow(int x,int n,int p)

{

    if (n==) return ;

    if (n==) return x%p;

    ll t=t*t%p;

    if (n%==) t=t*x%p;

    return t;

}

ll Hash(int l,int r)

{

    return ((hash[r]-hash[l-]*pow(e,r-l+,mo)%mo)%mo+mo)%mo;

}

其他hash方法

1. unsigned long long hash[N];
hash[i]=hash[i-1]*p（自动取模） (保险度***) 常数（几乎没有）（容易被卡）
2. hash[i]=(hash[i-1]*p+idx(s[i]))%mod （保险度****）常数（有一点）（一般）
3. 双hash
hash1[i]=(hash1[i-1]*p+idx(s[i]))%mod1
hash2[i]=(hash2[i-1]*p+idx(s[i]))%mod2
pair<hash1,hash2>表示一个字符串！（保险度*****）常数（比较大）（孪生质数不可能被卡）

推荐：hash[i]=(hash[i-1]*p+idx(s[i]))%mod （保险度****）常数（有一点）（一般）

P3370 【模板】字符串哈希

题目描述

如题，给定N个字符串（第i个字符串长度为Mi，字符串内包含数字、大小写字母，大小写敏感），请求出N个字符串中共有多少个不同的字符串。

输入输出格式

输入格式：

第一行包含一个整数N，为字符串的个数。

接下来N行每行包含一个字符串，为所提供的字符串。

输出格式：

输出包含一行，包含一个整数，为不同的字符串个数。

输入输出样例

输入样例#1：复制

5

abc

aaaa

abc

abcc

12345

输出样例#1：复制

说明

时空限制：1000ms,128M

数据规模：

对于30%的数据：N<=10，Mi≈6，Mmax<=15;

对于70%的数据：N<=1000，Mi≈100，Mmax<=150

对于100%的数据：N<=10000，Mi≈1000，Mmax<=1500

样例说明：

样例中第一个字符串(abc)和第三个字符串(abc)是一样的，所以所提供字符串的集合为{aaaa,abc,abcc,12345}，故共计4个不同的字符串。

Tip：感兴趣的话，你们可以先看一看以下三题：

BZOJ3097：http://www.lydsy.com/JudgeOnline/problem.php?id=3097

BZOJ3098：http://www.lydsy.com/JudgeOnline/problem.php?id=3098

BZOJ3099：http://www.lydsy.com/JudgeOnline/problem.php?id=3099

如果你仔细研究过了（或者至少仔细看过AC人数的话），我想你一定会明白字符串哈希的正确姿势的^_^

【字符串算法1】再谈字符串Hash（优雅的暴力）的更多相关文章

[VB.NET Tips]再谈字符串连接之内置池
CLR自动维护一个称为"内置池"(暂存池)(intern pool)的表,在编译时此表包含程序中声明的每个唯一的字符串常量的单个实例,以及以编程方式创建的String类的任何唯一实 ...
Python 再谈字符串
字符串除了要用引号来创建之外,其他和元组一样,不能修改,如果要修改只能用切片或者拼接的方式. 其他的什么乱七八糟的运算符都一样一些不同 capitalize()-将字符串的第一个字母大写 str1. ...
【字符串算法2】浅谈Manacher算法
[字符串算法1] 字符串Hash(优雅的暴力) [字符串算法2]Manacher算法 [字符串算法3]KMP算法这里将讲述字符串算法2:Manacher算法问题:给出字符串S(限制见后)求出最 ...
【字符串算法3】浅谈KMP算法
[字符串算法1] 字符串Hash(优雅的暴力) [字符串算法2]Manacher算法 [字符串算法3]KMP算法这里将讲述 [字符串算法3]KMP算法 Part1 理解KMP的精髓和思想其实KM ...
转载：字符串hash总结（hash是一门优雅的暴力！）
转载自:远航休息栈字符串Hash总结 Hash是什么意思呢?某度翻译告诉我们: hash 英[hæʃ] 美[hæʃ]n. 剁碎的食物; #号; 蔬菜肉丁;vt. 把…弄乱; 切碎; 反复推敲; 搞糟 ...
浅谈字符串Hash
浅谈字符串Hash 本篇随笔讲解Hash(散列表)的一个重要应用:字符串Hash. 关于Hash Hash是一种数据结构,叫做Hash表(哈希表),也叫散列表.关于Hash的实现,其实与离散化颇为类似 ...
解决AES算法CBC模式加密字符串后再解密出现乱码问题
问题在使用 AES CBC 模式加密字符串后,再进行解密,解密得到的字符串出现乱码情况,通常都是前几十个字节乱码: 复现因为是使用部门 cgi AESEncryptUtil 库,找到问题后,在这里 ...
浅谈字符串哈希 By cellur925
前言蒟蒻最近在复习字符串算法...但正如之前所说,我OI太菜被关起来了,本蒟蒻只能从最简单的哈希入手了TAT.而别的dalao都在学习AC自动机/后缀数组等高到不知哪里去的算法qwq. 基本思想映 ...
[算法2-数组与字符串的查找与匹配] （.NET源码学习）
[算法2-数组与字符串的查找与匹配] (.NET源码学习) 关键词:1. 数组查找(算法) 2. 字符串查找(算法) 3. C#中的String(源码) 4. 特性Attribute 与内 ...

随机推荐

一文让您全面了解清楚HBase数据库的所有知识点，值得收藏！
一.HBase基本概念:列式数据库在Hadoop生态体系结构中,HBase位于HDFS(Hadoop分布式文件系统)的上一层,不依赖于MapReduce,那么如果没有HBase这种Nosql数据库会 ...
Ansible入门笔记（1）之工作架构和使用原理
目录 Ansible入门笔记(1) 1.Ansible特性 2.ansible架构解析 3.ansible主要组成部分 1)命令执行来源: 2)利用ansible实现管理的方式 3)Ansile-pl ...
how2j 的shiro教程初探
教程案例里的mysql连接器只支持mysql,不支持mariadb,如果用的不是mysql,创建连接时会报错.
2PC/3PC到底是啥
讨论提到2PC/3PC首先想到的是它是一致性协议,而且经常把它和Paxos协议放在一起比较,并且经常看到这样的说法"世上只有一种一致性算法,那就是Paxos",2PC/3PC并不 ...
Windows：查看IP地址，IP地址对应的机器名，占用的端口，以及占用该端口的应用程
Windows 服务器系列: Windows:查看IP地址,IP地址对应的机器名,占用的端口,以及占用该端口的应用程 Windows:使用Dos命令管理服务(Services) Windows:任务调 ...
设计模式笔记代理模式 Proxy
//---------------------------15/04/21---------------------------- //Proxy 代理模式-----对象结构型模式 /* 1:意图: ...
零点计费系统_Ros云计费（下面是对接教程）
零点计费系统对接 ROS 教程 1.首先我们到零点控制台:oa.eczcz.com先注册一个主账号:(当然,以前有维盟片区的主账号就不用再注册了,因为零点早就设计到支持多台路由器,所以 ...
docker 安装 kali
1.安装 docker pull kalilinux/kali-linux-docker 2.运行容器 docker run -t -i kalilinux/kali-linux-docker /bi ...
链家鸟哥：从留级打架问题学生到PHP大神，他的人生驱动力竟然是？
链家鸟哥:从留级打架问题学生到PHP大神,他的人生驱动力竟然是?| 二叉树短视频 http://mp.weixin.qq.com/s/D4l_zOpKDakptCM__4hLrQ 从问题劝退学生到高考 ...
20135220谈愈敏Blog5_系统调用（下）
系统调用(下) 谈愈敏原创作品转载请注明出处 <Linux内核分析>MOOC课程 http://mooc.study.163.com/course/USTC-1000029000 给Me ...

【字符串算法1】再谈字符串Hash（优雅的暴力）

【字符串算法1】字符串Hash（优雅的暴力）

【字符串算法2】Manacher算法

【字符串算法3】KMP算法

这里将讲述【字符串算法1】字符串Hash

老版原文： RK哈希（Rabin_Karp 哈希）仅仅具有参考价值

新版题目：【字符串算法1】再谈字符串Hash（优雅的暴力）

概念

对字符进行映射

对字符串进行映射

Hash值的性质

例子

冲突：

求出每个子串的hash值

其他hash方法

P3370 【模板】字符串哈希

题目描述

输入输出格式

输入输出样例

说明

【字符串算法1】再谈字符串Hash（优雅的暴力）的更多相关文章

随机推荐

热门专题

【字符串算法1】 再谈字符串Hash（优雅的暴力）

【字符串算法1】 字符串Hash（优雅的暴力）

【字符串算法2】Manacher算法

【字符串算法3】KMP算法

这里将讲述 【字符串算法1】 字符串Hash

老版原文： RK哈希（Rabin_Karp 哈希） 仅仅具有参考价值

新版题目：【字符串算法1】 再谈字符串Hash（优雅的暴力）

概念

对字符进行映射

对字符串进行映射

Hash值的性质

例子

冲突：

求出每个子串的hash值

其他hash方法

P3370 【模板】字符串哈希

题目描述

输入输出格式

输入输出样例

说明

【字符串算法1】 再谈字符串Hash（优雅的暴力）的更多相关文章

随机推荐

热门专题

【字符串算法1】再谈字符串Hash（优雅的暴力）

【字符串算法1】字符串Hash（优雅的暴力）

这里将讲述【字符串算法1】字符串Hash

老版原文： RK哈希（Rabin_Karp 哈希）仅仅具有参考价值

新版题目：【字符串算法1】再谈字符串Hash（优雅的暴力）

【字符串算法1】再谈字符串Hash（优雅的暴力）的更多相关文章