算法竞赛进阶指南0x14 Hash
组成部分:
- 哈希函数;
- 链表
AcWing137. 雪花雪花雪花
因为所需要数据量过于大,所以只能以O(n)的复杂度。
所以不可能在实现的过程中一一顺时针逆时针进行比较,所以采用一种合适的数据结构。
如果使用set里面存储pair套上pair,维护起来稍微有一点麻烦。
取一个两片相同雪花都有的共同特征,(不同的重复也没事)。
tips:
如果已经发现两片雪花不一样,直接return 0即可。
普及一个比较大的质数:
99991
#include <bits/stdc++.h>
using namespace std;
#define N 100010
int buf[12];
int snow[N][8], nxt[N], ver[N], head[N];
int tot;
#define PRI 99991
int Hash()
{
int sum = 0, mul = 1;
for(int i = 0; i < 6; i++)
{
sum = (buf[i]+sum) % PRI;
mul = (long long)mul * buf[i] % PRI;
}
return (sum+mul)%PRI;
}
bool Compare(int id)//如果返回1,那么说明就有冲突。(比较方法:最暴力的比较方法)
{
for(int i = 0; i < 6; i++)
for(int j = 0; j < 6; j++)
{
bool eq = true;
for(int k = 0; k < 6; k++)
{
if(buf[(k+i)%6] != snow[id][(k+j)%6])
{
eq = false;
break;
}
}
if(eq) return 1;
eq = true;
for(int k = 0; k < 6; k++)
{
if(buf[(k+i)%6] != snow[id][(12+j-k)%6])
{
eq = false;
break;
}
}
if(eq) return 1;
}
return 0;
}
bool Insert()
{
int H = Hash();
for(int i = head[H]; i; i = nxt[i])
{
if(Compare(ver[i]))
return 1;
}
tot++;
memcpy(snow[tot], buf, 6*sizeof(int));
ver[tot] = tot;
nxt[tot] = head[H];
head[H] = tot;
return 0;
}
int main()
{
int n;
cin >> n;
for(int i = 1; i <= n; i++)
{
for(int j = 0; j < 6; j++)
scanf("%d", buf+j);
if(Insert())
{
printf("Twin snowflakes found.");
return 0;
}
}
printf("No two snowflakes are alike.");
return 0;
}
ver其实没有任何作用,因为每一条“边”的编号,就是这片雪花的存储位置。
字符串哈希:
把一个任意长度的字符串映射成一个非负整数,冲突的概率几乎为0。
方法步骤:
- 把字符串看做p进制数(p要取131或者13331)
- 每一种字符分配一个大于等于0的数字(使得分配到的数字远小于p)。
- 对构造出来的哈希值一直取模。(可以使用unsigned long long来进行)
一般来说,通过这种方法构造出来的Hash值是唯一的。
如果不放心的话,可以多取几组p,如果全部相等,才能认为字符串相等。
题型一:通过哈希来确定子串是否相等
对于一个灰常长的字符串,可以使用
O
(
n
)
O(n)
O(n)的时间维护出前缀数组的Hash值。然后可以使用
O
(
1
)
O(1)
O(1)的时间来求出子串的Hash。
在这道题目中,使用f数组存放前缀的Hash,使用p存放131^次方。
#include <bits/stdc++.h>
using namespace std;
#define N 1000010
unsigned long long f[N], p[N];
char s[N];
void Init()
{
p[0] = 1;
int len = strlen(s+1);
for(int i = 1; i <= len; i++)
{
f[i] = f[i-1] * 131 + s[i] - 'a' + 1;
p[i] = 131 * p[i-1];
}
}
int main()
{
scanf("%s", s+1);
Init();
int n;
cin >> n;
for(int i = 1; i <= n; i++)
{
int a, b, c, d;
scanf("%d%d%d%d", &a, &b, &c, &d);
unsigned long long h1 = f[b] - f[a-1]*p[b-a+1];
unsigned long long h2 = f[d] - f[c-1]*p[d-c+1];
if(h1 == h2) printf("Yes\n");
else printf("No\n");
}
return 0;
}
题型二:判断最长回文子序列
方法一(最最最暴力)
由于回文串分为奇回文串还有偶回文串,枚举N+N-1个端点,然后向两边进行拓展,可以达到目的
时间复杂度
O
(
n
2
)
O(n^2)
O(n2)
方法二(从方法一改进)
- 有了Hash这个工具之后,判断一个字符时间复杂度是
O
(
1
)
O(1)
O(1)的,判断任意长度字符串时间复杂度是
O
(
1
)
O(1)
O(1)的
- 由于最长回文子序列具有单调的性质。
所以通过二分加Hash可以以**
O
(
N
l
o
g
2
N
)
O(Nlog_2N)
O(Nlog2N)**解出。
二分条件:
- 一次查询时间复杂度是
O
(
1
)
O(1)
O(1)
- 具有单调性
方法三(manacher算法)
算法精髓:
- 利用了回文串的性质(如果一个位置在一个回文串里面,就可以通过之前算出的值线性地求出这个位置的值)
- 如果不在回文串里,那么就暴力拓展(虽说是暴力,但是可以为后人而栽树,右边界拓展到哪里,那么在这一段里面就不需要拓展了)
- 使用了分隔符,?#a#b#a#@,可以把奇回文串还有偶回文串联合起来考虑。
- 同时,从分隔符中找规律,声明:计从该点开始向右移动,直到移动到左右不相等的数所移动的步数就是p[i]的值。
- 对于每一个p[i]它的值减去一,就是以这个字符为中心的回文串的长度
but貌似好像只能解决这类问题。。
代码
#include <bits/stdc++.h>
using namespace std;
#define N 1000010
char ss[N];
char s[N*2+10];
int p[N*2+10];
int ans = 0;
void process()
{
int len = strlen(ss+1);
int q = 0;
s[++q] = '?';
s[++q] = '#';
for(int p = 1; p <= len; p++)
{
s[++q] = ss[p];
s[++q] = '#';
}
s[++q] = '@';//注意:首末一定是不一样的!!!
}
void manacher()
{
int len = 0;
while(s[len] != '@') len++;
int R = 0, mid = 0;
for(int i = 2; i <= len-1; i++)
{
if(R > i) p[i] = min(p[2*mid - i], R-i);//把情况3,4和情况二筛选出来
else p[i] = 1;//情况一
while(s[i-p[i]] == s[i+p[i]]) p[i]++;//注意:不仅仅是针对情况一,还针对情况三
if(i+p[i] > R)
{
R = i+p[i];
mid = i;
}
ans = max(ans, p[i]-1);
}
}
int main()
{
int cnt = 1;
while(1)
{
//memset(s, 0, sizeof(s));
//memset(ss, 0, sizeof(ss));
memset(p, 0, sizeof(p));
ans = 0;
scanf("%s", ss+1);
if(ss[1] == 'E') return 0;
process();
manacher();
printf("Case %d: %d\n",cnt, ans);
cnt++;
}
return 0;
}
参考博客:https://blog.csdn.net/rwbyblake/article/details/107991949
manacher的总结:
ACWing\140. 后缀数组
由于字符串哈希可以求出字符串的任意两个子串是否相等,所以如果可以采用二分,时间复杂度降低为logN。
#include <bits/stdc++.h>
using namespace std;
#define N 300010
typedef unsigned long long ull;
char s[N];
ull p[N];
ull H[N];
int SA[N];
int len;
int Height[N];
void hash_process()
{
p[0] = 1;
for(int i = 1; i <= len; i++)
{
H[i] = 131*H[i-1] + s[i] - 'a' + 1;
p[i] = p[i-1] * 131;
}
}
inline unsigned long long Hash(int l, int r)
{
return H[r] - H[l-1] * p[r-l+1];
}
bool my_compare(int x, int y)
{
int xlen = len-x+1;
int ylen = len-y+1;
int r = min(xlen, ylen);
int l = 0;
while(l < r)
{
int mid = (l+r) / 2;
if(Hash(x, x+mid) != Hash(y, y+mid)) r = mid;
else l = mid + 1;
}
if(s[x+r] < s[y+r]) return true;
else if(s[x+r] > s[y+r]) return false;
else
{
if(ylen > xlen) return true;
else return false;
}
}
int longest_pre(int x, int y)
{
int xlen = len-x+1;
int ylen = len-y+1;
int r = min(xlen, ylen);
int l = 0;
while(l < r)
{
int mid = (l+r) / 2;
if(Hash(x, x+mid) != Hash(y, y+mid)) r = mid;
else l = mid + 1;
}
return l;
}
int main()
{
scanf("%s", s+1);
len = strlen(s+1);
for(int i = 1; i <= len; i++) SA[i] = i;
hash_process();
sort(SA+1, SA+1+len, my_compare);
for(int i = 1; i <= len; i++) printf("%d ", SA[i]-1);
Height[1] = 0;
for(int i = 2; i <= len; i++)
{
Height[i] = longest_pre(SA[i], SA[i-1]);
}
putchar('\n');
for(int i = 1; i <= len; i++) printf("%d ", Height[i]);
return 0;
}
算法竞赛进阶指南0x14 Hash的更多相关文章
- 《算法竞赛进阶指南》0x10 基本数据结构 Hash
Hash的基本知识 字符串hash算法将字符串看成p进制数字,再将结果mod q例如:abcabcdefg 将字母转换位数字(1231234567)=(1*p9+2*p8+3*p7+1*p6+2*p5 ...
- 《算法竞赛进阶指南》1.4Hash
137. 雪花雪花雪花 有N片雪花,每片雪花由六个角组成,每个角都有长度. 第i片雪花六个角的长度从某个角开始顺时针依次记为ai,1,ai,2,-,ai,6. 因为雪花的形状是封闭的环形,所以从任何一 ...
- bzoj 1787 && bzoj 1832: [Ahoi2008]Meet 紧急集合(倍增LCA)算法竞赛进阶指南
题目描述 原题连接 Y岛风景美丽宜人,气候温和,物产丰富. Y岛上有N个城市(编号\(1,2,-,N\)),有\(N-1\)条城市间的道路连接着它们. 每一条道路都连接某两个城市. 幸运的是,小可可通 ...
- POJ1639 算法竞赛进阶指南 野餐规划
题目描述 原题链接 一群小丑演员,以其出色的柔术表演,可以无限量的钻进同一辆汽车中,而闻名世界. 现在他们想要去公园玩耍,但是他们的经费非常紧缺. 他们将乘车前往公园,为了减少花费,他们决定选择一种合 ...
- 算法竞赛进阶指南 0x00 基本算法
放在原来这个地方不太方便,影响阅读体验.为了读者能更好的刷题,另起一篇随笔. 0x00 基本算法 0x01 位运算 [题目][64位整数乘法] 知识点:快速幂思想的灵活运用 [题目][最短Hamilt ...
- 算法竞赛进阶指南--快速幂,求a^b mod p
// 快速幂,求a^b mod p int power(int a, int b, int p) { int ans = 1; for (; b; b >>= 1) { if (b &am ...
- 《算法竞赛进阶指南》1.6Trie
142. 前缀统计 给定N个字符串S1,S2-SN,接下来进行M次询问,每次询问给定一个字符串T,求S1-SN中有多少个字符串是T的前缀. 输入字符串的总长度不超过106,仅包含小写字母. 输入格式 ...
- 《算法竞赛进阶指南》 1 (P4) a^b 快速幂
快速幂 #include<cstdio> #include<cmath> #include<iostream> using namespace std; long ...
- POJ1722 算法竞赛进阶指南 SUBSTRACT减操作
原题连接 题目描述 给定一个整数数组\(a_1,a_2,-,a_n\). 定义数组第 i 位上的减操作:把\(a_i\)和\(a_{i+1}\)换成\(a_i - a_{i+1}\). 用con(a, ...
随机推荐
- 异步编程利器:CompletableFuture
一.一个示例回顾Future 一些业务场景我们需要使用多线程异步执行任务,加快任务执行速度. JDK5新增了Future接口,用于描述一个异步计算的结果.虽然 Future 以及相关使用方法提供了异步 ...
- maccms10二开批量入库和资源打包
批量入库 因为maccms自带的采集采集起来很慢,而且很多资源站的采集接口不能对内容排序,导致最旧的数据最后入库.用java写个采集程序,采集完入库的时候发现不能一次性入库多个数据,导致入库也很慢,所 ...
- 基础路径规划算法(Dijikstra、A*、D*)总结
引言 在一张固定地图上选择一条路径,当存在多条可选的路径之时,需要选择代价最小的那条路径.我们称这类问题为最短路径的选择问题.解决这个问题最经典的算法为Dijikstra算法,其通过贪心选择的步骤从源 ...
- 力扣算法JS LC 59-螺旋矩阵2,LC 152-乘积最大子数组
LC 59-螺旋矩阵2 给你一个正整数 n ,生成一个包含 1 到 n2 所有元素,且元素按顺时针顺序螺旋排列的 n x n 正方形矩阵 matrix . 示例 1: 输入:n = 3输出:[[1,2 ...
- 【WPF】WPF开发用户控件、用户控件属性依赖DependencyProperty实现双向绑定、以及自定义实现Command双向绑定功能演示
前言: Wpf开发过程中,最经常使用的功能之一,就是用户控件(UserControl)了.用户控件可以用于开发用户自己的控件进行使用,甚至可以用于打造一套属于自己的UI框架.依赖属性(Dependen ...
- 147_Power BI Report Server demo演示
焦棚子的文章目录 服务器地址:http://pbirs.jiaopengzi.com/reports 用户名:pbirs 密码:pbirs 分别用pc网页.pc桌面power bi软件以及手机端pow ...
- 以圆类 Circle 为基础设计球类 Sphere
学习内容:实验二以圆类 Circle 为基础设计球类 Sphere 代码示例: import java.util.Scanner; class Point{ private double x; pri ...
- 获取并检查系统负载\CPU\内存\磁盘\网络
安装依赖 需要net-tools.namp! CentOS:yum -y install net-tools nmap Ubuntu:apt-get update && apt-get ...
- Fail2ban 术语
filter 过滤器,使用正则表达式定义一个过滤器,从日志中匹配到IP.端口等. action 动作,定义在指定时间段要执行的操作. jail 监禁,jail是一个filter和一个action或者多 ...
- Redis概述及基本数据结构
SQL vs NoSQL 结构化 SQL 是结构化的,一旦定义了表结构,以后在维护数据的时候必须严格遵守定义的结构. NoSQL 是非结构化的,常见的形式有 Redis 的 Key-Value 存储形 ...