BZOJ-3555:企鹅QQ(字符串哈希)
PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。
Input
第一行包含三个正整数 , , 。其中 表示账户名称数量, 表示账户名称长度, 用来表示字符集规模大小,它的值只可能为2或64。
若 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。
Output
仅一行一个正整数,表示共有多少对相似的账户名称。
Sample Input
Fax
fax
max
mac
Sample Output
4
Hint
4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。N<=30000,L<=200,S<=64
思路:对每个串都求一下哈希值,因为只有一位不同,所以可以枚举一下,将每个字符串删除同样位置的字符,然后排序比一下,要是有哈希值(已删去一个字符的)相等的,就算一对。详见代码注释:
#include<cstdio>
#include<iostream>
#include<string>
#include<algorithm> using namespace std;
typedef long long ll;//以下有爆掉的情况会自然溢出,超过ll自动对2^63取模
#define maxn 30005 const ll key=;//选一个大素数做种子
int n,m,s;
char str[maxn][];
ll p[maxn]={},a[maxn],sum[maxn][];
ll ans; void hash(int x,char *s)//为每个字符串都赋一个映射的哈希函数值,就像它的代号
{
for(int i=;i<=m;i++) sum[x][i]=sum[x][i-]*key+s[i];
}
void cal(int j)
{
for(int i=;i<=n;i++)//对每个串都删去当前的。因为上一轮哈希值已经减去前一个字符的哈希值了,这一轮要加回来
a[i]=sum[i][m]-sum[i][j]*p[m-j]+sum[i][j-]*p[m-j+];//这里p的应用,自己举个小例子画一画,把字符当成数字就好
sort(a+,a++n);
ll now=;
for(int i=;i<=n;i++)//因为排过序了,所以直接比较前一个和后一个的值,相等就加一组。因为是总对数,对now的当前值直接往答案上加
if(a[i]==a[i-]) ans+=now,now++;
else now=;
}
int main()
{
scanf("%d%d%d",&n,&m,&s);
for(int i=;i<=maxn;i++)//提前初始化一下p数组,p的使用方法配合之后的过程来体会
p[i]=p[i-]*key;
for(int i=;i<=n;i++)//hash计算一下
scanf("%s",str[i]+),hash(i,str[i]);
for(int i=;i<=m;i++)//枚举,删去下标为i的那个字符
cal(i);
printf("%lld",ans);
return ;
}
10个月后重做:
唔,这是入驻博客园的第一篇题解,记得那时还懵懵逼逼看了半天黄学长代码才懂,且感到精妙……现在看来好像哈希莽一下就能过了,另外黄学长写那个题解的时候看来也还年轻啊……也是因为近一年里看过很多次这种类似进制的操作了吧。另外原来爆一爆longlong也能过啊,大概负数也算不冲突?当时好像以为longlong是自然溢出。
unordered_map是C++11的BZOJ不支持于是CE……map试了试被卡常于是TLE……只好sort一下,用了4秒多过去。
#include <cstdio>
#include <algorithm>
using namespace std; typedef unsigned long long ull;
const int maxn = 3e5 + ;
const int seed = ; int N, L, S, ans;
char str[maxn][];
ull p[], val[maxn], tmp[maxn]; int main() {
scanf("%d %d %d", &N, &L, &S);
p[] = ;
for (int i = ; i <= L; i++)
p[i] = p[i - ] * seed; for (int i = ; i <= N; i++) {
scanf("%s", str[i] + );
for (int j = ; j <= L; j++) {
val[i] += p[j] * (int)str[i][j];
}
} for (int j = ; j <= L; j++) {
for (int i = ; i <= N; i++) {
tmp[i] = val[i] - p[j] * (int)str[i][j];
}
sort(tmp + , tmp + + N);
for (int i = , pos = ; i <= N; i = pos) {
while (pos <= N && tmp[pos] == tmp[i]) pos++;
ans += (pos - i) * (pos - i - ) / ;
}
} printf("%d\n", ans);
return ;
}
BZOJ-3555:企鹅QQ(字符串哈希)的更多相关文章
- BZOJ 3555: [Ctsc2014]企鹅QQ [字符串哈希]【学习笔记】
3555: [Ctsc2014]企鹅QQ Time Limit: 20 Sec Memory Limit: 256 MBSubmit: 2046 Solved: 749[Submit][Statu ...
- Luogu P4503 [CTSC2014]企鹅QQ(字符串哈希)
P4503 [CTSC2014]企鹅QQ 题面 题目背景 \(PenguinQQ\) 是中国最大.最具影响力的 \(SNS(Social Networking Services)\) 网站,以实名制为 ...
- bzoj 3555 企鹅QQ
https://www.lydsy.com/JudgeOnline/problem.php?id=3555 枚举每一位字符,计算字符两侧的哈希值,然后进行比较,用map或排序记录出与其相同的字符串数量 ...
- bzoj3555 [Ctsc2014]企鹅QQ——字符串哈希
题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3555 很久以前就讲过哈希,但一直没写过题,所以这是哈希第一题! 哈希就是把一个字符串映射成一 ...
- 【BZOJ-3555】企鹅QQ 字符串Hash
3555: [Ctsc2014]企鹅QQ Time Limit: 20 Sec Memory Limit: 256 MBSubmit: 1545 Solved: 593[Submit][Statu ...
- 【BZOJ 3555】 [Ctsc2014]企鹅QQ(哈希)
Description PenguinQQ是中国最大.最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志.群.即时通讯.相册.集市等丰富强大 ...
- 【bzoj3555】[Ctsc2014]企鹅QQ 简单哈希
传送门 题目分析 题意即求有多少对字符串只相差一个字符,枚举删除每个字符后的哈希, 看有多少相等即可. 比如有如下字符串:$Sd123$,其中S部分的哈希值为H,删除的是d,则原字符串的哈希值为$$( ...
- 【bzoj3555】[Ctsc2014]企鹅QQ 字符串hash
题目描述 PenguinQQ是中国最大.最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志.群.即时通讯.相册.集市等丰富强大的互联网功能体 ...
- 字符串Hash || BZOJ 3555: [Ctsc2014]企鹅QQ || P4503 [CTSC2014]企鹅QQ
题面:[CTSC2014]企鹅QQ 题解:无 代码: #include<iostream> #include<cstring> #include<cstdio> # ...
- 【BZOJ3555】企鹅QQ(字符串哈希)
[BZOJ3555]企鹅QQ(字符串哈希) 题面 BZOJ 题解 把前缀哈希一下,后缀哈希一下 枚举哪个位置不选,然后检查一下相同就行了.. 为什么我的\(Hash\)老是\(WA\), 为什么\(Z ...
随机推荐
- html 转字符串换成代码
1. [文件] htmlToCode.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" ...
- Java_正则_00_资源贴
二.参考资料 1.揭开正则表达式的神秘面纱
- julia
版本还不成熟,等成熟了再完整的看看吧.
- 第十四章-MySQL
1 安装 MySQL常见的版本 GA: 广泛使用的版本 RC: 最接近正式版本 Alpha和Bean: 内测版本和公测版本 有两种安装方式: 安装包和压缩包 1) 安装msi文件 2) 解压zip文件 ...
- 【Lintcode】029.Interleaving String
题目: Given three strings: s1, s2, s3, determine whether s3 is formed by the interleaving of s1 and s2 ...
- Btree算法的C语言实现
btree.h //实现对order序(阶)的B-TREE结构基本操作的封装. //查找:search,插入:insert,删除:remove. //创建:create,销毁:destory,打印:p ...
- 一次LVS+MySQL的主主负载均衡实战
这是去年做的一个项目的记录,如果大家有更好的解决方案,欢迎指出. 先说说项目需求,用户需要在两个地市部署两套应用系统和两套数据库,在一个地市主用,在另一个热备:数据要互备:而且如果主用地市流量很大,可 ...
- rt-thread的定时器管理源码分析
1 前言 rt-thread可以采用软件定时器或硬件定时器来实现定时器管理的,所谓软件定时器是指由操作系统提供的一类系统接口,它构建在硬件定时器基础之上,使系统能够提供不受数目限制的定时器服务.而硬件 ...
- 快速排序(java)
快速排序是冒泡排序的优化,是一种非常高效的排序, 甚至是目前为止最高效的排序,其思想是这样的:设数组a中存放了n个数据元素,low为数组的低端下标,high为数组的高端下标,从数组a中任取一个元素(通 ...
- Pseudo Random Nubmer Sampling
Pseudo Random Nubmer Sampling https://en.wikipedia.org/wiki/Inverse\_transform\_sampling given a dis ...