[HNOI2004]L语言 trie树？ Ac自动机？ hash！！

题目描述

标点符号的出现晚于文字的出现，所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。

一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的，是指如果文章T可以被分成若干部分，且每一个部分都是字典D中的单词。

例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’}，则文章‘whatisyourname’是在字典D下可以被理解的，因为它可以分成4个单词：‘what’, ‘is’, ‘your’, ‘name’，且每个单词都属于字典D，而文章‘whatisyouname’在字典D下不能被理解，但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’，也可以在字典D下被理解，而且是在字典D下能够被理解的最长的前缀。

给定一个字典D，你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。

输入格式

输入文件第一行是两个正整数n和m，表示字典D中有n个单词，且有m段文章需要被处理。之后的n行每行描述一个单词，再之后的m行每行描述一段文章。

其中1<=n, m<=20，每个单词长度不超过10，每段文章长度不超过1M。

输出格式

对于输入的每一段文章，你需要输出这段文章在字典D可以被理解的最长前缀的位置。

emmmmmm, 好多神奇的算法，什么KMP，什么trie树，什么AC自动机，但是都不会，题解竟然没有hash，还是用hash + dp，随便搞一搞吧。。。

刚看到这道题的时候，这不显然用hash；用s， t表示两个指针，不断把t++，如果\([s, t]\)这个区间能够满足，就把s赋成t + 1，最后输出s - 1，然后。。。我就光荣的WA掉了。不妨看这组数据：

a

abc

aabc

假如用以上算法的话输出值为2，即匹配了aa，但整个文章显然都是可以翻译的，所以上面贪心的思想就是不对的，那怎么办呢。。。

首先我把每个单词的hash值求出来，再用一次数字hash，保证这个hash值能在我们存储的范围内。并且我开一个vector, q[i]表示以i结尾的单词的hash值和长度。

在匹配的时候，这\(f[i]\)表示前缀i是否能匹配，我从1枚举到当前文章的长度len，并枚举以当前字母结尾的hash值和长度len1，当且仅当\(f[i - len1]\)能满足，且\([i - len1 + 1, i]\)这个区间是一个单词，那么\(f[i]\)就可以赋成true，这样输出最后能够达到的长度即可。

#include <bits/stdc++.h>

using namespace std;

typedef unsigned long long ull;

const int INF = 0x3f3f3f3f;

const int MAXN = 1e6 + 100;

const int MAXM = 5e3 + 10;

const double eps = 1e-5;

template < typename T > inline void read(T &x) {

	x = 0; T ff = 1, ch = getchar();

	while (!isdigit(ch)) {

		if (ch == '-') ff = -1;

		ch = getchar();

	}

	while (isdigit(ch)) {

		x = (x << 1) + (x << 3) + (ch ^ 48);

		ch = getchar();

	}

	x *= ff;

}

template < typename T > inline void write(T x) {

	if (x == 0) {

		putchar('0');

		return ;

	}

	if (x < 0) putchar('-'), x = -x;

	static T tot = 0, ch[30];

	while (x) {

		ch[++tot] = x % 10 + '0';

		x /= 10;

	}

	while (tot) putchar(ch[tot--]);

} 

ull p[MAXN], vis[MAXN], sum[MAXN];

int n, m, f[MAXN];

char ch[MAXN];

const int mod = 1e6 + 7;

vector < pair < int, int > > q[30]; 

inline int H(ull x) {

	int u = x % mod;

	while (vis[u] && vis[u] != x) ++u;

	return u;

}

int main() {

	read(n), read(m);

	for (int i = 1; i <= n; ++i) {

		scanf("%s", ch + 1);

		int len = strlen(ch + 1);

		ull cnt = 0;

		for (int j = 1; j <= len; ++j) {

			cnt = cnt * 131 + ch[j] - 'a' + 1;

		}

		int u = H(cnt);

		vis[u] = cnt;

		q[ch[len] - 'a' + 1].push_back({u, len});

	}

	p[0] = 1;

	for (int i = 1; i <= MAXN; ++i) p[i] = p[i - 1] * 131;

	while (m--) {

		scanf("%s", ch + 1);

		int len = strlen(ch + 1);

		for (int i = 1; i <= len; ++i)

			sum[i] = sum[i - 1] * 131 + ch[i] - 'a' + 1;

		f[0] = 1;

		int cnt = 0;

		for (int i = 1; i <= len; ++i) {

			f[i] = 0;

			int x = ch[i] - 'a' + 1;

			for (int j = 0; j < q[x].size(); ++j) {

				int u = q[x][j].first, len1 = q[x][j].second;

				if (i < len1) continue;

				if (!f[i - len1]) continue;

				ull v = sum[i] - sum[i - len1] * p[len1];

				int h = H(v);

				if (vis[h]) f[i] = 1, cnt = i;

			}

		}

		write(cnt);

		puts("");

	}

 	return 0;

}

[HNOI2004]L语言 trie树？ Ac自动机？ hash！！的更多相关文章

【BZOJ1212】[HNOI2004]L语言 Trie树
[BZOJ1212][HNOI2004]L语言 Description 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构 ...
BZOJ1212[HNOI2004]L语言——trie树+DP
题目描述标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D是若干个单词的 ...
2021.11.09 P2292 [HNOI2004]L语言（trie树+AC自动机）
2021.11.09 P2292 [HNOI2004]L语言(trie树+AC自动机) https://www.luogu.com.cn/problem/P2292 题意: 标点符号的出现晚于文字的出 ...
[HNOI2004]L语言字典树记忆化搜索
[HNOI2004]L语言字典树记忆化搜索给出\(n\)个字符串作为字典,询问\(m\)个字符串,求每个字符串最远能匹配(字典中的字符串)到的位置容易想到使用字典树维护字典,然后又发现不能每步 ...
Luogu P2292 [HNOI2004]L语言(Trie+dp)
P2292 [HNOI2004]L语言题面题目描述标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章 \(T\) 是由若干小写字母构成. ...
BZOJ 1212 HNOI 2004 L语言 Trie树
标题效果:给一些词.和几个句子,当且仅当句子可以切子可以翻译词典,这意味着该子将被翻译. 找到最长前缀长度可以被翻译. 思维:使用Trie树阵刷.你可以刷到最长的地方是最长的字符串可以翻译到的地方. ...
洛谷.2292.[HNOI2004]L语言(Trie DP)
题目链接 /* 简单的DP,查找是否有字典中的单词时在Trie树上做要注意在最初Match(0)一遍后,i还是要从0开始匹配,因为如果有长度为1的单词,Match(i+1)不会从1更新 1M=102 ...
BZOJ1212: [HNOI2004]L语言(Trie图+DP)
Description 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D ...
BZOJ 1212: [HNOI2004]L语言 trie
长度小于 10 是关键信息~ #include <cstdio> #include <cstring> #include <algorithm> #define N ...

随机推荐

如何把安全证书导入到java中的cacerts证书库（转）
如何把安全证书导入到java中的cacerts证书库提示: javax.net.ssl.SSLHandshakeException: sun.security.validator.Validat ...
MongoDB 学习笔记之 group聚合
group聚合: key: 分组字段 cond:过滤条件 reduce: curr是当前行 result是每组的结果集 initial : 组变量初始值 finalize: 统计一组后的回调函数用g ...
spring5 源码深度解析----- @Transactional注解的声明式事物介绍（100%理解事务）
面的几个章节已经分析了spring基于@AspectJ的源码,那么接下来我们分析一下Aop的另一个重要功能,事物管理. 事务的介绍 1.数据库事物特性原子性多个数据库操作是不可分割的,只有所有的操作 ...
Windows10 1903错误0xc0000135解决方案
Windows10 1903错误0xc0000135解决方案 === windows10 1903是2019年Mircosoft推出的最新版windows操作系统,但是有很多机器装上之后会存在不支持. ...
Ned 的难题
题目描述 Ned 再也看不下去 Robert 的种种恶习, 于是他决定出一道题来让他醒悟. Ned 的题目是这样: 给出一个有 n 个数的序列, 求其中所有连续子序列的数的最大公因数的乘积模 1000 ...
声学回声消除(Acoustic Echo Cancellation)
回声就是声音信号经过一系列反射之后,又听到了自己讲话的声音,这就是回声.一些回声是必要的,比如剧院里的音乐回声以及延迟时间较短的房间回声:而大多数回声会造成负面影响,比如在有线或者无线通信时重复听到自 ...
Kubernetes快速入门
二.Kubernetes快速入门 (1)Kubernetes集群的部署方法及部署要点 (2)部署Kubernetes分布式集群 (3)kubectl使用基础 1.简介 kubectl就是API ser ...
Jenkins构建Jmeter项目之源代码管理（SVN）
1.查看项目创建中是否又svn插件,没有的话下载插件subversion 2.配置svn源代码管理,如下图(testcases目录下包含build.xml和脚本文件) 3.查看Jenkins本地工作空 ...
main(argc, char *argv[])
#include<stdio.h> int main(int argc, char *argv[]) { int i; ;i<argc;i++) { printf("arg ...
JavaScript ES6函数式编程（二）：柯里化、偏应用和组合、管道
上一篇介绍了闭包和高阶函数,这是函数式编程的基础核心.这一篇来看看高阶函数的实战场景. 首先强调两点: 注意闭包的生成位置,清楚作用域链,知道闭包生成后缓存了哪些变量高阶函数思想:以变量作用域作为根 ...

[HNOI2004]L语言 trie树？ Ac自动机？ hash！！

输出格式 对于输入的每一段文章，你需要输出这段文章在字典D可以被理解的最长前缀的位置。

[HNOI2004]L语言 trie树？ Ac自动机？ hash！！的更多相关文章

随机推荐

热门专题

输出格式

对于输入的每一段文章，你需要输出这段文章在字典D可以被理解的最长前缀的位置。