题目描述

标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。

一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。

例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的,因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解,而且是在字典D下能够被理解的最长的前缀。

给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。

输入格式

输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。之后的n行每行描述一个单词,再之后的m行每行描述一段文章。

其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。

输出格式

对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。

emmmmmm, 好多神奇的算法, 什么KMP, 什么trie树, 什么AC自动机, 但是都不会, 题解竟然没有hash, 还是用hash + dp, 随便搞一搞吧。。。

刚看到这道题的时候, 这不显然用hash;用s, t表示两个指针, 不断把t++, 如果\([s, t]\)这个区间能够满足, 就把s赋成t + 1, 最后输出s - 1, 然后。。。我就光荣的WA掉了。 不妨看这组数据:

  1. a
  2. abc
  3. aabc

假如用以上算法的话输出值为2, 即匹配了aa, 但整个文章显然都是可以翻译的, 所以上面贪心的思想就是不对的, 那怎么办呢。。。

首先我把每个单词的hash值求出来, 再用一次数字hash, 保证这个hash值能在我们存储的范围内。 并且我开一个vector, q[i]表示以i结尾的单词的hash值和长度。

在匹配的时候, 这\(f[i]\)表示前缀i是否能匹配, 我从1枚举到当前文章的长度len, 并枚举以当前字母结尾的hash值和长度len1, 当且仅当\(f[i - len1]\)能满足, 且\([i - len1 + 1, i]\)这个区间是一个单词, 那么\(f[i]\)就可以赋成true, 这样输出最后能够达到的长度即可。

  1. #include <bits/stdc++.h>
  2. using namespace std;
  3. typedef unsigned long long ull;
  4. const int INF = 0x3f3f3f3f;
  5. const int MAXN = 1e6 + 100;
  6. const int MAXM = 5e3 + 10;
  7. const double eps = 1e-5;
  8. template < typename T > inline void read(T &x) {
  9. x = 0; T ff = 1, ch = getchar();
  10. while (!isdigit(ch)) {
  11. if (ch == '-') ff = -1;
  12. ch = getchar();
  13. }
  14. while (isdigit(ch)) {
  15. x = (x << 1) + (x << 3) + (ch ^ 48);
  16. ch = getchar();
  17. }
  18. x *= ff;
  19. }
  20. template < typename T > inline void write(T x) {
  21. if (x == 0) {
  22. putchar('0');
  23. return ;
  24. }
  25. if (x < 0) putchar('-'), x = -x;
  26. static T tot = 0, ch[30];
  27. while (x) {
  28. ch[++tot] = x % 10 + '0';
  29. x /= 10;
  30. }
  31. while (tot) putchar(ch[tot--]);
  32. }
  33. ull p[MAXN], vis[MAXN], sum[MAXN];
  34. int n, m, f[MAXN];
  35. char ch[MAXN];
  36. const int mod = 1e6 + 7;
  37. vector < pair < int, int > > q[30];
  38. inline int H(ull x) {
  39. int u = x % mod;
  40. while (vis[u] && vis[u] != x) ++u;
  41. return u;
  42. }
  43. int main() {
  44. read(n), read(m);
  45. for (int i = 1; i <= n; ++i) {
  46. scanf("%s", ch + 1);
  47. int len = strlen(ch + 1);
  48. ull cnt = 0;
  49. for (int j = 1; j <= len; ++j) {
  50. cnt = cnt * 131 + ch[j] - 'a' + 1;
  51. }
  52. int u = H(cnt);
  53. vis[u] = cnt;
  54. q[ch[len] - 'a' + 1].push_back({u, len});
  55. }
  56. p[0] = 1;
  57. for (int i = 1; i <= MAXN; ++i) p[i] = p[i - 1] * 131;
  58. while (m--) {
  59. scanf("%s", ch + 1);
  60. int len = strlen(ch + 1);
  61. for (int i = 1; i <= len; ++i)
  62. sum[i] = sum[i - 1] * 131 + ch[i] - 'a' + 1;
  63. f[0] = 1;
  64. int cnt = 0;
  65. for (int i = 1; i <= len; ++i) {
  66. f[i] = 0;
  67. int x = ch[i] - 'a' + 1;
  68. for (int j = 0; j < q[x].size(); ++j) {
  69. int u = q[x][j].first, len1 = q[x][j].second;
  70. if (i < len1) continue;
  71. if (!f[i - len1]) continue;
  72. ull v = sum[i] - sum[i - len1] * p[len1];
  73. int h = H(v);
  74. if (vis[h]) f[i] = 1, cnt = i;
  75. }
  76. }
  77. write(cnt);
  78. puts("");
  79. }
  80. return 0;
  81. }

[HNOI2004]L语言 trie树? Ac自动机? hash!!的更多相关文章

  1. 【BZOJ1212】[HNOI2004]L语言 Trie树

    [BZOJ1212][HNOI2004]L语言 Description 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构 ...

  2. BZOJ1212[HNOI2004]L语言——trie树+DP

    题目描述 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D是若干个单词的 ...

  3. 2021.11.09 P2292 [HNOI2004]L语言(trie树+AC自动机)

    2021.11.09 P2292 [HNOI2004]L语言(trie树+AC自动机) https://www.luogu.com.cn/problem/P2292 题意: 标点符号的出现晚于文字的出 ...

  4. [HNOI2004]L语言 字典树 记忆化搜索

    [HNOI2004]L语言 字典树 记忆化搜索 给出\(n\)个字符串作为字典,询问\(m\)个字符串,求每个字符串最远能匹配(字典中的字符串)到的位置 容易想到使用字典树维护字典,然后又发现不能每步 ...

  5. Luogu P2292 [HNOI2004]L语言(Trie+dp)

    P2292 [HNOI2004]L语言 题面 题目描述 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章 \(T\) 是由若干小写字母构成. ...

  6. BZOJ 1212 HNOI 2004 L语言 Trie树

    标题效果:给一些词.和几个句子,当且仅当句子可以切子可以翻译词典,这意味着该子将被翻译. 找到最长前缀长度可以被翻译. 思维:使用Trie树阵刷.你可以刷到最长的地方是最长的字符串可以翻译到的地方. ...

  7. 洛谷.2292.[HNOI2004]L语言(Trie DP)

    题目链接 /* 简单的DP,查找是否有字典中的单词时在Trie树上做 要注意在最初Match(0)一遍后,i还是要从0开始匹配,因为如果有长度为1的单词,Match(i+1)不会从1更新 1M=102 ...

  8. BZOJ1212: [HNOI2004]L语言(Trie图+DP)

    Description 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D ...

  9. BZOJ 1212: [HNOI2004]L语言 trie

    长度小于 10 是关键信息~ #include <cstdio> #include <cstring> #include <algorithm> #define N ...

随机推荐

  1. JS实现数组排序的方法

    前言 排序是计算机内经常进行的一种操作,其目的是将一组“无序”的记录序列调整为“有序”的记录序列,当然排序也是算法中的一种,javascript内置的sort函数是多种排序算法的集合,数组在原数组上进 ...

  2. MongoDB 学习笔记之 Nested doc/DBRef (Spark)

    Nested doc/DBRef (Spark) 实现: 运行结果:

  3. 自动下载zar配置管理

    maven 下载: https://maven.apache.org/ 官网 download 下载:Binary zip archive apache-maven-3.6.2-bin.zip 免安装 ...

  4. 重磅发布 | 全球首个云原生应用标准定义与架构模型 OAM 正式开源

    作者: OAM 项目负责人 导读:2019 年 10 月 17 日,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟(花名:小邪)在 Qcon 上海重磅宣布,阿里云与微软联合推出开放应用模型 Op ...

  5. winsock完成端口套接字重用注意事项

    刚申请到博客,第一篇随笔(๑•̀ㅂ•́)و✧ 关于DisconnectEx的一个问题,目前主要发现在windows10中出现了这个问题,winserver2008 win7都没有这个问题. 被Disc ...

  6. 微信小程序开发环境安装以及相关设置配置

    微信小程序开发环境安装以及相关设置配置 一.安装 软件名称:wechat_devtools_1.02.1907232_x64 软件安装地址:https://developers.weixin.qq.c ...

  7. 攻防世界(XCTF)WEB(进阶区)write up(二)

    国庆就要莫得了   起床刷几道 NewsCenter mfw Training-WWW-Robots NaNNaNNaNNaN-Batman bug NewsCenter search传参那里发现有注 ...

  8. 渗透测试-基于白名单执行payload--Csc

    复现亮神课程 基于白名单执行payload--csc 0x01 Csc.exe C#的在Windows平台下的编译器名称是Csc.exe,如果你的.NET FrameWork SDK安装在C盘,那么你 ...

  9. 安装VMware Tools显示灰色正确解决办法

    首先问题如下: 解决办法如下:1.关闭虚拟机: 2.在虚拟机设置分别设置CD/DVD.CD/DVD2和软盘为自动检测三个步骤: 3.再重启虚拟机,灰色字即点亮. 大功告成,如果解决了你的问题,点个赞鼓 ...

  10. go-关键字-变量

        var 声明变量 const 常量的关键字, 常量不能出现只声明不赋值的情况. 名字首字母为大写的程序实体可以被任何代码包中的代码访问到. 名字首字母为小写的程序实体则只能被同一个代码包中的代 ...