数单词

时间限制:1000 ms  |  内存限制:65535 KB
难度:4
描写叙述
为了可以顺利通过英语四六级考试,如今大家每天早上都会早起读英语。
LYH本来以为自己在6月份的考试中能够通过六级,但是没想到,成绩出来以后。竟然没有通过。所以他不得不付出很多其它的时间来学习英语。
要想通过六级。最主要的要求就是词汇量。为了可以更快的记住一些陌生单词。LYH有时会找一些英语文章来读。
今天早上。LYH又找了一篇文章。读之前。他突然萌生出一个想法:文章中哪些单词出现的次数最多呢?
输入
第一行输入一个整数T。表示有T组測试数据(1≤T≤200)。

对于每组測试数据。第一行输入一个整数n(1≤n≤150),表示LYH要查询的单词数量(有些单词可能会反复出现)。

接下来n行。每行输入一个单词,长度不大于100。

最后一行包括一个由小写字母组成的英语文章(字符串),长度不大于10^6。
输出
对于每组数据,第一行输出一个整数,表示单词出现的次数。

然后依照输入顺序,每行输出一个出现次数最多的单词。

假设有反复出现的单词。把它们所有输出。

例子输入
2
3
good
oo
one
goodafternooneveryone
1
to
welcometotopcoder
例子输出
2
oo
one
2
to

分析:这就是一个AC自己主动机模板题,要注意的是查询的单词中,一个单词可能会出现多次。这里要处理一下。

#include <cstring>
#include <cstdio>
#include <algorithm>
#include <map>
#include <string>
#include <queue>
using namespace std; #define SIGMA_SIZE 26 //文本串字符内容
#define MAXNODE 20000 //节点数量
#define TEXT_SIZE 1000005 //文本串长度
#define P_SIZE 100 //模式串长度
#define P_NUM 200 //模式串数量 map <string, int> mp; struct AhoCorasickAutomata
{
int cnt[P_NUM];
int sz;
int ch[MAXNODE][SIGMA_SIZE];
int f[MAXNODE];
int val[MAXNODE];
int last[MAXNODE]; void Init() {
sz = 1;
memset(ch[0],0,sizeof(ch[0]));
memset(cnt,0,sizeof(cnt));
mp.clear();
} int idx(char c) {
return c - 'a';
} void Insert(char *s,int v) {
int u = 0, n = strlen(s);
for(int i = 0; i < n; i++) {
int c = idx(s[i]);
if(!ch[u][c]) {
memset(ch[sz], 0, sizeof(ch[sz]));
val[sz] = 0;
ch[u][c] = sz++;
}
u = ch[u][c];
}
val[u] = v;
mp[string(s)] = v;
} void print(int j) {
if(j) {
cnt[val[j]]++;
print(last[j]);
}
} void Find(char *T) {
int n = strlen(T);
int j = 0;
for(int i = 0; i < n; i++) {
int c = idx(T[i]);
while(j && !ch[j][c]) j = f[j];
j = ch[j][c];
if(val[j]) print(j);
else if(last[j]) print(last[j]);
}
} void Get_Fail() {
queue<int> q;
f[0] = 0;
for(int c = 0; c<SIGMA_SIZE; c++) {
int u = ch[0][c];
if(u) {
f[u] = 0;
q.push(u);
last[u] = 0;
}
}
while(!q.empty()) {
int r = q.front();
q.pop();
for(int c = 0; c<SIGMA_SIZE; c++) {
int u = ch[r][c];
if(!u) continue;
q.push(u);
int v = f[r];
while(v && !ch[v][c]) v = f[v];
f[u] = ch[v][c];
last[u] = val[f[u]] ? f[u] : last[f[u]];
}
}
}
}; char text[TEXT_SIZE];
char P[P_NUM][P_SIZE];
AhoCorasickAutomata ac;
int n, T; int main() {
scanf("%d", &T);
int cas = 0;
while(T--) {
scanf("%d", &n);
ac.Init();
for(int i = 1; i <= n; i++) {
scanf("%s", P[i]);
ac.Insert(P[i], i);
}
ac.Get_Fail();
scanf("%s", text);
ac.Find(text);
int Max_cnt = -1;
for(int i = 1; i <= n; i++)
if(ac.cnt[i] > Max_cnt)
Max_cnt = ac.cnt[i];
printf("%d\n", Max_cnt);
for(int i = 1; i <= n; i++)
if(ac.cnt[mp[string(P[i])]] == Max_cnt)
printf("%s\n", P[i]);
}
return 0;
}

NYOJ 1085 数单词 (AC自己主动机模板题)的更多相关文章

  1. hdu5384 AC自己主动机模板题,统计模式串在给定串中出现的个数

    http://acm.hdu.edu.cn/showproblem.php?pid=5384 Problem Description Danganronpa is a video game franc ...

  2. HDU 2222 Keywords Search(AC自己主动机模板题)

    题意:给出一个字符串和若干个模板,求出在文本串中出现的模板个数. 思路:由于有可能有反复的模板,trie树权值记录每一个模板出现的次数就可以. #include<cstdio> #incl ...

  3. HDU 5384 Danganronpa (AC自己主动机模板题)

    题意:给出n个文本和m个模板.求每一个文本中全部模板出现的总次数. 思路:Trie树权值记录每一个模板的个数.对于每一个文本跑一边find就可以. #include<cstdio> #in ...

  4. 【HDU】病毒侵袭(AC自己主动机模板题)

    AC自己主动机的模板题.因为输入的字符串中的字符不保证全为小写字母.所以范围应该在130之前,而前31位字符是不可能出如今字符串的(不懂得查下ACSII表即可了).所以仅仅须要开的结点数组大小为130 ...

  5. AC自己主动机模板

    AC自己主动机模板-- /* * AC自己主动机模板 * 用法: * 1.init() : 初始化函数 * 2.insert(str) : 插入字符串函数 * 3.build() : 构建ac自己主动 ...

  6. BZOJ 3172 [Tjoi2013]单词 AC自己主动机(fail树)

    题意:链接 方法:AC自己主动机与fail树性质 解析:复习AC自己主动机的第一道题?(真正的第一题明明是又一次写了遍hdu2222! ) 这题说实话第一眼看上去就是个sb题,仅仅要建出来自己主动机. ...

  7. HDU 2222 Keywords Search AC自己主动机入门题

    单词统计的题目,给出一些单词,统计有多少单词在一个文本中出现,最经典的入门题了. AC自己主动机的基础: 1 Trie. 以这个数据结构为基础的,只是添加一个fail指针和构造fail的函数 2 KM ...

  8. hdu2222--Keywords Search+AC自己主动机模板

    题目链接:pid=2222">点击进入 KMP对模式串进行处理.然后就能够方便的推断模式串是否在目标串中出现了:这显示适合一个模式串多个目标串的情况.可是假设模式串有多个,这时假设还用 ...

  9. hdoj 2222 Keywords Search 【AC自己主动机 入门题】 【求目标串中出现了几个模式串】

    Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others ...

随机推荐

  1. 生成pdf文件

  2. 基于visual Studio2013解决C语言竞赛题之0605strcat

      题目

  3. What’s New in Python 2.7 — Python 3.4.0b2 documentation

    What's New in Python 2.7 - Python 3.4.0b2 documentation What's New in Python 2.7¶

  4. adxl345的STM32驱动程序和硬件设计

    一.硬件电路接口图片 1.ADXL345硬件接口图片使用的是SPI端口进行通信,这样读取数据比较快且后续也可以转化为IIC通信接口. 在网上找一些发现IIC接口的比较多,所以本人就DIY做SPI的通信 ...

  5. mongodb进阶一之高级查询

    上篇文章我们讲了mongodb的crud基本操作 http://blog.csdn.net/stronglyh/article/details/46812579 这篇我们来说说mongodb的进阶-- ...

  6. 基于JSP+SERVLET的新闻发布系统(三)

    拖了这么久..今天把栏目管理还有新闻管理模块的也挂出来.. 栏目管理跟用户管理一样. 这里重点讲解新闻管理. 效果图如上: 1,可选择栏目类别,且栏目类别是动态生成的. 默认生成的文章是未审核状态的. ...

  7. 【译】在Asp.Net中操作PDF - iTextSharp - 使用字体

    原文 [译]在Asp.Net中操作PDF - iTextSharp - 使用字体 紧接着前面我对iTextSharp简介博文,iTextSharp是一个免费的允许Asp.Net对PDF进行操作的第三方 ...

  8. java设计模式之——适配器模式

    适配器模式把一个类的接口变换成客户端所期待的另一种接口,从而使原本因接口不匹配而无法在一起工作的两个类能够在一起工作. 适配器模式的用途 用电器做例子,笔记本电脑的插头一般都是三相的,即除了阳极.阴极 ...

  9. mysql 结合keepalived测试

    vip:192.168.32.66 192.168.32.6 主库: mysql> show variables like '%read_only%'; +------------------+ ...

  10. linux c setitimer使用方法说明

    在linux c编程中.setitimer是一个比較经常使用的函数.可用来实现延时和定时的功能,网上有各种零零散散的使用方法说明,都仅仅提到了个别使用方法,今天抽出时间实践整理了一份比較具体的: 使用 ...