题目大意

给出一个RxC的字符组成的puzzle,中间可以从左向右,从右到左,从上到下,从下到上,从左上到右下,从右下到左上,从左下到右上,从右上到左下,八个方向进行查找字符串。 
    给出M个字符串,找出他们在puzzle中的位置,返回该字符串在puzzle中的起点横纵坐标以及方向。

字符串长度L <=1000, R,C <= 1000, W <= 1000

题目分析

多模式串的字符串匹配问题,考虑使用Trie图。将M个待查的字符串作为模式串插入Trie图中,然后设置前缀指针,构造DFA。 
    查找的时候,在puzzle的四个边上每个点,沿8个方向分别确定最长的串作为母串,用母串在Trie图上进行行走,进行匹配。

题目比较坑的是,special judge没能对有些正确的结果给AC,只能按照“正常”的顺序来查找。

实现(c++)

#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<string.h>
#include<vector>
#include<deque>
using namespace std;
#define MAX_SIZE 1005
#define LETTERS 26
#define MAX_NODES 150000
#define MIN(a, b) a < b? a :b
char gPizza[MAX_SIZE][MAX_SIZE];
struct PosInfo{
int row;
int col;
int dir;
void SetInfo(int r, int c, int d){
row = r;
col = c;
dir = d;
}
};
PosInfo gPosInfo[MAX_SIZE]; struct Node{
Node* childs[LETTERS];
bool danger_node;
Node* prev;
int pattern_index;
Node(){
memset(childs, 0, sizeof(childs));
prev = NULL;
danger_node = false;
pattern_index = 0; //可以指示某个终止节点确定的字符串是第几个pattern
}
};
Node gNodes[MAX_NODES];
int gNodeCount = 2; void Insert(Node* root, char* str, int pattern_index){
Node* node = root;
char*p = str;
while (*p != '\0'){
int index = *p - 'A';
if (! node->childs[index]){
node->childs[index] = gNodes + gNodeCount++;
}
node = node->childs[index];
p++;
}
node->danger_node = true;
node->pattern_index = pattern_index;
} void BuildDfa(){
Node* root = gNodes + 1;
for (int i = 0; i < LETTERS; i++){
gNodes[0].childs[i] = root;
}
root->prev = gNodes;
gNodes[0].prev = NULL; deque<Node*> Q;
Q.push_back(root);
while (!Q.empty()){
Node* node = Q.front();
Node* prev = node->prev, *p;
Q.pop_front();
for (int i = 0; i < LETTERS; i++){
if (node->childs[i]){
p = prev;
while (p && !p->childs[i]){
p = p->prev;
}
node->childs[i]->prev = p->childs[i];
//这个地方注意,不能写成 p->childs[i]->danger_node = node->childs[i]->danger_node
if (p->childs[i]->danger_node)
node->childs[i]->danger_node = true;
Q.push_back(node->childs[i]);
}
}
}
} bool gPatterFind[MAX_SIZE];
int gPatternFoundNum = 0;
int gMinPatternLen = 0;
int gPatternLen[MAX_SIZE];
int gMoveStep[8][2] = { { -1, 0 }, { -1, 1 }, { 0, 1 }, { 1, 1 }, { 1, 0 }, { 1, -1 }, {0, -1 }, { -1, -1 } }; //在Trie图上达到一个“危险”节点,则该节点的各个前缀指针,仍然可能为“终止”节点,沿前缀指针找出所有的终止节点,以防止遗漏
//比如 ABCDFF 中查找 ABCD CD 若到达D,确定为一个危险节点,可以找到ABCD,若不沿着前缀指针找出所有的终止节点,则会遗漏CD
void FindPatternFromEndPoint(Node* node, int r, int c, int dir){
do{
if (node->pattern_index == 0){
node = node->prev;
continue;
} int pattern_index = node->pattern_index;
if (gPatterFind[pattern_index]){ //此时找到的串,有可能是别的串的前缀,因此继续向后找
node = node->prev;
continue;
}
gPatterFind[pattern_index] = true;
gPatternFoundNum++; int beg_r = r - gPatternLen[pattern_index] * gMoveStep[dir][0];
int beg_c = c - gPatternLen[pattern_index] * gMoveStep[dir][1];
if (gMoveStep[dir][0] == 0)
beg_r--; if (gMoveStep[dir][1] == 0)
beg_c--; if (dir == 1 || dir == 7 || dir == 0){
beg_r -= 2;
}
if (dir == 5 || dir == 7 || dir == 6){
beg_c -= 2;
}
gPosInfo[pattern_index].SetInfo(beg_r, beg_c, dir); node = node->prev;
} while (node); }
//从某个边界点出发,沿某个方向的最长字符串作为母串,在Trie图上进行查找
void SearchStr(int start_x, int start_y, int dir){
int r = start_x, c = start_y;
Node* node = gNodes + 1;
while (gPizza[r][c] != '\0'){
int index = gPizza[r][c] - 'A';
while (node && node->childs[index] == NULL){
node = node->prev;
}
node = node->childs[index];
if (node->danger_node){
FindPatternFromEndPoint(node, r, c, dir);
}
r += gMoveStep[dir][0];
c += gMoveStep[dir][1];
}
}
//确定在边界上的某个点,沿某个方向所构成最长字符串的长度
int MaxLen(int R, int C, int r, int c, int dir){
if (dir == 0 || dir == 4)
return R;
if (dir == 2 || dir == 6)
return C;
if (dir == 1){
if (c == 1)
return r;
else if (r == R)
return C - c + 1;
}
if (dir == 5){
if (r == 1)
return c;
else if (c == C)
return R - r + 1;
}
if (dir == 3){
if (r == 1)
return C - c + 1;
if (c == 1)
return R - r + 1;
}
if (dir == 7){
if (r == R)
return c;
if (c == C)
return r;
}
return -1;
} //对边界上的每个点,在8个方向进行查找
void SearchPuzzle(int R, int C, int total_word_to_find){
for (int r = 1; r <= R; r++){
for (int dir = 0; dir < 8; dir++){
if (gPatternFoundNum == total_word_to_find){
return;
}
if (MaxLen(R, C, r, 1, dir) >= gMinPatternLen){
SearchStr(r, 1, dir);
}
}
}
for (int r = 1; r <= R; r++){
for (int dir = 0; dir < 8; dir++){
if (gPatternFoundNum == total_word_to_find){
return;
}
if (MaxLen(R, C, r, C, dir) >= gMinPatternLen){
SearchStr(r, C, dir);
}
}
}
for (int c = 1; c <= C; c++){
for (int dir = 0; dir < 8; dir++){
if (gPatternFoundNum == total_word_to_find){
return;
}
if (MaxLen(R, C, 1, c, dir) >= gMinPatternLen){
SearchStr(1, c, dir);
}
}
}
for (int c = 1; c <= C; c++){
for (int dir = 0; dir < 8; dir++){
if (gPatternFoundNum == total_word_to_find){
return;
}
if (MaxLen(R, C, R, c, dir) >= gMinPatternLen){
SearchStr(R, c, dir);
}
}
}
} int main(){
int R, C, M;
scanf("%d %d %d", &R, &C, &M);
memset(gPizza, 0, sizeof(gPizza));
memset(gPatterFind, false, sizeof(gPatterFind));
gNodeCount = 2; for (int r = 1; r <= R; r++){
getchar();
for (int c = 1; c <= C; c++){
scanf("%c", &gPizza[r][c]);
}
}
getchar();
char str[MAX_SIZE];
Node* root = gNodes + 1;
for (int i = 1; i <= M; i++){
scanf("%s", str);
Insert(root, str, i);
gPatternLen[i] = strlen(str);
gMinPatternLen = MIN(gMinPatternLen, gPatternLen[i]);
} BuildDfa(); SearchPuzzle(R, C, M);
for (int i = 1; i <= M; i++){
printf("%d %d %c\n", gPosInfo[i].row, gPosInfo[i].col, gPosInfo[i].dir + 'A');
}
return 0;
}

poj_1204 Trie图的更多相关文章

  1. 【BZOJ-2938】病毒 Trie图 + 拓扑排序

    2938: [Poi2000]病毒 Time Limit: 1 Sec  Memory Limit: 128 MBSubmit: 609  Solved: 318[Submit][Status][Di ...

  2. 【hihoCoder】1036 Trie图

    题目:http://hihocoder.com/problemset/problem/1036 给一个词典dict,词典中包含了一些单词words.要求判断给定的一个文本串text中是否包含这个字典中 ...

  3. 【hihoCoder 1036】Trie图

    看了一下简单的$Trie图$,调模板调啊调一连调了$2h$,最后发现$-'a'$打成$-'A'$了hhh,有种摔键盘的冲动. $Trie图$是$Trie树$上建立“前缀边”,不用再像在$Trie树$上 ...

  4. 字符串 --- KMP Eentend-Kmp 自动机 trie图 trie树 后缀树 后缀数组

    涉及到字符串的问题,无外乎这样一些算法和数据结构:自动机 KMP算法 Extend-KMP 后缀树 后缀数组 trie树 trie图及其应用.当然这些都是比较高级的数据结构和算法,而这里面最常用和最熟 ...

  5. Trie图和Fail树

    Trie图和AC自动机的区别 Trie图是AC自动机的确定化形式,即把每个结点不存在字符的next指针都补全了.这样做的好处是使得构造fail指针时不需要next指针为空而需要不断回溯. 比如构造ne ...

  6. hdu2457 Trie图+dp

    hdu2457 给定n个模式串, 和一个文本串 问如果修改最少的字符串使得文本串不包含模式串, 输出最少的次数,如果不能修改成功,则输出-1 dp[i][j] 表示长度为i的字符串, 到达状态j(Tr ...

  7. Trie图

    AC自动机是KMP的多串形式,当文本串失配时,AC自动机的fail指针告诉我们应该跳到哪里去继续匹配(跳到当前匹配串的最长后缀去),所以AC自动机的状态是有限的 但是AC自动机具有不确定性, 比如要求 ...

  8. CF 291E. Tree-String Problem [dfs kmp trie图优化]

    CF291E 题意:一棵树,每条边上有一些字符,求目标串出现了多少次 直接求目标串的fail然后一边dfs一边跑kmp 然后就被特殊数据卡到\(O(n^2)\)了... 因为这样kmp复杂度分析的基础 ...

  9. AC自动机相关Fail树和Trie图相关基础知识

    装载自55242字符串AC自动机专栏 fail树 定义 把所有fail指针逆向,这样就得到了一棵树 (因为每个节点的出度都为1,所以逆向后每个节点入度为1,所以得到的是一棵树) 还账- 有了这个东西, ...

随机推荐

  1. 【C#】关闭 Window 之后,无法设置 Visibility,也无法调用 Show、ShowDialogor 或 WindowInteropHelper.EnsureHandle

    问题: 在做WPF项目时,点击一个按钮弹出一个自定义的窗体,然后点击X关闭该窗体,然后再点击按钮想弹出该窗体时,报错:关闭 Window 之后,无法设置 Visibility,也无法调用 Show.S ...

  2. 设计和开发ETL系统(二)——启动

    在针对某个维度模型开始ETL系统设计之前,应当完成逻辑设计,草拟高层架构计划,并且为所有的数据元素拟定源到目标映射. ETL的设计过程十分重要: 收集所有的相关信息,包括事物处理系统中所允许的提取处理 ...

  3. Win10系统设置专用网络和公用网络

    打开设置界面或者按Win+I组合键打开设置界面,打开后点击“网络和Internet”; 在网络和Internet界面,点击左侧“拔号”(有些是以太网),在右侧窗口点击“宽带连接”(大家基本都是以太网连 ...

  4. kafka_zookeeper_配置文件配置

    server.properties配置如下: broker.id=0 num.network.threads=2 num.io.threads=8 socket.send.buffer.bytes=1 ...

  5. oracle 字符集 AL32UTF8、UTF8

    简介:ORACLE数据库字符集,即Oracle全球化支持(Globalization Support),或即国家语言支持(NLS)其作用是用本国语言和格式来存储.处理和检索数据.利用全球化支持,ORA ...

  6. pip国内源

    pip install -i https://pypi.douban.com/simple pyqrcode

  7. 篇三:XPath--解析Html

    导语:爬虫爬取的界面,大致分为静态界面.ajax异步加载.动态界面.静态界面直接获取HTML对象,然后使用XPath获取值 最有用的路径表达式: 表达式 描述 nodename 选取此节点的所有子节点 ...

  8. Tomcat负载均衡和集群环境的搭建

    实现此集群的方法参考了网上的很多文章,但由于很多文章都表明是原创的,故无法知道整个操作流程的真正作者是谁.下面就是我用我们真实的项目去实现这个过程.同时修复这过程中一些问题.以下的所有步骤均为亲自测试 ...

  9. MYSQL的用户变量(@)和系统变量(@@)

    9.3. 用户变量 可以先在用户变量中保存值然后在以后引用它:这样可以将值从一个语句传递到另一个语句.用户变量与连接有关.也就是说,一个客户端定义的变量不能被其它客户端看到或使用.当客户端退出时,该客 ...

  10. Java并发编程基础

    Java并发编程基础 1. 并发 1.1. 什么是并发? 并发是一种能并行运行多个程序或并行运行一个程序中多个部分的能力.如果程序中一个耗时的任务能以异步或并行的方式运行,那么整个程序的吞吐量和可交互 ...