[CQOI2014]通配符匹配
Description
几乎所有操作系统的命令行界面(CLI)中都支持文件名的通配符匹配以方便用户。最常见的通配符有两个,一个是星号(“”’),可以匹配0个及以上的任意字符:另一个是问号(“?”),可以匹配恰好一个任意字符。
现在需要你编写一个程序,对于给定的文件名列表和一个包含通配符的字符串,判断哪些文件可以被匹配。
Input
第一行是一个由小写字母和上述通配符组成的字符串。
第二行包含一个整数n,表示文件个数。
接下来n行,每行为一个仅包含小写字母字符串,表示文件名列表。
Output
输出n行,每行为“YES”或“NO”,表示对应文件能否被通配符匹配。
Sample Input
*aca?ctc
6
acaacatctc
acatctc
aacacatctc
aggggcaacacctc
aggggcaacatctc
aggggcaacctct
Sample Output
YES
YES
YES
YES
YES
NO
HINT
对于1 00%的数据
字符串长度不超过100000
1 <=n<=100
通配符个数不超过10
本题有弱化版[AHOI2005]VIRUS 病毒检测,题解
关于这题有很多解法,例如KMP,Hash啥的……但是既然这题有AC自动机的标签,那么我们肯定要用AC自动机去解决对吧?
然后冥思苦想没有结果……滚去看题解,然后发现这题AC自动机的做法甚是巧妙
首先将模板串按'*'分段,每一段建立一个AC自动机,每个AC自动机里面的串按照'?'分成多个串建成一棵trie树
然后呢?我们考虑一下某个AC自动机的字符'abcd?abc?cd?abcd'
然后绿色的是终止节点(多个终止就开个vector),然后我们把其他串拿进来匹配后,每碰到一个绿色点,我们就让\(C[pos-End[p][i]]\)加1,其中pos是当前匹配位置(匹配串),p是AC自动机中位置,End[p]就是vector,这样处理完后,我们再次扫一遍匹配,看一下哪个位置的\(C[i]\)与段数相等,那么它就可以作为这段模板串的匹配起点
注意匹配的时候匹配串是不需要切成一段段再进去匹配的,你可以每次都整串匹配,但是需要开一个变量记录上一次匹配到的最靠前的位置,然后判断一下即可
最前面和最后面需要根据'*'的有无进行特判
匹配串在一个个AC自动机中不一定要匹配连续的一段,因为存在'*'这种高级玩意
/*program from Wolfycz*/
#include<cmath>
#include<cstdio>
#include<vector>
#include<cstring>
#include<iostream>
#include<algorithm>
#define inf 0x7f7f7f7f
#define for_vec(it,x) for (vector<int>::iterator it=x.begin();it!=x.end();it++)
using namespace std;
typedef long long ll;
typedef unsigned int ui;
typedef unsigned long long ull;
inline char gc(){
static char buf[1000000],*p1=buf,*p2=buf;
return p1==p2&&(p2=(p1=buf)+fread(buf,1,1000000,stdin),p1==p2)?EOF:*p1++;
}
inline int frd(){
int x=0,f=1;char ch=gc();
for (;ch<'0'||ch>'9';ch=gc()) if (ch=='-') f=-1;
for (;ch>='0'&&ch<='9';ch=gc()) x=(x<<1)+(x<<3)+ch-'0';
return x*f;
}
inline int read(){
int x=0,f=1;char ch=getchar();
for (;ch<'0'||ch>'9';ch=getchar()) if (ch=='-') f=-1;
for (;ch>='0'&&ch<='9';ch=getchar()) x=(x<<1)+(x<<3)+ch-'0';
return x*f;
}
inline void print(int x){
if (x<0) putchar('-'),x=-x;
if (x>9) print(x/10);
putchar(x%10+'0');
}
const int N=1e5;
int pos[N+10],pos_cnt,lenS;
bool BGN,END;
struct S1{
int trie[N+10][26],fail[N+10];
int tot,root,num,L;
vector<int>End[N+10];
void insert(char *s,int l,int r){
static char T[N+10];
for (int i=l;i<r;i++) T[i-l]=s[i];
int len=r-l,p=root; T[len++]='?';
for (int i=0;i<len;i++){
while (T[i]=='?'&&i<len){
if (i&&T[i-1]!='?') End[p].push_back(i-1),num++;
p=root,i++;
}
if (i>=len) break;
if (!trie[p][T[i]-'a']) trie[p][T[i]-'a']=++tot;
p=trie[p][T[i]-'a'];
}L=--len;
}
void make_fail(){
static int h[N+10];
int head=1,tail=0;
for (int i=0;i<26;i++) if (trie[root][i]) h[++tail]=trie[root][i];
for (;head<=tail;head++){
int Now=h[head];
for_vec(it,End[fail[Now]]) End[Now].push_back(*it);
for (int i=0;i<26;i++){
if (trie[Now][i]){
int son=trie[Now][i];
fail[son]=trie[fail[Now]][i];
h[++tail]=son;
}else trie[Now][i]=trie[fail[Now]][i];
}
}
}
bool check(char *s,bool Fir,bool Lst){
static int cnt[N+10];
memset(cnt,0,sizeof(cnt));
int len=strlen(s),p=root;
for (int i=0;i<len;i++){
p=trie[p][s[i]-'a'];
for_vec(it,End[p]) if (i>=*it) cnt[i-*it]++;
}
for (int i=0;i<len;i++){
if (cnt[i]!=num) continue;
if (!pos_cnt){
if (!BGN&&Fir&&i) break;
if (!END&&Lst&&len-i!=L) break;
pos[++pos_cnt]=i+L;
return 1;
}else{
if (i<pos[pos_cnt]) continue;
if (!END&&Lst&&len-i!=L) break;
pos[++pos_cnt]=i+L;
return 1;
}
}
return 0;
}
}AC[10];//Aho-Corasick automaton
char s[N+10];
int main(){
scanf("%s",s);
int len=strlen(s),tot=0; lenS=len;
BGN=s[0]=='*',END=s[len-1]=='*',s[len++]='*';
for (int i=0,Last=0;i<len;i++){
if (s[i]=='*'){
if (i>Last) AC[tot++].insert(s,Last,i);
Last=i+1;
}
}
for (int i=0;i<tot;i++) AC[i].make_fail();
for (int Q=read();Q;Q--){
if (!len){
printf("NO\n");
continue;
}
if (!tot){
printf("YES\n");
continue;
}
memset(s,0,sizeof(s));
memset(pos,0,sizeof(pos)); pos_cnt=0;
scanf("%s",s);
bool flag=1;
for (int i=0;i<tot;i++){
if (!AC[i].check(s,i==0,i==tot-1)){
flag=0;
break;
}
}
printf(flag?"YES\n":"NO\n");
}
return 0;
}
[CQOI2014]通配符匹配的更多相关文章
- 「题解报告」 P3167 [CQOI2014]通配符匹配
「题解报告」 P3167 [CQOI2014]通配符匹配 思路 *和?显然无法直接匹配,但是可以发现「通配符个数不超过 \(10\) 」,那么我们可以考虑分段匹配. 我们首先把原字符串分成多个以一个通 ...
- bzoj 3507: [Cqoi2014]通配符匹配
Description 几乎所有操作系统的命令行界面(CLI)中都支持文件名的通配符匹配以方便用户.最常见的通配符有两个,一个是星号(“”’),可以匹配0个及以上的任意字符:另一个是问号(“?”),可 ...
- BZOJ3507 [Cqoi2014]通配符匹配
题意 几乎所有操作系统的命令行界面(CLI)中都支持文件名的通配符匹配以方便用户.最常见的通配符有两个,一个是星号("*"),可以匹配0个及以上的任意字符:另一个是问号(" ...
- P3167 [CQOI2014]通配符匹配 题解
题目 题目大意 给出一个字符串,其中包含两种通配符 ‘?’和 ‘*’ ,‘?’可以代替一个字符,‘*’可以代替一个字符串(长度可以为0) 然后给出几个字符转,判断能否用给出的字符串表示出来 样例解释 ...
- BZOJ3507 [Cqoi2014]通配符匹配 【哈希 + 贪心】
题目 几乎所有操作系统的命令行界面(CLI)中都支持文件名的通配符匹配以方便用户.最常见的通配符有两个,一个 是星号(""'),可以匹配0个及以上的任意字符:另一个是问号(&quo ...
- 【bzoj3570】 Cqoi2014—通配符匹配
http://www.lydsy.com/JudgeOnline/problem.php?id=3507 (题目链接) 题意 给出一个主串,里面有些通配符,'*'可以代替任意字符串或者消失,'?'可以 ...
- [BZOJ3507][CQOI2014]通配符匹配(DP+Hash)
显然f[i][j]表示S匹配到第i个通配符,T匹配到第j个字符,是否可行. 一次一起转移两个通配符之间的所有字符,Hash判断. 稍微有点细节.常数极大卡时过排名倒数,可能是没自然溢出的原因. #in ...
- [bzoj3507 Cqoi2014]通配符匹配 (hash+DP)
传送门 Solution 显然用哈希233 设\(f[i][j]\)表示第i个通配符和当前第j个字符是否匹配 考虑两种通配符的特性,直接转移即可 Code #include <cstdio> ...
- P3167 [CQOI2014]通配符匹配
吐槽 本来是去写AC自动机的,然后发现数据范围每个串100000,有100个串(???),连塞进trie树里都塞不进去,玩个鬼的AC自动机啊,tag不要乱打啊 最后拿字符串hash+爆搜一发搜过去了. ...
随机推荐
- Spyder的汉化
我准备写下spyder的汉化问题:对于英文大佬,从来没得汉化问题,但是对于新手和英语差的来说,汉化还是有必要,至少用汉化过得软件能快速掌握软件等.后期会用软件了在慢慢习惯英文也不迟...哈哈哈哈.本文 ...
- mysql语句:SET NAMES UTF8
一直以来只知道mysql_query("SET NAMES UTF8");是设定数据库编码的,但是一直不清楚“SET NAMES UTF8”是什么. 直到今天才知道 SET NAM ...
- JavaScript提高:001:ASP.NET使用easy UI
jQuery EasyUI是一组基于jQuery的UI插件集合.能够简洁的开发出功能多内容丰富的界面,而不须要开发人员自己费力的写那些复杂的js代码.本文简介在ASP.NET开发中引用这些js文件和样 ...
- java输入输出流实例代码
1.编写一个程序,读取源代码文件的内容并在控制台输出.如果源文件不存在,则显示相应的错误信息. package src; import java.io.File; import java.io.Fil ...
- Axure Base 07 元件使用思路的补充
我们曾经对axure线框图基本元件进行过说明,现结合这我对这些元件的使用习惯,对部分元件的使用,再做一些补充. 1. 图片:可以编辑悬停.按下时候显示不同的图片,做图片的一些特殊效果. 2. 文本(l ...
- MySQL安装、安装时未提示输入密码、如何修改密码小结
http://blog.csdn.net/fr555wlj/article/details/54971412
- iOS UI控件之间的关系图
- B.大钉骑马走江湖
江湖是什么,对于在象棋界厮杀的大钉来说,江湖就是一个矩阵,他的目标,就是在江湖之中骑着马,从他的位置出发,走到终点. 当然,大钉的马也遵从中国象棋中的“马走日”的规则,而且在矩阵中,也会有一些障碍物, ...
- “There's no Qt version assigned to this project for platform ” - visual studio plugin for Qt
1.find menu "Qt VS Tools", select Qt Options 2.add a new Qt version 3. right click the tar ...
- 织梦文章分页后文章title的修改使得不一致
织梦Dedecms是一个不错的建站cms系统,最近在用织梦建站的时候发现文章分页后,每个分页都是同一个标题,不利于优化,想在分页后面加上一个数字来进行区别,怎么做呢? 找到include/arc.ar ...