POJ2778 DNA sequence
题目大意:给出m个疾病基因片段(m<=10),每个片段不超过10个字符。求长度为n的不包含任何一个疾病基因片段的DNA序列共有多少种?(n<=2000000000)
分析:本题需要对m个疾病基因片段构建一个AC自动机,自动机中的每个节点表示一个状态。其中AC自动机中的叶子节点表示的是病毒,所以是非法状态。同时,如果某个节点到根的字符串的后缀是一个病毒,那么该节点也是非法状态。剔除掉所有的非法状态,那么剩下的节点都表示合法状态了。然后用节点的nxt指针表示状态之间转化关系。若nxt[i]==0,则nxt[i]指针指向当前节点fail指针的nxt[i],如果仍然为0,则nxt[i]指向根节点。这样处理以后,每个指针都不会指向0。这样,该自动机可以看做是一个合法状态的转换图,节点表示各种合法状态,边表示添加一个字符将转换为另一个状态。于是我们可以得到一个矩阵。该矩阵实际上表示该状态图的邻接矩阵。对该矩阵自乘n次。最后结果矩阵的第1行各元素之和表示从空状态添加n个字符能够得到的所有合法状态的数量。
矩阵的思想非常巧妙。
#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
#define MAXN 102
#define MAXL 12
#define MAXC 4
#define MOD 100000
struct node
{
int fail,nxt[6],flag;
}trie[MAXN];
int head,tail,myq[MAXN],root=1,tot=1;
char word[MAXL];
int degree;
int a[MAXN][MAXN],b[MAXN][MAXN],c[MAXN][MAXN],(*ans)[MAXN];
void multi(int (*a)[MAXN],int (*b)[MAXN],int (*c)[MAXN])
{
for(int i=1;i<=degree;i++)
{
for(int j=1;j<=degree;j++)
c[i][j]=0;
}
for(int i=1;i<=degree;i++)
{
for(int j=1;j<=degree;j++)
{
for(int k=1;k<=degree;k++)
{
c[i][j]+=(long long)a[i][k]*b[k][j]%MOD;
c[i][j]%=MOD;
}
}
}
}
void power(int (*t1)[MAXN],int h)
{
for(int i=1;i<=degree;i++)
for(int j=1;j<=degree;j++)
b[i][j]=0;
for(int i=1;i<=degree;i++)
b[i][i]=1;
int (*t2)[MAXN],(*t3)[MAXN];
t2=b,t3=c;
while(h)
{
if(h&1)
{multi(t1,t2,t3);
swap(t2,t3);
}
h>>=1;
multi(t1,t1,t3);
swap(t1,t3);
}
if(t2!=a)
{
memcpy(a,t2,sizeof a);
}
}
int inline getid(char C)
{
if(C=='A')return 0;
else if(C=='T')return 1;
else if(C=='C')return 2;
else return 3;
}
void insert(int r,char *s)
{
int len=strlen(s);
for(int i=0;i<len;i++)
{
int val=getid(s[i]);
if(trie[r].nxt[val]==0)
trie[r].nxt[val]=++tot;
r=trie[r].nxt[val];
}
trie[r].flag=1;//1表示结束节点
}
void build(int r)
{
trie[r].fail=r;
myq[tail++]=r;
int ch;
while(head<tail)
{
r=myq[head++];
for(int i=0;i<MAXC;i++)
{
ch=trie[r].nxt[i];
if(ch)myq[tail++]=ch;
if(r==root)
{
if(ch)
trie[ch].fail=root;
else trie[r].nxt[i]=root;
}
else
{
if(ch)
{trie[ch].fail=trie[trie[r].fail].nxt[i];
trie[ch].flag|=trie[trie[ch].fail].flag;
}
else
trie[r].nxt[i]=trie[trie[r].fail].nxt[i];
}
ch=trie[r].nxt[i];
if(trie[ch].flag!=1)
a[r][ch]++;
}
}
}
int main()
{
int n,m;
scanf("%d%d",&m,&n);
for(int i=0;i<m;i++)
{
scanf("%s",word);
insert(root,word);
}
build(root);
degree=tot;
power(a,n);
int ans=0;
for(int i=1;i<=degree;i++)
{ans+=a[1][i];
ans%=MOD;
}
printf("%d\n",ans);
}
POJ2778 DNA sequence的更多相关文章
- poj2778 DNA Sequence【AC自动机】【矩阵快速幂】
DNA Sequence Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 19991 Accepted: 7603 Des ...
- poj2778 DNA Sequence(AC自动机+矩阵快速幂)
Description It's well known that DNA Sequence is a sequence only contains A, C, T and G, and it's ve ...
- POJ2778 DNA Sequence(AC自动机+矩阵快速幂)
题目给m个病毒串,问不包含病毒串的长度n的DNA片段有几个. 感觉这题好神,看了好久的题解. 所有病毒串构造一个AC自动机,这个AC自动机可以看作一张有向图,图上的每个顶点就是Trie树上的结点,每个 ...
- 【AC自动机】【矩阵乘法】poj2778 DNA Sequence
http://blog.csdn.net/morgan_xww/article/details/7834801 讲得很好~可以理解自动机的本质,就是一个用来状态转移的东西~对于确定的输入而言,可以从初 ...
- [poj2778]DNA Sequence(AC自动机+矩阵快速幂)
题意:有m种DNA序列是有疾病的,问有多少种长度为n的DNA序列不包含任何一种有疾病的DNA序列.(仅含A,T,C,G四个字符) 解题关键:AC自动机,实际上就是一个状态转移图,注意能少取模就少取模, ...
- [日常摸鱼]poj2778 DNA Sequence
这题太神啦 题意:求长度为$n$的不包含给定DNA序列的DNA序列个数,给定的不超过10个 构建出Trie图,用$danger[i]$来表示不能走到$i$,对于DNA序列结尾的结点$danger$设为 ...
- POJ2778 DNA Sequence(AC自动机 矩阵)
先使用AC自动机求得状态转移关系,再建立矩阵,mat[i][j]表示一步可从i到j且i,j节点均非终止字符的方案数,则此矩阵的n次方表示n步从i,到j的方法数. #include<cstdio& ...
- [POJ2778]DNA Sequence(AC自动机 + DP + 矩阵优化)
传送门 AC自动机加DP就不说了 注意到 m <= 10,所以模式串很少. 而 n 很大就需要 log 的算法,很容易想到矩阵. 但是该怎么构建? 还是矩阵 A(i,j) = ∑A(i,k) * ...
- [poj2778 DNA Sequence]AC自动机,矩阵快速幂
题意:给一些字符串的集合S和整数n,求满足 长度为n 只含charset = {'A'.'T‘.'G'.'C'}包含的字符 不包含S中任一字符串 的字符串的种类数. 思路:首先对S建立ac自动机,考虑 ...
随机推荐
- BaseDao代码,用于连接数据库实行增删改查等操作
在学习JavaWeb时会用到此代码,用于实行增删改查操作 1 package com.bdqn.dao; import java.sql.Connection; import java.sql.Dri ...
- shader forge卡通渲染!
自从用了shader forge,妈妈我再也不写shader了...... 写了3种,分别用的顶点法线.法线贴图.顶点法线+法线贴图,然后还有自发光和受光两种模式,那就是6种了吧... 最后来一张sh ...
- oracle xmltype导入并解析Excel数据--前言
通常,很多的时候,我们需要导入Excel数据到系统中,但是Excel数据需要我们去各种校验,比如身份证校验,手机号码校验等等. 校验失败的数据,提供Excel导出错误原因,提示给用户. 如此,如果校验 ...
- C#使用QQ邮箱发送邮件
首先要开通QQ邮箱的STMP服务.QQ邮箱——设置——账户——开启SMTP服务. 需要引用: using System.Net; using System.Net.Mail; using System ...
- 测试markdown
总结 写内容:博客重要的是内容,如果要讲形式与技术,应该深入学习html,这不是我的重点. 专注:就是利用MD这个好机会,忘记格式,用最简约的美观,来反衬出思考的清晰,内容的价值性. 今天 既要美国式 ...
- IOS-当遇到tableView整体上移时的解决方案
方案一在使用了navigationController后,当界面进行跳转往返后,时而会出现tableView或collectionView上移的情况,通常会自动上移64个像素,那么这种情况,我们可以关 ...
- jquery.easyui使用详解,和遇到的问题,提供大家在使用的时候少走弯路(二)
上次解释了几个易犯错的地方,当然对于大神们那都是小菜一碟了,今天来说说后台请求数据,分页,返回json数据 废话不多说献上代码 private string QueryList(ArrayList a ...
- Project Woosah Tu (五色土)
I bought this Raspberry Pi (model B) in spring 2013, I hadn't done too much with it except for some ...
- debain 8为Iceweasel安装flash播放器
到adobe官网下载flash.或https://get.adobe.com/flashplayer/?loc=cn 下载tar.gz文件后,解压缩后会有一个libflashplayer.so 文件. ...
- SVN更新报错
将服务器SVN文件更新到本地是出现下图错误 报错中已经提示可以通过clean up来清理,若直接执行release lock,则不会解决问题. 原因:本地的项目中存在过期的工作副本 解决办法:选择该文 ...