Keywords Search

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 25356    Accepted Submission(s): 8280

Problem Description
In the modern time, Search engine came into the life of everybody like Google, Baidu, etc. Wiskey also wants to bring this feature to his image retrieval system. Every image have a long description, when users type some keywords to find the image, the system will match the keywords with description of image and show the image which the most keywords be matched. To simplify the problem, giving you a description of image, and some keywords, you should tell me how many keywords will be match.
 
Input
First line will contain one integer means how many cases will follow by. Each case will contain two integers N means the number of keywords and N keywords follow. (N <= 10000) Each keyword will only contains characters 'a'-'z', and the length will be not longer than 50. The last line is the description, and the length will be not longer than 1000000.
 
Output
Print how many keywords are contained in the description.
 
Sample Input
1 5 she he say shr her yasherhs
 
Sample Output
3
text:100万长度,关键字1万,多个测试案例,用Trie匹配必定超时。Trie也可以多模式匹配,不多比AC自动机耗时太多。
Trie 超时代码:
  1. #include <iostream>
  2. #include <cstdio>
  3. #include <cstring>
  4. #include <cmath>
  5. #include <algorithm>
  6. #include <string>
  7. #include <vector>
  8. #include <stack>
  9. #include <queue>
  10. #include <set>
  11. #include <map>
  12. #include <iomanip>
  13. #include <cstdlib>
  14. using namespace std;
  15. const int INF=0x5fffffff;
  16. const int MS=;
  17. const double EXP=1e-;
  18.  
  19. struct node
  20. {
  21. int have;//根据情况灵活变化
  22. node * next[];
  23. }nodes[MS*]; //注意这个大小 尽量大一点
  24.  
  25. node *root;
  26. int cnt,ans;
  27.  
  28. char text[MS*];
  29.  
  30. node * add_node(int c)
  31. {
  32. node *p=&nodes[c];
  33. for(int i=;i<;i++)
  34. p->next[i]=NULL;
  35. p->have=;
  36. return p;
  37. }
  38.  
  39. void insert(char *str)
  40. {
  41. node *p=root;
  42. int len=strlen(str);
  43. for(int i=;i<len;i++)
  44. {
  45. int id=str[i]-'a';
  46. if(p->next[id]==NULL)
  47. {
  48. p->next[id]=add_node(cnt++);
  49. }
  50. p=p->next[id];
  51. }
  52. p->have++;
  53. }
  54. void search(char *str)
  55. {
  56. node *p=root;
  57. int len=strlen(str);
  58. for(int i=;i<len;i++)
  59. {
  60. int id=str[i]-'a';
  61. p=p->next[id];
  62. if(p==NULL)
  63. return ;
  64. if(p->have)
  65. {
  66. ans+=p->have;
  67. p->have=;
  68. }
  69. }
  70. }
  71.  
  72. int main()
  73. {
  74. int n,i,T;
  75. scanf("%d",&T);
  76. while(T--)
  77. {
  78. cnt=;
  79. ans=;
  80. root=add_node(cnt++);
  81. scanf("%d",&n);
  82. for(i=;i<n;i++)
  83. {
  84. scanf("%s",text);
  85. insert(text);
  86. }
  87. scanf("%s",text);
  88. int len=strlen(text);
  89. for(i=;i<len;i++)
  90. {
  91. search(text+i);
  92. }
  93. printf("%d\n",ans);
  94. }
  95. return ;
  96. }

这题是AC自动机最经典的入门题。学会了kmp,Trie,就可以学习ac自动机了。

time : 280 ms

  1. #include <iostream>
  2. #include <cstdio>
  3. #include <cstring>
  4. #include <cmath>
  5. #include <algorithm>
  6. #include <string>
  7. #include <vector>
  8. #include <stack>
  9. #include <queue>
  10. #include <set>
  11. #include <map>
  12. #include <iomanip>
  13. #include <cstdlib>
  14. using namespace std;
  15. const int INF=0x5fffffff;
  16. const int MS=;
  17. const double EXP=1e-;
  18. // AC自动机 KMP TRIE
  19. struct node
  20. {
  21. bool isbad;
  22. node *pre;
  23. node * next[];
  24. int n;
  25. }nodes[MS*]; //注意这个大小 个数*每个的长度就不会访问非法内存
  26.  
  27. node *root;
  28. int cnt,ans;
  29.  
  30. char text[MS*];
  31.  
  32. node * add_node(int c)
  33. {
  34. node *p=&nodes[c];
  35. for(int i=;i<;i++)
  36. p->next[i]=NULL;
  37. p->isbad=false;
  38. p->pre=NULL;
  39. p->n=;
  40. return p;
  41. }
  42.  
  43. void insert(char *str)
  44. {
  45. node *p=root;
  46. int len=strlen(str);
  47. for(int i=;i<len;i++)
  48. {
  49. int id=str[i]-'a';
  50. if(p->next[id]==NULL)
  51. {
  52. p->next[id]=add_node(cnt++);
  53. }
  54. p=p->next[id];
  55. }
  56. p->isbad=true;
  57. p->n++; //终止节点
  58. }
  59.  
  60. void build()
  61. { // 在trie树上加前缀指针
  62. for(int i=;i<;i++)
  63. nodes->next[i]=root;
  64. nodes->pre=NULL;
  65. root->pre=nodes;
  66. deque<node *> dq;
  67. dq.push_back(root);
  68. while(!dq.empty())
  69. {
  70. node *proot=dq.front();
  71. dq.pop_front();
  72. for(int i=;i<;i++)
  73. {
  74. node *p=proot->next[i];
  75. if(p!=NULL)
  76. {
  77. node *pre=proot->pre;
  78. while(pre)
  79. {
  80. if(pre->next[i]!=NULL) //NULL==0
  81. {
  82. p->pre=pre->next[i];
  83. if(p->pre->isbad)
  84. p->isbad=true;
  85. break;
  86. }
  87. else
  88. pre=pre->pre;
  89. }
  90. dq.push_back(p);
  91. }
  92. }
  93. }
  94. }
  95.  
  96. void search(char *str)
  97. { //返回值为true,说明包含模式串
  98. node *p=root;
  99. int len=strlen(str);
  100. for(int i=;i<len;i++)
  101. {
  102. int id=str[i]-'a';
  103. while(p!=root&&p->next[id]==NULL)
  104. {
  105. p=p->pre;
  106. }
  107. p=p->next[id];
  108. if(p==NULL)
  109. {
  110. p=root;
  111. }
  112. node *tp=p;
  113. while(tp!=root&&tp->n!=)
  114. {
  115. ans+=tp->n;
  116. tp->n=;
  117. tp=tp->pre;
  118. }
  119.  
  120. /*
  121. while(1) 是否包含模式串
  122. {
  123. if(p->next[id])
  124. {
  125. p=p->next[id];
  126. if(p->isbad)
  127. return true;
  128. break;
  129. }
  130. else
  131. p=p->pre;
  132. }
  133. */
  134. }
  135.  
  136. //return false;
  137. }
  138.  
  139. int main()
  140. {
  141. int n,T;
  142. scanf("%d",&T);
  143. while(T--)
  144. {
  145. cnt=;
  146. ans=;
  147. add_node(cnt++);
  148. root=add_node(cnt++);
  149. scanf("%d",&n);
  150. for(int i=;i<n;i++)
  151. {
  152. scanf("%s",text);
  153. insert(text);
  154. }
  155. build();
  156. scanf("%s",text);
  157. search(text);
  158. printf("%d\n",ans);
  159. }
  160. return ;
  161. }
  162. /*
  163. 节点p的前缀指针定义为:指向树中出现
  164. 过的S的最长的后缀(不能等于S)。
  165. 如果p节点匹配失败,该节点对应c,就沿着它的父节点的前缀指针走,直到某节点,其儿子节点
  166. 对应的字母也为c,把p节点的前缀指针指向该儿子节点。如果走到了root都没有找到,就指向root
  167. */
 
 

Keywords Search的更多相关文章

  1. 【HDU2222】Keywords Search AC自动机

    [HDU2222]Keywords Search Problem Description In the modern time, Search engine came into the life of ...

  2. hdu2222 Keywords Search ac自动机

    地址:http://acm.split.hdu.edu.cn/showproblem.php?pid=2222 题目: Keywords Search Time Limit: 2000/1000 MS ...

  3. HDU 2222 Keywords Search(AC自动机模版题)

    Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others ...

  4. HDU2222 Keywords Search [AC自动机模板]

    Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others ...

  5. C++之路进阶——hdu2222(Keywords Search)

    /*Keywords Search Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others) ...

  6. HDU 2222 Keywords Search(查询关键字)

    HDU 2222 Keywords Search(查询关键字) Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K ...

  7. hdu----(2222)Keywords Search(ac自动机)

    Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)T ...

  8. hdu----(2222)Keywords Search(trie树)

    Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)T ...

  9. hdu 2222 Keywords Search ac自己主动机

    点击打开链接题目链接 Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Ja ...

随机推荐

  1. CreateWaitableTimer和SetWaitableTimer函数(定时器)

    用户感觉到软件的好用,就是可以定时地做一些工作,而不需要人参与进去.比如每天定时地升级病毒库,定时地下载电影,定时地更新游戏里的人物.要想 实现这些功能,就可以使用定时器的API函数CreateWai ...

  2. How Tomcat Works(十三)

    本文分析tomcat容器的安全管理,servlet技术支持通过配置部署描述器(web.xml文件)来对受限内容进行访问控制:servlet容器是通过一个名为验证器的阀来支持安全限制的,当servlet ...

  3. UVa 297 - Quadtrees

    题目:利用四叉树处理图片,给你两张黑白图片的四叉树,问两张图片叠加后黑色的面积. 分析:搜索.数据结构.把图片分成1024块1*1的小正方形,建立一位数组记录对应小正方形的颜色. 利用递归根据字符串, ...

  4. myeclipse 8.6安装freemarker插件

    1. 打开http://sourceforge.net/projects/freemarker-ide/files/ 下载插件.2. 将其解压,将hudson.freemarker_ide_0.9.1 ...

  5. sql 无法识别的配置节 system.serviceModel

    sql 链接实例的时候,提示  无法识别的配置节 system.serviceModelC:\WINDOWS\Microsoft.NET\Framework\v2.0.50727\Config\mac ...

  6. 可配置多功能门 SN74LVC1G57, 1G58, 1G97, 1G98, 1G99

    Configurable Multiple-Function Gate  SN74LVC1G57 SN74LVC1G58 SN74LVC1G97 SN74LVC1G98 SN74LVC1G99

  7. IE兼容CSS3圆角border-radius的方法(同时兼容box-shadow,text-shadow)

    IE兼容CSS3圆角border-radius,box-shadow,text-shadow的方法 1.下载ie-css3.htc 2.CSS box { -moz-border-radius: 15 ...

  8. java面试笔试试题http://www.jobui.com/mianshiti/it/java/6827/

    一.判断题(每题1分,共10分)1.Applet是一种特殊的Panel,它是Java Applet程序的最外层容器.()2.Java的源代码中定义几个类,编译结果就生成几个以.class为后缀的字节码 ...

  9. 获取 CPU 序列号

    function GetCpuID: string; var _eax, _ebx, _ecx, _edx: Longword; s, s1, s2: string; begin asm push e ...

  10. nginx-1.4.4 + tcp_proxy_module手动编译安装

    Nginx开源软件默认没有提供TCP协议的负载均衡,下面记录一下我的安装过程: 1. 下载nginx最新稳定版的源码 mkdir /software cd /software yum install ...