【链接】h在这里写链接


【题意】


    给你一个长度为n的子串;

    让你求出第k小的子串是什么;

    输出答案的类型分两种;

    第一种,重复的算两次,第二种,重复的算一次。

     

    你的程序要能分别处理这两种情况。

    n最大5*10^5

【题解】


    感觉是道裸的后缀数组了。

    先求出后缀数组;

    然后按照后缀的大小升序枚举每一个后缀就好。

 

    对于重复算作一个的情况,则用每一个后缀的长度减去Height[i];

        这个被减过的值就是以i开头的子串,且不和之前出现过的重复的子串的个数了。

        ->也即算出来字典序为k的子串是多少。

    对于重复算作多个的情况。感觉反而不好写。。

        这样做.

        先把排名前i的后缀的所有的子串的个数算出来,->做一个前缀和

        便于后续的操作。

        然后,对于最后的子串的每一位,

        枚举它应该为多少

        ->一个类似数位DP的做法。

         

        假如最后的子串的第一位是'c'

        那么

        形如

        axxxxxxx

        bxxxxxxx

        的后缀,都能够把它删掉了。

        也即把所有小于它的子串全都减掉。

        直到

        'j'xxxxx的子串个数>=k为止。

        这样就能确定第一位是j.

        然后再枚举第二位是什么也从'a'..'z'

            直到能够确定每一位是什么为止。

 

        我们可以用二分+Sa来快速确定第i位是j的后缀有多少个。

        再用一开始处理好的前缀和。

        就能知道第i位是j的后缀,包含的子串个数。



        (一开始二分的范围是1..n)

        (这个范围表示的是后缀排名为1..n)

        (之后我们会逐渐缩小这个二分的范围)

        (左端点会逐渐变大..)

        (一旦确定第一位是某个字符之后,二分排名的范围就都会变小了..

            因为【第一位是某个字符的后缀】是【集中在一片区域里面】的,同理第二位也确定

            了之后,这个范围【又会变小】了。)

        (所以二分的时候,这片区域的后缀的前i-1位全都是相同的)

             

        从小到大枚举,逐渐确定每一位字符。

        具体实验看程序吧

【错的次数】


0

【反思】


类似数位DP确定每一位是什么的思路。

【代码】

  1. #include<bits/stdc++.h>
  2. #define ll long long
  3. using namespace std;
  4.  
  5. const int N = 5e5;
  6. const int MAX_CHAR = 255;//每个数字的最大值。
  7. char s[N + 10];//如果是数字,就写成int s[N+10]就好,从0开始存
  8. int Sa[N + 10], T1[N + 10], T2[N + 10], C[N + 10];
  9. int Height[N + 10], Rank[N + 10];
  10.  
  11. void build_Sa(int n, int m) {
  12. int i, *x = T1, *y = T2;
  13. for (i = 0; i<m; i++) C[i] = 0;
  14. for (i = 0; i<n; i++) C[x[i] = s[i]]++;
  15. for (i = 1; i<m; i++) C[i] += C[i - 1];
  16. for (i = n - 1; i >= 0; i--) Sa[--C[x[i]]] = i;
  17. for (int k = 1; k <= n; k <<= 1)
  18. {
  19. int p = 0;
  20. for (i = n - k; i<n; i++) y[p++] = i;
  21. for (i = 0; i<n; i++) if (Sa[i] >= k) y[p++] = Sa[i] - k;
  22. for (i = 0; i<m; i++) C[i] = 0;
  23. for (i = 0; i<n; i++) C[x[y[i]]]++;
  24. for (i = 1; i<m; i++) C[i] += C[i - 1];
  25. for (i = n - 1; i >= 0; i--) Sa[--C[x[y[i]]]] = y[i];
  26. swap(x, y);
  27. p = 1; x[Sa[0]] = 0;
  28. for (i = 1; i<n; i++)
  29. x[Sa[i]] = y[Sa[i - 1]] == y[Sa[i]] && y[Sa[i - 1] + k] == y[Sa[i] + k] ? p - 1 : p++;
  30. if (p >= n) break;
  31. m = p;
  32. }
  33. }
  34.  
  35. void getHeight(int n)
  36. {
  37. int i, j, k = 0;
  38. for (i = 1; i <= n; i++) Rank[Sa[i]] = i;
  39. for (i = 0; i<n; i++) {
  40. if (k) k--;
  41. j = Sa[Rank[i] - 1];
  42. while (s[i + k] == s[j + k]) k++;
  43. Height[Rank[i]] = k;
  44. }
  45. }
  46.  
  47. ll k, sum[N + 10];
  48. int T, n;
  49.  
  50. void print(int x, int y)
  51. {
  52. for (int i = x; i <= y; i++)
  53. putchar(s[i]);
  54. }
  55.  
  56. int main() {
  57. //freopen("F:\\rush.txt", "r", stdin);
  58. scanf("%s", s);
  59. scanf("%d%lld", &T, &k);
  60. n = strlen(s);
  61. s[n] = 0;
  62. build_Sa(n + 1, MAX_CHAR);//注意调用n+1
  63. getHeight(n);
  64. if (T == 0)
  65. {
  66. ll ans = 0;
  67. for (int i = 1; i <= n; i++)
  68. {
  69. int t = n - Sa[i] - Height[i];
  70. if (k <= t)
  71. return print(Sa[i], (int)k + Sa[i] + Height[i] - 1), 0;
  72. k -= t;
  73. }
  74. }
  75. else
  76. {
  77. sum[0] = 0;
  78. for (int i = 1; i <= n; i++) sum[i] = sum[i - 1] + n - Sa[i];
  79. //sum[i]表示排名第i的后缀的子串个数
  80. if (sum[n] < k) return puts("-1"), 0;
  81. int L = 1, R = n, pl = 1;
  82. for (int i = 1; i <= n; i++)
  83. {
  84. int l2 = L;
  85. for (int j = 'a'; j <= 'z'; j++)
  86. {
  87. int l = l2, r = R, temp = l2 - 1;
  88. while (l <= r)
  89. {
  90. int mid = (l + r) >> 1;
  91. if (s[Sa[mid] + i - 1] > j)//如果第i为大于j,就变小一点
  92. {
  93. r = mid - 1;
  94. }
  95. else//小于等于->其实就是等于了
  96. {
  97. temp = mid;
  98. l = mid + 1;
  99. }
  100. }
  101. if (temp == l2 - 1)//没找到第i为j的情况的。直接continue;
  102. {
  103. continue;
  104. }
  105. //找到了多少个后缀以xxxj为前缀 ->temp-l2+1;
  106. //然后算出来变成xxxj...会添加多少个子串
  107. //只要把后缀的前缀为xxxj的后缀的子串个数累加起来,然后减去之前重复计数过
  108. //的就好
  109. ll have = sum[temp] - sum[l2 - 1] - 1LL * (i - 1)*(temp - l2 + 1);
  110. //前面i-1位那个子串已经计数过了,不重复计数
  111. if (k <= have)
  112. {
  113. //如果第i位是j的后缀的子串数目大于等于k了
  114. //则可以肯定第i为肯定是j
  115. if (temp - l2 + 1 >= k)//如果j是最后一个字符了,直接输出就好
  116. return print(Sa[l2], Sa[l2] + i - 1), 0;
  117. L = l2, R = temp;//否则可以缩小二分的范围,因为第i位已经固定是j了,只有某一段的后缀的第i位是j
  118. k -= temp - l2 + 1;//xxxxj一共有temp-l2+1个
  119. //要减去
  120. break;
  121. }
  122. l2 = temp + 1, k -= have;//把第i位为j的后缀去掉,之后就不会管它了。
  123. //所以直接跳到temp+1就好,然后因为第i位不是j,是大于j的,所以把xxxj...
  124. //它所有的子串都去掉就好
  125. }
  126. }
  127. }
  128. puts("-1");
  129. return 0;
  130. }

【BZOJ 3998】弦论的更多相关文章

  1. bzoj 3998 弦论 —— 后缀自动机

    题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3998 关于相同子串算一个还是算多个,其实就是看一种状态的 right 集合是否加上 Pare ...

  2. BZOJ - 3998 弦论 (后缀自动机)

    #include<cstdio> #include<cstring> #include<queue> using namespace std; typedef lo ...

  3. BZOJ 3998: [TJOI2015]弦论 [后缀自动机 DP]

    3998: [TJOI2015]弦论 Time Limit: 10 Sec  Memory Limit: 256 MBSubmit: 2152  Solved: 716[Submit][Status] ...

  4. 【BZOJ 3998】 3998: [TJOI2015]弦论 (SAM )

    3998: [TJOI2015]弦论 Time Limit: 10 Sec  Memory Limit: 256 MBSubmit: 2627  Solved: 881 Description 对于一 ...

  5. BZOJ 3998 [TJOI 2015] 弦论 解题报告

    这是一道后缀自动机经典题目. 对于 $t=0$ 的情况:每个节点都代表一个子串,所以我们给每个节点的 $Size$ 都记为 $1$, 对于 $t=1$ 的情况:我们只给 $last$ 节点的 $Siz ...

  6. ●BZOJ 3998 [TJOI2015]弦论

    题链: http://www.lydsy.com/JudgeOnline/problem.php?id=3998题解: 后缀自动机. 当T=0时, 由于在后缀自动机上沿着trans转移,每个串都是互不 ...

  7. BZOJ 3998: [TJOI2015]弦论 后缀自动机 后缀自动机求第k小子串

    http://www.lydsy.com/JudgeOnline/problem.php?id=3998 后缀自动机应用的一个模板?需要对len进行一个排序之后再统计每个出现的数量,维护的是以该字符串 ...

  8. bzoj 3998 [TJOI2015]弦论——后缀自动机

    题目:https://www.lydsy.com/JudgeOnline/problem.php?id=3998 相同子串算多个的话,先求好 right ,然后求一个 sm 表示走到这个点之后有几种走 ...

  9. BZOJ 3998 TJOI2015 弦论 后缀自动机+DAG上的dp

    题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=3998 题意概述:对于一个给定长度为N的字符串,求它的第K小子串是什么,T为0则表示不同位置 ...

  10. bzoj 3998: [TJOI2015]弦论【SA+二分||SAM】

    SA的话t==0直接预处理出每个后缀的不同串贡献二分即可,然后t==1就按字典序枚举后缀,然后跳右端点计算和当前后缀的前缀相同的子串个数,直到第k个 不过bzoj上会T #include<ios ...

随机推荐

  1. C#变量的作用域

    using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...

  2. Apple iMac性能基准测试

    这里我要向大家介绍的一款苹果操作系统下的性能测试软件名叫GeekBench,是加拿大PrimateLabs公司出品. 下载地址:http://www.primatelabs.ca/geekbench/ ...

  3. 分享一个关于js原型链的理解

    http://www.cnblogs.com/wyaocn/p/5815761.html

  4. java(面向对象 )

    java面向对象的语言 对象:真实存在唯一的事物. 类:实际就是对某种类型事物的共性属性与行为的抽取. 面向对象的计算机语言核心思想: 找适合的对象做适合的事情. 如何找适合的对象: 1.sun已经定 ...

  5. less---查看文件

  6. 通过CURL抓取页面中的图片路径并下载到本地

    1.首页是图片处理页面downpic.php <?phpfunction getImage($url,$filename="") { if($url=="" ...

  7. 小米开源文件管理器MiCodeFileExplorer-源码研究(4)-文件操作工具类FileOperationHelper

    文件操作是非常通用的,注释都写在源代码中了,不多说~需要特别说明的是,任务的异步执行和IOperationProgressListener.拷贝和删除等操作,是比较费时的,采用了异步执行的方式~ An ...

  8. 数字签名算法--3.ECDSA

    package Imooc; import java.security.KeyFactory; import java.security.KeyPair; import java.security.K ...

  9. [REASONML] Using Javascript npm package from REASON

    For example, we want to use moment.js inside our ReasonML code. What we can do is create a module fi ...

  10. RecipientsEditor-信息收件人输入框

    首先说一下信息收件人这个类的继承关系 RecipientsEditor->EncapsulatedMTKRecipientEditTextView(这两个类都在mms目录下) ->MTKR ...