You are given a string, s, and a list of words, words, that are all of the same length. Find all starting indices of substring(s) in s that is a concatenation of each word in words exactly once and without any intervening characters.

For example, given:
words["foo", "bar"]

You should return the indices: [0,9].
(order does not matter).




  时间复杂度为 O(n2)。

  1. public class Solution {
  2. public List<Integer> findSubstring(String s, String[] words) {
  3. List<Integer> res = new ArrayList<>();
  4. if (s == null || words == null || words.length == 0) {
  5. return res;
  6. }
  8. HashMap<String, Integer> toFind = new HashMap<>();
  9. for (String word : words) {
  10. Integer k = toFind.containsKey(word) ? toFind.get(word) + 1 : 1;
  11. toFind.put(word, k);
  12. }
  14. int m = words.length, n = words[0].length();
  15. HashMap<String, Integer> found = new HashMap<>();
  16. for (int i = 0; i <= s.length() - m * n; i++) {
  17. found.clear();
  18. int j = i;
  19. for (; j < i + m * n; j += n) {
  20. String part = s.substring(j, j + n);
  21. Integer a = toFind.get(part);
  22. Integer b = found.get(part);
  23. if (a == null || (b != null && a <= b)) {
  24. break;
  25. }
  26. found.put(part, b == null ? 1 : ++b);
  27. }
  28. if (j == i + m * n) {
  29. res.add(i);
  30. }
  31. }
  33. return res;
  34. }
  35. }


  仔细研究上面的解法,会发现其中有很多多余的步骤。例如,s="abcdefghijklmn",n=3:第一次遍历从'a'开始,需要遍历"abc", "edf", "ghi"....;而第4次比较从'd'开始,又需要遍历"def", "ghi"....



  • curr在toFind中不存在,此时匹配中断,前面从left开始匹配到的都失效。因此,清空found,从下一个子串(curr+n)继续。
  • curr在toFind中存在,但在found中不存在,说明前面没有匹配到。因此,将curr记入found中,然后从下一个子串继续。
  • curr在toFind和found中都存在,并且found中的数量小于toFind中的数量。将found中的currz数量加一,然后从下一个子串继续。
  • curr在toFind和found中都存在,并且两者数量相同,此时再将curr记入found就超过数量限制了。因此,需要从left开始,找到最早出现的同curr相同的子串(设为dupl),并把dupl同之前的子串在found中的纪录删除,然后从left移到dupl的下一个子串,然后curr从curr的下一个子串继续。


  当 i = 0 遍历完成时,清空found,然后从 i = 1 进行下一次循环。

  这个算法实现难度比较大,但是整体的时间复杂度为 O(n)。

  1. public class Solution {
  2. public List<Integer> findSubstring(String s, String[] words) {
  3. List<Integer> res = new ArrayList<>();
  4. if (s == null || words == null || words.length == 0) {
  5. return res;
  6. }
  8. HashMap<String, Integer> toFind = new HashMap<>();
  9. for (String word : words) {
  10. Integer k = toFind.containsKey(word) ? toFind.get(word) + 1 : 1;
  11. toFind.put(word, k);
  12. }
  14. int m = words.length, n = words[0].length();
  15. HashMap<String, Integer> found = new HashMap<>();
  16. for (int first = 0; first < n; first++) {
  17. found.clear();
  18. int left = first; // 当前串联字符串的起始位置
  19. for (int curr = first; curr < s.length() && left <= s.length() - m * n; curr += n) {
  20. String part = s.substring(curr, curr + n);
  21. if (!toFind.containsKey(part)) { // 如果part不存在,清空found并从下一个位置开始
  22. found.clear();
  23. left = curr + n;
  24. continue;
  25. }
  27. if (!found.containsKey(part)) {
  28. found.put(part, 1);
  29. } else if (found.get(part) < toFind.get(part)) {
  30. found.put(part, found.get(part) + 1);
  31. } else {
  32. // found和toFind中part数量相同,再添加就超出了,因此需要从left开始,
  33. // 找到第一个part相同的子串,将其与之前的子串删去,再将其下一个字符串为起点。
  34. while (!part.equals(s.substring(left, left + n))) {
  35. Integer x = found.get(s.substring(left, left + n));
  36. found.put(s.substring(left, left + n), x - 1);
  37. left += n;
  38. }
  39. // 此处需要从found中删除left,再添加curr,但两者相同,故可抵消
  40. left += n;
  41. }
  43. // 如果当前串联子串的长度与数组长度相同,说明成功匹配了一个,
  44. // 将其记录到res后,从left的下一个子串再继续
  45. if (curr - left == (m - 1) * n) {
  46. res.add(left);
  47. Integer y = found.get(s.substring(left, left + n));
  48. found.put(s.substring(left, left + n), y - 1);
  49. left += n;
  50. }
  51. }
  52. }
  54. return res;
  55. }
  56. }

