Substring with Concatenation of All Words

You are given a string, S, and a list of words, L, that are all of the same length. Find all starting indices of substring(s) in S that is a concatenation of each word in L exactly once and without any intervening characters.
For example, given:
S: "barfoothefoobarman"
L: ["foo", "bar"]

You should return the indices: [0,9].
(order does not matter).

SOLUTION 1:

1. 使用HashMap来保存L中所有的字串。

2. 暴力破解之。使用i记录我们的查找结果字符串的位置,j记录单个单词的查找位置。j每次移动一个L中单词的位置。

3. 注意各种越界条件:i查到离结束还有L*N(L中所有单词总长)的时候,即需要停止。

j 也要考虑每一次查找的单词的长度。

4. 使用第二个HashMap来记录我们查到的单词。如果所有的单词都查到了,即可记录一个解。

 // SOLUTION 1:
public List<Integer> findSubstring1(String S, String[] L) {
HashMap<String, Integer> map = new HashMap<String, Integer>();
HashMap<String, Integer> found = new HashMap<String, Integer>();
List<Integer> ret = new ArrayList<Integer>(); if (S == null || L == null || L.length == 0) {
return ret;
} int cntL = 0; // put all the strings into the map.
for (String s: L) {
if (map.containsKey(s)) {
map.put(s, map.get(s) + 1);
} else {
map.put(s, 1);
cntL++;
}
} int lenL = L[0].length(); int cntFound = 0; // 注意这里的条件:i < S.length() - lenL * L.length
// 这里很关键,如果长度不够了,不需要再继续查找
for (int i = 0; i <= S.length() - lenL * L.length; i++) {
// clear the found hashmap.
found.clear();
cntFound = 0; // 一次前进一个L的length.
// 注意j <= S.length() - lenL; 防止越界
for (int j = i; j <= S.length() - lenL; j += lenL) {
String sub = S.substring(j, j + lenL);
if (map.containsKey(sub)) {
if (found.containsKey(sub)) {
if (found.get(sub) == map.get(sub)) {
// 超过了限制数目
break;
} found.put(sub, found.get(sub) + 1);
} else {
found.put(sub, 1);
} if (found.get(sub) == map.get(sub)) {
cntFound++;
} // L中所有的字符串都已经找到了。
if (cntFound == cntL) {
ret.add(i);
}
} else {
// 不符合条件,可以break,i前进到下一个匹配位置
break;
}
}
} return ret;
}

12.26.2014 redo:

注意到几个容易出错的点:1. i的终止条件(用以防止TLE).  2. j的终止条件。

 public class Solution {
public List<Integer> findSubstring(String S, String[] L) {
ArrayList<Integer> ret = new ArrayList<Integer>();
if (S == null || L == null || L.length == 0) {
return ret;
} HashMap<String, Integer> map = new HashMap<String, Integer>();
HashMap<String, Integer> des = new HashMap<String, Integer>(); for (String s: L) {
if (map.containsKey(s)) {
map.put(s, map.get(s) + 1);
} else {
// bug 1: should be , not .
map.put(s, 1);
}
} int wordLen = L[0].length(); int size = L.length;
int cnt = 0; int len = S.length();
// bug 3: j <= len - wordLen * size to avoid the TLE
for (int i = 0; i <= len - wordLen * size; i++) {
// bug 2: should be des.clear not map.clear.
des.clear();
cnt = 0; // pay attention: should use j <= len.
for (int j = i; j <= len - wordLen; j += wordLen) {
String sub = S.substring(j, j + wordLen); if (!map.containsKey(sub)) {
break;
} if (des.containsKey(sub)) {
des.put(sub, 1 + des.get(sub));
} else {
des.put(sub, 1);
} if (des.get(sub) > map.get(sub)) {
break;
} cnt++; if (cnt == size) {
ret.add(i);
break;
}
}
} return ret;
}
}

SOLUTION 2:

1. 与解1相比,我们这次每次复制一个HashMap,找到一个单词,即减少此单词的计数,直到HashMap为空,表示我们找到一个解。

与Solution 1相比,这个方法写起来会简单一点。

 // SOLUTION 2:
public List<Integer> findSubstring(String S, String[] L) {
HashMap<String, Integer> map = new HashMap<String, Integer>();
HashMap<String, Integer> found;
List<Integer> ret = new ArrayList<Integer>(); if (S == null || L == null || L.length == 0) {
return ret;
} // put all the strings into the map.
for (String s: L) {
if (map.containsKey(s)) {
map.put(s, map.get(s) + 1);
} else {
map.put(s, 1);
}
} int lenL = L[0].length(); // 注意这里的条件:i < S.length() - lenL * L.length
// 这里很关键,如果长度不够了,不需要再继续查找
for (int i = 0; i <= S.length() - lenL * L.length; i++) {
// 每一次,都复制之前的hashMap.
found = new HashMap<String, Integer>(map); // 一次前进一个L的length.
// 注意j <= S.length() - lenL; 防止越界
for (int j = i; j <= S.length() - lenL; j += lenL) {
String sub = S.substring(j, j + lenL);
if (found.containsKey(sub)) {
// 将找到字符串的计数器减1.
found.put(sub, found.get(sub) - 1); // 减到0即可将其移出。否则会产生重复运算,以及我们用MAP为空来判断是否找到所有的单词。
if (found.get(sub) == 0) {
found.remove(sub);
}
} else {
// 不符合条件,可以break,i前进到下一个匹配位置
break;
} // L中所有的字符串都已经找到了。
if (found.isEmpty()) {
ret.add(i);
}
}
} return ret;
}

SOLUTION 3:

九章算法官网解:

http://www.ninechapter.com/solutions/substring-with-concatenation-of-all-words/

主页君GITHUB:

https://github.com/yuzhangcmu/LeetCode_algorithm/blob/master/string/FindSubstring.java

LeetCode: Substring with Concatenation of All Words 解题报告的更多相关文章

  1. 【LeetCode】697. Degree of an Array 解题报告

    [LeetCode]697. Degree of an Array 解题报告 标签(空格分隔): LeetCode 题目地址:https://leetcode.com/problems/degree- ...

  2. 【LeetCode】779. K-th Symbol in Grammar 解题报告(Python)

    [LeetCode]779. K-th Symbol in Grammar 解题报告(Python) 作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingz ...

  3. 【LeetCode】792. Number of Matching Subsequences 解题报告(Python)

    [LeetCode]792. Number of Matching Subsequences 解题报告(Python) 作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://f ...

  4. 【LeetCode】881. Boats to Save People 解题报告(Python)

    [LeetCode]881. Boats to Save People 解题报告(Python) 作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu ...

  5. 【LeetCode】802. Find Eventual Safe States 解题报告(Python)

    [LeetCode]802. Find Eventual Safe States 解题报告(Python) 作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemi ...

  6. 【LeetCode】813. Largest Sum of Averages 解题报告(Python)

    [LeetCode]813. Largest Sum of Averages 解题报告(Python) 标签(空格分隔): LeetCode 作者: 负雪明烛 id: fuxuemingzhu 个人博 ...

  7. 【LeetCode】166. Fraction to Recurring Decimal 解题报告(Python)

    [LeetCode]166. Fraction to Recurring Decimal 解题报告(Python) 标签(空格分隔): LeetCode 作者: 负雪明烛 id: fuxuemingz ...

  8. 【LeetCode】556. Next Greater Element III 解题报告(Python)

    [LeetCode]556. Next Greater Element III 解题报告(Python) 标签(空格分隔): LeetCode 作者: 负雪明烛 id: fuxuemingzhu 个人 ...

  9. 【LeetCode】522. Longest Uncommon Subsequence II 解题报告(Python)

    [LeetCode]522. Longest Uncommon Subsequence II 解题报告(Python) 标签(空格分隔): LeetCode 作者: 负雪明烛 id: fuxuemin ...

随机推荐

  1. oracle 多字段去重查询

      oracle 多字段去重查询 CreationTime--2018年6月29日15点11分 Author:Marydon 1.情景展示 需要对表BASE_MRI_DEVICE的COMPNAME.F ...

  2. 老男孩Linux.shell.RHCE运维初中高级50G附解压密码

    学习Linux,好的教程.使学习事半功倍! 老男孩Linux.shell.RHCE运维初中高级 下载地址: http://pan.baidu.com/s/1hsQOb2W 密码: h4hs 解压密码: ...

  3. oper

    package main.java.com.zte.controller.ems; import java.util.HashMap; import java.util.List; import ja ...

  4. 设置/修改centos上的swap交换分区的方法

    设置centos上的swap交换分区的方法 作为linux世界里最稳定的服务器版本,rhas5一直有很大的应用面,之前一直关注的是freebsd,因为应用的需要,特别在配合mysql和oracle上r ...

  5. HDUOJ--1874 畅通工程续

    畅通工程续 Time Limit: 3000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Submi ...

  6. Google的创新九原则(转)

    原文url:http://www.365xiaoxi.com/All/News/2013-11-22/6432.html 想知道是什么让Google成为生产力与创造力的圣杯?当然不是喝山景城脚下的神水 ...

  7. PLSQL_SQL Loader的概念和用法(概念)

    2014-06-08 Created By BaoXinjian

  8. OAF_OAF Framework常用函数汇总(概念)

    2014-12-31 Created By BaoXinjian

  9. linux内存回收机制

    无论计算机上有多少内存都是不够的,因而linux kernel需要回收一些很少使用的内存页面来保证系统持续有内存使用.页面回收的方式有页回写.页交换和页丢弃三种方式:如果一个很少使用的页的后备存储器是 ...

  10. Linux内核(2) - 分析内核源码如何入手(上)

    透过现象看本质,兽兽们无非就是一些人体艺术展示.同样往本质里看过去,学习内核,就是学习内核的源代码,任何内核有关的书籍都是基于内核,而又不高于内核的. 既然要学习内核源码,就要经常对内核代码进行分析, ...