[经典面试题]包含T全部元素的最小子窗口

题目描述

给定一个包含一系列字符的集合T和字符串S,请在字符串S中找到一个最小的窗口，这个窗口中必须包含T中的所有字符。

例如,

S = “ADOBECODEBANC”

T = “ABC”

最小窗口是“BANC”

分析

这是一个有趣的问题,这个有趣的问题有多种方法来解决，最好的方法是非常简单，美丽的。

在这篇文章中,我首先说明了一个方法,是我第一次遇见这个问题时想到的。我的第一个方法有点复杂,同时也不是最好的解决方案(时间复杂度为O(NlgM))。在这篇文章的后面中,我介绍一个比较好的方法,时间复杂度为O(N)。

Hint:

使用上面的示例中S =“ADOBECODEBANC”，S =“ABC”,我们可以很容易地找到第一个窗口“ADOBEC”，包含了T中所有元素。另一个可能的候选者是“ADOBECODEB A”。事实上,我们应该跳过这个,因为在这个窗口中存在一个子窗口“CODEBA”，既短又满足约束条件。最后考虑的一个窗口是“BANC”,这也是最小的窗口。

为了有效地解决这个问题,下面我们需要考虑的两个关键点:

我们如何确定一个特定的窗口包含T ?(最理想的情况是O(1)时间)。

我们如何有效的选择所有窗口?(最理想的情况是不包括含有子窗口的那些窗口)。

我们绝对需要哈希表（Hash Table）的帮助。哈希表能在O(1)时间内告诉我们一个字符是否在T 中。

O(N lg M) 方法:

当我第一次遇到这一问题,我想到了另一个表,记录字符上次出现的位置。也就是说,当我第一次看到字符’A‘,我记录它的位置是0。我每次再见到’ A ‘,我就用新位置代替它原先的位置。这种方法虽然很简单,但是缺陷也很明显。请注意,T不包含重复的字符吗?如果T包含了重复的字符,如“AABC”,这种方法就不能使用了。

在这种情况下,补救措施是维持一个队列(而不是表),T中每个不同字符对应一个队列（例如：字符A对应一个队列，字符B对应一个队列。。。）。例如,假设T =“AABC”,当你第一次遇到“A”,把它的所在位置放入“A”队列中(最初是空的)。当你再次遇到“A ”时,把它的位置放入“A”队列末尾。第三次遇到“A”时,弹出第一个元素,并把这次遇到的A所在位置放入“A”队列末尾。通过弹出元素,我们不包括那些包含子窗口的窗口。这种方法很有效,但困难是双重的:

我们没有办法从队列本身直接确定窗口的开始和结束位置。一个最自然的方法是扫描整个队列得到最小值和最大值。我们如何确定这个窗口是否满足约束条件呢?我们不得不扫描整个队列来检查所有队列大小总和是否等于T的长度。

我解决上述问题的方法是维护一个sorted map,它映射到每一个字符。这样我们能在O(1)时间内获取最小值和最大值的位置。但这样做会花费额外的时间。每次你从队列中弹出一个元素,你不得不通过删除相应的元素和插入一个新元素来更新map。检查窗口是否满足约束条件,我们必须查看map的大小,如果map的大小等于T的长度就代表找到一个有效的窗口。

这个方法的时间复杂度是O(N lg M),其中N是S的长度,和M是T的长度。额外的lgM是由于在map中删除和插入一个元素的额外花费，每个最坏情况花费O(lgM)时间。（注意,M是map的最大大小。）

#include <iostream>

#include <map>

#include <queue>

#include <climits>

#include <algorithm>

using namespace std;

bool MinWindow(string s,string t,int &startWin,int &endWin){

    int slen = s.size();

    int tlen = t.size();

    if(slen <= 0 || tlen <= 0){

        return false;

    }//if

    // 存储T中不同字符的总数

    int needFind[256] = {0};

    for(int i = 0;i < tlen;++i){

        ++needFind[t[i]];

    }//for

    // 不在T中的元素设置为-1

    for(int i = 0; i < 256;++i){

        if(needFind[i] == 0){

            needFind[i] = -1;

        }//if

    }//for

    int minWinLen = INT_MAX;

    // 队列数组，每个不同的字符都对应一个队列

    queue<int> q[256];

    // 第一个元素和最后一个元素表明了窗口的开始和结束位置

    map<int,char> m;

    int val;

    for(int i = 0;i < slen;++i){

        val = s[i];

        // 跳过不在T中的元素

        if(needFind[val] == -1) {

            continue;

        }//id

        // 字符放入队列

        if(q[val].size() < needFind[val]) {

            q[val].push(i);

            m[i] = val;

        }//if

        // 取代队列中的字符，更新map中对应元素

        else{

            int idxToErase = q[val].front();

            map<int,char>::iterator it = m.find(idxToErase);

            m.erase(it);

            m[i] = val;

            q[val].pop();

            q[val].push(i);

        }//else

        if(m.size() == tlen){

            int end = m.rbegin()->first;

            int start = m.begin()->first;

            int winLen = end - start + 1;

            if (winLen < minWinLen) {

                minWinLen = winLen;

                startWin = start;

                endWin = end;

            }//if

        }//if

    }//for

    return (m.size() == tlen);

}

int main() {

    string s("acbbaca");

    string t("aba");

    int start,end;

    bool result = MinWindow(s,t,start,end);

    if(result){

        cout<<s.substr(start,end-start+1)<<endl;

    }//if

    else{

        cout<<"未找到"<<endl;

    }//else

    return 0;

}

O(N)方法：

注意到上面的思路是非常复杂的。它使用了一个哈希表,一个队列还有一个sorted map。在面试过程中,给出的问题往往是比较短的，解决方案通常在50行代码左右。所以你有必要大声说出你在想什么,时刻保持与面试官进行沟通。检查你的方法是否是没有必要的复杂,他/她可以给你指导。最不好的就是就是你被困在一点,什么也不说。

为了阐述这个思路,我使用一个不同上面的例子:S = “acbbaca”,T = “aba”。这个思路主要是遍历S时使用了两个指针begin和end(窗口开始和结束位置)和两个数组(needToFind 和 hasFound)。needToFind存储T中不同字符的总数，hasFound存储到目前为止遇到过的不同字符的总数。我们也使用一个count变量来存储到目前为止遇到过的T中字符总数(当hasFound[x]超过needToFind[x]时不用计数)。当count等于T的长度时,我们就找到了一个有效的窗口。

每次我们向前移动end指针(指向一个元素x),我们会使hasFound[x]加一。如果hasFound[x]是小于或等于needToFind[x]时count加一。为什么?当满足约束条件(即count等于T的大小),在满足约束的条件下，我们开尽可能的向右移动begin指针。

我们如何检查是否满足约束条件呢?假设begin指向一个元素x,我们检查hasFound[x]是否大于needToFind[x]。如果是,我们可以使hasFound[x]减一,在不破坏约束条件的前提下向前移动begin指针。相反,如果不是,我们立即停止向前移动begin指针，以防破坏约束条件。

最后,我们检查最小窗口长度是否小于当前的最小窗口长度。如果不是则更新最小窗口长度。

本质上,该算法找到满足约束的第一个窗口后,仍然继续保持约束条件。

（1） S = “acbbaca” T = “aba“

（2）第一个找到最小的窗口。我们无法向前移动begin指针当hasFound[‘a’]== needToFind[‘a’]= = 2。向前移动意味着打破约束。

（3）第二个窗口。begin指针仍然指向第一个元素“a”。hasFound[’ a ‘]（3）大于needToFind[‘a’]（2）。我们使hasFound[’ a ‘],向右移动begin指针。

（4）我们跳过元素c，因为它不在T中。现在begin指针指向元素b。hasFound[b]（2）大于needToFind[b]（1）。我们使hasFound[b]减一,同时向右移动begin指针。

（5）begin指针现在指向下一个元素b。hasFound[b]（1）等于needToFind[b]（1）。我们立即停止,这是我们新发现的最小的窗口。

begin指针和end指针最坏情况下向前移动至多N步（N 是字符串S的长度），加起来是2N时间，因此时间复杂度是O(N)。

#include <iostream>

#include <climits>

#include <algorithm>

using namespace std;

// Returns false if no valid window is found. Else returns

// true and updates start and end with the

// starting and ending position of the minimum window.

bool MinWindow(string s,string t,int &startWin,int &endWin){

    int slen = s.size();

    int tlen = t.size();

    if(slen <= 0 || tlen <= 0){

        return false;

    }//if

    // 存储T中不同字符的总数

    int needFind[256] = {0};

    for(int i = 0;i < tlen;++i){

        ++needFind[t[i]];

    }//for

    // 存储到目前为止遇到过的不同字符的总数

    int hasFound[256] = {0};

    // 存储到目前为止遇到过的T中字符总数

    int count = 0;

    int minWin = INT_MAX;

    int endEle;

    for(int start = 0,end = 0;end < slen;++end){

        endEle = s[end];

        // 剪枝 无用字符(T中字符为有用字符)

        if(needFind[endEle] == 0){

            continue;

        }//if

        ++hasFound[endEle];

        if(hasFound[endEle] <= needFind[endEle]){

            ++count;

        }//if

        // 找到一个有效窗口

        if(count == tlen){

            int begEle = s[start];

            // 满足：字符为无用字符，begEle元素找多了 start指针才向右移动

            while(needFind[begEle] == 0 || hasFound[begEle] > needFind[begEle]){

                if(hasFound[begEle] > needFind[begEle]){

                   --hasFound[begEle];

                }//if

                ++start;

                begEle = s[start];

            }//while

            // 更新最小窗口

            int curWin = end - start + 1;

            if(curWin < minWin){

                minWin = curWin;

                startWin = start;

                endWin = end;

            }//if

        }//if

    }//while

    return (count == tlen);

}

int main() {

    string s("ADOBECODEBANC");

    string t("ABC");

    int start,end;

    bool result = MinWindow(s,t,start,end);

    if(result){

        cout<<s.substr(start,end-start+1)<<endl;

    }//if

    else{

        cout<<"未找到"<<endl;

    }//else

    return 0;

}

[经典面试题]包含T全部元素的最小子窗口的更多相关文章

李洪强iOS经典面试题153- 补充
李洪强iOS经典面试题153- 补充补充有空就来解决几个问题,已经懒癌晚期没救了... UML 统一建模语言(UML,UnifiedModelingLanguage)是面向对象软件的标准化建模 ...
李洪强经典面试题152-Runtime
李洪强经典面试题152-Runtime Runtime Runtime是什么 Runtime 又叫运行时,是一套底层的 C 语言 API,其为 iOS 内部的核心之一,我们平时编写的 OC 代码, ...
李洪强iOS经典面试题141-报错警告调试
李洪强iOS经典面试题141-报错警告调试报错警告调试你在实际开发中,有哪些手机架构与性能调试经验刚接手公司的旧项目时,模块特别多,而且几乎所有的代码都写在控制器里面,比如UI控件代码.网络 ...
李洪强iOS经典面试题140-UI
李洪强iOS经典面试题140-UI UI viewcontroller的一些方法的说明viewDidLoad,viewWillDisappear, viewWillAppear方法的顺序和作用? ...
李洪强iOS经典面试题135-Objective-C
可能碰到的iOS笔试面试题(5)--Objective-C 面试笔试都是必考语法知识的.请认真复习和深入研究OC. Objective-C 方法和选择器有何不同?(Difference between ...
李洪强iOS经典面试题上
李洪强iOS经典面试题上 1. 风格纠错题修改完的代码: 修改方法有很多种,现给出一种做示例: // .h文件 // http://weibo.com/luohanchenyilong/ / ...
经典面试题（二）附答案算法+数据结构+代码微软Microsoft、谷歌Google、百度、腾讯
1.正整数序列Q中的每个元素都至少能被正整数a和b中的一个整除,现给定a和b,需要计算出Q中的前几项, 例如,当a=3,b=5,N=6时,序列为3,5,6,9,10,12 (1).设计一个函数void ...
web前端经典面试题大全及答案
阅读目录 JavaScript部分 JQurey部分 HTML/CSS部分正则表达式开发及性能优化部分本篇收录了一些面试中经常会遇到的经典面试题以及自己面试过程中遇到的一些问题,并且都给出了我在 ...
经典面试题：从 URL 输入到页面展现到底发生什么？
前言打开浏览器从输入网址到网页呈现在大家面前,背后到底发生了什么?经历怎么样的一个过程?先给大家来张总体流程图,具体步骤请看下文分解! 本文首发地址为GitHub 博客,写文章不易,请多多支持与关注 ...

随机推荐

2016/05/06 Sublime Text 3 常用插件以及安装方法(转)
http://www.cnsecer.com/460.html 安装Sublime Text 3插件的方法: 朋友们,小站活着不容易,全靠广告费养着了,如果本文对你有帮助.麻烦动下手点下页面的广告吧, ...
XMU 1606 nc与滴水问题【模拟】
1606: nc与滴水问题 Time Limit: 1000 MS Memory Limit: 64 MBSubmit: 85 Solved: 27[Submit][Status][Web Boa ...
HTML表单常用标签
名称用例备注文本输入框 <input type="text" name="uname" value="" ...
myeclipse 8.6安装SVN插件
方法二: 安装subclipse, SVN 插件 1.从官网下载site-1.6.9.zip文件,网址是:subclipse.tigris.org, 2.从中解压出features与plug ...
bleve搜索引擎源码分析之索引——mapping真复杂啊
接下来看看下面index部分的源码实现: data := struct { Name string Des string }{ Name: "hello world this is bone ...
gerrit调试
开源可扩展的Web视频播放器：Clappr Player
http://www.open-open.com/lib/view/open1417057033846.html http://www.csdn.net/article/2014-11-27/2822 ...
CodeForces 722B Verse Pattern (水题)
题意:统计元音,这里多加一个元音,y. 析:直接统计就好了. 代码如下: #pragma comment(linker, "/STACK:1024000000,1024000000" ...
cardboard sdk for unity 下载地址
https://github.com/googlesamples/cardboard-unity
JNI编程(一) —— 编写一个最简单的JNI程序（转载）
转自:http://chnic.iteye.com/blog/198745 忙了好一段时间,总算得了几天的空闲.貌似很久没更新blog了,实在罪过.其实之前一直想把JNI的相关东西整理一下的,就从今天 ...

[经典面试题]包含T全部元素的最小子窗口

[经典面试题]包含T全部元素的最小子窗口的更多相关文章

随机推荐

热门专题