519. Random Flip Matrix（Fisher-Yates洗牌算法）

1. 问题

给定一个全零矩阵的行和列，实现flip函数随机把一个0变成1并返回索引，实现rest函数将所有数归零。

2. 思路

拒绝采样

（1）先计算矩阵的元素个数（行乘以列），记作n，那么[0, n-1]相当于矩阵下标对应的一维索引。

（2）用一个arrays数组存放矩阵元素为1的索引。每次从 [0, n-1]取数，这个数可以表示矩阵元素的索引，如果取的数已经在这个数组里，说明这个索引对应的矩阵元素已经被flip为1了，则放弃，继续取数，直到取到的数不在数组里（对应的矩阵元素为0），就把取到的数加入arrays数组，表示已经被flip为1。

（3）取到的这个数（矩阵元素对应的一维索引）可以转换成矩阵的位置下标然后返回。

（4）关于拒绝采样的原理，我在470. Implement Rand10() Using Rand7() （拒绝采样Reject Sampling）做过阐述。简单说就是，当矩阵中含有0和1时，我想在只含有0的这些数中取样，但是这样取样比较困难，我可以直接从整个矩阵采样，当采样到1的时候拒绝，继续采样，直到采样到0为止，这样子的采样可以视为“在只含有0的这些数中取样”的一种近似，特别是1的个数远小于0的个数时，两种采样会很接近。

（5）缺点：但是当1的个数很大时，这样采样的效率就很低了，可能大部分情况采样的都是1，需要采样很多次才能采样到0。note中提到，行和列最大为1万，那么总大小就为一亿，而flip和reset的调用次数不会超过1000，只看这个最坏情况的话，这么做还挺ok的，毕竟flip这么少次，1的个数相对于0来说可以忽略不计了。

（方法二）Fisher-Yates Shuffle算法

Fisher-Yates洗牌算法是用来打乱一个随机序列的算法，主要步骤为：在0到n（索引）之间生成一个数m，交换m和n（索引对应的数），n（索引）减掉1，循环这三步，直到n等于0。主要思想就是每次采样（索引）时，当前随机采样到的数（索引对应的数）交换到最后一个数（末尾索引对应的数），然后采样池数量减一（末尾索引减一），然后继续采样和交换（不断迭代），直到采样池为空。这里参考了Fisher-Yates洗牌算法，主要步骤如下：

（1）建立一维数组，每个元素含有三个值，两个值为矩阵坐标，一个为flip值，0/1。

（2）每次flip时，按数组长度，随机抽取一个索引值，将这个索引对应的元素里的flip值从0变成1，然后把这个元素和最后一个元素交换。

（3）数组长度减1，然后返回最后一个元素（这个“最后一个元素”指的是数组长度减1之前，数组的最后一个元素）。

（4）对于reset操作，只需要把所有flip值改为0即可。

（5）然而这样做超时了，因为要建立的这个一维数组太大了，note中说到，行和列最大为1万，那么总大小就为一亿。而且flip和reset的调用次数不会超过1000，所以很多元素是不会被采样到的，用这么大的数组来维护实在是太奢侈了。实际上我们只要维护那些已采样的元素就可以了。

（6）考虑不使用这么大的数组，而是使用一个dict来映射已采样元素和最后一个元素，下面的方法三阐述了这样的做法。

（方法三）Fisher-Yates Shuffle算法，利用dict字典映射

（1）计算矩阵的元素个数记作n，那么[0, n-1]相当于矩阵下标对应的一维索引。

（2）每次采样（flip）时，维护一个字典dict，key表示采样到的索引，value表示这一次采样时的末尾索引。每次采样时末尾索引都不一样，第一次采样时末尾索引为n-1，每次采样前，我们都把末尾索引减1。

（3）这样，如果采样到“已经采样过的索引”，我们就可以从dict中根据“已经采样过的索引”（key）得到value（“采样这个已经采样过的索引时记录下来的末尾索引”）来作为我们的采样索引。

（4）如果采样到“还未采样过的索引”，则直接使用这个索引来作为我们的采样索引。

（5）在返回采样索引之前，我们需要更新dict，插入（更新）采样索引对应的value，即这次采样时的末尾索引（因为末尾索引可能也被采样过，所以要先从dict中查看是否存在“末尾索引”，如果采样则使用末尾索引对应的value）。

（6）最后返回采样索引对应的矩阵位置

3. 代码

拒绝采样

import random

class Solution(object):

    def __init__(self, n_rows, n_cols):

        self.n_rows, self.n_cols = n_rows, n_cols

        self.n = n_rows * n_cols

        self.arrays = []

    def flip(self):

        while True:

            i = random.randint(0,self.n-1)

            if i not in self.arrays:

                self.arrays.append(i)

                break

        return [i/self.n_cols, i%self.n_cols]

    def reset(self):

        self.arrays = []

时间复杂度O(1)，最坏情况O(无穷)

空间复杂度O(n)

（方法三）Fisher-Yates Shuffle算法，利用dict字典映射

import random

class Solution(object):

    def __init__(self, n_rows, n_cols):

        self.n_rows, self.n_cols = n_rows, n_cols

        self.reset()

    def flip(self):

        self.n -= 1

        i = random.randint(0, self.n)

        index = self.dic.get(i, i)

        self.dic[i] = self.dic.get(self.n, self.n)

        return [index / self.n_cols, index % self.n_cols]

    def reset(self):

        self.n = self.n_rows * self.n_cols

        self.dic = {}

时间复杂度O(1)

空间复杂度O(n)

4. 类似题目

470. Implement Rand10() Using Rand7() （拒绝采样Reject Sampling）

478. Generate Random Point in a Circle