Coppersmith-Winograd 算法
转自:https://www.douban.com/group/topic/29658298/
对正整数 $q$,定义张量 $T$,其对应的多项式为 $p(X,Y,Z)=\sum_{i=1}^q (X_0Y_iZ_i+X_iY_0Z_i+X_iY_iZ_0)$。对于 $\epsilon>0$,定义张量 $T(\epsilon)$,其对应的多项式为
\begin{align}
&\left(\sum_{i=1}^q \epsilon^{-2} (X_0+\epsilon X_i)(Y_0+\epsilon Y_i)(Z_0+\epsilon Z_i)\right)\\
&-\epsilon^{-3}\left(X_0+\epsilon^2\sum_{i=1}^q X_i\right)\left(Y_0+\epsilon^2\sum_{i=1}^q Y_i\right)\left(Z_0+\epsilon^2\sum_{i=1}^q Z_i\right)\\
&+\left(\epsilon^{-3}-q\epsilon^{-2}\right)X_0Y_0Z_0
\end{align}
则 $\lim_{\epsilon\to 0} T(\epsilon)=T$ 且 $R(T(\epsilon))\leq q+2$。故 $\underline{R}(T)\leq q+2$。
出于方便采用如下的记号:将变量 $X_0,\dots,X_q$ 分成两块,其中块 $[0]$ 包含 $X_0$,块 $[1]$ 包含 $X_1,\dots,X_q$。对 $Y$ 和 $Z$ 作同样的处理。令 $X^{[I_1]}Y^{[I_2]}Z^{[I_3]}$ 包含 $p(X,Y,Z)$ 中所有单项式 $X_{j_1}Y_{j_2}Z_{j_3}$ 之和,其中 $j_1,j_2,j_3$ 分别属于块 $[I_1],[I_2],[I_3]$。即
\begin{align}
X^{[0]}Y^{[1]}Z^{[1]}&=\sum_{i=1}^q X_0Y_iZ_i,\\
X^{[1]}Y^{[0]}Z^{[1]}&=\sum_{i=1}^q X_iY_0Z_i,\\
X^{[1]}Y^{[1]}Z^{[0]}&=\sum_{i=1}^q X_iY_iZ_0,
\end{align}
其对应的张量分别为 $\langle 1,1,q\rangle$,$\langle 1,q,1\rangle$,$\langle q,1,1\rangle$。并且有 $p(X,Y,Z)=X^{[0]}Y^{[1]}Z^{[1]}+X^{[1]}Y^{[0]}Z^{[1]}+X^{[1]}Y^{[1]}Z^{[0]}$。下面考虑张量 $T^{\otimes N}$ ($N$ 为 $3$ 的倍数),并设其对应的多项式为 $p'(X,Y,Z)$,其中 $X=\{X_{i_1,\dots,i_N}: 0\leq i_t\leq q\}$,对 $Y,Z$ 同理。称 $X_{j_1,\dots,j_N}$ 属于块 $[I_1,\dots,I_N]$,若 $X_{j_t}$ 属于块 $[I_t]$。对 $Y$ 和 $Z$ 作同样的处理。令 $X^{[I_1,\dots,I_N]}Y^{[I'_N,\dots,I'_N]}Z^{[I''_N,\dots,I''_N]}$ 包含 $p'(X,Y,Z)$ 中所有单项式 $X_{j_1,\dots,j_N}Y_{j'_1,\dots,j'_N}Z_{j''_1,\dots,j''_N}$ 之和,其中 $X_{j_1,\dots,j_N},Y_{j'_1,\dots,j'_N},Z_{j''_1,\dots,j''_N}$ 分别属于块 $[I_1,\dots,I_N],[I'_1,\dots,I'_N],[I''_1,\dots,I''_N]$。并且有
$$
p'(X,Y,Z)=\sum X^{[I_1,\dots,I_N]}Y^{[I'_N,\dots,I'_N]}Z^{[I''_N,\dots,I''_N]}.
$$
对任意变量 $X_{j_1,\dots,j_N}$,设其属于块 $[I_1,\dots,I_N]$ 且 $I_1,\dots,I_N$ 中 $0$ 的数量不为 $N/3$(即 $1$ 的数量不为 $2N/3$),则删除 $p'(X,Y,Z)$ 中所有含变量 $X^{j_1,\dots,j_N}$ 的项。类似地处理 $Y$ 和 $Z$。设得到的多项式为 $p''$,对应的张量为 $T'$。则 $\underline{R}(T')\leq \underline{R}\left(T^{\otimes N}\right)\leq (q+2)^N$。这里 $p''$ 为形如 $X^{[I_1,\dots,I_N]}Y^{[I'_N,\dots,I'_N]}Z^{[I''_N,\dots,I''_N]}$ 的 $M={N\choose N/3,N/3,N/3}$ 项之和,其中每一项恰为 $(\langle 1,1,q\rangle\otimes\langle 1,q,1\rangle\otimes\langle q,1,1\rangle)^{\otimes N/3}=\langle q,q,q\rangle^{\otimes N/3}$。若项与项之间是独立的(即不同的项不包含相同的变量),则 $T''=\left(\langle q,q,q\rangle^{\otimes N/3}\right)^{\oplus M}$,并可利用渐近和不等式(定理 4.1)得到 $\omega$ 的上界。但这并不成立,例如 $N=3$ 时 $X^{[0,1,1]}$ 包含在不同的两项 $X^{[0,1,1]}Y^{[1,1,0]}X^{[1,0,1]}$ 和 $X^{[0,1,1]}Y^{[1,0,1]}X^{[1,1,0]}$ 中。接下来进一步删除一些变量以确保独立性:令 $S=\left\{A,B,C\in \{0,1\}^N: A,B,C ~\text{含有 } N/3 \text{ 个 } 0 \right\}$。有 $|S|={N\choose N/3,N/3,N/3}$。取 $S$ 中尽量大的子集 $S'$ 使得对任意 $(A,B,C),(A',B',C'),(A'',B'',C'')\in S'$,$A+B'+C''=(2,\dots,2)$ 仅当 $(A,B,C)=(A',B',C')=(A'',B'',C'')$。利用定理 7.4 证明中的构造,可得 $|S'|\geq ((27/4)^{1/3}-o(1))^N$。删除 $p''$ 中含变量 $X_{i_1,\dots,i_N}$ 的项,如果 ${i_1,\dots,i_N}$ 不属于任何块 $A$ 使得存在 $(A,B,C)\in S'$。类似地删除 $p''$ 中含变量 $Y_{i'_1,\dots,i'_N}$ 的项,如果 ${i'_1,\dots,i'_N}$ 不属于任何块 $B$ 使得存在 $(A,B,C)\in S'$。最后删除 $p''$ 中含变量 $Z_{i''_1,\dots,i''_N}$ 的项,如果 ${i''_1,\dots,i''_N}$ 不属于任何块 $C$ 使得存在 $(A,B,C)\in S'$。设得到的多项式为 $P$,其对应的张量为 $T''$。有 $P=\sum_{(A,B,C)\in S'} X^{[A]}Y^{[B]}Z^{[C]}$,且项与项之间是独立的(否则,不失一般性假设 $(A,B,C),(A,B',C'')\in S'$,且 $(A,B,C)\neq (A,B',C'')$,但 $A+B'+C''=(2,\dots,2)$,矛盾)。于是 $T''=\left(\langle q,q,q\rangle^{\otimes N/3}\right)^{\oplus |S'|}$ 并且 $\underline{R}(T'')\leq \underline{R}(T')\leq (q+2)^N$。由渐近和不等式,有 $|S'|q^{N\omega/3}\leq (q+2)^N$,其中 $|S'|\geq ((27/4)^{1/3}-o(1))^N$。令 $N\to\infty$ 并令 $q=8$,得 $\omega \leq (3\log_2 10 - \log_2 (27/4)) / \log_2 8=2.403\dots$。这样就重新证明了定理 7.6。
对上述结果可作如下改进:引入变量 $X_{q+1}$ 并设块 $[2]$ 包含 $X_{q+1}$。对 $Y$ 和 $Z$ 作同样的处理。定义张量 $T$,其对应的多项式为
\begin{align}
p(X,Y,Z)&=\sum_{i=1}^q (X_0Y_iZ_i+X_iY_0Z_i+X_iY_iZ_0)\\
&+X_0Y_0Z_{q+1}+X_0Y_{q+1}Z_0+X_{q+1}Y_0Z_0.
\end{align}
对于 $\epsilon>0$,定义张量 $T(\epsilon)$,其对应的多项式为
\begin{align}
&\left(\sum_{i=1}^q \epsilon^{-2} (X_0+\epsilon X_i)(Y_0+\epsilon Y_i)(Z_0+\epsilon Z_i)\right)\\
&-\epsilon^{-3}\left(X_0+\epsilon^2\sum_{i=1}^q X_i\right)\left(Y_0+\epsilon^2\sum_{i=1}^q Y_i\right)\left(Z_0+\epsilon^2\sum_{i=1}^q Z_i\right)\\
&+\left(\epsilon^{-3}-q\epsilon^{-2}\right)(X_0-q\epsilon^3 X_{q+1})(Y_0-q\epsilon^3 Y_{q+1})(Z_0-q\epsilon^3 Z_{q+1})
\end{align}
则 $\lim_{\epsilon\to 0} T(\epsilon)=T$ 且 $R(T(\epsilon))\leq q+2$。故 $\underline{R}(T)\leq q+2$。沿用之前的记号,则有
\begin{align}
p(X,Y,Z)&=X^{[0]}Y^{[1]}Z^{[1]}+X^{[1]}Y^{[0]}Z^{[1]}+X^{[1]}Y^{[1]}Z^{[0]}\\
&+X^{[0]}Y^{[0]}Z^{[2]}+X^{[0]}Y^{[2]}Z^{[0]}+X^{[2]}Y^{[0]}Z^{[0]}
\end{align}
其中
\begin{align}
X^{[0]}Y^{[1]}Z^{[1]}&=\sum_{i=1}^q X_0Y_iZ_i,\\
X^{[1]}Y^{[0]}Z^{[1]}&=\sum_{i=1}^q X_iY_0Z_i,\\
X^{[1]}Y^{[1]}Z^{[0]}&=\sum_{i=1}^q X_iY_iZ_0,\\
X^{[0]}Y^{[0]}Z^{[2]}&=X_0Y_0Z_{q+1},\\
X^{[0]}Y^{[2]}Z^{[0]}&=X_0Y_{q+1}Z_0,\\
X^{[2]}Y^{[0]}Z^{[0]}&=X_{q+1}Y_0Z_0
\end{align}
其对应的张量分别为 $\langle 1,1,q\rangle$,$\langle 1,q,1\rangle$,$\langle q,1,1\rangle$,$\langle 1,1,1\rangle$,$\langle 1,1,1\rangle$,$\langle 1,1,1\rangle$。
令
$$
S=\left\{A,B,C\in \{0,1,2\}^N: \begin{array} ~(0,1,1),(1,0,1),(1,1,0),(0,0,2),(0,2,0),(2,0,0) \\\text{在所有 }
(A_i,B_i,C_i) ~\text{中出现的次数分别为 } \\
(1-\alpha)N/3,(1-\alpha)N/3,(1-\alpha)N/3,\\
\alpha N/3,\alpha N/3,\alpha N/3\end{array}\right\}.$$
有 $|S|={N\choose (1-\alpha)N/3,(1-\alpha)N/3,(1-\alpha)N/3,\alpha N/3,\alpha N/3,\alpha N/3}$。取 $S$ 中尽量大的子集 $S'$ 使得对任意 $(A,B,C),(A',B',C'),(A'',B'',C'')\in S'$,$A+B'+C''=(2,\dots,2)$ 仅当 $(A,B,C)=(A',B',C')=(A'',B'',C'')$。修改定理 7.4 证明中的构造:定义哈希函数 (hash function) $h_1,h_2,h_3:\{0,1,2\}^N\to\mathbb{F}_m$ 如下
\begin{align}
h_1(a)&=\sum_{i=1}^N w_i a_i+w_{N+1}\\
h_2(b)&=\sum_{i=1}^N w_i b_i+w_{N+2}\\
h_3(c)&=\frac{1}{2}\left( \sum_{i=1}^N w_i(2-c_i)+w_{N+1}+w_{N+2} \right).
\end{align}
定义 $S'=\{(a,b,c)\in S: h_1(a),h_2(b),h_3(c)\in Q\}$,其中 $Q$ 的定义与定理 7.4 证明中相同。定义 $S'$ 的子集 $T_1,T_2,T_3$ 如下:
\begin{align}
T_1&=\{(a,b,c)\in S': \exists~(a,b',c')\in S', b\neq b'\}\\
T_2&=\{(a,b,c)\in S': \exists~(a',b,c')\in S', a\neq a'\}\\
T_3&=\{(a,b,c)\in S': \exists~(a',b',c)\in S', a\neq a'\}.
\end{align}
并令 $U=S'\setminus (T_1\cup T_2\cup T_3)$。类似定理 7.4 的证明可得集合 $U$ 满足要求。令 $m=\Theta\left({2(1-\alpha)N/3\choose (1-\alpha)N/3}{(1+\alpha)N/3 \choose (1-\alpha)N/3, \alpha N/3, \alpha N/3}\right)$,可得 $|U|=\Omega(|S||Q|/m^2)={N\choose (1+\alpha)N/3, 2(1-\alpha)N/3, \alpha N/3}^{1-o(1)}$。考虑 $T^{\otimes N}$。对任意变量 $X_{j_1,\dots,j_N}$,设其属于块 $[A]$。若 $0,1,2$ 在 $A$ 中出现的次数不分别为 $(1+\alpha)N/3, 2(1-\alpha)N/3, \alpha N/3$,或者 $h_1(A)\neq Q$,则删除所有含变量 $X^{j_1,\dots,j_N}$ 的项。类似地处理 $Y$ 和 $Z$。这样项 $X^{[A]}Y^{[B]}Z^{[C]}$ 出现当且仅当 $(A,B,C)\in S'$。进一步,删除含变量 $X_{i_1,\dots,i_N}$ 的项,如果 ${i_1,\dots,i_N}$ 不属于任何块 $A$ 使得存在 $(A,B,C)\in U$。类似地删除含变量 $Y_{i'_1,\dots,i'_N}$ 的项,如果 ${i'_1,\dots,i'_N}$ 不属于任何块 $B$ 使得存在 $(A,B,C)\in U$。最后删除含变量 $Z_{i''_1,\dots,i''_N}$ 的项,如果 ${i''_1,\dots,i''_N}$ 不属于任何块 $C$ 使得存在 $(A,B,C)\in U$。设得到的多项式为 $P$,其对应的张量为 $T'$。有 $P=\sum_{(A,B,C)\in U} X^{[A]}Y^{[B]}Z^{[C]}$,且项与项之间是独立的。于是 $T'=\left(\langle q,q,q\rangle^{\otimes (1-\alpha)N/3}\otimes \langle 1,1,1\rangle^{\otimes \alpha N/3}\right)^{\oplus |U|}$ 并且 $\underline{R}(T')\leq \underline{R}\left(T^{\otimes N}\right)\leq (q+2)^N$。由渐近和不等式,有 $|U|q^{(1-\alpha)N\omega/3}\leq (q+2)^N$。令 $N\to\infty$ 并令 $q=6$,$\alpha\approx 0.048$,得到:
定理 8.1 ([CW90]):
$\omega \leq 2.388\dots$
接下来考虑 $T^{\otimes 2}$ 并设其对应多项式 $p$。修改变量的分块 $[i,j]\mapsto [i+j]$,即:
\begin{align}
X^{[0]}&=\{X_{0,0}\},\\
X^{[1]}&=\{X_{i,0}, X_{0,k}: i,k=1,\dots, q\},\\
X^{[2]}&=\{X_{0,q+1}, X_{i,k} ,X_{q+1,0}: i,k=1,\dots, q\},\\
X^{[3]}&=\{X_{i,q+1}, X_{k,q+1}: i,k=1,\dots, q\},\\
X^{[4]}&=\{X_{q+1,q+1}\}.
\end{align}
且有 $p(X,Y,Z)=\sum_{i+j+k=4} X^{[i]}Y^{[j]}Z^{[k]}$。有:
\begin{align}
X^{[0]}Y^{[0]}Z^{[4]}=X^{[0]}Y^{[4]}Z^{[0]}=X^{[4]}Y^{[0]}Z^{[0]}&\simeq\langle 1,1,1\rangle\\
X^{[0]}Y^{[1]}Z^{[3]}=X^{[0]}Y^{[3]}Z^{[1]}&\simeq\langle 1,1,2q\rangle\\
X^{[1]}Y^{[0]}Z^{[3]}=X^{[3]}Y^{[0]}Z^{[1]}&\simeq\langle 1,2q,1\rangle\\
X^{[1]}Y^{[3]}Z^{[0]}=X^{[3]}Y^{[1]}Z^{[0]}&\simeq\langle 2q,1,1\rangle\\
X^{[0]}Y^{[2]}Z^{[2]}&\simeq\langle 1,1,q^2+2\rangle\\
X^{[2]}Y^{[0]}Z^{[2]}&\simeq\langle q^2+2,1,1\rangle\\
X^{[2]}Y^{[2]}Z^{[0]}&\simeq\langle 1,q^2+2,1\rangle
\end{align}
但 $X^{[1]}Y^{[1]}Z^{[2]}$,$X^{[1]}Y^{[2]}Z^{[1]}$ 和 $X^{[2]}Y^{[1]}Z^{[1]}$ 不对应任何矩阵乘法。处理这一问题的方法是取对应张量的高次张量幂,并(在删除若干变量后)表示为若干矩阵乘法张量的直和。有下列结论(证明见后):
引理 8.1 ([CW90]):
令 $T_1,T_2,T_3$ 分别为 $X^{[1]}Y^{[1]}Z^{[2]}$,$X^{[1]}Y^{[2]}Z^{[1]}$ 和 $X^{[2]}Y^{[1]}Z^{[1]}$ 对应的张量,则对于正整数 $N$ 以及 $\tau>0$,存在正整数 $t$ 以及 $(n_1,m_1,p_1),\dots,(n_t,m_t,p_t)$ 使得
$$
(T_1\otimes T_2\otimes T_3)^{\otimes N}=\left(\oplus_{i=1}^t \langle n_i,m_i,p_i\rangle\right)\oplus\dots
$$
并且有 $\lim_{N\to\infty}\left(\sum_{i=1}^t (n_i m_i p_i)^\tau\right)^{1/N} \geq 4q^{3\tau}(q^{3\tau}+2)$。
定理 8.2 ([CW90]):
$\omega\leq 2.375\dots$
证明:考虑 $\left(T^{\otimes 2}\right)^{\otimes N}$。取非负整数 $A_0,\dots,A_4$ 使得 $\sum_{i=0}^4 A_i=N$ 并且 $\sum_{i=0}^4 i A_i=4N/3$ 。对 $0\leq i,j,k\leq 4$ 且 $i+j+k=4$,取非负整数 $\eta_{i,j,k}$ 使得
\begin{align}
&\sum_{\substack{0\leq i,j,k\leq 4\\ i+j+k=4}} \eta_{i,j,k}=N\\
&\sum_{\substack{0\leq j,k\leq 4\\ i+j+k=4}} \eta_{i,j,k}=A_i & \forall 0\leq i\leq 4\\
&\sum_{\substack{0\leq i,k\leq 4\\ i+j+k=4}} \eta_{i,j,k}=A_j & \forall 0\leq j\leq 4\\
&\sum_{\substack{0\leq i,j\leq 4\\ i+j+k=4}} \eta_{i,j,k}=A_k & \forall 0\leq k\leq 4\\
\end{align}
令
$$
S=\left\{A,B,C\in \{0,\dots,4\}^N: ~(i,j,k) ~\text{在所有 }
(A_\ell,B_\ell,C_\ell) ~\text{中出现 } \eta_{i,j,k} ~\text{次} \right\}.
$$
有 $|S|={N\choose \{\eta_{i,j,k}\}}$。取 $S$ 中尽量大的子集 $S'$ 使得对任意 $(A,B,C),(A',B',C'),(A'',B'',C'')\in S'$,$A+B'+C''=(2,\dots,2)$ 仅当 $(A,B,C)=(A',B',C')=(A'',B'',C'')$。修改定理 7.4 证明中的构造:定义哈希函数 (hash function) $h_1,h_2,h_3:\{0,1,2\}^N\to\mathbb{F}_m$ 如下
\begin{align}
h_1(a)&=\sum_{i=1}^N w_i a_i+w_{N+1}\\
h_2(b)&=\sum_{i=1}^N w_i b_i+w_{N+2}\\
h_3(c)&=\frac{1}{2}\left( \sum_{i=1}^N w_i(4-c_i)+w_{N+1}+w_{N+2} \right).
\end{align}
定义 $S'=\{(a,b,c)\in S: h_1(a),h_2(b),h_3(c)\in Q\}$,其中 $Q$ 的定义与定理 7.4 证明中相同。定义 $S'$ 的子集 $T_1,T_2,T_3$ 如下:
\begin{align}
T_1&=\{(a,b,c)\in S': \exists~(a,b',c')\in S', b\neq b'\}\\
T_2&=\{(a,b,c)\in S': \exists~(a',b,c')\in S', a\neq a'\}\\
T_3&=\{(a,b,c)\in S': \exists~(a',b',c)\in S', a\neq a'\}.
\end{align}
并令 $U=S'\setminus (T_1\cup T_2\cup T_3)$。类似定理 7.4 的证明可得集合 $U$ 满足要求。令 $m_X$ 为包含某个 $X^{[I]}$ 且 $(I,J,K)\in S$ 的项 $X^{[I]}Y^{[J]}Z^{[K]}$ 的数量 。对 $Y$ 和 $Z$ 类似地定义 $m_Y$ 和 $m_Z$。有:
$$
m_X=m_Y=m_Z=\frac{\prod_{i=0}^4 A_i!}{\prod_{i+j+k=4}\eta_{i,j,k}!}.
$$
另一方面,令 $m'_X$ 为包含某个 $X^{[I]}$ 的项 $X^{[I]}Y^{[J]}Z^{[K]}$ 的数量(其中 $I,J,K$ 中 $i$ 出现的次数均为 $A_i$) 。对 $Y$ 和 $Z$ 类似地定义 $m'_Y$ 和 $m'_Z$。有:
$$
m'_X=m'_Y=m'_Z=\sum_{\{\eta_{i,j,k}\}}\frac{\prod_{i=0}^4 A_i!}{\prod_{i+j+k=4}\eta_{i,j,k}!}.
$$
注意到上式共有至多 $N^{O(1)}$ 项,故可以取 $\{\eta_{i,j,k}\}$ 使得 $m_X\geq m'_X/N^{O(1)}$。令 $m=\Theta(m'_X)$,可得
\begin{align}
|U|=\Omega(|S||Q|/m^2)=\Omega(|S|/m^{1+o(1)})&={N\choose A_0,\dots,A_4}^{1-o(1)}N^{-O(1)}\\&={N\choose A_0,\dots,A_4}^{1-o(1)}.
\end{align}
考虑 $\left(T^{\otimes 2}\right)^{\otimes N}$。对任意变量 $X_{j_1,\dots,j_N}$,设其属于块 $[A]$。若 $0,\dots,4$ 在 $A$ 中出现的次数不分别为 $A_0,\dots,A_4$,或者 $h_1(A)\neq Q$,则删除所有含变量 $X^{j_1,\dots,j_N}$ 的项。类似地处理 $Y$ 和 $Z$。这样若 $(A,B,C)\in S'$,则项 $X^{[A]}Y^{[B]}Z^{[C]}$ 出现。进一步,删除含变量 $X_{i_1,\dots,i_N}$ 的项,如果 ${i_1,\dots,i_N}$ 不属于任何块 $A$ 使得存在 $(A,B,C)\in U$。类似地删除含变量 $Y_{i'_1,\dots,i'_N}$ 的项,如果 ${i'_1,\dots,i'_N}$ 不属于任何块 $B$ 使得存在 $(A,B,C)\in U$。最后删除含变量 $Z_{i''_1,\dots,i''_N}$ 的项,如果 ${i''_1,\dots,i''_N}$ 不属于任何块 $C$ 使得存在 $(A,B,C)\in U$。设得到的多项式为 $P$,其对应的张量为 $T'$。有 $P=\left(\sum_{(A,B,C)\in U} X^{[A]}Y^{[B]}Z^{[C]}\right)+\dots$,且项与项之间是独立的。于是 $T'=\left(\langle q,q,q\rangle^{\otimes (1-\alpha)N/3}\otimes \langle 1,1,1\rangle^{\otimes \alpha N/3}\right)^{\oplus |U|}$ 并且 $\underline{R}(T')\leq \underline{R}\left(\left(T^{\otimes 2}\right)^{\otimes N}\right)\leq (q+2)^{2N}$。由渐近和不等式,有
$$
{N\choose A_0,\dots,A_4}^{1-o(1)}\left((2q)^{6b}(q^2+2)^{3c}\right)^{\omega/3}(4q^\omega(q^\omega+2))^d \leq (q+2)^{2N}
$$
其中
\begin{align}
&\eta_{0,0,4}=\eta_{0,4,0}=\eta_{4,0,0}=a,\\
&\eta_{0,1,3}=\eta_{0,3,1}=\eta_{1,0,3}=\eta_{1,3,0}=\eta_{3,0,1}=\eta_{3,1,0}=b,\\
&\eta_{0,2,2}=\eta_{2,0,2}=\eta_{2,2,0}=c,\\
&\eta_{1,1,2}=\eta_{1,2,1}=\eta_{2,1,1}=d.
\end{align}
(可以验证使得 $m_X$ 在 $m'_X$ 中最大的 $\{\eta_{i,j,k}\}$ 满足上述条件。)
令 $\bar{a}=a/N$ 并类似地定义 $\bar{b},\bar{c},\bar{d}$。令 $N\to\infty$ 并对上式两边开 $N$ 次方,得到:
$$
\frac{(2q)^{2\bar{b}\omega}(q^2+2)^{\bar{c}\omega}(4q^\omega(q^\omega+2))^{\bar{d}}}
{(2\bar{a}+2\bar{b}+\bar{c})^{2\bar{a}+2\bar{b}+\bar{c}}
(2\bar{b}+2\bar{d})^{2\bar{b}+2\bar{d}}(2\bar{c}+\bar{d})^{2\bar{c}+\bar{d}}(2\bar{b})^{2\bar{b}}\bar{a}^{\bar{a}}}
\leq (q+2)^2.
$$
令 $\bar{a}=0.000233, ~\bar{b}=0.012506, ~\bar{c}=0.102546, ~\bar{d}=0.205542, ~q=6$,解得 $\omega\leq 2.375\dots$。证毕。
证明(引理 8.1):
\begin{align}
X^{[1]}Y^{[1]}Z^{[2]}&=\sum_{i=1}^q x_{i,0}^{[1,0]}y_{i,0}^{[1,0]}z_{0,q+1}^{[0,2]}
+\sum_{k=1}^q x_{0,k}^{[0,1]}y_{0,k}^{[0,1]}z_{q+1,0}^{[2,0]}\\
&+\sum_{i,k=1}^q x_{i,0}^{[1,0]}y_{0,k}^{[0,1]}z_{i,k}^{[1,1]}
+\sum_{i,k=1}^q x_{0,k}^{[0,1]}y_{i,0}^{[1,0]}z_{i,k}^{[1,1]}
\end{align}
其对应的张量为 $T_1$。考虑 $T_1^{\otimes 2N}$。取非负整数 $L,G$ 使得 $L+G=N$。删除项 $X^{[I]}Y^{[J]}Z^{[K]}$,如果 $I$ 中 $[1,0]$ 与 $[0,1]$ 的数量不同,或者 $J$ 中 $[1,0]$ 与 $[0,1]$ 的数量不同,或者 $K$ 中 $[2,0]$,$[0,2]$ 与 $[1,1]$ 的数量不分别为 $L,L,2G$。设得到的张量为 $T'_1$。类似地考虑 $X^{[1]}Y^{[2]}Z^{[1]}$ 和 $X^{[2]}Y^{[1]}Z^{[1]}$ 并得到 $T'_2$ 和 $T'_3$。考虑 $T''=T'_1\otimes T'_2\otimes T'_3$。在 $T''$ 中有 ${2N \choose N}^2{2N \choose L,L,2G}$ 个可能的 $X$ 块,每块出现在 ${N\choose L}^4{2G\choose G}$ 个项 $X^{[I]}Y^{[J]}K^{[K]}$ 中。利用与定理 8.2 的证明相同的哈希函数进一步删除变量以保证独立性,则剩余至少 $t=\Omega\left(\left({2N\choose N}^2 {2N\choose L,L,2G}\right)^{1-o(1)}\right)$ 项,其中每一项对应一个矩阵乘法 $\langle n_i,m_i,p_i\rangle$,并且 $n_im_ip_i=(q^2)^{6G}q^{6L}=q^{12G+6L}$。于是有
$$
\sum_{i=1}^t (n_i m_i p_i)^\tau=\Omega\left(\left({2N\choose N}^2 {2N\choose L,L,2G}\right)^{1-o(1)} q^{12G+6L}\right)
$$
令 $L=\frac{2N}{q^\tau+2}$,$G=\frac{q^\tau N}{q^\tau+2}$。对上式左右两边开 $N$ 次方并令 $N\to\infty$,得到
$$\lim_{N\to\infty}\left(\sum_{i=1}^t (n_i m_i p_i)^\tau\right)^{1/N} \geq 4q^{3\tau}(q^{3\tau}+2).
$$
证毕。
Stothers [Sto10] 和 Williams [Wil12] 分析了 $T^{\otimes 4}$,并分别得到 $\omega\leq 2.3736\dots
$ 和 $\omega\leq 2.3729\dots$。Williams [Wil12] 进一步分析了 $T^{\otimes 8}$,并得到:
定理 8.2 ([Wil12]):
$\omega \leq 2.3726\dots$
参考文献:
[CW90] Don Coppersmith and Shmuel Winograd. Matrix Multiplication via
Arithmetic Progressions. J. Symb. Comput., 9 (1990), 251-280.
[Sto10] Andrew Stothers. Ph.D. Thesis, U. Edinburgh, 2010.
[Wil12] Virginia Vassilevska Williams. Multiplying Matrices Faster Than Coppersmith-Winograd. Proceedings of the 44th Symposium on Theory of Computing, 887-898, 2012.
Coppersmith-Winograd 算法的更多相关文章
- [winograd]winograd算法在卷积中的应用
卷积优化方法之Winograd 在卷积神经网络当中, 卷积运算是尤其是计算敏感的, 尤其是在端上设备中, 对于性能的要求更为苛刻.对于卷积优化的方法也有很多种,本文便针对近年来最常见的优化方法Wino ...
- 卷积神经网络中的Winograd快速卷积算法
目录 写在前面 问题定义 一个例子 F(2, 3) 1D winograd 1D to 2D,F(2, 3) to F(2x2, 3x3) 卷积神经网络中的Winograd 总结 参考 博客:blog ...
- Winograd Convolution 推导 - 从1D到2D
Winograd Convolution 推导 - 从1D到2D 姚伟峰 http://www.cnblogs.com/Matrix_Yao/ Winograd Convolution 推导 - 从1 ...
- 深度学习框架如何自动选择最快的算法?Fast Run 让你收获最好的性能!
作者:王博文 | 旷视 MegEngine 架构师 一.背景 对于深度学习框架来说,网络的训练/推理时间是用户非常看中的.在实际生产条件下,用户设计的 NN 网络是千差万别,即使是同一类数学计算,参数 ...
- zz开源 MNN:淘宝在移动 AI 上的实践
开源 MNN:淘宝在移动 AI 上的实践 陈以鎏(离青) 阅读数:40612019 年 6 月 28 日 随着深度学习的快速发展和端侧设备算力的不断提升,原本在云端执行的推理预测工作正在部分迁 ...
- 阿里开源!轻量级深度学习端侧推理引擎 MNN
阿里妹导读:近日,阿里正式开源轻量级深度学习端侧推理引擎“MNN”. AI科学家贾扬清如此评价道:“与 Tensorflow.Caffe2 等同时覆盖训练和推理的通用框架相比,MNN 更注重在推理时的 ...
- 阿里开源首个移动AI项目,淘宝同款推理引擎
淘宝上用的移动AI技术,你也可以用在自己的产品中了. 刚刚,阿里巴巴宣布,开源自家轻量级的深度神经网络推理引擎MNN(Mobile Neural Network),用于在智能手机.IoT设备等端侧加载 ...
- RepVGG
RepVGG: Making VGG-style ConvNets Great Again 作者:elfin 资料来源:RepVGG论文解析 目录 1.摘要 2.背景介绍 3.相关工作 3.1 单 ...
- 旷视MegEngine核心技术升级
旷视MegEngine核心技术升级 7 月 11 日,旷视研究院在 2020 WAIC · 开发者日「深度学习框架与技术生态论坛」上围绕 6 月底发布的天元深度学习框架(MegEngine)Beta ...
- MegEngine推理性能优化
MegEngine推理性能优化 MegEngine「训练推理一体化」的独特范式,通过静态图优化保证模型精度与训练时一致,无缝导入推理侧,再借助工业验证的高效卷积优化技术,打造深度学习推理侧极致加速方案 ...
随机推荐
- 51nod建设国家
小C现在想建设一个国家.这个国家中有一个首都,然后有若干个中间站,还有若干个城市. 现在小C想把国家建造成这样的形状:选若干(可以是0个)的中间站把他们连成一条直线,然后把首都连在这一条直线的左端.然 ...
- HTML TAG FROM MDN
A <a> <abbr> <acronym> <address> <applet> <area> <article> ...
- windows core audio apis
这个播放流程有一次当初不是很理解,做个记录,代码中的中文部分,原文档是有解释的:To move a stream of rendering data through the endpoint buff ...
- CentOS 6.5 IP 设置
DEVICE=eth0TYPE=EthernetUUID=7d6d54e0-054d-472b-8cc1-080f16ef36c1ONBOOT=yesNM_CONTROLLED=yesBOOTPROT ...
- php中文字符串反转
<?php header("content-type:text/html;charset=utf-8"); /** 此函数的作用是反转中文字符串 mb_strlen() 获取 ...
- wdcp-apache配置错误导致进程淤积进而内存吃紧
内存总是越来越少,虚拟内存使用越来越多 首先确定到底是什么占用了大量的内存 可以看到,大部分内存被闲置的httpd进程占用 且当我重启mysql服务后,内存没有出现明显变化,但是当我重启apache时 ...
- UFLDL实验报告2:Sparse Autoencoder
Sparse Autoencoder稀疏自编码器实验报告 1.Sparse Autoencoder稀疏自编码器实验描述 自编码神经网络是一种无监督学习算法,它使用了反向传播算法,并让目标值等于输入值, ...
- 测试gcc的优化选项
一.测试准备及原理 测试代码: static void wait(volatile unsigned long dly) { ; dly--); } int main(void) { unsigned ...
- vmware中ubuntu更新内核后无法进入桌面,鼠标“漂移”滑动
问题背景: 我机子上是在vmware下安装了ubuntu12.04,今天正在ubuntu下工作,结果提示内核有更新,手贱的就点了个OK,开始更新,更新完重启.结果,问题来了,刚开始系统启动,进入系统登 ...
- Hibernate中的事务隔离
在我们的项目中,老发现程序报告sesssion is closed或者因数据已经被其他事务修改而导致当前事务无法提交,由于系统的运行用户最多也就几十个人,所以考虑使用严格的事务隔离来防止这种类型的问题 ...