Quick Pow: 如何快速求幂

今天讲个有趣的算法：如何快速求 \(n^m\)，其中 n 和 m 都是整数。

为方便起见，此处假设 m >= 0，对于 m < 0 的情况，求出 \(n^{|m|}\) 后再取倒数即可。

另外此处暂不考虑结果越界的情况（超过 int64 范围）。

当然不能用编程语言的内置函数，我们只能用加减乘除来实现。

n 的 m 次方的数学含义是：m 个 n 相乘：n*n*n...*n，也就是说最简单的方式是执行 m 次乘法。

直接用乘法实现的问题是性能不高，其时间复杂度是 O(m)，比如 \(3^{29}\) 要执行 29 次乘法，而乘法运算是相对比较重的，我们看看能否采用什么方法将时间复杂度降低。

设 m = x + y + z（x、y、z 都是整数），我们知道有如下数学等式： \(n^m\) = \(n^{x+y+z}\) = \(n^x * n^y * n^z\)。

也就是说，如果我们已经知道 \(n^x\)、\(n^y\)、\(n^z\) 的值，是不是就可以直接用他们相乘得出 \(n^m\)的结果？这样的话乘的次数就大大降低了。

于是问题就变成应该将 m 拆成怎样的几个数的和。

因为计算机是玩二进制的，我们尝试着将这些数跟 2 扯上联系（以 2 为底），看看会不会有奇迹发生。

我们看看具体的例子：\(3^{29}\)。

我们将 29 做这样的拆分：29 = 16 + 8 + 4 + 1。

这个拆分有什么特点呢？右边的数都是 2 的 X 次方（\(2^4 + 2^3 + 2^2 + 2^0\)）。

我们把上面的拆分带进公式：\(3^{29} = 3^{16} * 3^{8} * 3^{4} * 3^{1}\)。

那我们能不能知道 \(3^{16}\)、\(3^{8}\)、\(3^{4}\)、\(3^{1}\) 是什么呢？

我们不用计算就知道 \(3^{1}\) 是什么——但仅此而已。

不过我们可以用 \(3^{1}\) 自乘 4 次的到 \(3^4\)；然后再用 \(3^4\) 自乘得到 \(3^8\)；再通过 \(3^8\) 自乘得到 \(3^{16}\)。

好像有点感觉了——我们每做一次乘法，就能将结果翻倍（如 \(3^4\) 自乘就变成 \(3^4*3^4 = 3^8\)）。

如此，虽然也要多次乘法，但乘的次数从 29 次降到 9 次！

然后我们再回头看看上面的拆分：

29 = 16 + 8 + 4 + 1 = \(2^4 + 2^3 + 2^2 + 2^0\) = \(1*2^4 + 1*2^3 + 1*2^2 + 0*2^1 + 1*2^0\) 。

这不就是学校学的二进制转十进制吗（29 的二进制是 11101）？

\(3^{29} = 3^{16} * 3^{8} * 3^{4} * 3^{1}\) 是说：取 29 的二进制表示中所有值是 1 的位，算出它们的指数值并相乘就得到最终的值。

我们用 go 语言实现一下：

// 求 a 的 n 次方

// a、n 是非负整数

func Pow(a,n int64) int64 {

	// 0 的任何次方都是 0

	if a == 0 {

		return 0

	}

	// 任何数的 0 次方都是 1

	if n == 0 {

		return 1

	}

	// 1 次方是它自身

	if n == 1 {

		return a

	}

	// 用滚雪球的方式计算幂

	// 雪球初始值是 1

	var result int64 = 1

	// 滚动因子初始化为 a 的 1 次方（a 自身）

	factor := a

	// 循环处理直到 n 变成 0（所有的二进制位都处理完了）

	for n != 0 {

		// 跟 1 做与运算，判断当前要处理的位是不是 1

		// 之所以是直接跟 1 做与运算，因为后面每处理一轮都将 n 右移了一位，保证每次要处理的位都在最低位

		if n & 1 != 0 {

			// 当前位是 1，需要乘进去

			result *= factor

		}

		// 每轮结束时将滚动因子自乘

		// 因为每行进一轮，指数都翻倍，整体结果就是自乘

		// 比如本轮因子是 2**4，下一轮就是 2**8

		// 2**8 = 2**(4+4) = 2**4 * 2**4

		// （** 表示指数）

		factor *= factor

		// n 右移一位，将下一轮要处理的位放在最低位

		n = n >> 1

	}

	return result

}

有什么用呢？

很多语言内置的 pow 函数都只接受浮点数，浮点数的运算是非常重的，如果我们的程序需要频繁计算整数的幂，就可以采用 quick pow 算法代替语言内置的幂函数以提升性能。

我们对 go 语言内置的 math.Pow 和 quick pow 算法做个性能测试对比一下。

// 测试 3 的 29 次方的性能测试

var benchPowB int64 = 3

var benchPowP int64 = 29

// 上面的 quick pow 算法

func BenchmarkQuickPow(b *testing.B)  {

	for i := 0; i < b.N; i++ {

		algo.Pow(benchPowB, benchPowP)

	}

}

// go 语言 math 包的 Pow 方法，只接受 float64 类型

func BenchmarkInnerPow(b *testing.B)  {

	x := float64(benchPowB)

	y := float64(benchPowP)

	for i := 0; i < b.N; i++ {

		math.Pow(x, y)

	}

}

// 用简单乘法实现（3 自乘 29 次）

func BenchmarkSimpleMulti(b *testing.B) {

	for i := 0; i < b.N; i++ {

		var r int64 = 1

		var j int64 = 0

		for ; j < benchPowP; j++ {

			r *= benchPowB

		}

	}

}

测试结果：

goos: darwin

goarch: amd64

cpu: Intel(R) Core(TM) i7-7700HQ CPU @ 2.80GHz

BenchmarkQuickPow-8           357897716                3.373 ns/op

BenchmarkInnerPow-8           39162492                29.30 ns/op

BenchmarkSimpleMulti-8          121066731                9.549 ns/op

PASS

ok      command-line-arguments  4.894s

从性能测试结果看，quick pow 算法比简单乘法快了好几倍，比 math.pow 快了近 10 倍。

所以，如果程序只需要求整数幂，而且能确保计算结果不会越界时，可以考虑使用 quick pow 算法代替语言内置的浮点函数。

Quick Pow: 如何快速求幂的更多相关文章

快速求幂（Quick Exponentiation）
接触ACM没几天,向各路大神求教,听说ACM主要是研究算法,所以便开始了苦逼的算法学习之路.话不多说,RT所示,学习快速求幂. 在头文件<math.h>或是<cmath>中,d ...
NYOJ--102--次方求模（快速求幂取模）
次方求模时间限制:1000 ms | 内存限制:65535 KB 难度:3 描述求a的b次方对c取余的值输入第一行输入一个整数n表示测试数据的组数(n<100)每组测试只有一 ...
HDU 2035 人见人爱A^B（二分求幂，快速求幂）
题意:求A的B次方的后三位数字思路1:常规求幂,直接取余求解代码: #include<iostream> #include<cstdio> using namespace ...
[leetcode]50. Pow(x, n)求幂
Implement pow(x, n), which calculates x raised to the power n (xn). Example 1: Input: 2.00000, 10 Ou ...
ahjesus js 快速求幂
/* 快速幂计算,传统计算方式如果幂次是100就要循环100遍求值快速幂计算只需要循环7次即可求x的y次方 x^y可以做如下分解把y转换为2进制,设第n位的值为i,计算第n位的权为x^(2^(n ...
NYOJ-127 快速求幂，最小生成树
#include"iostream" using namespace std; int kuaisuqiumo(int a,int b,int c){ ; a = a % c; ) ...
hdu 1005 Number Sequence（矩阵连乘+二分快速求幂）
题目:http://acm.hdu.edu.cn/showproblem.php?pid=1005 代码: #include<iostream> #include<stdio.h&g ...
求幂&&快速幂&&位运算
1.普通的求幂方法: 时间复杂度为O(n),对于比较大的数在1s限时内可能会TLE int pow(int base,int p){ int ans=1; for(int i=1;i<=p;i+ ...
九度OJ 1085 求root(N, k) -- 二分求幂及快速幂取模
题目地址:http://ac.jobdu.com/problem.php?pid=1085 题目描述: N<k时,root(N,k) = N,否则,root(N,k) = root(N',k). ...

随机推荐

Nginx作为高性能服务器的缘由以及请求过程
Nginx作为高性能服务器的缘由以及请求过程简介: Nginxx采用的是多进程(单线程)&多路IO复用模型,使用I/O多路复用技术的Nginx,就成了"并发事件驱动"的服 ...
新华三Gen10服务器进SSA查看、配置阵列
1.开机自检进F10 2.F10后选择[smart storage administrator](跳到第5步)或选择第一项IP[intelligent provisioning] 3.选择执行维护 4 ...
XCTF练习题---MISC---Cephalopod
XCTF练习题---MISC---Cephalopod flag:HITB{95700d8aefdc1648b90a92f3a8460a2c} 解题步骤: 1.观察题目,下载附件 2.拿到手以后发现是 ...
postman4.15
测开培训笔记4.15 postman:很主流的API测试工具,也是在工作中使用很广泛的研发工具 queue 队列先进先出的原则列如:客户端有100个请求服务端最多只能承受90个其余都要排队进行 ...
HashMap中红黑树插入节点的调整过程
如果有对红黑树的定义及调整过程有过研究,其实很容易理解HashMap中的红黑树插入节点的调整过程. "红黑树定义及调整过程"的参考文章:<红黑树原理.查找效率.插入及变化规则 ...
CentOS 7 执行 yum 命令失败问题的排查方法
一个执着于技术的公众号简介本文主要为大家讲解 CentOS 7系统中执行yum命令失败等常见问题的排查方法. 1.执行yum命令报404错误 1)检查yum仓库是否配置正确,可以到阿里云下载rep ...
关于transform属性的一些理解
3D transform transform进行动画演示时,是以元素的中心为基准点的,可以使用transform-origin改变元素转变的基准点. 所有的transform动作改变都会引起X.Y轴的 ...
Go语言学习——函数二 defer语句
函数 package main import "fmt" // 函数:一段代码的封装 func f1(){ fmt.Println("Hello 中国!") } ...
Angular中懒加载一个模块并动态创建显示该模块下声明的组件
angular中支持可以通过路由来懒加载某些页面模块已达到减少首屏尺寸, 提高首屏加载速度的目的. 但是这种通过路由的方式有时候是无法满足需求的. 比如, 点击一个按钮后显示一行工具栏, 这个工具栏组 ...
好客租房18-jsx阶段总结
JSX 1jsx是react的核心内容 2jsx是在js代码中写HTML结构,是react中声明式的提现 3使用jsx配合嵌入的js表达式,条件渲染,列表渲染,可以描述任意ui结构 4推荐使用cals ...

Quick Pow: 如何快速求幂

有什么用呢？

Quick Pow: 如何快速求幂的更多相关文章

随机推荐

热门专题